logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Learning to Rebalance Multi-Modal Optimization by Adaptively Masking Subnetworks 解读与个人思考

本文提出了一种创新的多模态学习方法AMSS(Adaptively Mask Subnetworks Considering Modal Significance),旨在解决多模态学习中普遍存在的模态不平衡问题。该方法通过细粒度的子网络更新机制,动态调整不同模态的参数更新策略,从而实现更均衡的多模态优化。

文章图片
#人工智能#机器学习#算法 +1
大模型学习笔记之Dense模型与MOE模型比较

全连接特性:在 Dense 模型中,每一层的每个神经元都与下一层的所有神经元相连,形成一个完全互联的结构[5例如,在一个典型的 Dense 层中,输入数据的每个元素都会被传递到输出数据的每个元素[8全激活模式:对于每个输入数据点,网络中的所有参数(包括连接权重和偏置项)都会被激活并参与计算[5。

文章图片
#学习
Learning to Rebalance Multi-Modal Optimization by Adaptively Masking Subnetworks 解读与个人思考

本文提出了一种创新的多模态学习方法AMSS(Adaptively Mask Subnetworks Considering Modal Significance),旨在解决多模态学习中普遍存在的模态不平衡问题。该方法通过细粒度的子网络更新机制,动态调整不同模态的参数更新策略,从而实现更均衡的多模态优化。

文章图片
#人工智能#机器学习#算法 +1
大模型学习笔记之Dense模型与MOE模型比较

全连接特性:在 Dense 模型中,每一层的每个神经元都与下一层的所有神经元相连,形成一个完全互联的结构[5例如,在一个典型的 Dense 层中,输入数据的每个元素都会被传递到输出数据的每个元素[8全激活模式:对于每个输入数据点,网络中的所有参数(包括连接权重和偏置项)都会被激活并参与计算[5。

文章图片
#学习
大模型学习笔记之Dense模型与MOE模型比较

全连接特性:在 Dense 模型中,每一层的每个神经元都与下一层的所有神经元相连,形成一个完全互联的结构[5例如,在一个典型的 Dense 层中,输入数据的每个元素都会被传递到输出数据的每个元素[8全激活模式:对于每个输入数据点,网络中的所有参数(包括连接权重和偏置项)都会被激活并参与计算[5。

文章图片
#学习
大模型学习笔记之Dense模型与MOE模型比较

全连接特性:在 Dense 模型中,每一层的每个神经元都与下一层的所有神经元相连,形成一个完全互联的结构[5例如,在一个典型的 Dense 层中,输入数据的每个元素都会被传递到输出数据的每个元素[8全激活模式:对于每个输入数据点,网络中的所有参数(包括连接权重和偏置项)都会被激活并参与计算[5。

文章图片
#学习
到底了