logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

LoRA以及其变体

它是一种面向大模型微调的参数高效方法,核心思想是:冻结原始大模型参数,只在部分线性层旁边加入少量可训练的低秩矩阵,用这些小矩阵来学习任务相关的参数增量。例如,有些任务更依赖视觉编码器,有些任务更依赖语言模型,有些任务更依赖跨模态对齐模块。从技术发展趋势来看,LoRA 已经不再只是一个简单的参数高效微调工具,而是在持续学习、多模态学习、专家混合、任务路由、抗遗忘等方向上不断扩展,逐渐成为大模型高效适

#LoRA
记录每天的学习内容2026.3.12--简单了解图像分割任务sam1233d(AI总结),与ai问答全部对话在https://github.com/101per/learning.git

Hypernetwork → 动态生成 mask 分类器Sigmoid → 多 mask 独立像素预测SAMv3 → Cross-modal attention(文本 + 图像)SAM3D → 3D/时空 attention + voxel mask。

#计算机视觉
记录每天的学习内容2026.3.22--理解Diffusion本质(AI总结),与ai问答全部对话在https://github.com/101per/learning.git

今天你完成了 diffusion 的“本质层理解”,并成功跨入 VLA 的入口。(明天开始,你将进入:真正的具身智能建模阶段)

TransReID细读

这样一来,模型在每一层计算自注意力时,都会被明确告知:“这张图来自摄像头A,视角是B”。:不同的摄像头有不同的光照、角度等特性,SIE可以帮助模型学习到这些特性,并在特征提取时将其“减去”,从而关注于身份本身的不变特征。以上是transReID大部分思想和内容,其中我认为最有意思的是SIE,感觉是用一种隐式的方式去消除相机和视角的因素。:SIE的自动更新,本质上是将非视觉信息转化为可训练的向量,将

记录每天的学习内容2026.3.26--diffuser(AI总结),与ai问答全部对话在https://github.com/101per/learning.git

本次学习完成了从“动作预测”到“轨迹分布建模”,再到“基于分布的规划”的核心跃迁,为进入 VLA 奠定了理论基础。

#学习
记录每天的学习内容2026.3.26--diffuser(AI总结),与ai问答全部对话在https://github.com/101per/learning.git

本次学习完成了从“动作预测”到“轨迹分布建模”,再到“基于分布的规划”的核心跃迁,为进入 VLA 奠定了理论基础。

#学习
记录每天的学习内容2026.3.25--diffusion policy(AI总结),与ai问答全部对话在https://github.com/101per/learning.git

日期学习目标深入理解在视觉-语言-动作(VLA)系统中的原理理解 BC(Behavior Cloning)与 Diffusion Policy 的关系理解时间一致性与多模态问题将 BC、Diffusion Policy 与 RL(Dreamer)统一到策略学习框架中。

#学习
记录每天的学习内容2026.3.23--简单了解VLA中的语义空间和action行为(AI总结),与ai问答全部对话在https://github.com/101per/learning.git

latent 是去除冗余后保留语义结构的表示空间VLA = 在语义空间中,通过学习动力学与动作变量,实现对未来状态的可控生成(完)

#学习
记录每天的学习内容2026.3.23--简单了解VLA中的语义空间和action行为(AI总结),与ai问答全部对话在https://github.com/101per/learning.git

latent 是去除冗余后保留语义结构的表示空间VLA = 在语义空间中,通过学习动力学与动作变量,实现对未来状态的可控生成(完)

#学习
    共 23 条
  • 1
  • 2
  • 3
  • 请选择