101%87 个人主页

@2403_88318326

101%87

2024-10-24 01:05:40 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

LoRA以及其变体

它是一种面向大模型微调的参数高效方法，核心思想是：冻结原始大模型参数，只在部分线性层旁边加入少量可训练的低秩矩阵，用这些小矩阵来学习任务相关的参数增量。例如，有些任务更依赖视觉编码器，有些任务更依赖语言模型，有些任务更依赖跨模态对齐模块。从技术发展趋势来看，LoRA 已经不再只是一个简单的参数高效微调工具，而是在持续学习、多模态学习、专家混合、任务路由、抗遗忘等方向上不断扩展，逐渐成为大模型高效适

#LoRA

记录每天的学习内容2026.3.12--简单了解图像分割任务sam1233d(AI总结),与ai问答全部对话在https://github.com/101per/learning.git

Hypernetwork → 动态生成 mask 分类器Sigmoid → 多 mask 独立像素预测SAMv3 → Cross-modal attention（文本 + 图像）SAM3D → 3D/时空 attention + voxel mask。

#计算机视觉

记录每天的学习内容2026.3.22--理解Diffusion本质(AI总结),与ai问答全部对话在https://github.com/101per/learning.git

今天你完成了 diffusion 的“本质层理解”，并成功跨入 VLA 的入口。（明天开始，你将进入：真正的具身智能建模阶段）

TransReID细读

这样一来，模型在每一层计算自注意力时，都会被明确告知：“这张图来自摄像头A，视角是B”。：不同的摄像头有不同的光照、角度等特性，SIE可以帮助模型学习到这些特性，并在特征提取时将其“减去”，从而关注于身份本身的不变特征。以上是transReID大部分思想和内容，其中我认为最有意思的是SIE,感觉是用一种隐式的方式去消除相机和视角的因素。：SIE的自动更新，本质上是将非视觉信息转化为可训练的向量，将

记录每天的学习内容2026.3.26--diffuser(AI总结),与ai问答全部对话在https://github.com/101per/learning.git

本次学习完成了从“动作预测”到“轨迹分布建模”，再到“基于分布的规划”的核心跃迁，为进入 VLA 奠定了理论基础。

#学习

记录每天的学习内容2026.3.26--diffuser(AI总结),与ai问答全部对话在https://github.com/101per/learning.git

本次学习完成了从“动作预测”到“轨迹分布建模”，再到“基于分布的规划”的核心跃迁，为进入 VLA 奠定了理论基础。

#学习

记录每天的学习内容2026.3.25--diffusion policy(AI总结),与ai问答全部对话在https://github.com/101per/learning.git

日期学习目标深入理解在视觉-语言-动作（VLA）系统中的原理理解 BC（Behavior Cloning）与 Diffusion Policy 的关系理解时间一致性与多模态问题将 BC、Diffusion Policy 与 RL（Dreamer）统一到策略学习框架中。

#学习

记录每天的学习内容2026.3.24--简单了解Dreamer强化学习(AI总结),与ai问答全部对话在https://github.com/101per/learning.git

Dreamer 不是拟合未来状态，而是让 policy 产生一个。

#学习