
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
自动驾驶VLA和世界模型的统一架构论文笔记:DriveVLA-W0[中科院&引望],MindDrive[北航],UniUGP[字节Seed]
DriveVLA-W0[中科院&引望],MindDrive[北航],UniUGP[字节Seed] 论文解读

大模型RLHF强化学习笔记(三):RLHF介绍,PPO训练技巧
LLM中的RLHF介绍,PPO训练技巧

大模型显存占用分析笔记:模型显存,训练显存,推理显存,显存优化
模型显存,训练显存,推理显存,显存优化

自动驾驶VLM最新论文笔记:AgentThink,DriveMoE
AgentThink,DriveMoE详解

多模态大模型位置编码梳理笔记(一):绝对位置编码(正弦,可学习),相对位置编码(XL, T5, RoPE, ALiBi)
详细介绍绝对位置编码(正弦,可学习),相对位置编码(XL, T5, RoPE, ALiBi)

掩码图像/视频生成Transformer论文笔记:MaskGIT,MAGVIT,MAGVITv2
MaskGIT,MAGVIT,MAGVITv2 方法的详细解读

大模型RLHF强化学习笔记(四):GRPO,DAPO,VAPO
GRPO,DAPO,VAPO方法详解

Diffusion扩散模型梳理笔记(二):LDM (Stable Diffusion核心算法), DiT (Transformer架构)
LDM (Stable Diffusion核心算法), DiT (Transformer架构)的方法讲解

DeepSeek-R1技术梳理笔记&知识点解读:GPRO,思维链CoT,拒绝采样
DeepSeek-R1技术要点整理知识点解读:GPRO,思维链CoT,拒绝采样

自动驾驶端到端梳理笔记(一):UniAD, ReasonNet, VAD, VADv2
UniAD, ReasonNet, VAD, VADv2方法的详细解读








