
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
多模态大模型位置编码梳理笔记(二):DeepSeek位置编码,位置编码长度外推
DeepSeek位置编码,位置编码长度外推详解

掩码图像/视频生成Transformer论文笔记:MaskGIT,MAGVIT,MAGVITv2
MaskGIT,MAGVIT,MAGVITv2 方法的详细解读

多模态大模型掩码梳理笔记:因果掩码,视觉-语言任务掩码设计
多模态大模型如何针对不同的任务设计Attention Mask

大模型RLHF强化学习笔记(一):强化学习基础梳理Part1
强化学习基础和经典方法梳理

大模型RLHF强化学习笔记(四):GRPO,DAPO,VAPO
GRPO,DAPO,VAPO方法详解

自动驾驶端到端大模型VLM/VLA论文笔记:ORION,ReCogDrive
ORION [ICCV2025],ReCogDrive论文详解

大模型显存占用分析笔记:模型显存,训练显存,推理显存,显存优化
模型显存,训练显存,推理显存,显存优化

自动驾驶“大模型+端到端”整理笔记:DriveVLM(理想), Senna(地平线),EMMA(Waymo), LeapAD[NIPS2024]
VLM+端到端模型方法详解和整理:DriveVLM(理想), Senna(地平线),EMMA(Waymo), LeapAD[NIPS2024]

多模态大模型掩码梳理笔记:因果掩码,视觉-语言任务掩码设计
多模态大模型如何针对不同的任务设计Attention Mask

Diffusion生成室外3D大场景论文笔记:SemCity [CVPR2024], Pyramid Discrete Diffusion [ECCV2024 Oral]
Diffusion生成室外3D大场景论文方法详解








