
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
Diffusion生成室外3D大场景论文笔记:SemCity [CVPR2024], Pyramid Discrete Diffusion [ECCV2024 Oral]
Diffusion生成室外3D大场景论文方法详解

大模型RLHF强化学习笔记(一):强化学习基础梳理Part1
强化学习基础和经典方法梳理

多模态大模型位置编码梳理笔记(二):DeepSeek位置编码,位置编码长度外推
DeepSeek位置编码,位置编码长度外推详解

DeepSeek-V3技术梳理笔记&知识点解读:混合专家模型,训练精度
DeepSeek-V3技术要点整理知识点解读:混合专家模型,训练精度

大模型直接优化偏好DPO学习笔记
DPO,DPOP,TDPO,KTO

统一自回归和扩散方法的Transformer论文解读:Show-o[ICLR 2025],Transfusion[MetaAI]
Show-o[ICLR 2025],Transfusion[MetaAI]详细解读

自动驾驶VLA和世界模型的统一架构论文笔记:DriveVLA-W0[中科院&引望],MindDrive[北航],UniUGP[字节Seed]
DriveVLA-W0[中科院&引望],MindDrive[北航],UniUGP[字节Seed] 论文解读

大模型RLHF强化学习笔记(三):RLHF介绍,PPO训练技巧
LLM中的RLHF介绍,PPO训练技巧

大模型显存占用分析笔记:模型显存,训练显存,推理显存,显存优化
模型显存,训练显存,推理显存,显存优化

自动驾驶VLM最新论文笔记:AgentThink,DriveMoE
AgentThink,DriveMoE详解








