
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
2605.VGGT-Omega 论文解读: 3D重建的Scaling Law, Register Attention效率革命 | Oxford+Meta CVPR26 Oral
VGGT-Omega通过Register Attention将训练显存降至前作30%,支持15倍数据和10B模型训练,首次证明3D重建遵循幂律Scaling Law。Sintel相机估计提升77%,Register Token可即插即用提升VLA性能。CVPR 2026 Oral。
2605.CoWorld-VLA 论文解读: 多专家世界模型Latent CoT, 单帧NAVSIM 89.8 PDMS | Afari
CoWorld-VLA提出多专家世界推理框架,将语义交互/几何结构/动态演化/轨迹先验解耦为4种Expert Token构成Latent CoT,通过HMEF扩散规划器融合生成轨迹。NAVSIM v1单帧前视相机PDMS 89.8 SOTA。
2512.MindDrive 论文解读: 世界模型 what-if 仿真 + VLM 多目标评估, E2E 规划新范式 | 北航
MindDrive: World Action Model what-if 仿真 + VLM-Critic 多目标评估. 解决 E2E-AD 生成-选择不平衡. NAVSIM SOTA.
到底了







