koala7580 个人主页

koala7580

2023-10-08 18:46:25 加入 DevPress

简介

该用户还未填写简介

未填写擅长的技术栈

暂无可提供的服务

VGGT-Omega通过Register Attention将训练显存降至前作30%，支持15倍数据和10B模型训练，首次证明3D重建遵循幂律Scaling Law。Sintel相机估计提升77%，Register Token可即插即用提升VLA性能。CVPR 2026 Oral。

CoWorld-VLA提出多专家世界推理框架，将语义交互/几何结构/动态演化/轨迹先验解耦为4种Expert Token构成Latent CoT，通过HMEF扩散规划器融合生成轨迹。NAVSIM v1单帧前视相机PDMS 89.8 SOTA。

MindDrive: World Action Model what-if 仿真 + VLM-Critic 多目标评估. 解决 E2E-AD 生成-选择不平衡. NAVSIM SOTA.

到底了