
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
26年3月来自北大和小鹏汽车的论文“EvoDriveVLA: Evolving Autonomous Driving Vision–Language–Action Model via Collaborative Perception-Planning Distillation”。视觉-语言-动作模型在自动驾驶领域展现出巨大的潜力,但它们在解冻视觉编码器后会面临感知能力下降的问题,并且在长期规划中也

26年2月来自小米机器人的论文“Xiaomi-Robotics-0: An Open-Sourced Vision-Language-Action Model with Real-Time Execution”。Xiaomi-Robotics-0,是一款视觉-语言-动作(VLA)模型,针对高性能和快速流畅的实时执行进方法的关键在于精心设计的训练方案和部署策略。Xiaomi-Robotics-0首先

25年12月来自华中科技和小米电动的论文“DriveLaW: Unifying Planning and Video Generation in a Latent Driving World”。世界模型对于自动驾驶至关重要,因为它们能够学习场景随时间演变的方式,从而应对现实世界中长尾分布的挑战。然而,目前的方法将世界模型的作用限制在有限的范围内:它们在看似统一的架构中运行,但仍然将世界预测和运动规

25年5月来自香港大学、OpenDriveLab 和智元机器人的论文“Learning to Act Anywhere with Task-centric Latent Actions”。通用机器人应该在各种环境中高效运行。然而,大多数现有方法严重依赖于扩展动作标注数据来增强其能力。因此,它们通常局限于单一的物理规范,难以学习跨不同具身和环境的可迁移知识。为了突破这些限制,UniVLA,是一个用于

25年12月来自上海交大、清华、旷视科技和迈驰智行公司的论文“GaussianDWM: 3D Gaussian Driving World Model for Unified Scene Understanding and Multi-Modal Generation”。随着生成模型的进步,驾驶世界模型(DWM)发展迅速。然而,现有的DWM缺乏三维场景理解能力,只能根据输入数据生成内容,而无法解释

26年1月来自博世、华盛顿大学(圣路易斯)、Arizona州立和Case Western Reserve大学的论文“UniDrive-WM: Unified Understanding, Planning and Generation World Model For Autonomous Driving”。世界模型已成为自动驾驶的核心,其中精确的场景理解和未来预测对于安全控制至关重要。近期研究探索

这是来自Facebook和Intel两个公司和几所大学在19年ICCV的论文“Habitat: A Platform for Embodied AI Research“,推出一个具身智能研究平台。

25年1月来自加拿大 SFU的论文“Semantic Mapping in Indoor Embodied AI – A Comprehensive Survey and Future Directions”。智能具身智体(例如机器人)需要在陌生的环境中执行复杂的语义任务。在智体需要具备的众多技能中,构建和维护环境的语义地图对于长期任务至关重要。语义地图以结构化的方式捕获有关环境的信息,允许智体在

25年7月来自南京大学、香港大学、中南大学、地平线机器人公司、中科院计算所、上海交大、慕尼黑工大和清华大学的论文“A Survey: Learning Embodied Intelligence from Physical Simulators and World Models”。对通用人工智能 (AGI) 的追求已将具身智能 (embodied intelligence) 置于机器人研究的前沿。

24年7月来自UCLA的论文“MetaUrban: A Simulation Platform for Embodied AI in Urban Spaces”。








