logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

EvoDriveVLA:通过协同感知-规划提炼演进的自动驾驶VLA模型

26年3月来自北大和小鹏汽车的论文“EvoDriveVLA: Evolving Autonomous Driving Vision–Language–Action Model via Collaborative Perception-Planning Distillation”。视觉-语言-动作模型在自动驾驶领域展现出巨大的潜力,但它们在解冻视觉编码器后会面临感知能力下降的问题,并且在长期规划中也

文章图片
#自动驾驶#人工智能#机器学习 +1
Xiaomi-Robotics-0:一个开源的、具有实时执行能力的视觉-语言-动作模型

26年2月来自小米机器人的论文“Xiaomi-Robotics-0: An Open-Sourced Vision-Language-Action Model with Real-Time Execution”。Xiaomi-Robotics-0,是一款视觉-语言-动作(VLA)模型,针对高性能和快速流畅的实时执行进方法的关键在于精心设计的训练方案和部署策略。Xiaomi-Robotics-0首先

文章图片
#机器学习#语言模型#深度学习 +2
DriveLaW:在潜驾驶世界中统一规划和视频生成

25年12月来自华中科技和小米电动的论文“DriveLaW: Unifying Planning and Video Generation in a Latent Driving World”。世界模型对于自动驾驶至关重要,因为它们能够学习场景随时间演变的方式,从而应对现实世界中长尾分布的挑战。然而,目前的方法将世界模型的作用限制在有限的范围内:它们在看似统一的架构中运行,但仍然将世界预测和运动规

文章图片
#音视频#深度学习#机器学习 +2
学习以任务为中心的潜动作,随地采取行动

25年5月来自香港大学、OpenDriveLab 和智元机器人的论文“Learning to Act Anywhere with Task-centric Latent Actions”。通用机器人应该在各种环境中高效运行。然而,大多数现有方法严重依赖于扩展动作标注数据来增强其能力。因此,它们通常局限于单一的物理规范,难以学习跨不同具身和环境的可迁移知识。为了突破这些限制,UniVLA,是一个用于

文章图片
#计算机视觉#语言模型#机器人 +2
GaussianDWM:用于统一场景理解和多模态生成的三维高斯驱动世界模型

25年12月来自上海交大、清华、旷视科技和迈驰智行公司的论文“GaussianDWM: 3D Gaussian Driving World Model for Unified Scene Understanding and Multi-Modal Generation”。随着生成模型的进步,驾驶世界模型(DWM)发展迅速。然而,现有的DWM缺乏三维场景理解能力,只能根据输入数据生成内容,而无法解释

文章图片
#自动驾驶#机器学习#语言模型 +2
UniDrive-WM:自动驾驶的统一理解、规划和生成世界模型

26年1月来自博世、华盛顿大学(圣路易斯)、Arizona州立和Case Western Reserve大学的论文“UniDrive-WM: Unified Understanding, Planning and Generation World Model For Autonomous Driving”。世界模型已成为自动驾驶的核心,其中精确的场景理解和未来预测对于安全控制至关重要。近期研究探索

文章图片
#自动驾驶#人工智能#机器学习 +3
Habitat:具身智能的模拟研究平台

这是来自Facebook和Intel两个公司和几所大学在19年ICCV的论文“Habitat: A Platform for Embodied AI Research“,推出一个具身智能研究平台。

文章图片
#人工智能#机器人#语言模型
室内具身智能中的语义建图—全面综述和未来方向

25年1月来自加拿大 SFU的论文“Semantic Mapping in Indoor Embodied AI – A Comprehensive Survey and Future Directions”。智能具身智体(例如机器人)需要在陌生的环境中执行复杂的语义任务。在智体需要具备的众多技能中,构建和维护环境的语义地图对于长期任务至关重要。语义地图以结构化的方式捕获有关环境的信息,允许智体在

文章图片
#人工智能#机器人#自然语言处理 +2
综述:从物理模拟器和世界模型中学习具身智能(下)

25年7月来自南京大学、香港大学、中南大学、地平线机器人公司、中科院计算所、上海交大、慕尼黑工大和清华大学的论文“A Survey: Learning Embodied Intelligence from Physical Simulators and World Models”。对通用人工智能 (AGI) 的追求已将具身智能 (embodied intelligence) 置于机器人研究的前沿。

文章图片
#机器人#人工智能#计算机视觉 +2
MetaUrban:城市空间中具身智能的一个模拟平台

24年7月来自UCLA的论文“MetaUrban: A Simulation Platform for Embodied AI in Urban Spaces”。

文章图片
#人工智能#机器学习#机器人
    共 990 条
  • 1
  • 2
  • 3
  • 99
  • 请选择