
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
教师策略用PPO算法训练,还能拿到模拟器里的“特权信息”(比如真实根速度、关节位置、地面摩擦系数)——相当于有个“上帝视角”,专门学“怎么精准跟踪运动”。简单说:以前的方法要么“没视觉理解”(MoCap),要么“理解不到位”(文本),要么“理解了但做不到”(传统视频)——提示词是“描述视频里的运动”,让VLM捕捉“动作特征”(比如“人交替把左膝抬到右肘,右膝抬到左肘”)。不用依赖参考运动,跳过po

导读准确预测道路智能体的运动对于自动驾驶的安全性至关重要。当前,现有的数据驱动方法直接预测未来轨迹,缺乏对驾驶行为的充分考虑,限制了可解释性和可靠性。为此,本文引入了一种可解释的、奖励驱动的意图推理器来解决这一问题。实验结果表明,本文所提出的预测器能够生成高置信度、可靠的未来轨迹,同时与现有的最先进模型相比,实现了极具竞争力的性能。道路交通智能体的运动预测对于确保自动驾驶系统的安全性既是一项重大挑
此外,方法还集成了大语言模型(LLM)辅助语义匹配,提出了 SOBB 结构用于精确的尺寸匹配,并构建了基于平面检测的点云配准方法(PDM registration)用于模仿式抓取规划,同时引入了双阶段微调策略以优化最终抓取质量。实验方面,作者使用一个不足100个物体模型的小型数据库,在丰富的新颖物体抓取任务上(包括独立物体和杂乱场景)进行评估,显著优于当前主流方法,在准确率、效率与泛化能力上均取得
©️【深蓝AI】编译论文题目:CoLMDriver: LLM-based Negotiation Benefits Cooperative Autonomous Driving论文作者:Changxing Liu, Genjia Liu, Zijun Wang, Jinchang Yang, Siheng Chen论文地址:https://arxiv.org/abs/2503.08683。

近日,《Science Robotics》期刊上发表了一篇由苏黎世联邦理工学院的Emanuele Aucone和Stefano Mintchev撰写的焦点论文,该研究突破性地提出具身空中物理交互(E-APhI)框架,为飞行机器人从单纯感知观察向主动物理交互的进化指明了方向。这场由具身智能引领的技术变革,本质是对机器人 “智能” 的重新定义 —— 当 “身体” 成为感知与决策的核心载体,飞行机器人正
随着深度学习算法的进步、计算基础设施的发展以及大规模真实世界驾驶数据集的发布,自动驾驶技术取得了显著进展。然而,当前自动驾驶车辆的感知和规划系统主要依赖于其自身的LiDAR传感器和摄像头来检测周围重要物体并规划未来轨迹。这种方法在传感器被遮挡或发生故障时可能会遇到安全关键问题。在这种情况下,自动驾驶车辆无法准确检测所有附近的重要物体,导致后续轨迹规划结果变得不可靠。为了解决这个安全关键问题,近期研

为解决此类问题,基于大语言模型的COT思想,本文提出基于现有的路径规划算法库(如 RRT, APF 方法等)及其对应 API 接口,构建功能完备的工具函数提示体系,通过补充算法功能的语义描述与调用规则,帮助大模型理解算法功能,创建任务目标的功能库。实验时将基于大模型的智能体部署于无人艇地面站,使用的 GPU 为 NVIDIA GeForce RTX 4070,显存容量为 12GB,智能体使用的大模
结果上,它在多项 2D/3D 具身推理基准上取得领先(8B 规模对齐甚至超越更大模型),在模拟器与真实平台上把“语义正确”进一步落实为“可执行的动作”,Mobile Placement/Approach/Go 等原子—复合任务链条也得到验证。面向实际应用,OmniEVA 的按需 3D 与具身约束范式,为“长时序、多约束、端到端”的机器人任务提供了一条可复制的工程路径。通过这套“任务+具身”的强化微
作者认为,这一问题的根源在于缺乏跨任务的统一表述。受到其他领域中基础模型成功经验的启发,作者提出,如果能在大规模、多样化的行为数据上进行预训练,就有可能学习到广泛且可复用的行为知识,并应用于各种下游任务。为了解决这一挑战,作者重新审视了现有系统的设计,并提出一个关键观察:尽管控制模式不同,但这些系统的结果(无论是行走还是跳舞)在本质上都是人形机器人的行为。与以往局限在特定任务或控制模式的方法不同,
这款模型以70亿和320亿参数的两种规格,实现了感知、推理与规划能力的统一,在空间理解、时间决策等核心任务上超越了现有开源与专有模型,为通用具身智能体的发展奠定了里程碑式的基础。未来,随着与Vision-Language-Action(VLA)框架的融合以及机器人操作系统的深度集成,RoboBrain 2.0有望实现"感知-推理-行动"的端到端闭环,让机器人真正理解物理世界的规则,在家庭、工厂、社







