
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
论文提出了RoboSense数据集,针对拥挤和非结构化环境中自主智能体导航的自我中心感知任务的大规模多模态数据集和基准,包含丰富的标注信息和多种任务设置!

论文探讨了具身AI从LLMs到WMs的发展,分析了二者在具身AI中的作用,提出了联合MLLMs与WMs的架构,强调其对复杂任务的重要性,总结了具身AI的应用,并展望了未来研究方向,推动具身AI向通用物理智能发展!

论文提出具身AGI的五级分类体系(L1-L5):从仅能完成单一任务的初级阶段(L1)到能够独立完成开放式任务且行为类似人类的高级阶段(L5),为具身AI的发展提供了明确的里程碑!

FINDINGDORY用于评估具身智能体在长期任务中的记忆能力,通过构造需要回忆过去交互经验的多样化任务,揭示了现有视觉语言模型(VLM)在处理长时序记忆和复杂推理时的局限性!

论文提出视觉语言导航系统FSR-VLN,通过结合分层多模态场景图(HMSG)和快慢速推理(FSR)机制,在真实世界的长距离导航任务中实现了高成功率和低响应时间,显著优于现有方法,并展示了其在人形机器人上的应用潜力!

论文指出,尽管 VLTNet 在 L-ZSON 任务中取得了显著的性能提升,但仍存在一些局限性,例如在处理某些复杂的自然语言指令时可能还需要进一步优化模型的推理过程和语义理解能力。

论文提出了基于课程学习的 Transformer 强化学习算法CTSAC,通过集成 Transformer 到SAC框架中,利用历史信息增强机器人的环境推理能力,并采用定期复习的课程学习策略提高训练效率和泛化性能!

本文综述了通过物理模拟器和世界模型学习具身智能的最新进展,提出了智能机器人的五级分级标准,并分析了物理模拟器与世界模型在提升机器人自主性、适应性和泛化能力中的作用!

提出了基于逆强化学习的学习型视觉规划器RAPID,用于复杂环境中的敏捷无人机飞行,能够在毫秒级生成无碰撞的航点,无需单独的感知、建图和规划模块,可直接应用于现实场景,无需额外训练或调整。

论文提出了一种基于DEPSI环境的AGI评估方法—Tong测试,解决了传统AI评估方法的局限性。通过无限任务生成、价值和能力导向的评估,Tong测试能够全面评估AGI的能力和价值。该方法为AGI的开发和标准化提供了一个实用路径,推动了AGI领域的发展。








