logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

CVPR-2025 | 上交拥挤无序环境下的具身导航最新基准!RoboSense:以机器人为中心的具身感知与导航大规模数据集

论文提出了RoboSense数据集,针对拥挤和非结构化环境中自主智能体导航的自我中心感知任务的大规模多模态数据集和基准,包含丰富的标注信息和多种任务设置!

文章图片
#机器人#人工智能#深度学习
清华世界模型与具身智能融合全面综述!具身智能:从LLMs到世界模型

论文探讨了具身AI从LLMs到WMs的发展,分析了二者在具身AI中的作用,提出了联合MLLMs与WMs的架构,强调其对复杂任务的重要性,总结了具身AI的应用,并展望了未来研究方向,推动具身AI向通用物理智能发展!

文章图片
#人工智能#机器人
迈向通用具身智能:具身智能的综述与发展路线

论文提出具身AGI的五级分类体系(L1-L5):从仅能完成单一任务的初级阶段(L1)到能够独立完成开放式任务且行为类似人类的高级阶段(L5),为具身AI的发展提供了明确的里程碑!

文章图片
#人工智能#深度学习#机器人
长期记忆在导航与操作任务中的评估!FindingDory:具身智能体记忆能力评估基准测试

FINDINGDORY用于评估具身智能体在长期任务中的记忆能力,通过构造需要回忆过去交互经验的多样化任务,揭示了现有视觉语言模型(VLM)在处理长时序记忆和复杂推理时的局限性!

文章图片
#人工智能#机器人#深度学习
地平线机器人具身导航快慢推理新探索!FSR-VLN:基于分层多模态场景图快慢推理的视觉语言导航

论文提出视觉语言导航系统FSR-VLN,通过结合分层多模态场景图(HMSG)和快慢速推理(FSR)机制,在真实世界的长距离导航任务中实现了高成功率和低响应时间,显著优于现有方法,并展示了其在人形机器人上的应用潜力!

文章图片
#机器人#人工智能
ICPR-2025 | 让机器人在未知环境中 “听懂” 指令精准导航!VLTNet:基于视觉语言推理的零样本目标导航

论文指出,尽管 VLTNet 在 L-ZSON 任务中取得了显著的性能提升,但仍存在一些局限性,例如在处理某些复杂的自然语言指令时可能还需要进一步优化模型的推理过程和语义理解能力。

文章图片
#机器人#人工智能#深度学习
ICRA-2025 | 机器人具身探索导航新策略!CTSAC:基于课程学习Transformer SAC算法的目标导向机器人探索

论文提出了基于课程学习的 Transformer 强化学习算法CTSAC,通过集成 Transformer 到SAC框架中,利用历史信息增强机器人的环境推理能力,并采用定期复习的课程学习策略提高训练效率和泛化性能!

文章图片
#机器人#人工智能
南京大学具身机器人万字长文全面综述!从物理模拟器和世界模型中学习具身智能

本文综述了通过物理模拟器和世界模型学习具身智能的最新进展,提出了智能机器人的五级分级标准,并分析了物理模拟器与世界模型在提升机器人自主性、适应性和泛化能力中的作用!

文章图片
#人工智能#深度学习#机器人
RAPID:基于逆强化学习的无人机视觉导航鲁棒且敏捷规划器

提出了基于逆强化学习的学习型视觉规划器RAPID,用于复杂环境中的敏捷无人机飞行,能够在毫秒级生成无碰撞的航点,无需单独的感知、建图和规划模块,可直接应用于现实场景,无需额外训练或调整。

文章图片
#无人机#人工智能
北大AGI与具身智能评估新范式!Tong测试:基于动态具身物理和社会互动的评估标准

论文提出了一种基于DEPSI环境的AGI评估方法—Tong测试,解决了传统AI评估方法的局限性。通过无限任务生成、价值和能力导向的评估,Tong测试能够全面评估AGI的能力和价值。该方法为AGI的开发和标准化提供了一个实用路径,推动了AGI领域的发展。

文章图片
#人工智能#深度学习
    共 189 条
  • 1
  • 2
  • 3
  • 19
  • 请选择