
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
论文提出T-araVLN方法,通过引入指令翻译模块将原始指令转化为精炼精确的形式,显著提高了农业机器人在视觉语言导航任务中的成功率和导航精度,展示了其在农业领域的先进性能!

本文提出的SM-CERL框架通过构建语义地图和认知逃逸机制,有效解决了无人机在大规模户外环境中视觉导航中的部分可观察性和局部最优陷阱问题,显著提升了导航性能。

Spatial-MLLM通过结合语义2D编码器和结构感知的空间编码器,能够从纯2D视觉输入中有效实现空间理解和推理!

VLM-Nav 通过结合深度估计和视觉语言模型,实现了在复杂未知环境中的高效自主导航!

论文发布了一个新的数据集UEVAVD,包含不同地形和遮挡条件下的多视角航拍图像。通过这些观测数据的组合,可以模拟无人机在轨迹上连续观测的过程。论文提出的IBE-MAP方法通过引入先验知识改进了原始MAP方法,使策略网络能够学习到更好的状态表示,从而提高了智能体在测试环境中的泛化能力。

论文提出了一个用于3D环境视觉导航的空间感知机器人系统(SARO)。高层模块通过任务分解和闭环子任务执行模块提高了3D场景理解和运动规划能力。低层控制策略PAS是一种新颖的强化学习方法,能够有效地从oracle策略中学习部分策略,促进四足机器人跨越多样化的3D地形。广泛的仿真和真实世界实验展示了整个系统的有效性和鲁棒性以及运动控制策略的性能。

论文介绍了具身对话导航任务 DialNav,该任务通过模拟现实世界中导航智能体与远程向导之间的多轮对话来完成导航目标,并为此收集发布了 RAIN 数据集,同时设计了综合评估基准并进行了实验分析,揭示了任务的关键挑战,旨在推动具身对话导航领域的发展!

论文介绍了具身对话导航任务 DialNav,该任务通过模拟现实世界中导航智能体与远程向导之间的多轮对话来完成导航目标,并为此收集发布了 RAIN 数据集,同时设计了综合评估基准并进行了实验分析,揭示了任务的关键挑战,旨在推动具身对话导航领域的发展!

论文提出CogNav框架,通过模仿人类的认知过程并利用大型语言模型(LLMs)的推理能力,显著提升了具身智能体在未知环境中进行目标导航(ObjectNav)任务的成功率和效率!

论文提出CogNav框架,通过模仿人类的认知过程并利用大型语言模型(LLMs)的推理能力,显著提升了具身智能体在未知环境中进行目标导航(ObjectNav)任务的成功率和效率!
