logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

中农农业机器人具身导航最新突破!T-araVLN:农业机器人视觉语言导航的指令翻译器

论文提出T-araVLN方法,通过引入指令翻译模块将原始指令转化为精炼精确的形式,显著提高了农业机器人在视觉语言导航任务中的成功率和导航精度,展示了其在农业领域的先进性能!

文章图片
#人工智能
南航无人机大规模户外环境视觉导航框架!SM-CERL:基于语义地图与认知逃逸强化学习的无人机户外视觉导航

本文提出的SM-CERL框架通过构建语义地图和认知逃逸机制,有效解决了无人机在大规模户外环境中视觉导航中的部分可观察性和局部最优陷阱问题,显著提升了导航性能。

文章图片
#无人机#人工智能#深度学习
清华大学视觉空间智能新突破!Spatial-MLLM:提升多模态大语言模型的视觉空间智能能力

Spatial-MLLM通过结合语义2D编码器和结构感知的空间编码器,能够从纯2D视觉输入中有效实现空间理解和推理!

文章图片
#语言模型#人工智能#自然语言处理
低成本、高泛化能力的无人机自主飞行!VLM-Nav:基于单目视觉与视觉语言模型的无地图无人机导航

VLM-Nav 通过结合深度估计和视觉语言模型,实现了在复杂未知环境中的高效自主导航!

文章图片
#无人机#人工智能#深度学习
无人机如何自主侦察?UEAVAD:基于视觉的无人机主动目标探测与导航数据集

论文发布了一个新的数据集UEVAVD,包含不同地形和遮挡条件下的多视角航拍图像。通过这些观测数据的组合,可以模拟无人机在轨迹上连续观测的过程。论文提出的IBE-MAP方法通过引入先验知识改进了原始MAP方法,使策略网络能够学习到更好的状态表示,从而提高了智能体在测试环境中的泛化能力。

文章图片
#无人机
ICRA-2025 | 具身导航如何跨越地形障碍?SARO:通过视觉语言模型实现地形穿越

论文提出了一个用于3D环境视觉导航的空间感知机器人系统(SARO)。高层模块通过任务分解和闭环子任务执行模块提高了3D场景理解和运动规划能力。低层控制策略PAS是一种新颖的强化学习方法,能够有效地从oracle策略中学习部分策略,促进四足机器人跨越多样化的3D地形。广泛的仿真和真实世界实验展示了整个系统的有效性和鲁棒性以及运动控制策略的性能。

文章图片
#人工智能#机器人#深度学习
ICCV-2025 | 对话协作驱动具身导航!DialNav:远程向导指导下的多轮对话导航

论文介绍了具身对话导航任务 DialNav,该任务通过模拟现实世界中导航智能体与远程向导之间的多轮对话来完成导航目标,并为此收集发布了 RAIN 数据集,同时设计了综合评估基准并进行了实验分析,揭示了任务的关键挑战,旨在推动具身对话导航领域的发展!

文章图片
#人工智能
ICCV-2025 | 对话协作驱动具身导航!DialNav:远程向导指导下的多轮对话导航

论文介绍了具身对话导航任务 DialNav,该任务通过模拟现实世界中导航智能体与远程向导之间的多轮对话来完成导航目标,并为此收集发布了 RAIN 数据集,同时设计了综合评估基准并进行了实验分析,揭示了任务的关键挑战,旨在推动具身对话导航领域的发展!

文章图片
#人工智能
ICCV-2025 | 大模型驱动的认知导航框架!CogNav:面向目标导航的大型语言模型驱动的认知过程建模

论文提出CogNav框架,通过模仿人类的认知过程并利用大型语言模型(LLMs)的推理能力,显著提升了具身智能体在未知环境中进行目标导航(ObjectNav)任务的成功率和效率!

文章图片
#人工智能#机器人
ICCV-2025 | 大模型驱动的认知导航框架!CogNav:面向目标导航的大型语言模型驱动的认知过程建模

论文提出CogNav框架,通过模仿人类的认知过程并利用大型语言模型(LLMs)的推理能力,显著提升了具身智能体在未知环境中进行目标导航(ObjectNav)任务的成功率和效率!

文章图片
#人工智能#机器人
    共 150 条
  • 1
  • 2
  • 3
  • 15
  • 请选择