
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
视觉语言导航 之 人机交互主动对话导航新基准VL-LN Benchmark
本文提出 IIGN 任务与 VL-LN 基准,首次系统研究具备主动对话能力的具身导航智能体如何在房屋级长程环境中通过"主动提问"解决指令歧义、提升实例定位精度。arxiv研究领域:具身智能(Embodied AI)× 视觉-语言导航(VLN)× 人机对话arxiv核心任务:Interactive Instance Goal Navigation(IIGN)——在模糊类别指令下,智能体需边导航边向
视觉语言导航 之 人机交互主动对话导航新基准VL-LN Benchmark
本文提出 IIGN 任务与 VL-LN 基准,首次系统研究具备主动对话能力的具身导航智能体如何在房屋级长程环境中通过"主动提问"解决指令歧义、提升实例定位精度。arxiv研究领域:具身智能(Embodied AI)× 视觉-语言导航(VLN)× 人机对话arxiv核心任务:Interactive Instance Goal Navigation(IIGN)——在模糊类别指令下,智能体需边导航边向
视觉语言导航 相关工作速览之一
人类在陌生环境中导航时,会结合语义知识(如物体空间分布规律)进行推理。受此启发,Yokoyama等(2023)[1]提出了一种零样本(zero-shot)语义导航方法VLFM,旨在让机器人在未知环境中高效寻找目标物体,。

视觉语言导航 相关工作速览之二
SG-Nav首次通过场景图结构化表示与分层推理,实现了高精度、可解释的零样本导航,为LLM在具身智能中的场景理解提供了新范式[1]。

到底了







