logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

通过预言来强化动作策略

25年11月来自复旦、上海创新研究院和ASU Logos Robotics Lab 的论文“Reinforcing Action Policies by Prophesying”。视觉-语言-动作(VLA)策略在协调语言、感知和机器人控制方面表现出色。然而,大多数VLA策略仅通过模仿进行训练,这会导致过拟合演示数据,并且在分布偏移的情况下稳定性较差。强化学习(RL)直接优化任务奖励,从而解决这种协

文章图片
#计算机视觉#机器学习#深度学习 +2
RoboMemory:一种受大脑启发的多记忆智体框架,用于物理具身系统中的交互式环境学习

25年10月来自深圳未来智联网络研究院(FNii-Shenzhen)、香港中文大学SSE、香港中文大学(深圳)、香港大学、南洋理工、哈工大(深圳)、哈尔滨工程大学和 Infused Synapse AI 的论文“RoboMemory: A Brain-inspired Multi-memory Agentic Framework for Interactive Environmental Lear

文章图片
#人工智能#计算机视觉#深度学习 +2
RoboMemory:一种受大脑启发的多记忆智体框架,用于物理具身系统中的交互式环境学习

25年10月来自深圳未来智联网络研究院(FNii-Shenzhen)、香港中文大学SSE、香港中文大学(深圳)、香港大学、南洋理工、哈工大(深圳)、哈尔滨工程大学和 Infused Synapse AI 的论文“RoboMemory: A Brain-inspired Multi-memory Agentic Framework for Interactive Environmental Lear

文章图片
#人工智能#计算机视觉#深度学习 +2
智体人工智能安全:威胁、防御、评估和未解决的挑战(上)

25年10月来自南佛罗里达大学的论文“Agentic AI Security: Threats, Defenses, Evaluation, and Open Challenges”。由大语言模型 (LLM) 驱动、具备规划、工具使用、记忆和自主性等能力的智体人工智能系统,正逐渐成为强大而灵活的自动化平台。它们能够在网络、软件和物理环境中自主执行任务,这带来新的、更显著的安全风险,这些风险既不同于

文章图片
#人工智能#安全#机器学习 +2
灵巧和具身机器人操作的发展与挑战:综述

25年7月来自浙大的论文“The Developments and Challenges towards Dexterous and Embodied Robotic Manipulation: A Survey”。实现类人灵巧的机器人操作一直是机器人领域的核心目标和关键挑战。人工智能(AI)的发展推动机器人操作的快速进步。本文概述机器人操作从机械编程到具身智能的演变历程,以及从简单夹爪到多指灵巧

文章图片
#机器人#机器学习#深度学习 +1
Hi Robot:基于分层视觉-语言-动作模型的开放式指令跟随

25年7月来自 PI、斯坦福和伯克利分校的论文“Hi Robot: Open-Ended Instruction Following with Hierarchical Vision-Language-Action Models”。能够在开放世界环境中执行各种不同任务的通用机器人不仅必须能够推理完成目标所需的步骤,还必须能够处理任务执行过程中的复杂指令、提示甚至反馈。复杂的指令(例如,“你能给我做

文章图片
#人工智能#机器人#机器学习 +2
跨尺度大语言模型驱动的空间智能:综述

25年4月来自清华和芬兰赫尔辛基大学的论文“A Survey of Large Language Model-Powered Spatial Intelligence Across Scales: Advances in Embodied Agents, Smart Cities, and Earth Science”。过去一年,大语言模型(LLM)的发展使空间智能成为关注焦点,其中基于视觉的具身

文章图片
#语言模型#人工智能#自然语言处理 +2
通才机器人策略中的捷径学习:数据集多样性和碎片化的作用

25年8月来自中科大和同济大学的论文“Shortcut Learning in Generalist Robot Policies: The Role of Dataset Diversity and Fragmentation”。在 Open X-Embodiment (OXE) 等大规模数据集上训练的通才机器人策略在各种任务中都表现出色。然而,它们通常难以在其训练数据的分布之外进行泛化。本文研

文章图片
#机器人#深度学习#机器学习 +1
基础模型能为机器人学习操纵带来什么:综述

24年12月来自北京 Samsung R&D 中心、北邮、清华和汉堡大学的论文“What Foundation Models can Bring for Robot Learning in Manipulation : A Survey”。实现通用机器人(universal robot)是研究人员的最终目标。然而,实现这一目标的一个关键障碍在于机器人根据不同的任务在非结构化环境中操纵目标的能力。基

文章图片
#机器人#语言模型#计算机视觉 +2
基于大语言模型的四足机器人长距离运动和操作

25年3月来自清华、上海姚期智研究院和伯克利分校的论文“Long-horizon Locomotion and Manipulation on a Quadrupedal Robot with Large Language Models”。本文提出一种基于大语言模型(LLM)的系统,旨在赋予四足机器人超越短期运动的长期任务解决能力。四足机器人的长期任务极具挑战性,因为它们既需要对问题语义有深刻的理

文章图片
#语言模型#机器人#人工智能 +3
    共 762 条
  • 1
  • 2
  • 3
  • 77
  • 请选择