logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

DexGraspVLA:面向通用灵巧抓取的视觉-语言-动作框架

25年3月来自北大、北大-灵初智能(PsiBot)联合实验室、香港科技大学广州分校的论文“DexGraspVLA: A Vision-Language-Action Framework Towards General Dexterous Grasping”。灵巧抓取仍然是机器人技术中一个基本但具有挑战性的问题。通用机器人必须能够在任意场景中抓取各种物体。然而,现有研究通常依赖于特定假设,例如单物体

文章图片
#人工智能#计算机视觉#语言模型 +2
LeRobot 实现的 PI 0 策略

PI0(π0)是 LeRobot 框架中用于通用机器人控制的视觉-语言-动作流模型。它结合了视觉感知、语言理解和流匹配技术,能够基于多模态输入(图像、语言指令和机器人状态)生成精确的机器人动作。在此介绍 PI0 策略系统的架构、实现和使用方法。

文章图片
#机器人#计算机视觉#深度学习 +1
VIRAL:用于人形机器人运动操控的大规模视觉模拟-到-现实迁移

25年11月来自Nvidia、CMU、UC Berkeley和香港中文大学的论文“VIRAL: Visual Sim-to-Real at Scale for Humanoid Loco-Manipulation”。人形机器人实际部署的一大障碍是缺乏自主移动操作技能。VIRAL,一个视觉化的仿真-到-真实框架,它完全在仿真环境中学习人形机器人的移动操作,并将其零样本部署到真实硬件上。VIRAL 采

文章图片
#机器人#深度学习#机器学习 +2
缩小基于梯度规划的世界模型中训练集与测试集差距

25年12月来自哥伦比亚大学和NYU的论文"Closing the Train-Test Gap in World Models for Gradient-based Planning"。世界模型与模型预测控制(MPC)相结合,可以在大规模专家轨迹数据集上进行离线训练,并在推理时实现对各种规划任务的泛化。与依赖缓慢搜索算法或迭代精确求解优化问题的传统MPC程序相比,基于梯度的规划提供一种计算效率更

文章图片
#人工智能#深度学习#机器学习 +1
GR-RL:实现灵巧精准的长视界机器人操作

25年12月来自字节SEED的论文“GR-RL: Going Dexterous and Precise for Long-Horizon Robotic Manipulation”。GR-RL,一个机器人学习框架,它将通用的视觉-语言-动作(VLA)策略转化为能够胜任长视界灵巧操作的高效专家。现有VLA策略的核心假设是人类示范的最优性。然而,在高度灵巧和精确的操作任务中,人类示范往往存在噪声且并

文章图片
#机器人#机器学习#计算机视觉 +2
视觉落地研究的综述

24年12月来自中科院自动化所、深圳鹏城实验室和中科院大学的论文“Towards Visual Grounding: A Survey”。视觉落地(visual grounding)又称为参考表达理解和短语落地。它涉及根据给定的文本描述在图像中定位数个特定区域。此任务的目标是模拟社交对话中普遍存在的参考关系,使机器具备类似人类的多模态理解能力。因此,它在各个领域都有广泛的应用。然而,自 2021

文章图片
#语言模型#人工智能#计算机视觉 +2
RL-100:基于现实世界强化学习的高性能机器人操作

25年10月来自上海姚期智研究院、上海交大、香港大学、清华大学、北卡大学、CMU和中科院大学的论文“RL-100: Performant Robotic Manipulation with Real-World Reinforcement Learning”。在家庭和工厂中,现实世界中的机器人操控要求可靠性、效率和稳健性接近甚至超越熟练的人类操作员。RL-100,是一个基于监督学习训练的扩散视觉运

文章图片
#机器人#机器学习#深度学习 +1
LeRobot的数据集系统(下)

LeRobot 的数据集系统提供了一个强大的框架,用于管理用于训练、评估和推理的机器人数据。本文介绍 LeRobot 数据集组件的架构和使用方法,重点介绍了机器人数据的存储、访问和处理方式。

文章图片
#机器人#计算机视觉#深度学习 +2
Hugging Face 中 LeRobot 使用的入门指南

本页面提供 LeRobot 的快速入门指南,涵盖如何加载数据集、评估预训练策略以及训练您自己的模型。

文章图片
#人工智能#计算机视觉#机器学习 +1
LeRobot的数据集系统(上)

LeRobot 的数据集系统提供了一个强大的框架,用于管理用于训练、评估和推理的机器人数据。本文介绍 LeRobot 数据集组件的架构和使用方法,重点介绍了机器人数据的存储、访问和处理方式。

文章图片
#机器人#计算机视觉#深度学习 +2
    共 733 条
  • 1
  • 2
  • 3
  • 74
  • 请选择