
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
2026年3月,中国具身智能机器人赛道融资热度持续升温。其中,基础模型层与核心部件层的企业融资规模显著。

2026年3月,中国具身智能机器人赛道融资热度持续升温。其中,基础模型层与核心部件层的企业融资规模显著。

Physical Intelligence(PI)团队在最新研究论文《RL Token: Bootstrapping Online RL with Vision-Language-Action Models》中,提出了 RL Token(RLT)方法。该方法通过构建 VLA 与轻量级强化学习之间的紧凑接口,仅需数小时真实交互数据,即可让机器人完成精密操作的在线优化,有效解决了通用模型难以兼顾泛化性

智元 Genie 业务部生态及解决方案总监沈咏剑表示,本届赛事是去年赛事的全面迭代升级,在赛事设计、工具链层面和选手支持方面均做了优化。一方面旨在降低开发者参赛门槛、提升参与体验,另一方面也是希望能够助力参与者在赛事实践中深化对具身智能产业的理解与认知。

智元 Genie 业务部生态及解决方案总监沈咏剑表示,本届赛事是去年赛事的全面迭代升级,在赛事设计、工具链层面和选手支持方面均做了优化。一方面旨在降低开发者参赛门槛、提升参与体验,另一方面也是希望能够助力参与者在赛事实践中深化对具身智能产业的理解与认知。

视觉语言模型的语义推理、问题解决和视觉理解能力对需要在真实环境中执行多种任务的通用机器人而言极具价值。然而,机器人应如何获取此类能力尚不明确。

Gemini Robotics模型在精细的柔性布料操作、铰接物体精准操控等多样化任务中展现突出能力。研究人员把该模型能力突出的原因归结于:强大的视觉语言模型,具备增强的具身推理能力;针对机器人任务,采用大规模机器人动作数据与多样化的非机器人数据的特定训练方案;专为低延迟机器人控制设计的独特架构。

RH20T数据集规模:数据集总数据量达20TB,包含超 11 万个高接触度机器人操作序列与等量的11万个人类演示视频,共计超 5000 万帧图像。该数据集包含视觉、触觉、音频等多模态信息,覆盖147种任务与42种技能。

国内具身智能机器人开源数据集:RoboMIND。目前,数据集包含10.7万条机器人轨迹(任务成功的轨迹),涵盖479种任务、96种物体类别和38种操作技能;

ARIO数据集规模:共有258 个场景系列(Series),321064 个任务(tasks),3033188个轨迹片段(Episodes)。这些数据来自3种方式:真实世界采集 +仿真模拟生成+开源数据集转换。








