logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

2026年3月,国内具身智能机器人企业融资情况汇总

2026年3月,中国具身智能机器人赛道融资热度持续升温。其中,基础模型层与核心部件层的企业融资规模显著。

文章图片
#机器人#人工智能
2026年3月,国内具身智能机器人企业融资情况汇总

2026年3月,中国具身智能机器人赛道融资热度持续升温。其中,基础模型层与核心部件层的企业融资规模显著。

文章图片
#机器人#人工智能
RL Token:破解 VLA “最后一厘米”精度难题,在线强化学习实现机器人精准操控

Physical Intelligence(PI)团队在最新研究论文《RL Token: Bootstrapping Online RL with Vision-Language-Action Models》中,提出了 RL Token(RLT)方法。该方法通过构建 VLA 与轻量级强化学习之间的紧凑接口,仅需数小时真实交互数据,即可让机器人完成精密操作的在线优化,有效解决了通用模型难以兼顾泛化性

文章图片
#机器人#人工智能
智元机器人赛事官方解读:双赛道升级,以开源生态共推具身智能落地

智元 Genie 业务部生态及解决方案总监沈咏剑表示,本届赛事是去年赛事的全面迭代升级,在赛事设计、工具链层面和选手支持方面均做了优化。一方面旨在降低开发者参赛门槛、提升参与体验,另一方面也是希望能够助力参与者在赛事实践中深化对具身智能产业的理解与认知。

文章图片
#机器人#开源
智元机器人赛事官方解读:双赛道升级,以开源生态共推具身智能落地

智元 Genie 业务部生态及解决方案总监沈咏剑表示,本届赛事是去年赛事的全面迭代升级,在赛事设计、工具链层面和选手支持方面均做了优化。一方面旨在降低开发者参赛门槛、提升参与体验,另一方面也是希望能够助力参与者在赛事实践中深化对具身智能产业的理解与认知。

文章图片
#机器人#开源
谷歌具身智能VLA模型RT-2—— 将互联网知识迁移至机器人控制

视觉语言模型的语义推理、问题解决和视觉理解能力对需要在真实环境中执行多种任务的通用机器人而言极具价值。然而,机器人应如何获取此类能力尚不明确。

文章图片
#机器人#人工智能
谷歌具身智能VLA大模型 —— Gemini Robotics : 将人工智能带入到物理世界

Gemini Robotics模型在精细的柔性布料操作、铰接物体精准操控等多样化任务中展现突出能力。研究人员把该模型能力突出的原因归结于:强大的视觉语言模型,具备增强的具身推理能力;针对机器人任务,采用大规模机器人动作数据与多样化的非机器人数据的特定训练方案;专为低延迟机器人控制设计的独特架构。

文章图片
#人工智能
详解具身智能开源数据集:RH20T

RH20T数据集规模:数据集总数据量达20TB,包含超 11 万个高接触度机器人操作序列与等量的11万个人类演示视频,共计超 5000 万帧图像。该数据集包含视觉、触觉、音频等多模态信息,覆盖147种任务与42种技能。

文章图片
详解具身智能机器人开源数据集:RoboMIND

国内具身智能机器人开源数据集:RoboMIND。目前,数据集包含10.7万条机器人轨迹(任务成功的轨迹),涵盖479种任务、96种物体类别和38种操作技能;

文章图片
详解具身智能开源数据集:ARIO(All Robots In One)

ARIO数据集规模:共有258 个场景系列(Series),321064 个任务(tasks),3033188个轨迹片段(Episodes)。这些数据来自3种方式:真实世界采集 +仿真模拟生成+开源数据集转换。

文章图片
    共 72 条
  • 1
  • 2
  • 3
  • 8
  • 请选择