
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
从2025年3月首款模型GR00T N1发布,到 2026 年 4 月 N1.7 以 Apache 2.0 许可全面开放商用。GR00T N系列围绕感知与推理能力、动作控制精度与流畅度、数据利用效率、跨本体与场景适配性持续迭代,逐步实现从基础能力验证到工业级实用化的跨越。

芯驰科技精准布局具身智能领域,推出全栈式芯片解决方案:面向机器人“大脑”的SoC、面向“小脑”的智控SoC,以及面向激光雷达、机器视觉、运动中枢、灵巧手和关节模组的E3-R系列MCU。其中,D9-Max小脑芯片和E3119-R关节模组MCU已可提供完整的软硬件开发套件,支持客户快速落地研发。

1、什么是深度学习1.1 基本概念深度学习即深度神经网络学习,其概念源于人工神经网络的研究,是一种特殊的机器学习形式;其目的在于建立和模拟人脑进行分析学习的神经网络,通过模仿人脑的接受和反馈机制来解释数据;深度学习整个过程就是数据采集、数据处理、数据训练和数据优化,最后形成高准确率的识别分类模型;图1. 深度学习、机器学习及人工智能三者关系1.2 多层感知器多层感知器包含三种类型的神经网络层:输入
π0.7是基于π0.6的VLA架构与MEM记忆系统构建,核心升级是将上下文从简短任务文本扩展为更丰富的多模态信息:更具表达力的语言指令、交互片段元数据(速度、质量和失误标记等)以及视觉子目标图像。这使得模型能在多样化甚至非最优的数据上训练并持续提升性能。

尽管RT-1 在多项关键指标上表现突出:以 97% 成功率执行超 700 条指令,在新任务、物体与环境的泛化能力上超越已发布基线模型;能有效融合模拟环境与异构机器人形态的数据,且在不削弱原任务性能的前提下增强新场景适应性;还可在SayCan框架中完成长达50步的长时程任务 —— 但该模型仍存在一定局限性。

5家主流的具身智能开源数据集:Open X-Embodiment、RoboMIND、AgiBot World、RH20T和AIRO。

RH20T数据集规模:数据集总数据量达20TB,包含超 11 万个高接触度机器人操作序列与等量的11万个人类演示视频,共计超 5000 万帧图像。该数据集包含视觉、触觉、音频等多模态信息,覆盖147种任务与42种技能。

北京大学等机构提出Being-H0模型,通过物理指令微调范式突破灵巧操作型视觉-语言-动作(VLA)模型的数据瓶颈。该研究创新性地利用大规模人类视频数据进行预训练,构建包含250万指令样本的UniHand数据集,采用部件级运动Token化技术实现毫米级精度。通过物理空间对齐和后训练适配,模型成功将人类手部动作迁移至机器人操作任务。

苏治中系统介绍了地平线在具身智能领域的关键技术布局,涵盖四大核心模块:具身智能仿真数据引擎 EmbodiedGen、人形全身运控基础模型 HoloMotion、视觉语言导航模型 VLN,以及通用操作基础模型 HoloBrain。此外,他也重点分享了地平线推出的具身智能学习框架——RoboOrchard。

Gemini Robotics模型在精细的柔性布料操作、铰接物体精准操控等多样化任务中展现突出能力。研究人员把该模型能力突出的原因归结于:强大的视觉语言模型,具备增强的具身推理能力;针对机器人任务,采用大规模机器人动作数据与多样化的非机器人数据的特定训练方案;专为低延迟机器人控制设计的独特架构。








