logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

开源发布 | 从青龙Nano到青龙Mini:共建开源生态,首次亮相产教融合场景

随着具身智能逐步进入工程化阶段,强化学习被越来越多的技术团队视为连接算法能力与机器人实机行为的重要技术路径,而随着实际应用不断展开,机器人平台本身的设计方式对强化学习能否顺利展开的影响无法让人忽视:过于复杂的系统往往放大训练难度,而过于简化的结构又难以承载真实的动力学问题。国地中心 CTO 邢伯阳介绍,这种能够陪伴开发者从第一次成功行走,到逐步探索更复杂行为的连续性,使青龙Mini成为一个适合长期

文章图片
#开源#人工智能
开源发布 | 从青龙Nano到青龙Mini:共建开源生态,首次亮相产教融合场景

随着具身智能逐步进入工程化阶段,强化学习被越来越多的技术团队视为连接算法能力与机器人实机行为的重要技术路径,而随着实际应用不断展开,机器人平台本身的设计方式对强化学习能否顺利展开的影响无法让人忽视:过于复杂的系统往往放大训练难度,而过于简化的结构又难以承载真实的动力学问题。国地中心 CTO 邢伯阳介绍,这种能够陪伴开发者从第一次成功行走,到逐步探索更复杂行为的连续性,使青龙Mini成为一个适合长期

文章图片
#开源#人工智能
技术视界 | 打造人形机器人数据集的现实挑战与技术解法:国地中心的工程实践分享

"OpenLoong" 是全球领先的人形机器人开源社区,秉承技术驱动与开放透明的价值观,致力于汇聚全球开发者推动人形机器人产业发展。由国家地方共建人形机器人创新中心发起的 OpenLoong 项目,是业内首个全栈、全尺寸的开源人形机器人项目,有着人人都可以打造属于自己的机器人的美好愿景,旨在推动人形机器人全场景应用、助力具身智能时代的到来。若您有更多想法或问题,欢迎,在论坛发起讨论,与国地中心的技

文章图片
#机器人
数据开源 | 白虎-VTouch 正式开源:首个跨本体视触觉多模态数据集

摘要:国家地方共建人形机器人创新中心联合纬钛科技发布全球首个大规模跨本体视触觉多模态数据集"白虎-VTouch",包含60,000分钟数据(首批6,000分钟已开源)。该数据集整合视触觉传感器、RGB-D视觉与机器人位姿等多模态信息,覆盖4大应用领域380+任务类型,重点填补了具身智能在触觉维度的数据空白。通过"矩阵式"任务构建和跨层次标注体系,为物理交互研

#开源
数据开源 | 白虎-VTouch 正式开源:首个跨本体视触觉多模态数据集

摘要:国家地方共建人形机器人创新中心联合纬钛科技发布全球首个大规模跨本体视触觉多模态数据集"白虎-VTouch",包含60,000分钟数据(首批6,000分钟已开源)。该数据集整合视触觉传感器、RGB-D视觉与机器人位姿等多模态信息,覆盖4大应用领域380+任务类型,重点填补了具身智能在触觉维度的数据空白。通过"矩阵式"任务构建和跨层次标注体系,为物理交互研

#开源
技术观察 | 上海电气中央研究院的破局思考:人形机器人如何兼得“灵活”与“精度”?

本文将围绕王韬涵博士的分享,梳理其在“精度与灵活性协同”“具身智能闭环训练”“开源仿真平台构建”等方面的核心观点与实践路径,为关注工业机器人智能化升级的研究者、工程师与行业伙伴,提供一个可供借鉴的技术框架与落地参考。

文章图片
#机器人#人工智能
技术视界 | VLA:教AI“看懂”并“动手”的魔法

从“看懂”牌局到“动手”出牌,整个过程在同一个智能体系中一气呵成,这正是VLA所代表的革命性跨越。本文将围绕VLA技术,层层递进地阐述了其突破性、工作原理与未来方向,为开发者理解技术演进脉络、把握未来走向提供清晰的技术图景。

文章图片
#人工智能
技术视界 | 具身感知与生成大模型:开启智能新时代 (下)

作为全球第一款数字人动作生成和控制具身大模型,MotionGPT 借鉴了 ChatGPT 语言模型的经验上,在包括文本驱动的动作生成、动作描述、动作预测和动作衔接等多个动作任务上拥有出色的表现。未来的机器人、虚拟数字人乃至混合现实中的智能体,将不再是冷冰冰的命令执行器,而是能理解意图、感知环境、自主行动的真正“智能存在”。”为基础,构建闭环仿真训练体系,同时推动从“形似”向“神似”过渡,构建基于“

文章图片
#人工智能
最新发布 | “龙跃”(MindLoongGPT)大模型正式发布!龙跃而起,推动中国方案走向全球智能体前沿

人形机器人如何像人类一样自然运动?如何通过语言指令让机器人理解并执行复杂动作?这一直是行业亟待突破的技术瓶颈。国地中心联合复旦大学未来信息创新学院研发的“

文章图片
#人工智能#机器人
RoboBrain 与大小脑协作:通向可落地具身智能的新路径探索

我们可以通过一个例子来深入理解:当向模型发出“我渴了”这样抽象的语言指令时,大脑并不会简单地匹配某一个固定动作,而是会先结合当前视觉输入,对环境进行整体理解,例如在任务规划过程中,模型会识别桌面上存在多个可用杯子,并基于语义与常识推理,选择“重新拿一个新的纸杯去接水”这一更合理的操作方案。从技术目标上看,行业并未放弃对“大小脑模型”的追求,这一模型的目标也正被更清晰地重新定义:如何在统一系统中,让

文章图片
#人工智能#机器人#开源
    共 26 条
  • 1
  • 2
  • 3
  • 请选择