手提30公斤重物、还能拧螺丝、颠勺,全能人形机器人灵宝“CASBOT 01”来了!
想象一下,如果拥有一款人形机器人,你会让它来做什么?随着具身智能时代的到来,各大科技公司纷纷加大了对人形机器人的研发投入,让很多人想象中的场景逐渐成为现实。然而,市场上产品虽多,但真正能够从科研成果转化为实际应用的机器人却寥寥无几。就在 11 月 13 日,成立仅有 300 多天的灵宝CASBOT正式发布了其首款人形机器人——“CASBOT 01”,成为人形机器人赛道的重要参与者。不同于行业中已有
想象一下,如果拥有一款人形机器人,你会让它来做什么?
随着具身智能时代的到来,各大科技公司纷纷加大了对人形机器人的研发投入,让很多人想象中的场景逐渐成为现实。然而,市场上产品虽多,但真正能够从科研成果转化为实际应用的机器人却寥寥无几。
就在 11 月 13 日,成立仅有 300 多天的灵宝CASBOT正式发布了其首款人形机器人——“CASBOT 01”,成为人形机器人赛道的重要参与者。不同于行业中已有的人形机器人产品,CASBOT 01 在功能和设计上做了多项创新和突破。它不仅能够颠勺做饭:
还能拧螺丝、换灯泡:
帮忙收拾家务、整理衣柜:
闲暇之余,也能弹弹钢琴,陶冶情操:
出场即带来操作如此丝滑的机器人,其背后必然离不开核心团队的大力支持。深入挖掘这支核心团队,我们发现其成员不乏有来自中国科学院自动化研究所、清华大学、北京理工大学等知名高校和研究机构。
时下,在行业中已有特斯拉“擎天柱”、波士顿 Atlas等人形机器人的激烈竞争下,面对外界“现在做机器人是否太迟了”的质疑声,灵宝 CASBOT 联合创始人兼首席运营官张淼在发布会上坦言,「要做出一个应用级的人形机器人产品其实非常的不容易,我们认为一个产品必须建立在真实的需求基础上,才有规模化商用的可能。这也是灵宝团队在成立之初就已经考虑清楚的事情。我们希望我们的机器人能够在那些高重复、低成本、无意义的作业流水线中全力以赴,协助人们更高效地生产,创造更多价值。我们希望打造一个智创新物种,从而塑造一个智慧共生的新世界。」
那么,为什么 CASBOT 01 能够胜任这些工作?在这场“生而为(wéi & wèi)人”的发布会上,灵宝团队从机械设计、具身类脑、操作能力等多个软硬件技术维度进行了全面的解析与分享。
身高 179cm、体重 60kg 的人形机器人——CASBOT 01
相较而言,CASBOT 01 要比其他机器人更像“人”,身高达 179cm,体重 60kg,如同一个正常成年人的身形。
在本体设计上,CASBOT 01 拥有的:
- 头部具有两个自由度,配备了先进的雷达、相机及显示屏,能够实现视觉和听觉的双重交互。
- 上身集成了高能量密度电池和核心控制器单元,确保整机续航能力超过 4 小时和高效的运算能力。标配双电池,快拆背包式的结构,单电池能够实现 30 分钟的有效快充。
- CASBOT 01 的单腿有 6 个自由度,现有构型能实现类似人类的运动范围,部分关节位置可以满足 360 度及更大的运动空间,可以像人一样在不同地形实现平衡行走。
- 在人形机器人的关节设计上,灵宝 CASBOT 自主研发了包括行星、谐波以及直线三大系列一体化关节,峰值扭矩密度最高可达 207Nm/kg,关节效率超80%。该团队表示,CASBOT 01 的关节使用基于电流或传感器的力控优化策略,辅以模型跟踪控制,采用振动抑制、惯量辨识、摩擦补偿及增益自整定等技术,实现高精度的力矩环控制效果。
此外,其内部还搭载了高达 550T 的 AI 算力单元,结合以上的 RGBD 相机、激光雷达和 IMU 等传感器,机器人本体能够完成实时视觉感知计算。
不过,一款人形机器人的构建远非想象中那么简单。这一点,灵宝 CASBOT 团队深有感受。其在发布会上表示,仅在机械结构设计部分,他们起步便遇到了不少的挑战,譬如,该如何平衡机器人超大的运动范围和造型美观度之间的矛盾;又该怎样控制带宽对结构刚度的要求,因为双足机器人的应用场景对轻量化和质心位置都有较高的要求。
经过多次优化,灵宝 CASBOT 一方面找到了运动范围与机器人美观度之间的平衡点,其也在机器人 ID 设计上,根据人体肌肉的比例构成进行了视觉化分解,并进行了抽象化的概括提炼,将其应用在人形机器人整体结构设计上,使得机器人看起来更加美观。
另一方面为了保证结构刚度,在整机极致减重的情况下,该团队采用了高强度金属材料加工复杂曲面,形成了中间加固的超薄空心腔体,保证了结构的稳定性和抗冲击性。
分层端到端模型的具身类脑
一款优秀的人形机器人,不仅需要漂亮的外观,更重要的是需要有一个聪明的大脑。
在“大脑”层面,灵宝 CASBOT 联合创始人兼 CTO 马世奎表示,具身智能领域不乏有多种技术路线的选择,这些技术各有千秋,但是也都存在一定的不足,例如:
- RT-2 这样大一统的端到端具身大模型,虽然在特定场景下表现出色,但在泛化性和角色频率上存在局限;
- 以视觉大模型为主的分段决策模型 VoxPoser,虽然在通用物品抓取方面表现良好,但在工具操作和技能学习方面则显得力不从心。
- 此外,类似 Mobile Aloha 少样本示教,模仿训练出的技能模型。虽然能够实现高效的技能学习,但泛化性和数据获取成本仍然是问题。
在此背景下,灵宝 CASBOT 选择了一种分层端到端模型技术路线,将算力要求高、决策频率需求低的高级感知和复杂认知决策部分放在云端,将决策频率需求高的技能运动规划和闭环控制放在机器人本体,以此能够结合各种路线的优势同时规避它们的不足。
详细来看,灵宝 CASBOT 的具身智能系统分为三个层次:
- 顶层是多模态大模型,实现多模态人机交互、意图理解和任务拆解规划;
- 中间是多模态灵巧操作大模型,以大语言模型为基座,采用多元混合数据训练而成,实现技能层面的机器人全身运动轨迹规划。大模型之间则通过 AI Agent 以自然语言为接口,进行无缝深度协同;
- 底层是通用运动先验控制模型,确保机器人在跟踪技能动作轨迹的时候,动态平衡、碰撞避免和高精度相对控制。
在模型训练方面,灵宝 CASBOT 团队首先通过深度学习重建高逼真度的数字孪生环境,然后由人类专家进行小样本示教,生成海量的高质量机器人视角的操作数据。这些数据结合大语言模型进行语义化组织,训练出语言条件的端到端多模态灵巧操作大模型。
在模型获得到物理事件后,人类专家针对特殊情况进行实时数字孪生示教,将人类专家数据、仿真合成数据、机器人真实的运行数据进行混合训练,以此来提升灵巧操作大模型的泛化能力。同时,该团队还利用互联网上的海量人类操作视频,通过 real2Sim 的迁移,数据增广和混合训练,进一步提升大模型的性能。
基于以上,让机器人更加智能、灵活和自主。
CASBOT 01 是如何动起来的?
有了“身体”和“大脑”,人形机器人也是时候该动起来了,那么,它究竟是怎么动的?
CASBOT 01 采用了一种结合了对抗运动先验和全身控制(WBC)的运动控制框架,实现了运动的一体化控制。这意味着机器人可以在复杂的环境中稳健地完成全身任务。
具体来说,团队首先在仿真环境中生成与机器人匹配的数字孪生,并赋予其所有物理特性。通过动捕设备采集大量人体运动数据,经过过滤、插值和平滑处理,筛选出最优数据,生成运动先验数据集。这些数据集用于强化学习训练,使机器人能够生成高度拟人的运动控制策略。
再细分到手部,CASBOT 01 的灵巧手是关键。这款 5 指仿生灵巧手,单手重量 800 克,额定负载 5 公斤。该团队分别在结构、感知、控制和算法等方面进行了创新:
- 结构设计:灵巧手采用高紧凑度的整机构型,以及驱-传-感-控系统一体化的仿生设计,能够适应不同负载和尺寸的需求。此外,复合连杆与带传动相结合的模块化传动设计,可实现复杂动作的运动解耦。
- 感知系统:此款灵巧手采用触觉、力觉、视觉的多元感知系统,覆盖指尖、指腹、掌心等区域,实现接近觉、力觉、压觉、滑觉的融合感知。多维传感器的融合确保了灵巧手与物体、环境的准确交互。
- 智能控制:通过多元信息融合反馈,构建灵巧手与物体的交互状态评估模型,实现不同形状和材质物体的稳定抓取。进而优化控制算法和动作规划,模仿人手的灵活性,完成挑、捻、搓、钩等多种操作。
- 在算法层面:通过物体点云输入,预测抓取配置,构建不同类别物体和抓取标签的数据集。使用视觉语言模型的通用抓取学习算法,实现机器人手部对环境、对象、任务的泛化和适应能力。
基于这种软硬件协同的方式,CASBOT 01 实现了可快速学习、可泛化的长时序灵巧操作。
One More Thing
据官方介绍,目前灵宝 CASBOT 已经在航天航海应急救援井下作业、工业制造和商业服务等多个领域有了深度应用。
值得一提的是,CASBOT 01 在发布会的最后,不仅现身为自己取了一个更为接地气的名字——“星期三”(发布日期),还客串了主持人带来了 One More Thing,其宣布,将在 2025 年发布全新的下一代人形机器人“CASBOT NEXT GEN”,搭载 Embodied Brain 2.0、视觉基础大模型 2.0 等先进技术,实现更轻、更强、更高效的目标。
最后,灵宝希望通过 5 到 10 年的时间,成为全球人形机器人品牌的主力军,从 ToB 市场逐步拓展到 ToC 市场,最终让每个人都能拥有自己的人形机器人,实现人形机器人走进千家万户的愿景,你期待住了吗?
更多推荐
所有评论(0)