
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
本篇博客介绍的是 ETH 苏黎世联邦理工的研究团队在机器人顶刊Science Robotics上发布的成果,探索如何让拥有腿部和手臂的机器人(即腿足机械臂)学习并执行像羽毛球这样高度动态、需要全身协调的复杂技能。这篇论文不仅仅是让机器人学会打羽毛球,更重要的是它提供了一个通用的框架和方法,用于训练高自由度、多模态机器人执行需要精细全身协调的复杂动态任务,这对于推动通用型机器人的发展具有里程碑式的意

加州理工学院团队研发的ATMO地空两用机器人,采用创新设计实现0.3秒快速形态转换。研究对比了强化学习(RL)与模型预测控制(MPC)策略:RL在极限工况下表现更优(最大着陆倾角65°、抗干扰能力强),而MPC姿态控制更精准(±3°滚转振荡)。实验显示RL在推进器故障时仍能稳定着陆,但存在通信延迟敏感问题。该成果发表于IROS2025,为多模态机器人控制提供了新思路,未来可应用于物流、救援等领域。

阿里高德地图团队提出AutoDrive-R²VLA大模型,通过思维链与强化学习提升自动驾驶的推理与自反思能力。该模型基于Qwen2.5-VL构建,采用两阶段训练:先在自建nuScenesR²-6K数据集(含6000个带推理步骤的样本)进行监督微调,再结合物理奖励框架优化轨迹生成。在nuScenes和Waymo数据集测试中,模型在轨迹精确度和合理性上超越现有方法,但输出轨迹仍较粗糙,需进一步优化控制

本文提出DriveTransformer,一种创新的端到端自动驾驶框架。该模型采用并行任务查询机制,通过任务自注意力、传感器交叉注意力和时间交叉注意力实现流式、并行和稀疏的Token交互,解决了传统方法中误差累积和计算挑战等问题。实验表明,DriveTransformer在bench2drive和nuscenes基准上均达到SOTA性能,支持目标检测、运动预测、在线建图和规划等任务,显著提升了自动

特斯拉已开始向车主推送(有监督)完全自动驾驶(FSD)v14 版本更新,这是该系统时隔一年推出的首次重大更新。FSD v14 的研发借鉴了特斯拉在RobotTaxi中的经验,并将相关技术整合到面向普通消费者的车辆软件中。

nuScenes 数据集在大模型训练中应用广泛,在很多CVPR或者其它论文中经常能看到使用nuScenes 数据集达到SOTA水平。SOTA 水平即 “State of the Art” 水平,指的是在某一技术领域或特定任务中,当前所能达到的最高水平或最先进的状态。

nuScenes 数据集在大模型训练中应用广泛,在很多CVPR或者其它论文中经常能看到使用nuScenes 数据集达到SOTA水平。在之前的博客中,笔者主要介绍了nuScenes数据集的来源和下载方式,本篇博客主要介绍如何使用nuScenes数据集。

本篇博客主要介绍蔚来汽车NWM的大概内容,关于模型内部的结构呈现的并不多(比如采用Diffusion Transformer生成视频或者多模轨迹等等),其实从前面介绍的几家企业的大模型方案来看,总体架构差不太多,至于性能,笔者后续再结合网友们发布的测试视频写一篇博客。

大模型环境安装中的踩坑记录

目前机器人的技术随着驱动方式的变化,控制越来越成熟,在自主无人化方面随着大模型的发展也会逐渐进化,但对于未来的应用场景和市场化方面仍然需要进一步挖掘。








