logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

盘点|2025下半年「自动驾驶」最推荐学习的10篇强化学习应用论文

在 Bench2Drive 闭环基准测试中,搭载轻量化 Qwen2-0.5B的 LLM 的 MindDrive,取得了 78.04 的驾驶评分(DS)和 55.09% 的成功率(SR),分别超越同参数 IL 基线模型 5.15 分和 9.26%,是首个通过与环境实时交互进行在线强化学习训练的自动驾驶VLA模型。作者计划在后续更新中开源模型和部分数据集。模型不再采用“先看图、再推理”的割裂流程,而是

#学习
VLN 领域首个双系统基础模型,三大基准 SOTA,重新定义导航技术上限!

这种异步推理实现了连续且流畅的导航过程。这是一个轻量级的扩散Transformer策略,以高达 30 Hz 的频率运行,接收系统2输出的像素目标及其隐含的语义特征,结合当前高频RGB图像,生成平滑、连续、避障的轨迹。这是一个基于 Qwen-VL-2.5 的全局规划器,以约 2 Hz 的频率运行,负责理解指令、观察环境,并预测一个像素级目标点,作为中期导航的视觉路标。:为此,模型使用一个轻量模块,将

文章图片
首个VLA性能优化设计发展综述,解锁具身智能落地关键

策略类型原理优势劣势静态模型骨干网络以轻量级模型替代大规模预训练VLM骨干,通过缩减参数规模降低计算与存储开销直接高效,无需额外设计动态模块;核心任务能力保留较好,边缘部署可行性高过度压缩会降低模型能力上限,泛化性能受损,难以适配未训练的新场景、新任务动态计算路径训练时保留大架构以维持表达能力,推理时通过规则/指标动态选择有效计算层/路径平衡模型能力与效率,避免冗余计算;需完整能力时可调用全架构,

#性能优化
PhysHSI让人形机器人学会“恐龙步”等特色动作

这样一来,机器人能更快接触到多样化的运动起始点,探索到不同的动作序列和解决任务的方式,从而提升在训练过程中的探索效率,避免因初始状态单一而陷入局部最优解。在分布内场景(场景参数与训练数据分布一致)和全分布场景(场景参数随机化,更贴近真实复杂环境)中,相比于传统强化学习(RL-Rewards,依赖手动设计奖励)和轨迹跟踪方法(Tracking-Based,依赖轨迹模仿),PhysHSI均能同时实现更

#机器人
CoRL 2025 Oral 论文盘点:17 篇代表作带你看机器人学习新趋势

在 2025 年的 CoRL 上,共有42 篇 Oral 论文脱颖而出(仅占总投稿的 5% 左右),涵盖了操作与模仿学习、感知、规划与安全、运动控制、人形与硬件五大主题。我们从中挑选了17 篇已经公开的研究进行盘点,内容横跨人形机器人、腿足机器人、大模型驱动的操作、多模态感知,以及安全与鲁棒规划等多个方向。为什么值得关注这些论文?● 研究者可以从中看到最新的方法突破与可借鉴的基线;● 工程实践者可

#机器人#学习#人工智能
比主流VLA小10倍,性能却达SOTA!SmolVLA仅用消费级GPU就能高效操控机器人

因此,该研究提出了SmolVLA,一个开源、轻量且高效的VLA模型,同时发布了完整的训练代码、预训练模型与数据处理流程。根据实验分析,选取前半部分的层作为特征提取来源,在保证性能的同时,显著降低了计算量。通过在模拟环境和真实机器人平台上的广泛评估,该研究展示了SmolVLA即便体量小巧,也能达到甚至超过大模型的表现,为具身智能系统的高效部署与广泛普及提供了切实可行的路径。在模型设计上,SmolVL

#机器人
Isaac Lab 全面盘点:具身智能时代的“通用模拟器”究竟长什么样?

相比过去的模拟器只负责“模拟物理”,Isaac Lab 的目标是把机器人学习中的关键环节——动力学、控制器、传感器、场景生成、数据采集、模仿学习工作流、强化学习训练等——全部整合到同一个统一框架下。在白皮书中,Isaac Lab 被描述为一个“GPU 加速、多模态、支持大规模并行的机器人学习框架”,它基于 NVIDIA Omniverse、PhysX、RTX Renderer 与 OpenUSD

文章图片
#仿真平台#机器人
Isaac Lab 全面盘点:具身智能时代的“通用模拟器”究竟长什么样?

相比过去的模拟器只负责“模拟物理”,Isaac Lab 的目标是把机器人学习中的关键环节——动力学、控制器、传感器、场景生成、数据采集、模仿学习工作流、强化学习训练等——全部整合到同一个统一框架下。在白皮书中,Isaac Lab 被描述为一个“GPU 加速、多模态、支持大规模并行的机器人学习框架”,它基于 NVIDIA Omniverse、PhysX、RTX Renderer 与 OpenUSD

文章图片
#仿真平台#机器人
无人机终于有“全景数据集”了!影石发布AirSim360,实现“能飞、能看、能闭环”的全景模拟

图4|AirSim360 的核心交互架构与数据生成模块:左侧展示平台闭环交互的三大核心:飞控模块(控制无人机运动)、渲染引擎(生成全景观测与真值)、推理引擎(运行算法并与仿真交互)。图1|AirSim360 平台概览:作者提出一个面向无人机的 360° 全景仿真平台,基于高质量渲染引擎,实现“能飞、能看、能闭环”的全景无人机模拟。这对全景任务很关键,因为全景图的投影与几何关系更复杂,一旦标签不一致

文章图片
#无人机
三个专家一辆车,ExpertAD:为自动驾驶装上“专家大脑”,效率与安全双提升

ExpertAD 代表了一种正在兴起的新趋势——将Mixture-of-Experts理念引入自动驾驶,让系统具备“模块动态调度”和“注意力重构”的能力。相比一味堆叠参数,它主张用结构来解耦任务、用选择来提升效率。这不仅提升了性能,也为未来将更多知识融入系统提供了接口,比如未来结合世界模型(world models)或语言模型时,ExpertAD可能就是它们之间的调度中枢。在真实上路之前,我们也许

文章图片
#自动驾驶#人工智能#机器学习
    共 268 条
  • 1
  • 2
  • 3
  • 27
  • 请选择