logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

自动驾驶大模型---慕尼黑工业大学之OpenDriveVLA

OpenDriveVLA 通过端到端架构和多模态大模型,为自动驾驶提供了一种更高效、泛化的解决方案。其核心价值在于将语言模型的推理能力与视觉感知深度融合,突破了传统模块化系统的局限性。尽管在算力、数据隐私等方面仍需突破,但该研究为行业指明了 “感知 - 推理 - 决策” 一体化的未来方向,有望推动自动驾驶从 “功能实现” 向 “类人智能” 跨越。

文章图片
#自动驾驶#人工智能#机器学习 +1
具身智能大模型---香港大学之UniVLA

UniVLA提出了一种创新的跨具身视觉-语言-动作通用策略学习框架,突破了传统具身智能模型的三大局限:通过无监督视频学习减少标注依赖、构建任务中心的隐式动作空间实现跨机器人形态迁移、采用轻量级适配降低部署成本。实验表明,该框架在多个操控和导航基准测试中性能显著优于现有方法,仅用少量数据即可达到SOTA效果,并在真实机器人部署中展现出80%以上的任务成功率与10Hz实时控制能力,为具身智能的通用化发

文章图片
#自动驾驶#人工智能#机器学习 +1
创业思考---黄仁勋与英伟达

英伟达CEO黄仁勋从台湾赴美求学,1993年创立英伟达并带领公司成为AI芯片巨头。在央视采访中,他坦言33年CEO生涯压力巨大,同时表达了对华为等竞争对手的尊重。在链博会演讲中,黄仁勋回顾了英伟达从GPU发明到AI计算平台的发展历程,强调中国开发者在AI革命中的重要作用。他指出AI正在重塑各行业,将推动新的工业革命,并看好中国供应链在AI时代的发展机遇。目前英伟达已成为全球市值最高的公司之一。

文章图片
#人工智能#自动驾驶
行业分析---理想汽车2025年报

摘要: 理想汽车2025年财报显示业绩下滑,全年交付40.6万辆,仅完成目标的58%。总营收1123亿元,同比下降22.3%,净利润11.4亿元,暴跌85.8%。毛利率承压(整车17.9%),主要因销量不及预期、行业价格战及高研发投入(113亿元)。纯电车型表现不佳,AI、芯片及机器人研发消耗大量资源。财报反映国内新能源市场竞争激烈,理想激进押注AI的策略面临挑战。文末探讨车企是否需自研自动驾驶,

文章图片
#运维#人工智能#大数据
自动驾驶大模型---Diffusion Planner

清华大学联合多家机构提出了一种基于扩散模型的自动驾驶规划方法DiffusionPlanner,发表于ICLR2025。该方法通过扩散模型强大的多模态建模能力,有效捕捉人类驾驶行为,摆脱了对基于规则优化的依赖。关键创新包括:1)将规划重构为未来轨迹生成任务,联合建模自车规划与周边车辆预测;2)基于扩散Transformer架构实现车辆状态、历史数据等多源信息融合;3)利用分类器引导机制实现安全、舒适

文章图片
#自动驾驶#人工智能#机器学习
自动驾驶---基于强化学习的CarPlanner

本文介绍了浙江大学与菜鸟无人车团队提出的自动驾驶轨迹规划方法CarPlanner,该工作被CVPR2025录用。针对传统模仿学习和强化学习在轨迹规划中存在分布漂移、因果混淆等问题,提出基于一致性自回归建模的强化学习框架。核心创新包括:1)引入一致性模式信息解决时间不一致性;2)采用"生成-选择"框架实现多模态轨迹规划;3)设计非反应式转移模型降低计算复杂度。实验表明,在nuPl

文章图片
#自动驾驶#人工智能#机器学习
大模型踩坑---libstdc++.so.6: version `GLIBCXX_3.4.29‘ not found

摘要:本文记录了解决GLIBCXX版本缺失问题的方法。当运行Python环境时出现"GLIBCXX_3.4.29 not found"错误,通过检查系统libstdc++.so.6文件发现最高仅支持到GLIBCXX_3.4.28。解决方法是通过设置LD_LIBRARY_PATH环境变量,指向包含更新版本libstdc++.so.6的miniforge3安装目录(/root/mi

文章图片
#c++#开发语言#人工智能
自动驾驶大模型---AutoVLA视觉语言动作大模型

AutoVLA是一种创新的视觉-语言-动作(VLA)模型,通过统一的自回归生成框架解决了自动驾驶中的物理可行性、模型复杂度和推理效率问题。其核心创新包括:将连续轨迹离散化为物理可行的动作token,采用自适应双模式推理机制(快速/慢速思考),以及结合监督预训练和GRPO强化微调方法。实验表明,AutoVLA在轨迹精度、安全性和计算效率上均优于传统方法,实现了视觉感知、语言理解和动作生成的有效结合,

文章图片
#自动驾驶#人工智能#机器学习
自动驾驶大模型---AutoVLA视觉语言动作大模型

AutoVLA是一种创新的视觉-语言-动作(VLA)模型,通过统一的自回归生成框架解决了自动驾驶中的物理可行性、模型复杂度和推理效率问题。其核心创新包括:将连续轨迹离散化为物理可行的动作token,采用自适应双模式推理机制(快速/慢速思考),以及结合监督预训练和GRPO强化微调方法。实验表明,AutoVLA在轨迹精度、安全性和计算效率上均优于传统方法,实现了视觉感知、语言理解和动作生成的有效结合,

文章图片
#自动驾驶#人工智能#机器学习
自动驾驶---学术论文的常客:nuScenes数据集的使用

nuScenes 数据集在大模型训练中应用广泛,在很多CVPR或者其它论文中经常能看到使用nuScenes 数据集达到SOTA水平。在之前的博客中,笔者主要介绍了nuScenes数据集的来源和下载方式,本篇博客主要介绍如何使用nuScenes数据集。

文章图片
#自动驾驶#人工智能#机器学习
    共 57 条
  • 1
  • 2
  • 3
  • 6
  • 请选择