logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

小鹏汽车 vla 算法最新进展

小鹏汽车的 VLA 算法已从概念验证迈向规模化落地,其核心优势在于高算力芯片支撑的车端大模型部署云端基座模型的持续进化,以及多模态交互的场景化创新。随着年底跨代更新的到来,小鹏有望在智驾领域进一步拉开与竞品的差距。不过,其技术路线仍需面对数据隐私、长尾场景泛化等挑战,而行业对 “十倍体验” 的实际效果验证,将成为 2025 年下半年的关注焦点。

#汽车#算法
Alexandr Wang 和 Lecun,谁对 Meta 更重要

【摘要】科技发展史表明,当需要工程化实现既定理论时(如曼哈顿计划),需要奥本海默式的组织者;当行业处于理论迷茫期(如计算机早期发展),则需要图灵式的开拓者。当前AI领域明显处于后者状态——LLM技术已遇瓶颈,算力和数据资源接近极限,缺乏理论突破,各大公司纷纷转向商业化应用(如OpenAI专注盈利、Anthropic深耕编程、Google主攻办公场景),而非追求AGI。这反映出AI发展正面临基础理论

#人工智能
AI agent 最新 进展

2025年12月,AI Agent领域迎来重大突破:谷歌发布Gemini Deep Research Agent,在HLE测试中达46.4%准确率,成本仅为GPT-5 Pro的1/10;OpenAI推出GPT-5.2和ChatGPT Agent,增强复杂问题处理能力;Anthropic发布Claude Opus 4.5,编码能力显著提升;亚马逊推出Kiro开发Agent,开发效率提升10倍;智谱A

#人工智能
理想星环OS与AUTOSAR有何区别?

理想星环OS通过架构革新突破AUTOSAR闭源生态限制,实现‌“芯片自由定义、算力全局调度、生态开源共建”‌三大跃迁‌7066706917069706770707070706670727075270757073707670767072。其本质是智能汽车时代对传统汽车电子架构的范式重构,从‌技术追随者‌转向‌标准制定者‌‌707870812708170797082708270787084708747

#汽车#risc-v
介绍一下基于 CNN 的多分支架构(如特斯拉 HydraNet)

HydraNet 通过 CNN 多分支架构与 Transformer 的深度融合,实现了自动驾驶感知的高效性与鲁棒性。其核心优势在于特征共享 - 任务解耦 - 时空建模的三位一体设计,以及硬件 - 算法 - 数据的全链路优化。随着 Dojo 超算和 HW5.0 的量产,HydraNet 正推动自动驾驶从辅助功能向完全自主化跨越,为 Robotaxi 和智能交通系统提供底层技术支撑。

#cnn#架构#人工智能
详细总结一下这篇文章Impromptu VLA:用于驾驶视觉-语言-动作模型的开放权重与开放数据

摘要:Impromptu VLA研究针对自动驾驶在非结构化场景(如乡村土路、恶劣天气等)的瓶颈问题,提出首个开源大规模基准数据集。该数据集从200多万条视频中筛选出8万条高质量标注剪辑,涵盖道路边界模糊、临时交通规则变更等4类核心挑战场景。通过VLM模型结合人工验证的混合标注流程,生成7类面向规划的问答对标注。实验验证表明,该数据集能有效提升模型在极端场景下的感知与规划能力,同时其标注体系可作为模

#自动驾驶
小鹏汽车 vla 算法最新进展

小鹏汽车的 VLA 算法已从概念验证迈向规模化落地,其核心优势在于高算力芯片支撑的车端大模型部署云端基座模型的持续进化,以及多模态交互的场景化创新。随着年底跨代更新的到来,小鹏有望在智驾领域进一步拉开与竞品的差距。不过,其技术路线仍需面对数据隐私、长尾场景泛化等挑战,而行业对 “十倍体验” 的实际效果验证,将成为 2025 年下半年的关注焦点。

#汽车#算法
什么是 vla模型

VLA模型(视觉-语言-动作模型)是一种多模态AI系统,通过整合视觉感知、语言理解和动作生成,实现智能体与真实世界的交互。其核心架构包括视觉编码器、语言模型、多模态融合器和动作生成器,采用端到端或模块化设计,结合预训练、强化学习等技术优化性能。该模型广泛应用于机器人、自动驾驶和虚拟助手等领域,但面临数据需求大、实时性不足等挑战。典型案例包括Google RT-2和手术机器人应用。未来发展方向包括轻

#人工智能
国内企业2025 在自动驾驶上投入多少钱

2025年中国自动驾驶领域总投入预计达700-750亿元,同比增长40%。比亚迪、蔚来、小鹏、华为、百度等头部企业聚焦核心技术突破:比亚迪投入200亿自研芯片和算法,蔚来54亿开发5nm芯片,小鹏45亿推进端到端AI模型,华为100亿升级昇腾芯片和车路云方案,百度30亿扩展Robotaxi商业化。产业链方面,Momenta融资20-30亿优化数据闭环,滴滴推进Robotaxi商业化。行业呈现全栈自

#自动驾驶#人工智能#机器学习
小鹏汽车在 VLA(视觉 - 语言 - 动作)算法模型框架细节与原理

小鹏汽车VLA算法采用"云端基座+车端蒸馏"混合架构,720亿参数的云端模型基于Qwen2.5-VL大模型,支持5秒长时序预判;30亿参数车端模型通过知识蒸馏实现实时推理。核心技术包括:1)视觉处理采用Grounded-SAM分割和ViT-CNN混合架构,通过ReconPruner剪枝压缩视觉Token;2)语言推理模块结合Qwen2.5-VL模型和导航引导优化;3)动作生成采

#汽车#算法
    共 223 条
  • 1
  • 2
  • 3
  • 23
  • 请选择