logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

WoVR:基于世界模型的 VLA 策略强化学习后训练可靠框架

本文是对论文《WoVR: World Models as Reliable Simulators ...》的深度解读。在机器人操作领域,VLA 模型的 RL 后训练受限于真实世界交互成本与世界模型幻觉问题,成为核心研究挑战。多机构联合团队提出的 WoVR 框架,从可控模拟器设计、可靠交互协议、策略 - 模型对齐三层显式控制幻觉,实现了稳定的长视野想象滚动,在 LIBERO 基准和真实机器人任务中大

文章图片
#人工智能#深度学习#论文阅读
MindDrive:基于在线强化学习的自动驾驶视觉 - 语言 - 动作模型

本文是对论文《MindDrive: A Vision-Language-Action Model for Autonomous Driving via Online Reinforcement Learning》的深度解读。在自动驾驶领域,VLA模型依赖模仿学习存在分布偏移与因果混淆问题,在线强化学习应用受限于连续动作空间探索低效。该研究创新提出MindDrive框架,通过双LoRA专家架构实现语

文章图片
#自动驾驶#论文阅读
Raw2Drive:基于对齐世界模型的端到端自动驾驶强化学习方案

本文是对论文《Raw2Drive: Reinforcement Learning with Aligned World Models for End-to-End Autonomous Driving (in CARLA v2)》的深度解读。在E2E自驾领域,RL应用受原始传感器数据复杂性、训练难度高的困扰,模仿学习则存在因果混淆等局限。上交等团队提出的Raw2Drive,创新设计双流模型基强化学

文章图片
#机器人#论文阅读
WoVR:基于世界模型的 VLA 策略强化学习后训练可靠框架

本文是对论文《WoVR: World Models as Reliable Simulators ...》的深度解读。在机器人操作领域,VLA 模型的 RL 后训练受限于真实世界交互成本与世界模型幻觉问题,成为核心研究挑战。多机构联合团队提出的 WoVR 框架,从可控模拟器设计、可靠交互协议、策略 - 模型对齐三层显式控制幻觉,实现了稳定的长视野想象滚动,在 LIBERO 基准和真实机器人任务中大

文章图片
#人工智能#深度学习#论文阅读
UniDrive-WM:自动驾驶领域的统一理解、规划与生成世界模型

本文是对论文《UniDrive-WM: Unified Understanding, Planning and Generation World Model For Autonomous Driving》的深度解读。在自动驾驶领域,现有方法常将感知、规划与生成割裂,存在信息瓶颈。研究团队提出统一世界模型 UniDrive-WM,在单一 VLM 架构中集成场景理解、轨迹规划与未来图像生成,通过离散

文章图片
#自动驾驶#论文阅读
MindDrive:融合世界模型与视觉语言模型的端到端自动驾驶框架

本文是对论文《MindDrive: An All-in-One Framework Bridging World Models and Vision-Language Model for End-to-End Autonomous Driving》的深度解读。在端到端自动驾驶领域,轨迹规划中生成与选择失衡是关键挑战。北航等团队提出的 MindDrive 框架,创新整合世界模型与视觉语言模型,通过未

文章图片
#自动驾驶#论文阅读
LoRA:大语言模型低秩适配

本文是对论文《LoRA: Low-Rank Adaptation of Large Language Models》的深度解读。在大语言模型快速发展的背景下,全参数微调面临存储成本高、显存占用大、部署低效等难题。微软团队提出的 LoRA 低秩适配方法,通过冻结预训练模型权重、注入可训练低秩矩阵,在不引入推理延迟的情况下大幅减少了适配参数量与训练开销。

文章图片
#LoRA#论文阅读
AsyncVLA:面向边缘机器人的异步VLA导航框架 —— 让大模型在高延迟、动态环境下依然安全稳健

本文是对论文《AsyncVLA: An Asynchronous VLA for Fast and Robust Navigation on the Edge》的深度解读。在边缘机器人自主导航领域,大参数量 VLA 推理慢、延迟高、难以实时部署,成为落地核心瓶颈。UC Berkeley 联合丰田、普林斯顿大学提出 AsyncVLA 异步控制框架,将大模型高层语义推理与边缘端实时动作执行解耦,配合轻

文章图片
#论文阅读
从训练到部署:PyTorch模型压缩与嵌入式C++部署完整指南

摘要:本文提供了一套PyTorch模型从训练到嵌入式C++部署的完整流程。针对模型体积大、资源受限、依赖Python等问题,系统介绍模型压缩(量化、剪枝)、ONNX导出、NCNN转换及C++嵌入(C数组/静态库)等关键技术。通过代码示例,实现模型在资源受限设备上的高效推理,适用于边缘计算、物联网等场景,为AI落地提供可复现方案。

文章图片
#pytorch#c++#人工智能 +1
OpenEMMA:开源多模态端到端自动驾驶框架全解析

本文是对论文《OpenEMMA: Open-Source Multimodal Model for End-to-End Autonomous Driving》的深度解读。在自动驾驶领域,端到端系统存在闭源限制、泛化不足等问题,德州农工大学等联合团队提出开源框架 OpenEMMA,基于多模态大语言模型,融合思维链推理与微调 YOLO 模型,实现轨迹规划与 3D 目标检测,打破闭源壁垒,提升系统效率

文章图片
#自动驾驶#论文阅读
    共 64 条
  • 1
  • 2
  • 3
  • 7
  • 请选择