logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

基于视觉语言动作的竞速无人机自主导航RaceVLA深度代码解析

摘要: RaceVLA项目首次将视觉语言动作(VLA)模型应用于高速竞速无人机,实现端到端的自主导航。该系统基于OpenVLA模型优化,通过处理第一视角视频和自然语言指令,直接生成4D飞行控制向量(线速度+偏航角速度),显著提升了动态环境下的泛化能力。采用分布式架构设计,服务器端运行VLA模型(4Hz实时推理),无人机端配备定制硬件(T265相机、NUC计算机),实现了连续控制策略,飞行轨迹更接近

文章图片
#无人机
经典文献阅读之--Lifelong SLAM(变化环境中Lifelong定位建图)

商场、超市等大多数现实场景的环境随时都在变化。不考虑这些变化的预建地图很容易变得过时。因此,有必要拥有一个最新的环境模型,以促进机器人的长期运行。为此《》一文提出了一个通用的全生命周期同步定位和建图 (SLAM) 框架。该框架使用多会话地图表示,并利用有效的地图更新策略,包括地图构建、位姿图细化和稀疏化。为了缓解内存使用量的无限制增加,本文提出了一种基于 Chow-Liu 最大互信息生成树的地图修

文章图片
#人工智能#机器学习#深度学习
经典文献阅读之--STD(激光SLAM回环检测算法)

各位也知道,我们在之前的博客中,介绍了很多回环的方法,比如Scan Context,Lris, BoW3D等方法。之前作者也在《》一文中,给到了一些回环检测算法的介绍。最近林博新开源了一个回环检测算法《我们从博主中的实验中发现,确实效果不错,同时相关的代码也已经在上开源了。图1。(a)显示从查询点云中提取的稳定三角形描述符(STD)。(b)显示从历史点云中提取的STD。(c)显示了这两帧点云之间S

文章图片
#算法
经典文献阅读之--Removert(SLAM动态障碍物滤除)

在离线拼接点云地图过程中,使用的一组原始LiDAR扫描数据(原始数据就会包括静态点和动态点)来构建,其中的目标是删除原始地图中动态点。在此过程中主要考虑两个不同的坐标:全局统一地图坐标系MMM和本地传感器的局部坐标系QQQ。PQP^{Q}PQ表示在局部坐标系下的query scan,PMP^{M}PM表示在全局坐标系下的map,对于PQkP_{Q}^{k}PQk​的位姿通过TQkT_{Q}^{k}

文章图片
#人工智能
复现Lingbot-vla接入RoboTwin2.0(WebSocket模式)

本文详细记录了在Ubuntu 20.04系统上为RoboTwin和Lingbot-VLA两个项目分别配置Python环境的完整流程。首先检查了NVIDIA驱动、CUDA版本和Vulkan库等系统依赖,随后为RoboTwin创建Python 3.10环境并安装CUDA Toolkit 12.1,完成数据下载和处理。接着为Lingbot-VLA创建Python 3.12.3环境,安装指定版本的PyTo

文章图片
#websocket#网络协议#网络
World Knowledge:让智能体在任务到来前先理解世界

当前自进化智能体仍依赖人工预设任务和奖励机制,缺乏真正的自主探索能力。本研究提出元学习驱动的智能体进化范式,让智能体在没有明确任务时主动构建结构化环境知识(World Knowledge)。通过URL爬取聚类、知识生成、任务执行和效果评估的完整流程,智能体能预先建立环境认知地图,显著提升后续任务效率。实验表明,这种自主探索生成的知识能有效减少任务执行步数,提高成功率,为实现真正的自进化智能体提供了

文章图片
#机器人
Memoir 论文解读:让导航智能体学会“先想一段,再回忆一段”

Memoir论文提出了一种创新的具身导航方法,通过重新定义"想象"的用途来改进视觉语言导航任务。与以往将想象用于规划不同,Memoir将想象结果作为检索查询,从长期记忆中寻找类似场景下的观察和行为模式。该方法包含三个核心组件:语言条件化的世界模型进行状态推断和未来想象,混合视点级记忆存储环境观察和历史行为,以及经验增强的导航模型动态融合当前观测与检索结果。实验表明,这种&quo

文章图片
#人工智能
经典文献阅读之--BEVWorld(通过统一的BEV潜在空间实现多模态世界模型的自动驾驶)

世界模型建模了有关环境的知识,其可以通过给定的条件对未来进行合理的想象。:生成鬼探头、前方车辆遗撒等稀缺数据,并通过条件拓展不同天气、光照等环境下的数据。:自动驾驶模型的planning结果作为世界模型未来预测的条件,产出控车后的数据进行闭环测试。:对抗样本是自动驾驶模型的一个安全隐患,利用世界模型,采用同一场景变换condition的方式或者黑盒攻击方式,拿到模型失效的且逼真的样本,用于提升自动

文章图片
#自动驾驶#人工智能#机器学习
高效神经地图表示的蒙特卡罗定位(ENM-MCL)代码详解

ENM-MCL提出了一种创新的室内机器人定位方法,通过高效神经地图(ENM)和蒙特卡罗定位(MCL)的结合,解决了传统方法的局限性。ENM采用特征网格和轻量级神经网络,能够高效预测SDF和PSDF值。相比传统占用栅格地图,该方法具有更低的内存占用量和更高的精度,在室内定位任务中展现出优越性能。实验表明,ENM-MCL在定位精度和计算效率方面均优于现有方法,为机器人导航提供了更可靠的解决方案。

文章图片
#机器人#人工智能
Paper2Code----无痛从科学论文到代码实现

【摘要】韩国科学技术院与DeepAuto.ai联合开发的Paper2Code框架采用多Agent大语言模型技术,实现了从机器学习论文到可运行代码的自动化转换。该框架通过规划、分析和代码生成三阶段流程,解决了科研复现难题(仅21%论文提供完整代码)。实验表明,其生成代码在ICML等顶会论文上正确性得分达3.7-4.7分,77%用户认为最适合复现研究,代码修改率仅0.48%。Paper2Code显著提

文章图片
#人工智能#机器人
    共 632 条
  • 1
  • 2
  • 3
  • 64
  • 请选择