logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

激光SLAM框架LeGO-LOAM

LeGO-LOAM全称为:Lightweight and Groud-Optimized Lidar Odometry and Mapping on Variable Terrain,从标题可以看出 LeGO-LOAM 为应对可变地面进行了地面优化,同时保证了轻量级。LeGO-LOAM是专门为地面车辆设计的SLAM算法,要求在安装的时候Lidar能以水平方式安装在车辆上;如果是倾斜安装的话,也要进

文章图片
#自动驾驶#机器人
电池连接接触电阻的优化研究

表面结构可以通过表面平整度、表面氧化和吸水性进一步描述。电池组中的这些接头将采用焊接或螺栓连接方式。最初最容易想到的是螺栓母线接头。螺栓扭矩可用于估算力,从而估算接触压力。实际上,连接表面并不是完全平坦的。表面粗糙度将有效减少实际电接触面积。因此,如果这些元表面中的两个在非常低的压力下聚集在一起,表面上的孤立点就会接触。电流将在这些限制点处遇到更高的电阻。除了电流密度大大增加之外,电流线的收缩还会

文章图片
#硬件工程
RAFT: Recurrent All-Pairs Field Transforms for Optical Flow

本文提出了Recurrent All-Pairs Field Transforms(RAFT), 一个光流估计的深度神经网络. RAFT 提取像素级的特征, 为所有像素建立多尺度 4D 关联信息, 通过查找4D关联信息, 循环迭代的更新光流场. 本文算法在KITTI、Sintel数据集上取得了state-of-the-art的表现. 同时, RAFT在多个数据集上有很强的泛化能力, 并且在训练速度

文章图片
#深度学习#人工智能
RCM:特征匹配

本文提出了一种新型特征匹配方法RCM(Raising the Ceiling of Matching),通过动态视图切换、无冲突粗匹配和半稀疏范式三大创新点,显著提升了特征匹配的理论上限和实际性能。针对小尺度图像匹配点稀缺、密集方法匹配冲突和稀疏方法依赖关键点可重复性三大挑战,RCM分别提出了解决方案:动态切换源/目标图像以增加可匹配点、采用多对一匹配策略避免冲突、结合半稀疏范式与由粗到细架构。实

#计算机视觉#人工智能#深度学习
Top-k 和 Top-p 有什么区别

Top-k和Top-p是文本生成中的两种采样方法。Top-k固定选择概率最高的k个词随机采样,确保连贯性但可能不够灵活;Top-p则动态选择累计概率超过p的词,适配模型当前置信度,生成更自然多样。Top-k适合需要稳定输出的场景,Top-p追求创造性和流畅度。实际应用中,Top-p通常更优,可配合温度参数调节多样性。两种方法都旨在平衡生成质量与多样性,是控制大模型文本输出的核心技术。理解其原理和区

#人工智能#深度学习
清华开源 VLA 数据集:面向自动驾驶极端场景,安全提升35%

《ImpromptuVLA:面向非结构化道路的开放权重与数据驱动的视觉-语言-动作模型》提出了一套专为解决自动驾驶在非结构化场景(如乡村道路、施工区域等)数据匮乏问题的大规模数据集。该数据集从8个公开来源精选8万条视频片段,涵盖边界模糊道路、临时交通规则变动等四大挑战场景,采用视觉-语言模型进行多任务标注并经人工核验。实验表明,基于该数据集训练的模型在NeuroNCAP测试中碰撞率降低7%(72.

#自动驾驶#人工智能#机器学习
VSCode 插件 Python Image Preview 使用笔记

Python Image Preview支持numpy pillow opencv-python matplotlib seaborn plotly imageio skimage tensorflow pytorch等library的可显示为图像的变量。这里以matplotlib官方的一个热力图例程为例,来展示如何使用Python Image Preview插件在远程调试时查看绘制的实验图像。

文章图片
#vscode#ide
具身智能中 VLA 主流方案全解析:技术总结与未来展望

本文详细总结了具身智能中 VLA 的主流方案,包括基于经典 Transformer 结构、预训练 LLM/VLM、扩散模型、LLM + 扩散模型、视频生成 + 逆运动学以及不同类型的端到端方案。通过对各方案的开源项目和核心思想的介绍,对比了它们在模型架构、动作类型、训练目标等方面的特点,得出了相应的结论共识。同时,探讨了 VLA 面临的数据稀缺、运动规划、实时响应、多模态融合、泛化能力、长时域任务

#人工智能#自动驾驶
双目深度估计大模型 FoundationStereo

本文介绍了 FoundationStereo,一种用于立体深度估计的基础模型,旨在实现强大的零样本泛化能力。通过构建大规模(100 万立体图像对)合成训练数据集,结合自动自筛选流程去除模糊样本,并设计了网络架构组件(如侧调谐特征主干和远程上下文推理)来增强可扩展性和准确性。这些创新显著提升了模型在不同领域的鲁棒性和精度,为零样本立体深度估计设立了新标准。相关论文 FoundationStereo:

文章图片
#计算机视觉#人工智能
自动驾驶系统系统时间同步方案设计

下一代自动驾驶系统需要采用多激光雷达、多毫米波雷达、多摄像头等各类传感器,传感器从采集数据到处理到发送到域控制器内部,存在延时,且延时的时长不稳定。为了提高自动驾驶的传感器融合、决策规划和融合定位等性能,自动驾驶高级域控制器HPC与其关联的传感器均需要做时间同步,实际过程就是需要定义清楚传感器输入数据的时间戳信息(包括打时间戳的时刻及精度要求),同时也需要定义整体时间同步方案和同步精度要求。...

文章图片
#自动驾驶#人工智能#机器学习
    共 172 条
  • 1
  • 2
  • 3
  • 18
  • 请选择