logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

万字综述|自动驾驶多传感器融合感知

多模态融合是自动驾驶系统感知的一个基本任务,最近引起了许多研究者的兴趣。然而,由于原始数据的噪声、信息的未充分利用以及多模态传感器的未对齐,实现相当好的性能并不是一件容易的事情。在本文中,我们对现有的自动驾驶多传感器融合感知方法进行了文献综述。整体上,我们对50多篇论文进行了详细的分析,其中包括使用激光雷达和相机尝试解决目标检测和语义分割任务的方法。与传统的融合模型分类方法不同,我们提出了一种创新

文章图片
#自动驾驶#人工智能#机器学习
多视图点云配准算法综述

针对三维多视图点云配准问题,本研究首先对近二十余年的方法进行了系统分类,然后依据分类对方法进行归纳总结,随后介绍了该领域的主流数据库与评价指标,最后对本研究工作进行总结

文章图片
#计算机视觉#自动驾驶#3d +1
复旦大学自然语言处理实验室《大规模语言模型·从理论到实践》网络初版发布

为了使得更多的自然语言处理研究人员和对大语言模型感兴趣的读者能够快速了解大语言模型和理论基础,并开展大语言模型实践,复旦大学自然语言处理实验室张奇教授、桂韬研究员、郑锐博士生以及黄萱菁教授结合之前在自然语言处理领域研究经验,以及分布式系统和并行计算的教学经验,通过在大语言模型实践和理论研究的过程中,历时 8 个月完成本书。这个阶段是从语言模型向对话模型转变的关键,其核心难点在于如何构建训练数据,包

文章图片
#自然语言处理#语言模型#人工智能
AnyDexGrasp: 通用灵巧抓取方法的创新与应用

通过个性化的训练和优化,AnyDexGrasp 能够根据不同机械手的特点调整其策略,从而在多变的任务环境中保持高效的抓取能力。接着,针对每一种机械手,通过现实世界的试错训练出独特的抓取决策模型,将这些表示转化为最终的抓取姿势。每一个抓取决策子模型都是通过神经网络学习得到的,它接收一个接触中心抓取表示作为输入,并输出一个介于0到1之间的分数,指示相应的抓取候选是否可能成功。例如,在实验中,研究人员发

文章图片
#机器人
多任务多传感器数据融合实现3D目标检测

本文提出了一种多任务多传感器检测模型,该模型联合推理 2D 和 3D 对象检测、全局估计和深度补全。

文章图片
#人工智能#计算机视觉#深度学习 +2
Harmon:从语言描述中生成人形机器人的全身动作

这篇论文介绍了一种名为“HARMON”的方法,用于从自然语言描述中生成人形机器人的全身运动。该方法利用了人类运动数据集中的先验知识来初始化机器人动作,并利用视觉语言模型(Vision Language Models,VLM)的能力编辑和优化这些动作。通过模拟和真实世界实验验证,该方法能够产生自然、富有表现力且符合文本描述的人形机器人动作。

文章图片
#机器人
基于HWC-Loco框架的鲁棒人形机器人运动控制方法

该论文提出了一种分层全身控制框架HWC-Loco,旨在解决人形机器人在复杂环境中的鲁棒运动控制问题。摘要部分明确指出,现有基于强化学习的方法虽在仿真环境中表现优异,但面临仿真与现实(Sim2Real)的动力学差异,且传统鲁棒优化方法常导致策略过于保守。HWC-Loco通过分层策略设计,动态协调目标追踪与安全恢复的平衡,并通过人类行为模仿提升运动自然性。作者指出,经典模型驱动方法依赖精确动力学建模,

文章图片
基于YOLOv8的无人机图像目标检测算法

在无人机(UAV)目标检测任务中,存在因检测目标尺度小、检测图像背景复杂等原因导致的漏检、误检问题。针对上述问题,提出改进YOLOv8s的无人机图像目标检测算法。首先,针对无人机拍摄目标普遍为小目标的应用场景,减少算法骨干网络(Backbone)层数,增大待检测特征图尺寸,使得网络模型更专注于微小目标;其次,针对数据集普遍存在一定数量低质量示例影响训练效果的问题,引入Wise-IoU损失函数,增强

文章图片
#无人机#目标检测
多任务多传感器数据融合实现3D目标检测

本文提出了一种多任务多传感器检测模型,该模型联合推理 2D 和 3D 对象检测、全局估计和深度补全。

文章图片
#人工智能#计算机视觉#深度学习 +2
两万字梳理 | 四足机器人的结构、控制及运动控制

本文系统回顾了四足机器人在结构设计、步态规划、传统控制方法、智能控制策略以及自主导航等核心技术领域的最新成就,特别关注各领域内的智能化发展趋势和技术革新动向。通过深入分析,本文不仅为四足机器人的未来发展提供了坚实的理论依据和前沿的技术导向,还为相关领域的研究人员提供了重要的参考价值。

文章图片
#机器人
    共 38 条
  • 1
  • 2
  • 3
  • 4
  • 请选择