logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

无需训练的开源插件3DGS-to-PC:将3DGS直接转换为稠密点云或Mesh!

在本研究中,我们提出了3DGS-to-PC框架,该框架能够从3DGS(三维几何形状)场景中稳健地生成高质量的点云表示。我们的方法通过分析高斯分量对渲染图像中像素颜色的贡献,有效地计算出高斯颜色,从而确保生成的点云中颜色表示的准确性。点的分布与每个高斯分量的体积成正比。利用马氏距离识别出的离群点将被移除并重新生成,以确保3DGS场景的真实表示。该框架还支持通过泊松表面重建生成网格,该方法应用于从预测

文章图片
#3d#自动驾驶#计算机视觉 +1
移动机器人路径规划的前世今生!(一)全局路径规划

点击下方卡片,关注「计算机视觉工坊」公众号选择星标,干货第一时间送达作者:一个大胖猪 | 编辑:计算机视觉工坊添加小助理:dddvision,备注:方向+学校/公司+昵称,拉你入群。文末附行业细分群扫描下方二维码,加入3D视觉知识星球,星球内凝聚了众多3D视觉实战问题,以及各个模块的学习资料:近20门视频课程(星球成员免费学习)、最新顶会论文、计算机视觉书籍、优质3D视觉算法源码等。想要入门3D视

国内首个面向自动驾驶目标检测领域的Transformer原理与实战课程

不仅为大家详细讲解视觉Transformer的基础知识,各种经典的基于Transformer的目标检测算法,还配有代码解读和实践课程,让大家真正活学活用,理解和掌握这些知识理论。掌握基于Transformer的目标检测算法的思路和创新点,一些Transformer论文涉及的新概念比较多,话术没有那么通俗易懂,读完论文仍然不理解算法的细节部分。目标检测领域中,视觉Transformer不仅可以实现2

文章图片
#自动驾驶#目标检测#transformer +3
无惧遮挡 & 小目标!复旦开源UAV-DETR:无人机图像的高效端到端目标检测

我们设计了UAV-DETR,一个专门设计用于无人机图像的实时端到端物体检测器。通过引入MSFF-FE模块、FD模块和SAC模块,UAV-DETR有助于缓解在航空图像中检测小物体和遮挡物体的困难。在VisDrone和UAVVaste数据集上的实验结果表明,我们的方法在保持实时推理速度的同时,比现有方法在类似计算成本下实现更高的准确性。未来的工作将侧重于提高其对噪声的鲁棒性。对更多实验结果和文章细节感

文章图片
#开源#无人机#目标检测 +4
国内首个Halcon深度学习项目实战系统教程

Halcon在机器视觉中的价值主要体现在提供高效、可扩展、灵活的机器视觉解决方案,帮助用户解决各种复杂的机器视觉问题,提高生产效率和产品质量。Halcon的灵活架构使其能够快速开发出任何类型的机器视觉应用。其全球通用的集成开发环境(HDevelop)有助于降低产品成本,并缩短软件开发周期。Halcon拥有超过2100个算子的成像库,该库支持多核平台、AVX2和NEON等特殊指令集以及GPU加速,从

文章图片
#深度学习#人工智能
突破二维、重建三维!基于深度学习的三维重建MVSNet

本门课程从学术研究和实际应用两方面展开,理论层面带你从零入门多视图几何MVSNet的原理学习、论文阅读、代码梳理等。学术研究层面,从教会”如何读论文?“ → 教会“如何扩展出新论文?” → 教会“如何具有顶会idea并作出sota工作?应用层面通过实际项目的运行手把手教会大家复现MVSNet相关工作并服务于自己的应用。

文章图片
#深度学习#人工智能#重构
推动人工智能发展的24个经典模型,揭秘卷积神经网络的革命

点击下方卡片,关注「计算机视觉工坊」公众号选择星标,干货第一时间送达编辑:计算机视觉工坊,作者:小张Tt添加小助理:dddvision,备注:方向+学校/公司+昵称,拉你入群。文末附行业细分群扫描下方二维码,加入3D视觉知识星球,星球内凝聚了众多3D视觉实战问题,以及各个模块的学习资料:近20门视频课程(星球成员免费学习)、最新顶会论文、3DGS系列、计算机视觉书籍、优质3D视觉算法源码等。想要入

#人工智能#cnn#神经网络 +2
清华最新综述!基于深度学习的6D目标位姿估计

点击下方卡片,关注「计算机视觉工坊」公众号选择星标,干货第一时间送达作者:Jian Liu |编辑:计算机视觉工坊添加小助理:dddvision,备注:方向+学校/公司+昵称,拉你入群。文末附行业细分群扫描下方二维码,加入3D视觉知识星球,星球内凝聚了众多3D视觉实战问题,以及各个模块的学习资料:近20门视频课程(星球成员免费学习)、最新顶会论文、计算机视觉书籍、优质3D视觉算法源码等。想要入门.

#深度学习#人工智能
SLAM还能跟大模型结合?全新Go-SLAM:利用3D GS重建动态环境!精度暴涨35%!

我们介绍了Go-SLAM,这是一个新的框架,它利用3D高斯Splatting SLAM来重建动态环境,同时在场景表示中嵌入对象级信息。该框架采用先进的对象分割技术,为每个高斯splat分配一个唯一的标识符,该标识符对应于它所表示的对象。因此,我们的系统促进了开放词汇查询,允许用户使用自然语言描述来定位对象。此外,该框架具有最佳路径生成模块,该模块考虑到障碍和环境不确定性,为机器人向查询对象计算有效

文章图片
#3d#自动驾驶#计算机视觉 +1
港科大 & 地平线开源DrivingWorld:构建自动驾驶的世界模型!

综上所述,DrivingWorld通过利用GPT风格框架,生成了更长、更高保真度且具有更好泛化能力的视频预测,从而解决了自动驾驶中先前视频生成模型的局限性。与在传统方法中难以处理长序列连贯性或严重依赖标记数据的情况不同,DrivingWorld能够生成逼真的、结构化的视频序列,同时实现精确的动作控制。与经典的GPT结构相比,我们提出的时空GPT结构采用了下一个状态预测策略来建模连续帧之间的时间连贯

文章图片
#自动驾驶#人工智能#机器学习 +4
    共 44 条
  • 1
  • 2
  • 3
  • 4
  • 5
  • 请选择