logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

港大重磅开源!三维重建大一统!TEXGen:高分辨率纹理的美学盛宴!

0. 论文信息标题:TEXGen: a Generative Diffusion Model for Mesh Textures作者:Xin Yu, Ze Yuan, Yuan-Chen Guo, Ying-Tian Liu, JianHui Liu, Yangguang Li, Yan-Pei Cao, Ding Liang, Xiaojuan Qi机构:The University of Ho

文章图片
#3d#算法#自动驾驶 +2
完爆全部YOLO家族!RT-DETRv3突破目标检测网络的极限!

RT-DETR是第一款基于实时端到端转换器的物体检测器。它的效率来自于框架设计和匈牙利匹配。然而,与YOLO系列等密集监督检测器相比,匈牙利匹配提供的监督要稀疏得多,导致模型训练不足,难以实现最佳结果。为了解决这些问题,我们提出了一种基于RT-DETR的分层密集正监督方法,命名为RT-DETRv3。首先,我们引入一个基于CNN的辅助分支,它提供密集的监督,与原始解码器协作来增强编码器特征表示。其次

文章图片
#目标检测#人工智能#transformer +3
暴虐COLMAP和MASt3R!全新开源Spars3R:稀疏3D重建SOTA!无限接近真值!

我们介绍了SPARS3R、场景重建和NVS。可以用稀疏实现高质量渲染的方法输入图像。我们证明了现有方法能够引导tc。由于稀疏点云初始化导致渲染模糊。重新在从之前生成密集点云方面取得进展深度估计模型虽然很有前途,但可能导致噪声姿势估计。为了解决这些问题,SPARS3R结合了二者的优点,提出了一种两步对齐方法。第一步计算深度先验点云与参考SfM点云之间的全局变换矩阵。第二步使用第一步中的异常点语义区域

文章图片
#3d#目标检测#人工智能 +2
CVPR'24开源 | 无惧遮挡!Meta发布清晰、通用、实时的光流估计!

点击下方卡片,关注「计算机视觉工坊」公众号选择星标,干货第一时间送达作者:Shuai Yuan | 编辑:计算机视觉工坊添加小助理:dddvision,备注:方向+学校/公司+昵称,拉你入群。文末附行业细分群扫描下方二维码,加入3D视觉知识星球,星球内凝聚了众多3D视觉实战问题,以及各个模块的学习资料:近20门视频课程(星球成员免费学习)、最新顶会论文、计算机视觉书籍、优质3D视觉算法源码等。想要

无惧遮挡 & 小目标!复旦开源UAV-DETR:无人机图像的高效端到端目标检测

我们设计了UAV-DETR,一个专门设计用于无人机图像的实时端到端物体检测器。通过引入MSFF-FE模块、FD模块和SAC模块,UAV-DETR有助于缓解在航空图像中检测小物体和遮挡物体的困难。在VisDrone和UAVVaste数据集上的实验结果表明,我们的方法在保持实时推理速度的同时,比现有方法在类似计算成本下实现更高的准确性。未来的工作将侧重于提高其对噪声的鲁棒性。对更多实验结果和文章细节感

文章图片
#开源#无人机#目标检测 +4
一文带你了解工业相机和镜头参数和选型

点击下方卡片,关注「计算机视觉工坊」公众号选择星标,干货第一时间送达作者:小柠檬 | 审核:小凡 | 编辑:计算机视觉工坊添加小助理:cv3d001,备注:方向+学校/公司+昵称,拉你入群。文末附3D视觉行业细分群。扫描下方二维码,加入「3D视觉从入门到精通」知识星球(点开有惊喜),星球内凝聚了众多3D视觉实战问题,以及各个模块的学习资料:近20门秘制视频课程、最新顶会论文、计算机视觉书籍、优..

国内首个Halcon深度学习项目实战系统教程

Halcon在机器视觉中的价值主要体现在提供高效、可扩展、灵活的机器视觉解决方案,帮助用户解决各种复杂的机器视觉问题,提高生产效率和产品质量。Halcon的灵活架构使其能够快速开发出任何类型的机器视觉应用。其全球通用的集成开发环境(HDevelop)有助于降低产品成本,并缩短软件开发周期。Halcon拥有超过2100个算子的成像库,该库支持多核平台、AVX2和NEON等特殊指令集以及GPU加速,从

文章图片
#深度学习#人工智能
国内首个面向自动驾驶目标检测领域的Transformer原理与实战课程

不仅为大家详细讲解视觉Transformer的基础知识,各种经典的基于Transformer的目标检测算法,还配有代码解读和实践课程,让大家真正活学活用,理解和掌握这些知识理论。掌握基于Transformer的目标检测算法的思路和创新点,一些Transformer论文涉及的新概念比较多,话术没有那么通俗易懂,读完论文仍然不理解算法的细节部分。目标检测领域中,视觉Transformer不仅可以实现2

文章图片
#自动驾驶#目标检测#transformer +3
国内首个Halcon深度学习项目实战系统教程

Halcon在机器视觉中的价值主要体现在提供高效、可扩展、灵活的机器视觉解决方案,帮助用户解决各种复杂的机器视觉问题,提高生产效率和产品质量。Halcon的灵活架构使其能够快速开发出任何类型的机器视觉应用。其全球通用的集成开发环境(HDevelop)有助于降低产品成本,并缩短软件开发周期。Halcon拥有超过2100个算子的成像库,该库支持多核平台、AVX2和NEON等特殊指令集以及GPU加速,从

文章图片
#深度学习#人工智能
SIGGRAPH‘25!Drag Your Gaussian: 首个Scene-leve! 3DGS拖拽编辑方法

传统的3D表示方式,比如网格、体素、点云等,虽然奠定了计算机图形的基础,但它们或过于笨重,或过于稀疏,很难兼顾高质量渲染与高效率操作。用户只需通过简单的控制点对和 3D掩码,即可实现高质量、可控、跨视角一致的3D几何编辑。相较于传统的文本驱动方法,DYG通过“控制点+3D掩码”的方式,结合隐式三平面表示与高斯场优化,使得用户可以实现更精细、更稳定的几何编辑。编辑效率的提升:当前的两阶段优化过程仍存

#3d
    共 45 条
  • 1
  • 2
  • 3
  • 4
  • 5
  • 请选择