logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

旋转目标检测综述(持续更新中)

文章目录前言(所有检测模型)五、RRPN(倾斜文本)1.概述2.网络结构3.旋转边界框的表达(Rotated Bounding Box Representation)4。旋转的锚点(Rotation Anchors)5.兴趣区域的学习(Learning of Rotated Proposal)6.区域提取网络的优化(Accurate Proposal Refinement)7.RRoI Pooli

MAE:视觉自监督2021(原理+代码)

MAE论文「Masked Autoencoders Are Scalable Vision Learners」证明了 masked autoencoders(MAE) 是一种可扩展的计算机视觉自监督学习方法。遮住95%的像素后,仍能还原出物体的轮廓,效果如图:本文提出了一种掩膜自编码器 (MAE)架构,可以作为计算机视觉的可扩展自监督学习器使用。实现方法很简单:先将输入图像的随机部分予以屏蔽(Ma

文章图片
#计算机视觉#深度学习#人工智能
【三维分割】SAGA:Segment Any 3D Gaussians

交互式三维分割技术在三维场景理解和操作中具有重要意义,是一项值得关注的任务。然而,现有的方法在实现细粒度、多粒度分割或争夺大量计算开销方面面临挑战,抑制了实时交互。在本文中,我们引入了分段任意三维gasssin(SAGA),一种新的三维交互分割方法,无缝地将二维分割模型与三维高斯Splatting(3DGS)相结合。SAGA通过设计良好的对比训练,有效地将分割模型生成的多粒度二维分割结果嵌入到三维

文章图片
#3d
【3D点云】分割算法总结(一)

总结近3年来主要的点云分类、检测与分割算法,介绍原理与代码。

文章图片
#深度学习
【三维重建】【SLAM】SplaTAM:基于3D高斯的密集RGB-D SLAM(CVPR 2024)

SplaTAM,一个新的SLAM系统,利用3D Gaussian Splatting作为底层map表示,渲染和优化更快,明确的地图空间范围,和流线型的地图稠密化。可以同时优化pose估计、场景重建和新视图合成

文章图片
#3d#神经网络
【三维重建】VastGaussian:用于大场景重建的大3D Gaussian(CVPR 2024)

VastGaussian:基于3D GS的分块优化重建:引入了渐进式数据划分策略,允许独立的单元优化和无缝合并,获得具有足够三维高斯分布的完整场景。解耦外观建模消除了训练图像中的外观变化,实现了不同视图之间的一致渲染

文章图片
#3d#神经网络
【Backbone】TransNeXt:最新ViT模型(原理+常用神经网络汇总)

基于生物模仿视杆细胞视觉设计的Token混合器聚合注意力和一种具有门控通道注意力的通道混合器卷积GLU。作者将它们结合起来,提出一种强大的高度鲁棒的视觉模型TransNeXt,它在各种视觉任务如分类、检测和分割等方面都实现了最先进的性能。TransNeXt在多尺度推理的出色性能突显了它在解决深度衰减问题方面优于大型核策略的优势。此外,作者还提供了一个CUDA实现,在训练中实现了高达103.4%的加

文章图片
#神经网络#人工智能#深度学习
【生成模型】Stable Diffusion原理+代码

Stable diffusion是一个基于(潜在扩散模型,LDMs)的文图生成(text-to-image)模型。具体来说,得益于的计算资源支持和在LAION-5B的一个子集数据支持训练,用于文图生成。通过在一个潜在表示空间中迭代“去噪”数据来生成图像,然后将表示结果解码为完整的图像,让文图生成能够在消费级GPU上,在10秒级别时间生成图片。目前,Stable Diffusion发布了v2版本。

文章图片
#深度学习#人工智能
【三维重建】DreamGaussian:高斯splatting的单视图3D内容生成(原理+代码)

常用的3D内容创建方式,主要是利用基于优化的通过分数蒸馏采样(SDS)进行的3D生成。该方法每个样本优化较慢,很难实际应用。本文提出了DreamGaussian,兼顾效率和质量:设计一个生成的三维高斯splitting 模型,并在 uv 空间中配合网格提取和纹理细化。与NeRF中使用的 occupancy pruning 相比,三维高斯分布的渐进致密化收敛速度明显更快。为了进一步提高纹理质量,促进

文章图片
#3d#深度学习#机器学习
【图像融合】融合算法综述(持续更新)

按时间顺序,综述近5年的融合算法。重点分析了最近两年的work,欢迎留言探讨

文章图片
#算法#计算机视觉#人工智能
    共 18 条
  • 1
  • 2
  • 请选择