logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【ShapeConv2021】ShapeConv: Shape-aware Convolutional Layer for Indoor RGB-D Semantic Segmentation

RGB-D语义分割在过去几年中引起了越来越多的关注。现有的方法大多使用同质卷积算子来消耗RGB和深度特征,而忽略了它们的内在差异。事实上,RGB值捕获投影图像空间中的光度外观属性,而深度特征在更大的上下文中编码局部几何体的形状以及其基础(其周围)。与基础相比,形状可能更固有,与语义的联系更强,因此对分割精度更为关键。受此观察的启发,我们引入了一个用于处理深度特征的形状感知卷积层(ShapeConv

文章图片
#深度学习#cnn#人工智能
【DCANet2022】:DCANet: Differential Convolution Attention Network for RGB-D Semantic Segmentation

结合RGB图像和相应的深度图进行语义分割在过去几年证明了有效性。现有的RGB-D模态融合方法要么缺乏非线性特征融合能力,要么对两种模态图像一视同仁,而不考虑固有分布差距或信息损失。在这里,我们发现深度图适合提供对象固有的细粒度模式,因为它们的局部深度连续性,而RGB图像有效地提供了全局视图。在此基础上,我们提出了一个像素差分卷积注意(DCA)模块来考虑深度数据的几何信息和局部距离相关性。此外,我们

文章图片
#深度学习#cnn#计算机视觉
【RedNet2018】RedNet: Residual Encoder-Decoder Network for indoor RGB-D Semantic Segmentation

室内语义分割一直是计算机视觉中的一项困难任务。在本文中,我们提出了一个用于室内RGB-D语义分割的RGB-D残差编码器-解码器架构,名为RedNet。在RedNet中,残差模块作为基本构件被应用于编码器和解码器,并使用跳过连接来绕过编码器和解码器之间的空间特征。为了纳入场景的深度信息,我们构建了一个融合结构,它分别对RGB图像和深度图像进行推理,并将它们的特征融合在若干层上。为了有效地优化网络参数

文章图片
#计算机视觉#深度学习#人工智能
DeepLab v3

在本工作中,我们重新审视了空洞卷积这一强大的工具,它可以明确调整过滤器的视野,以及通过深度卷积神经网络计算特征响应的分辨率。我们设计了模块来处理多尺度分割对象的问题,这些模块采用多个空洞率级联或并行地使用空洞卷积来捕获多尺度上下文。此外,我们建议利用全局上下文编码图像级特征来进一步提高我们之前提出的" Atrous Spatial Pyramid Pooling" 模块对多尺度卷积特征的探究,并进

文章图片
#cnn#深度学习#计算机视觉
【U-HRNet2022】U-HRNet: Delving into Improving Semantic Representation of High Resolution Network for

分辨率和先进的语义表示对密集预测都是至关重要的。根据经验,低分辨率的特征图往往能实现更强的语义表示,而高分辨率的特征图一般能更好地识别局部特征,如边缘,但包含较弱的语义信息。现有的先进框架,如HRNet,将低分辨率和高分辨率的特征图并行保存,并在不同的分辨率下反复交换信息。然而,我们认为,最低分辨率的特征图往往包含最强的语义信息,需要经过更多的层来与高分辨率的特征图合并,而对于高分辨率的特征图,每

UNET 3+: A FULL-SCALE CONNECTED UNET FOR MEDICAL IMAGE SEGMENTATION

最近,人们对基于深度学习的语义分割产生了越来越大的兴趣。UNet是具有编码器-解码器结构的深度学习网络之一,被广泛用于医学图像分割。结合多尺度特征是准确分割的重要因素之一。UNet++是通过设计一个具有嵌套和密集跳过连接的架构,作为一个改进的Unet而开发的。然而,它并没有从全尺度中发掘足够的信息,仍有很大的改进空间。在本文中,我们提出了一个新颖的UNet 3+,它利用了全尺度跳过连接和深度监督的

文章图片
#计算机视觉#深度学习#人工智能
到底了