logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

深度学习论文精读[14]:Vision Transformer

从这篇文章开始,我们把深度学习语义分割的目光转向Transformer,即基于ViT的语义分割模型。在正式介绍Transformer分割网络之前,需要先了解一下ViT的分类网络。Vision Transformer (ViT) 可以算是整个Visuier任务的backbone网络。提出ViT模型的这篇文章题名为An Image is Worth 16x16 Words: Transformers

深度学习论文精读[7]:nnUNet

相较于常规的自然图像,以UNet为代表的编解码网络在医学图像分割中应用更为广泛。常见的各类医学成像方式,包括计算机断层扫描(Computed Tomography, CT)、核磁共振成像(Magnetic Resonance Imaging, MRI)、超声成像(Ultrasound Imaging)、X光成像(X-ray Imaging)和光学相干断层扫描(Optica...

#网络#计算机视觉#机器学习 +2
深度学习100问-15:什么是深监督(Deep Supervision)?

深度学习100问Author:louwillMachine Learning Lab所谓深监督(Deep Supervision),就是在深度神经网络的某些中间隐藏层...

深度学习第54讲:训练一个深度卷积对抗网络DCGAN

自从GoodFellow提出GAN以后,GAN就存在着训练困难、生成器和判别器的loss无法指示训练进程、生成样本缺乏多样性等问题。为了解决这些问题,后来的研究...

深度学习100问-9:为什么EfficientNet号称是最好的分类网络?

深度学习100问Author:louwillMachine Learning LabModel Scaling(模型扩展)一直以来都是提高卷积神经网络...

《深度学习图像分割》第2章:传统图像分割算法

《深度学习图像分割》这本书写写停停,历经三年多,目前在二稿修订中。正式出版之前,计划先在GitHub做逐步的内容和代码开源。以下为本书第2章节选内容:图像分割是数字图像处理和计算机视觉领域中的一个经典问题,旨在将图像划分为若干具有特定意义的子区域或目标对象。图像分割是一种典型的图像处理方法,其输入和输出都是图像。传统的图像分割方法通常基于图像的两个基本属性:灰度值的不连续性和灰度值的相似性,并围绕

#深度学习#算法#人工智能
深度学习100问-6:有哪些经典的卷积类型?

深度学习100问Author:louwillMachine Learning Lab在前面五篇文章的准备之后,从今天开始,我们就正式进入深度学习的主题...

深度学习论文精读[13]:Deeplab v3+

Deeplab v3+是Deeplab系列最后一个网络结构,也是基于空洞卷积和多尺度系列模型的集大成者。相较于Deeplab v3,v3+版本参考了UNet系列网络,对基于空洞卷积的Deeplab网络引入了编解码结构,一定程度上来讲,Deeplab v3+是编解码和多尺度这两大系列网络的一个大融合,在很长一段时间内代表了自然图像语义分割的SOTA水平的分割模型。提出Deeplab v3+的论文为E

#网络#机器学习#人工智能 +1
深度学习论文精读[3]:SegNet

在场景理解(Scene understanding)和自动驾驶(Autonomous driving)等应用领域,仅关注分割精度并不能满足应用需要,更应该关注模型推理速度和内存占用等性能。在编解码分割框架上,不同的方法在编码器上一般都是大同小异,但在上采样解码器上各有不同。来自剑桥的研究团队认为,在内存不受限和实时性要求不高的情况下,UNet将编码器中的特征图全部连接到解...

#网络#深度学习#计算机视觉 +1
深度学习论文精读[8]:ParseNet

U形的编解码结构奠定了深度学习语义分割的基础,随着基线模型的表现越来越好,深度学习语义分割关注的焦点开始由原先的编解码架构下上采样如何更好的恢复图像像素转变为如何更加有效的利用图像上下文信息和提取多尺度特征。因而催生出语义分割的第二个主流的结构设计:多尺度结构。接下来的几篇论文解读将对重在关注图像上下文信息和多尺度特征的结构设计网络进行梳理,包括ParseNet、PSPN...

#计算机视觉#机器学习#人工智能 +1
    共 129 条
  • 1
  • 2
  • 3
  • 13
  • 请选择