AI算法-图哥个人主页

@weixin_45250844

AI算法-图哥

2022-12-28 21:36:40 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

图像修复之Image Inpainting for Irregular Holes Using Partial Convolutions

1. 摘要现有的基于深度学习的图像修补方法在损坏的图像上使用标准卷积网络，使用卷积滤波器响应以有效像素以及掩蔽孔中的替代值（通常为平均值）为条件。这通常会导致诸如颜色差异和模糊等伪影。后处理通常用于减少这些工件，但代价很高，可能会失败。我们提出使用部分卷积，部分卷积指的是卷积只在图片的有效区域进行(mask部分为0)，并且图片的mask会随着网络的层数加深不断迭代和收缩，也就是说带有mask

#计算机视觉 #深度学习

图像修复之DeepFill: Free-Form Image Inpainting with Gated Convolution

1. 摘要作者提出了一种生成式图像修复系统，该系统基于从数百万个图像中学习的门控卷积，无需额外的标记工作。作者所提出的卷积解决了将所有输入像素都视为有效像素的香草卷积问题，通过为所有通道在所有层上的每个空间位置提供可学习的动态特征选择机制来概括部分卷积。此外，由于自由形式的蒙版可能会出现在任何形状的图像中，因此为单个矩形蒙版设计的全局和局部GAN均不适用。因此，我们还通过应用频谱归一化提出了基于补

#深度学习 #计算机视觉 #图像处理

《Fast End-to-End Trainable Guided Filter》阅读笔记

1. 介绍这篇论文主要是将引导滤波的思想引入到了网络之中，先在小图上进行学习，再通过在引导滤波器上学习针对特定任务的引导图实现对生成小图上采样，最后恢复大图。这种思想在Deep bilateral里面已经使用过，但是这篇论文里生成的大量仿射系数使得速度受到了限制。论文：https://arxiv.org/abs/1803.05619代码：https://github.com/wuhuika...

人脸关键点数据集整理

1. 什么是关键点检测？人脸关键点检测是指给定人脸图像，定位出人脸面部的关键点，包括眉毛、眼睛、鼻子、嘴巴、脸部轮廓区域的点，由于受到姿态和遮挡等因素的影响，人脸关键点检测是一个富有挑战性的任务。人脸关键点是人脸各个部位的重要特征点，通常是轮廓点与角点，下图是96个面部关键点检测结果。其中点代表位置，数字代表序号。人脸关键点可以有以下主要应用：人脸姿态对齐，人脸识别等算法都需要对人脸的姿态进行对齐

#计算机视觉 #深度学习

BSRGAN | 一种针对真实图像退化的盲图像超分模型

1. 摘要众所周知，当图像超分的预假设退化模型与真实图像的退化方式不匹配时，模型的性能会出现性能下降，甚至负面效果现象。尽管已有集中退化模型考虑的额外的影响因素(比如模糊核以及程度)，但是它们仍然无法有效覆盖真实图像的多样性退化方式。为解决该问题，本文设计了一种更复杂但实用的退化模型，它包含对模糊、下采样以及噪声退化的随机置换(也就是说每种退化对应多种类型，且顺序会进行随机调整)。具体来说，模糊退

#图像处理

图像质量评估-NIMA（Neural Image Assessment）

1. 背景图像质量和美学的量化一直是图像处理和计算机视觉长期存在的问题。技术质量评估测量的是图像在像素级别的损坏，例如噪声、模糊、人为压缩等等，而对艺术的评估是为了捕捉图像中的情感和美丽在语义级别的特征。通常情况下，图像的质量评估一般分为两种：有参照(Full-Reference,FR)：PSNR(峰值信噪比)、SSIM(标准-结构相似度)等图像质量评分系统无参照(No-Referen...

MIT5K数据集的使用

1. MIT5K数据集介绍MIT-Adobe FiveK是现在很多做图像增强（image enhancement）与图像修饰（image retouching）方面研究的人员经常会使用到的数据库。这个数据库中包含5000张dng格式的原始图片及分别由五个（A，B，C，D，E）专业修图人员手工修饰后的图片。关于该数据库的详细资料可以在：https://data.csail.mit.edu/graph

噪声及降噪算法总结

1. 噪声介绍噪声是图像中不请自来的信号。当相机拍摄一个亮度十分均匀的区域时，相机输出的结果会不可避免地叠加一部分噪声。相机的输出信号=真实信号+噪声信号。由于真实信号的具体值是未知的，所以只能用多次测量的平均值来代替。用数学公式表示就是，在数码照相机和摄影机产品中，总的规律是光圈越小、（电子）快门越短、ISO越高，图像噪声就越大。2. 噪声类型高斯噪声 Gaussian，也称热噪声或约翰逊-奈奎

#计算机视觉 #人工智能 #图像处理

LSTM原理详解

1. 递归神经网络在传统神经网络中，模型不会关注上一时刻的处理会有什么信息可以用于下一时刻，每一次都只会关注当前时刻的处理。举个例子来说，我们想对一部影片中每一刻出现的事件进行分类，如果我们知道电影前面的事件信息，那么对当前时刻事件的分类就会非常容易。实际上，传统神经网络没有记忆功能，所以它对每一刻出现的事件进行分类时不会用到影片已经出现的信息，那么有什么方法可以让神经网络能够记住这些信息呢？..

#计算机视觉 #深度学习

3D LUT图像处理

1. 介绍在我们开始之前，先对必要的背景知识做一些简单的铺垫。LUT 是 Lookup Table 的缩写，在图像处理方面，LUT 可以用来完成类似滤镜的效果，其原理本质上就是一个映射关系，输入颜色 (r, g, b)，通过 LUT 去查找，得到一个新的颜色 (R, G, B)，则完成了一次映射操作。LUT 又分为 1D LUT 和 3D LUT，1D LUT 是指 R, G, B 三个分量互相不

#图像处理 #人工智能

共 27 条

请选择