logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

面向视频编解码后处理的深度学习方法进展

1 背景介绍视频以及图像的有损压缩算法会造成较为严重的失真以及效应,比如,基于块的编码策略将会引起块效应;高频分量的缺失会造成压缩后的图像会更加模糊,还有振铃效应,颜色偏移等等。特别是在编码是在较差的编码配置下(低比特率)尤为明显。这些效应会严重降低用户体验,所以如何去除这些效应或者削弱这些效应的影响也就成为一个重要的问题。在新一代视频编码标准HEVC(High Efficiency Video

深度学习之长短期记忆网络LSTM理解

转自博客http://colah.github.io/posts/2015-08-Understanding-LSTMs/,大致翻译了一下,大神讲的很好。RNN Networks人类不会每时每刻都开始思考。当你阅读这篇文章时,你会根据你对之前单词的理解来理解每个单词。你不会扔掉所有东西,然后再从头开始思考。你的思想有持久性。传统的神经网络无法做到这一点,这似乎是一个主要的缺点。例...

#深度学习
pytorch的4种边界Padding方法

卷积操作作为卷积神经网络的核心模块,在其计算过程中必须考虑图像“边缘像素”的卷积方式。查阅资料发现,我们可以采用“卷积之前进行边界填充”或“卷积之后进行边界填充两种方式”,同时边界填充的具体手段包含常量填充、零填充、镜像填充以及重复填充等。在具体分析各种Pad之前,先创建一个2dTensor用于测试后面的填充操作:x = torch.Tensor([[1, 2], [3, 4]])创建的Tenso

文章图片
#pytorch#深度学习#机器学习
深度学习之RNN循环神经网络

最近在看RNN循环神经网络,但是网上的教程杂七杂八的太乱了,这里我将网上的教程大概整理一下,以供大家一起起学习。1、为什么需要RNN我们知道 对于传统神经网络,通过训练之后,给特定的输入就会得到期望的输出。但是对于传统的神经网络,前一个输入与后一个输入之间通常是没有联系的,并且其输出之间也是没有联系的。试想一下,如果我们要处理进行翻译一段文字,这时候将单个文字输入到神经网络里面,输...

#深度学习
深度学习之长短期记忆网络LSTM理解

转自博客http://colah.github.io/posts/2015-08-Understanding-LSTMs/,大致翻译了一下,大神讲的很好。RNN Networks人类不会每时每刻都开始思考。当你阅读这篇文章时,你会根据你对之前单词的理解来理解每个单词。你不会扔掉所有东西,然后再从头开始思考。你的思想有持久性。传统的神经网络无法做到这一点,这似乎是一个主要的缺点。例...

#深度学习
AV1视频编解码器核心编码工具概述

一、介绍在过去的十年里,基于网络的视频应用变得非常普遍,现代设备和网络基础设施推动了高分辨率、高质量内容消费的快速增长。因此,占主导地位的带宽消费者,如视频点播(VoD)、实时流媒体和会话视频,以及新兴的新应用,包括虚拟现实和云游戏,这些都非常依赖于高分辨率和低延迟,对传输基础设施提出了严峻的挑战,因此对高效视频压缩技术的需求更加强烈。二、AV1编码工具1.编码块划分VP9使用从64×64级别到4

NSST: Non-Separable Secondary Transforms for Next Generation Video Coding

摘要—在传统的图像和视频编码方案中,由于可分离变换复杂度较低,通常采用可分离的变换。然而,对于通常大多数具有任意定向的边缘和纹理图案的自然图像/视频块,可分离变换的压缩效率受到限制。众所周知,对于具有方向性的纹理图案,不可分离的变换可以实现更好的压缩效率,但是它们的计算复杂,尤其是对于较大的块而言。为了用相对低复杂度的实现方式实现更高的变换编码增益,在本文中,我们提出了不可分离的二次变换(NSST

安装opencv时候遇到terminate called after throwing an instance of 'cv::Exception'解决方法

安装opencv的时候遇到如下问题OpenCV Error: Unspecified error (The function is not implemented. Rebuild the library with Windows, GTK+ 2.x or Carbon support. If you are on Ubuntu or Debian, install libgtk2.0-de...

PTA 7-3 链表倒数n个结点的乘积 (20 分)

本题要求计算单链表倒数n个结点的乘积。例如,给出单链表1 2 3 4 5,则倒数2个结点的乘积为20。输入格式:输入有2行,第一个行为2个非负整数m和n。其中m为链表结点个数,n为链表倒数结点的数量。题目保证计算结果在int范围内。 第二行为链表的m个数,以空格分隔。输出格式:在一行中输出倒数n个结点的乘积。输入样例:5 21 2 3 4 5输出样例:20...

#数据结构
PTA 7-2 约瑟夫环 (25 分)

N个人围成一圈顺序编号,从1号开始按1、2、3......顺序报数,报p者退出圈外,其余的人再从1、2、3开始报数,报p的人再退出圈外,以此类推。 请按退出顺序输出每个退出人的原序号。输入格式:输入只有一行,包括一个整数N(1<=N<=3000)及一个整数p(1<=p<=5000)。输出格式:按退出顺序输出每个退出人的原序号,数据间以一个空格分隔,但行尾无空...

#数据结构
    共 16 条
  • 1
  • 2
  • 请选择