logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

无参考图像质量评估方法:BRISQUE、RankIQA、DIQA详解

常用的图像质量评估(IQA)分为无参考和有参考两种类型。常见的有参考图像质量评估方法有PSNR,SSIM以及VMAF。其中vmaf是针对视频来讲的,在它的评价方法里面添加了一些时域信息,如果应用于单张图片,需要做一些处理,如去除时域信息。有参考意味着图像质量是以参考图为基准。基于参考图像都是高清图像的假设,这些评价方法已经广泛应用于图像压缩以及图像传输、拼接之类的处理后图像的质量,假如这...

卷积层和归一化层融合以及ONNX的使用

之前就已经提到过,在神经网络种涉及到归一化的操作中就要特别小心。一方面是训练和推理阶段要有明确的标识来进行区分。否则,就会导致训练和推理的结果相差很大。另一方面就是归一化的方法很多,大致可分为:...

#pytorch#深度学习
贝叶斯优化器

基于github上的一个贝叶斯优化开源项目,其用法在项目的说明中有详细英文记录,这里主要是整理简化,并参考了其他文献来记录一下项目中用的数学函数以及论文中一些单词的说明。原理这篇文章(参考一)从详细说明了该项目的核心思想和过程,包括该过程用到的先验函数和采集函数的介绍。博客和github项目里面都提到了exploration与exploitation这两个单词。可以解释为不确定策略的探索(Expl

#算法
无参考图像质量评估方法:BRISQUE、RankIQA、DIQA详解

常用的图像质量评估(IQA)分为无参考和有参考两种类型。常见的有参考图像质量评估方法有PSNR,SSIM以及VMAF。其中vmaf是针对视频来讲的,在它的评价方法里面添加了一些时域信息,如果应用于单张图片,需要做一些处理,如去除时域信息。有参考意味着图像质量是以参考图为基准。基于参考图像都是高清图像的假设,这些评价方法已经广泛应用于图像压缩以及图像传输、拼接之类的处理后图像的质量,假如这...

颜色空间和色域映射

一般的设备通常是用RGB的方式来表示颜色,但是随着新的标准和设备的不断更新,出现了在不同色域下的RGB表示方式。比较常见的是bt2020,bt709和bt601等。出现这些原因主要是随着硬件设备的更迭,显示器可以表达了更广的色域。随之而来就带来了一些所谓的看到同一颜色统一的问题,例如在bt2020下的红色RGB=(1,0,0)和bt709下的RGB=(1,0,0)是不一样的红。在BT709的显示器

#算法
杜比视界HDR参数

之前已经介绍了基于HDR10和HLG的HDR视频的相关参数,但是由于本身这类视频在市场上属于少数,或者由于设备的不支持都没有正确的观看,更不要提杜比视界这种更高端的玩家了。不过随着iPhone12的推出,由于其支持HLG格式的杜比视界HDR视频拍摄,杜比视界的片源大大增加。这就有点蒙圈了,不是说杜比视界是在PQ转换曲线的基础上使用动态元数据么,HLG是没有元数据的HDR。接下来主要是围绕这些疑问来

#html5#vue.js#javascript
FFmpeg:常用命令小笔记

FFmpeg的详细介绍可以查看官网wiki提供的一些信息,这里只是列举具体几种常用的命令一:格式转换#普通封装格式的转换ffmpeg -i input_video.avi output_video.mp4# yuv之间不同格式互转,如果出现花屏现象,注意查看尺寸是否设置正确。ffmpeg -s 1280*720 -pix_fmt yuv444p -i input.yuv -pix_........

文章图片
#音视频
HDR中HLG与PQ曲线的互转

HDR视频中由于电光转换曲线的不同,技术标准也大致分为了杜比视界、HDR10+、HDR10、HLG等,目前常用的主要是以PQ曲线的HDR10和HLG。这两者之间的区别在HDR视频编码参数中进行过详细的说明。一般的HLG适用于广电(根据用户设备的峰值亮度动态的调整最高显示亮度),PQ适用于数码电脑等(绝对的亮度,如果设备达不到,则进行削峰)。他们之间根据不同的用户选择不同的技术标准。如果知道其中一个

HDR视频的编码参数

对于hdr视频的一个ffmpeg编解码命令或者参数在该篇中进行过记录,这里来详细解释一下其中参数的意义。解码因为以mp4等封装格式的视频里面已经包含了相关编解码信息,所以不需要什么复杂参数即可解码成yuv格式的视频。ffmpeg -i input.mp4 -y output.yuv解码后变成了yuv这种纯数据格式,如果涉及到hdr视频的话,相应的元数据metadata...

TensorFlow:将多个pb文件模型合并成一个

由于计算机计算能力的增强和相关AI芯片的产出,深度学习中的神经网络结构也是朝着更深、更宽等方向发展。总之就是相应的网络结构参数越来越多,结构越来越复杂。这样无论对于工作还是学习上,想要训练一个网络变得越来越困难。迁移学习的概念很好的解决了这个问题。在之前的视频场景分类中介绍过,将一张图片输入到一个网络,在具体的分类层的前一层输出的数据可以看成是这张图片的全局特征。我们只需对相应的特征进行处理。因此

    共 12 条
  • 1
  • 2
  • 请选择