墨晓白个人主页

@qq_24193303

墨晓白

2022-11-24 22:15:02 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

opencv 读取普通视频、以YUV数据格式保存的视频以及图片序列的方法

在刚入门opencv的阶段，读取图片以及视频是作为初学者最需要掌握的方法。最近在上智能视频分析这门课程，通过几次实验课，发现针对不同的数据分别对应着不同的载入方式，特此开贴，记录下来，一是可以与人分享，共同进步，二是权当学习笔记记录下来，以供以后回顾。若有谬误，还望各位大佬指正，定不胜感激！！！一.普通视频的载入方式这个是入门级的教程，就不多说。主要是先定义 Vedio

#opencv

pytorch分类任务时将标签转成tensor类型

pytorch分类任务时，需要将标签转成可用于学习的tensor类型。标签可分为两种，一种是常用于多分类的整型数字标签（类似0,1,2,3）；另一种是one-hot类型，假设共有三个类别，那么1，2，3对应的one-hot 分别是0 0 0, 0 1 0, 0 0 1。一、one-hot类型的标签直接转tensor类型我们通常会将one-hot类型的标签以list的形式读取，然后直接就可以使用to

#pytorch #分类 #深度学习

pytorch分类任务时将标签转成tensor类型

#pytorch #分类 #深度学习

求取差值图像时，解决两个图像相减，差值图像结果限定在[0,255]范围内问题

这是因为当我们使用imread函数直接去加载图像时，读取的图像格式是 CV_8UC3 即为uint8 是unsigned 的，因此在图像相减过程中会自动将像素值限定在[0,255]范围内。假设img1中像素值为（12,3,255），img2像素值为（13,4,23），则img1-img2的像素值为（255,255,232），但是我们实际上是需要（-1，-1, 232）。为了解决这个问题，我们可以在

#图像处理

如何使用Tensorboard的数据，自己使用plot()函数，在同一副图中画出多条loss曲线

最近在写论文时，需要在一张图中，同时绘制出多个模型的loss变化曲线，之前虽然在训练模型时，也会使用Tensorboard来观察loss曲线的变化，但是只限于观看，并没有对立里面的数据进行提取和分析。后查找资料，成功解决问题，现将教程分享如下：一、下载Tensorboard中的loss曲线的数据1.选中左上角的 Show data download links2.选中右下角的下载文件的...

#机器学习

关于torch.max(a,dim)中维度的选取

Pytorch中，经常会使用torch.max(a,dim)对tensor进行处理，特别是针对多维的tensor，就感觉对dim的选取似懂非懂。一、针对1维的数据这个比较好理解，就是针对1维的数据取最大值，返回一个tensor类型的数值，和该数值对应的下标，合起来就是一个tuple类型。import torcha = torch.randn(3) #随机生成数组max=torch.max(a,di

#python

可视化特征图

一副图像输入网络中，每一层都会生成特征图，将指定层的特征图进行可视化，可以方便我们直观去理解每层网络提取出的特征是什么。主要分为三个步骤：1.将输入图片转成tensor形式[1,c,h,w], 其中1代表batchsize为12.创建模型，并且指定需要可视化的层3.保存特征图的每一层，转成伪彩图进行保存from torchvision import datasets, models, transf

深度学习训练模型时，使用argparse模块以及shell脚本，进行“炼丹”

我们在训练模型时，进场需要调整batchsize,初始学习率，以及模型中的超参数，以求达到最好的实验效果。如果采用传统操作，即这个模型跑完之后，手动调整模型参数，然后再开始训练模型，显而易见，这种方法费时又费力。下面就介绍一种使用argparse模块以及shell脚本，进行“炼丹”的方式。一、argparse模块1.1 参数的定义argparse模块感觉就是一个全局变量，在运行程序时，如果没有给某

#深度学习 #机器学习 #pytorch

关于二分类，多分类，及多标签分类的损失函数详解及Pytorch实现

相信很多小伙伴最开始都是从分类任务入手深度学习这个领域的吧，这个就类似学习代码的第一课，“Hello world”一样。深度学习中，除了模型设计之外，最重要的想必就是选取合适的损失函数了。不过一般实验中，损失函数的调用十分简单，也就是一行代码的事情，但是最近发现，好多小伙伴，对于损失函数的基础意义及实现细节，还是不甚了解，所以在此对分类任务中常用的交叉熵损失函数进行详细的介绍。1. 交叉熵（Cro

#分类 #pytorch #数据挖掘

CNN以及Transformer特征图可视化

热力图是一张和原始图片等同大小图，该图片上每个位置的像素取值范围从0到1，一般用0到255的灰度图表示。可以理解为对预测输出的贡献分布，分数越高的地方表示原始图片对应区域对网络的响应越高、贡献越大。主要有两种类型的可视化方法，利用GAP层，以及基于梯度传导的方法，具体可参考文档万字长文：特征可视化技术(CAM)https://mp.weixin.qq.com/s/WKImrtpjQBziz6Wr5

#cnn #transformer

共 14 条

请选择