logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

opencv保存的视频占用太大,linux下用ffmpeg将视频转为h264格式压缩大小

opencv 读取读片并拼接成视频后,视频大小出奇的大,30多万帧占用30G。因此使用ffmpeg将视频转码为h264格式,减少至3G。ffmpeg需要提前linux自己安装好。

文章图片
#opencv#音视频#linux
对vit(Vision Transformer)的注意力可视化。使用grad_cam方法

首先定义函数对vit输出的3维张量转换为传统卷积处理时的二维张量,gradcam需要。#(B,H*W,feat_dim)转换到(B,C,H,W),其中H*W是分pathc数。具体参数根据自己模型情况#我的输入为224*224,pathsize为(16*16),那么我的(H,W)就是(224/16,224/16),即14*14# 去掉cls token# 将通道维度放到第一个位置# 创建 GradC

文章图片
#transformer#深度学习#人工智能
到底了