简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
opencv保存的视频占用太大,linux下用ffmpeg将视频转为h264格式压缩大小
opencv 读取读片并拼接成视频后,视频大小出奇的大,30多万帧占用30G。因此使用ffmpeg将视频转码为h264格式,减少至3G。ffmpeg需要提前linux自己安装好。
对vit(Vision Transformer)的注意力可视化。使用grad_cam方法
首先定义函数对vit输出的3维张量转换为传统卷积处理时的二维张量,gradcam需要。#(B,H*W,feat_dim)转换到(B,C,H,W),其中H*W是分pathc数。具体参数根据自己模型情况#我的输入为224*224,pathsize为(16*16),那么我的(H,W)就是(224/16,224/16),即14*14# 去掉cls token# 将通道维度放到第一个位置# 创建 GradC
到底了