Horizon2333 个人主页

@Horizon2333

Horizon2333

2024-06-18 19:00:25 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

读取视频并转换为Tensor方法对比

最近在学习视频问答（Video Question Answering），发现视频问答中对于视觉特征的处理通常是使用预训练模型提前处理好的，然而运行一些提取特征的代码的时候发现GPU占用率并不高，发现大部分时间花费在了加载视频上，考虑到以后大量的读取需求，于是自己做了一些使用python库加载视频的实验。使用的方法如下：方法结果备注opencv√scikit-video√imageio√vidgea

#计算机视觉 #深度学习 #pytorch

视频问答数据集解析和可视化

最近在学习视频问答相关的内容，相关的数据集找起来比较麻烦，网上也没有太多介绍，因此写这篇博客，总结一下常用的数据集，对他们的数据解析方式进行介绍，并进行简单的可视化。1. MSVD-QA该数据集共有1970个视频，大小约为1.7G数据集官方网站：link数据集视频下载网站：link (相比官网命名更规律)数据集标注下载网站：link标注文件格式为json,每个标注都是一个dict标注加载代码：im

#深度学习

视频问答数据集解析和可视化

#深度学习

到底了