
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
读取视频并转换为Tensor方法对比
最近在学习视频问答(Video Question Answering),发现视频问答中对于视觉特征的处理通常是使用预训练模型提前处理好的,然而运行一些提取特征的代码的时候发现GPU占用率并不高,发现大部分时间花费在了加载视频上,考虑到以后大量的读取需求,于是自己做了一些使用python库加载视频的实验。使用的方法如下:方法结果备注opencv√scikit-video√imageio√vidgea
视频问答数据集解析和可视化
最近在学习视频问答相关的内容,相关的数据集找起来比较麻烦,网上也没有太多介绍,因此写这篇博客,总结一下常用的数据集,对他们的数据解析方式进行介绍,并进行简单的可视化。1. MSVD-QA该数据集共有1970个视频,大小约为1.7G数据集官方网站:link数据集视频下载网站:link (相比官网命名更规律)数据集标注下载网站:link标注文件格式为json,每个标注都是一个dict标注加载代码:im
视频问答数据集解析和可视化
最近在学习视频问答相关的内容,相关的数据集找起来比较麻烦,网上也没有太多介绍,因此写这篇博客,总结一下常用的数据集,对他们的数据解析方式进行介绍,并进行简单的可视化。1. MSVD-QA该数据集共有1970个视频,大小约为1.7G数据集官方网站:link数据集视频下载网站:link (相比官网命名更规律)数据集标注下载网站:link标注文件格式为json,每个标注都是一个dict标注加载代码:im
到底了







