VoTT视觉目标标注工具使用笔记

VoTT是微软发布的用于图像目标检测的标注工具，它是基于javascript开发的，因此可以跨Windows和Linux平台运行，并且支持从图片和视频读取。此外，其还提供了基于CNTK训练的faster-rcnn模型进行自动标注然后人工矫正的方式，这样大大减轻了标注所需的工作量。github地址：https://github.com/Microsoft/VoTT/它最主要的三大特性：能够标...

文章共593字 · 阅读需要大约2分钟

一键AI生成摘要，助你高效阅读

问答

Fan72

9202人浏览 · 2019-03-01 14:01:16

Fan72 · 2019-03-01 14:01:16 发布

VoTT是微软发布的用于图像目标检测的标注工具，它是基于javascript开发的，因此可以跨Windows和Linux平台运行，并且支持从图片和视频读取。此外，其还提供了基于CNTK训练的faster-rcnn模型进行自动标注然后人工矫正的方式，这样大大减轻了标注所需的工作量。
github地址：https://github.com/Microsoft/VoTT/
它最主要的三大特性：

能够标注图像，也能支持从单独视频中标志。
使用Camshift跟踪算法对视频中的对象进行计算机辅助标记和跟踪，不用每一帧每一帧的标注。
能够导出CNTK、tesnorflow（VOC）和YOLO等各种格式的标注数据用于训练。

我用最简单的安装方式，使用预编译的包，可以点此下载
双击VoTT.exe运行
在这里插入图片描述

在这里插入图片描述 Frame Extraction Rate: 每秒钟从视频中提取多少张图片。比如一段帧率为30帧每秒的视频，如果此处设为1，就是每隔30帧标注一张
Tagging Region Type: 标注区域的类型，有Rectangle和Square可选
Suggested Region Method: 可选（1）Tracking： 用camshift 来预测下一帧标注的位置。（2）Copy Last Frame： copy上一帧的
Enable Scene Change Detection: 场景更改检测，防止因为场景变化而产生的跟踪错误，选择此项的话生成速度会比较慢
Labels: 标注的标签，比如狗人猫汽车什么的