VoTT是微软发布的用于图像目标检测的标注工具,它是基于javascript开发的,因此可以跨Windows和Linux平台运行,并且支持从图片和视频读取。此外,其还提供了基于CNTK训练的faster-rcnn模型进行自动标注然后人工矫正的方式,这样大大减轻了标注所需的工作量。
github地址:https://github.com/Microsoft/VoTT/
它最主要的三大特性:

  1. 能够标注图像,也能支持从单独视频中标志。
  2. 使用Camshift跟踪算法对视频中的对象进行计算机辅助标记和跟踪,不用每一帧每一帧的标注。
  3. 能够导出CNTK、tesnorflow(VOC)和YOLO等各种格式的标注数据用于训练。

我用最简单的安装方式,使用预编译的包,可以点此下载
双击VoTT.exe运行
在这里插入图片描述

在这里插入图片描述Frame Extraction Rate: 每秒钟从视频中提取多少张图片。比如一段帧率为30帧每秒的视频,如果此处设为1,就是每隔30帧标注一张
Tagging Region Type: 标注区域的类型,有Rectangle和Square可选
Suggested Region Method: 可选(1)Tracking: 用camshift 来预测下一帧标注的位置。(2)Copy Last Frame: copy上一帧的
Enable Scene Change Detection: 场景更改检测,防止因为场景变化而产生的跟踪错误,选择此项的话生成速度会比较慢
Labels: 标注的标签,比如狗 人 猫 汽车什么的

在这里插入图片描述
这里要注意的是,如果跳帧标注的话,由于camshift 算法的局限性,不是都能在下一帧成功标注的

输出的话,点击上方object detection中的Export Tags
在这里插入图片描述

Logo

旨在为数千万中国开发者提供一个无缝且高效的云端环境,以支持学习、使用和贡献开源项目。

更多推荐