论文浏览(16) A Novel Online Action Detection Framework from Untrimmed Video Streams

文章目录0. 前言1. 要解决什么问题2. 用了什么方法3. 效果如何4. 还存在什么问题0. 前言相关资料：arxivgithub论文解读论文基本信息领域：在线行为检测作者单位：高丽大学发表时间：2020.31. 要解决什么问题在Untrimmed Videos中做Online Action Detection主要的挑战在于：在Untrimmed Videos中，可能会发生的动作不止一种。在On

清欢守护者

339人浏览 · 2020-07-07 14:59:52

清欢守护者 · 2020-07-07 14:59:52 发布

文章目录

0. 前言

相关资料：
- arxiv
- github
- 论文解读
论文基本信息
- 领域：在线行为检测
- 作者单位：高丽大学
- 发表时间：2020.3

1. 要解决什么问题

在Untrimmed Videos中做Online Action Detection主要的挑战在于：
- 在Untrimmed Videos中，可能会发生的动作不止一种。
- 在Online的限制下，只能获取当前以及过去的数据。

2. 用了什么方法

提出一种Online Action Detection的解决方案。
- 使用了 future frame generation，预测未来帧作为后续模型输入。
- 构建 Proposal Representation 分支，用于判断当前输入是否是action，只用来区分 action 与 background。
  - 类似于 faster rcnn 中的RPN阶段。
- 构建了 Action Recognition 分支用于，用于判断行为类别以及是beginning phases还是end phases。
  - 将每一类都分为 beginning phases 和 end phases 两个阶段，具体怎么划分
  - 论文中说是AR分支是用来学习 Traits （特点，即每个行为开始/结束时候都有其固定的特点）与Temporal Order（猜测意思就是预测动作的起始/结束阶段）。
- 构建了 $F^2G$ 分支，即future frame generation，用于预测未来帧。
- 构建detection network，通过PR/AR提取的特征，在做Temporal的特征融合时使用了LSTM。
- AR/PR 模型结构如下，感觉就是很普通的3D网络

3. 效果如何

给出了与一些offline的temporal action detection方法的结果对比，明显是不如这些offline的方法。

4. 还存在什么问题

论文自己就给出了存在的问题
- 需要大量计算资源，整体模型有174M的参数。
- BP时受限，因为显存有限，不能同时放入所有参数。
- 依赖future frame预测的性能。

AtomGit 开源协作平台测评赛

瓜分20万奖金获得内推名额丰厚实物奖励易参与易上手

更多推荐

mac 使用brew卸载安装node

mac 使用brew卸载安装node卸载1. 查看当前安装的node版本：node -v2. 卸载node：brew uninstall node@版本号 --force比如安装的是12.18.1，使用brew uninstall node@12 --force。还有另外两种现在不能用的方法：使用brew uninstall node，会报错：Error: No such keg: /usr/lo

开放原子开发者工作坊

诺，你们要的Python进阶来咯！【函数、类进阶必备】

目录一、Python进阶初体验——内置函数1、数据类型相关2、数值计算相关3、bool 值判断相关4、IO 相关5、元数据相关6、help()函数7、sorted()函数8、range()函数二、给代码安个家——函数进阶1、位置参数2、参数默认值3、关键字参数4、任意参数列表5、多返回值三、让你函数更好用——类进阶1、类属性和类方法（1）类属性的定义（2）类方法的定义2、静态方法3、私有属性、方法