logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

时空行为检测数据集 MultiSports 详解

文章目录0. 前言1. 时空行为检测数据集现状2 MultiSports 介绍3 现有时空行为检测数据集统计与对比4 实验结果0. 前言相关资料官方资料:论文,官网,竞赛链接(2021.9.1)发布时间:ICCV 2021发布机构:南京大学一句话总结:机遇篮球、足球、体操、排球赛事的大型时空行为检测数据集。本数据集是 DeeperAction Workshop 三个赛道之一。数据集获取方式就是到竞

目标检测 - End-to-End Object Detection with Transformers

文章目录0. 前言1. 要解决什么问题2. 用了什么方法3. 效果如何4. 还存在什么问题&可借鉴之处0. 前言相关资料:arxivgithub论文解读,知乎讨论,知乎讨论2论文基本信息领域:目标检测作者单位:FAIR发表时间:2020.5一句话总结:提出了一种不同于之前工作的新目标检测解决方案1. 要解决什么问题当前的目标检测解决方案(比如Faster RCNN/YOLO/CenterN

#目标检测#计算机视觉#深度学习
行为识别 - TAM: Temporal Adaptive Module for Video Recognition

文章目录0. 前言1. 要解决什么问题2. 用了什么方法3. 效果如何4. 还存在什么问题0. 前言相关资料:arxivgithub:等论文接收了就开源论文解读论文基本信息领域:行为识别作者单位:南京大学&商汤研究院发表时间:2020.51. 要解决什么问题深度学习领域,视频相关研究比图像相关研究少/慢一些。视频相比于图像,其主要区别在于,除了要考虑空间特征,还需要考虑时间特征。在行为识别

#深度学习#计算机视觉
行为识别 - TDN: Temporal Difference Networks for Efficient Action Recognition

文章目录0. 前言1. 要解决什么问题2. 用了什么方法3. 效果如何4. 还存在什么问题&可借鉴之处0. 前言相关资料:arxivgithub:还没有开源论文解读论文基本信息领域:行为识别作者单位:南京大学发表时间:2020.12一句话总结:使用RGB difference设计了新的特征提取结构。1. 要解决什么问题探索高效的temporal modeling方式。常见的 tempora

行为识别 - X3D: Expanding Architectures for Efficient Video Recognition

文章目录0. 前言1. 要解决什么问题2. 用了什么方法3. 效果如何4. 还存在什么问题0. 前言相关资料:arxivgithub:说会放到slowfast里,但暂时还没有放论文解读论文基本信息领域:视频理解,包括行为识别、Temporal Action Detection作者单位:FAIR发表时间:2020.41. 要解决什么问题当前视频理解相关的模型基本都是在2D卷积神经网络的基础上进行一些

视频理解相关源码解析

文章目录0. 前言1. 综合项目总体对比2. 分别介绍2.1 MMAction22.2 SlowFast2.3 PyTorchVideo2.4 MMAction2.5 PaddleVideo2.6 GluonCV0. 前言在视频理解领域搞了一年多,看了不少源码,记录一下。一般开源项目分为综合性源码库:包括众多类型数据(动作识别、时序动作检测、时空动作检测)、模型,还包括各种训练、测试、可视化、部署

数据增强 - Cutout、Random Erasing、Mixup、Cutmix

文章目录0. 前言1. Cutout1.1. 要解决什么问题1.2. 用了什么方法1.3. 效果如何1.4. 还存在什么问题&可借鉴之处2. Rand Erasing2.1. 要解决什么问题2.2. 用了什么方法2.3. 效果如何2.4. 还存在什么问题&可借鉴之处3. Mixup3.1. 要解决什么问题3.2. 用了什么方法3.3. 效果如何3.4. 还存在什么问题&可借

#计算机视觉
阿里云部署静态网站

文章目录0. 前言1. 网站备案2. 阿里云部署静态网站2.1. Nginx 的安装与常用命令2.2. nginx 配置0. 前言属于记笔记三部曲的最后一步:第一步:通过Markdown记录笔记,选择适合自己的Markdown编辑器。第二步:将Markdown文件转换为网站,即选择适当的静态网站生成器。第三步:部署生成好的静态网站,并设置域名。更方便的方式是将网站部署在Github Pages中,

#nginx#阿里云
TensorRT 入门(7) INT8 量化

文章目录0. 前言1. sampleINT81.1 实例简介1.2 扩展阅读2. sampleINT8API2.1 实例简介2.2 扩展阅读3. Python Caffe MNIST INT80. 前言TensorRT 提供了 FP16 量化与 INT8 量化。前者通过 FP32 engine 或 ONNX 模型就可以直接得到。后者多了一步操作,需要进行校准(calibration),生成校准文件

SlowFast/mmaction2 中的 GradCAM 工具

文章目录0. 前言1. SlowFast 中的 GradCAM1.1. GradCAM的功能1.2. GradCAM 的原理1.3. SlowFast 中的具体实现2. mmaction2 复现 GradCAM 功能2.1. mmaction2 中的 shape2.2. GradCAM 的具体实现2.3. 其他0. 前言最近一直在mmaction2上进行二次开发,有一个需求,想实现一个gradca

    共 37 条
  • 1
  • 2
  • 3
  • 4
  • 请选择