logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

目标检测 - End-to-End Object Detection with Transformers

文章目录0. 前言1. 要解决什么问题2. 用了什么方法3. 效果如何4. 还存在什么问题&可借鉴之处0. 前言相关资料:arxivgithub论文解读,知乎讨论,知乎讨论2论文基本信息领域:目标检测作者单位:FAIR发表时间:2020.5一句话总结:提出了一种不同于之前工作的新目标检测解决方案1. 要解决什么问题当前的目标检测解决方案(比如Faster RCNN/YOLO/CenterN

#目标检测#计算机视觉#深度学习
Yolov5 (1) 训练过程记录与解析

文章目录0. 前言1. 数据集相关1.1 自定义数据集构建1.2 数据增强策略2. 训练相关2.1 训练基本流程与参数2.2 超参数解析2.2 训练过程与结果解析0. 前言官方文档(官方资料总是最好的,必须先阅读):Train Custom Data:跑通DemoTips for Best Training Results:数据集构建经验,非常推荐阅读,本文不多介绍Multi-GPU Traini

数据增强 - Cutout、Random Erasing、Mixup、Cutmix

文章目录0. 前言1. Cutout1.1. 要解决什么问题1.2. 用了什么方法1.3. 效果如何1.4. 还存在什么问题&可借鉴之处2. Rand Erasing2.1. 要解决什么问题2.2. 用了什么方法2.3. 效果如何2.4. 还存在什么问题&可借鉴之处3. Mixup3.1. 要解决什么问题3.2. 用了什么方法3.3. 效果如何3.4. 还存在什么问题&可借

#计算机视觉
标注工具 VoTT 详细教程

文章目录1. 概述1.1. VoTT 的功能1.2. 下载与安装2. 入门基本使用2.1. 准备工作2.2. 新建项目2.3. 标注bbox2.4. 导出标注结果3. 功能详解3.1. 自动标定(Active Learning)3.2. 视频帧相关3.3. Tags 设置3.4. 标注结果导出3.5. 标框的第三种方式3.6. 其他没有详细研究的内容1. 概述我并没有看过源码,只是看了官方READ

#目标检测
论文浏览(22) TEINet: Towards an Efficient Architecture for Video Recognition

文章目录0. 前言1. 要解决什么问题2. 用了什么方法3. 效果如何4. 还存在什么问题0. 前言相关资料:arxivgithub论文解读论文基本信息领域:行为识别作者单位:南大&腾讯发表时间:AAAI 20201. 要解决什么问题行为识别中的老问题:3D CNN 可以对时间进行建模,但参数量太大,需要大量算力。2D CNN 参数少、计算量小,但无法直接对时间进行建模。2. 用了什么方法

Backbone - Involution: Inverting the Inherence of Convolution for Visual Recognition

文章目录0. 前言1. 要解决什么问题2. 用了什么方法3. 效果如何4. 还存在什么问题&可借鉴之处0. 前言相关资料:arxivgithub论文解读论文基本信息领域:卷积基本结构作者单位:港科技&字节发表时间:CVPR 2021 Oral一句话总结:设计了一种“内卷”的卷积结构替代普通卷积,卷积核是通过特征图算出来的1. 要解决什么问题卷积操作有两个固有特点spatial-ag

论文浏览(16) A Novel Online Action Detection Framework from Untrimmed Video Streams

文章目录0. 前言1. 要解决什么问题2. 用了什么方法3. 效果如何4. 还存在什么问题0. 前言相关资料:arxivgithub论文解读论文基本信息领域:在线行为检测作者单位:高丽大学发表时间:2020.31. 要解决什么问题在Untrimmed Videos中做Online Action Detection主要的挑战在于:在Untrimmed Videos中,可能会发生的动作不止一种。在On

论文浏览(14) STM: SpatioTemporal and Motion Encoding for Action Recognition

文章目录0. 前言1. 要解决什么问题2. 用了什么方法3. 效果如何4. 还存在什么问题0. 前言相关资料:arxivgithub论文解读论文基本信息领域:行为识别作者单位:浙大&商汤发表时间:2019.81. 要解决什么问题当时的行为识别SOTA模型一般都会提取两种特征时空特征(Spatiotemporal features):期望编码不同帧中空间特征的相互关系运动特征(motion

Open Images Dataset V6 简介

文章目录0. 前言1. 简介2. 获取以及标注格式2.1 数据获取2.2 标注格式附录:各种类别介绍检测标签(600类)视觉关系-人物/物体属性(15类)视觉关系 - 人物/物体之间相互关系(31类)视觉关系 - 人物/物体之间关系三元组(1767类)0. 前言官网,Github,官方介绍,官方介绍翻译版其他参考资料谷歌最新发布数据集:Open Images V6 来了!新增局部叙事标注形式Goo

PyTorch Distributed Tutorials(4) Writing Distributed Applications with PyTorch

文章目录0. 前言1. Setup2.点对点通信3. Collective Communication4. 分布式训练5. 进阶内容5.1. 通信后端5.2. 初始化方法0. 前言官方链接中文翻译本文目标:过一遍pytorch中的distributed相关API1. Setuptorch.distributed 与 torch.multiprocessing两者应该都提供了方法,可以令任意两个进程

    共 14 条
  • 1
  • 2
  • 请选择