logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

计算机视觉算法——Vision Transformer / Swin Transformer

9. TransformerTransformer来源于2017年的一篇论文《Attention Is All You Need》,Transformer的提出最开始是针对NLP领域的,在此之前,NLP领域里使用的主要是RNN、LSTM这样一些网络,这些网络都存在一些问题,一方面是记忆长度有限,另一方面是无法并行,而Transeformer理论上记忆长度是无限长的,并且可以做到并行化。9.1 网络

#计算机视觉#深度学习
计算机视觉算法——目标检测网络总结

计算机视觉算法——目标检测网络总结计算机视觉算法——目标检测网络总结1. RCNN系列1.1 RCNN1.1.1 网络结构及特点1.1.2 关键知识点——非极大值抑制算法(NMS)1.2 Fast RCNN网络结构及特点2. SSD3. YOLO系列计算机视觉算法——目标检测网络总结由于后面工作方向的需要,也是自己的兴趣,我决定补习下计算机视觉算法相关的知识点,参考的学习资料主要是B站Up主霹雳吧

#算法#计算机视觉
计算机视觉算法——基于深度学习的高精地图算法(HDMapNet / VectorMapNet / MapTR / VectorNet)

高精地图广泛应用于自动驾驶领域,传统的高精地图构建和使用算法通常是基于SLAM实现的,但是最近两年出现了很多基于深度学习的方法,例如HDMapNet、VectorMapNet和MapTR就介绍了如何通过NN直接利用感知信息构建矢量化的高精地图,而VectorNet介绍了如何使用NN直接对矢量化的高精地图信息进行编码,从而能高效地作为一路输入被系统所利用。下面HDMapNet为2021年发表的文章,

#计算机视觉#深度学习#算法
计算机视觉算法——基于Transformer的目标检测(Efficient DETR / Anchor DETR / Conditional DETR / DAB DETR)

可以看到,代码上的修改并不大,相对于Conditional DETR主要是Cross Attention的过程中加入了长宽对Position Similarity的影响,并在Cross Attention的输出中对Anchor Box的四个参数进行显示的修正。DAB DETR是在Conditional DETR的基础上进行改进的,因此上文在Conditional DETR中介绍的Content Q

#计算机视觉#算法#目标检测
深度学习框架YOLOv3的C++调用

深度学习框架YOLOv3的C++调用深度学习框架YOLOv3的C++调用(1)tensorflow版本的YOLOv3的C++调用(失败)(2)darknet版本的YOLOv3的C++调用一(失败)(3)darknet版本的YOLOv3的C++调用二(成功)深度学习框架YOLOv3的C++调用因为项目需要,我需要用C++调用YOLOv3来进行物体检测,本文记录了我尝试的几种调用方法,可能都有些旁..

计算机视觉算法——基于Transformer的目标检测(DN DETR / DINO / Sparser DETR / Lite DETR)

在介绍最终的方法前,论文中首先提到了一种使用Objectness Score的方法,Objectness Score指的是在Backbone的Feature上直接接一个和最终检测头相同的结构的检测头,并同样使用匈牙利计算损失,这个检测头输出的前。

#计算机视觉#算法#transformer
计算机视觉算法——基于深度学习的高精地图算法(HDMapNet / VectorMapNet / MapTR / VectorNet)

高精地图广泛应用于自动驾驶领域,传统的高精地图构建和使用算法通常是基于SLAM实现的,但是最近两年出现了很多基于深度学习的方法,例如HDMapNet、VectorMapNet和MapTR就介绍了如何通过NN直接利用感知信息构建矢量化的高精地图,而VectorNet介绍了如何使用NN直接对矢量化的高精地图信息进行编码,从而能高效地作为一路输入被系统所利用。下面HDMapNet为2021年发表的文章,

#计算机视觉#深度学习#算法
计算机视觉算法——基于Transformer的目标检测(DN DETR / DINO / Sparser DETR / Lite DETR)

在介绍最终的方法前,论文中首先提到了一种使用Objectness Score的方法,Objectness Score指的是在Backbone的Feature上直接接一个和最终检测头相同的结构的检测头,并同样使用匈牙利计算损失,这个检测头输出的前。

#计算机视觉#算法#transformer
视觉SLAM总结——SVO中关键知识点总结

SVO中关键知识点总结SVO中关键知识点总结1. SVO的优缺点是什么?SVO中关键知识点总结SVO是我接触的第一个视觉SLAM框架(按照高博的说法,这个是VO,算不上SLAM),当时和几个小伙伴一起读了源码相互交流下,但是当时没有及时总结,又忘得差不多了,这段时间正在复习,就借此机会一起总结下,复习的时候参看了几位SLAM大佬的笔记,觉得数学这个东西挖深了搞明白了真的很有意思,搞得我甚至有点..

视觉SLAM总结——视觉特征子综述

特征子综述首先需要明确的一个概念是特征描述子是由关键点(keypoints)+特征描述子(feature)两部分构成,下面所介绍的算法中,一部分是同时介绍了关键点和特征描述子的算法,比如SIFT,另一部分是更加强调关键点或者特征描述子的提取算法,比如Harris。第一部分:2D特征子1. Harris性质算法的核心是利用局部窗口在图像上进行移动判断灰度发生较大的变化,其性质主要是(1)...

    共 36 条
  • 1
  • 2
  • 3
  • 4
  • 请选择