logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

计算机视觉算法——基于Transformer的目标检测(Efficient DETR / Anchor DETR / Conditional DETR / DAB DETR)

可以看到,代码上的修改并不大,相对于Conditional DETR主要是Cross Attention的过程中加入了长宽对Position Similarity的影响,并在Cross Attention的输出中对Anchor Box的四个参数进行显示的修正。DAB DETR是在Conditional DETR的基础上进行改进的,因此上文在Conditional DETR中介绍的Content Q

#计算机视觉#算法#目标检测
计算机视觉算法——基于Transformer的目标检测(DETR / Deformable DETR / Dynamic DETR / DETR 3D)

DETR是DEtection TRansformer的缩写,该方法发表于2020年ECCV,原论文名为《End-to-End Object Detection with Transformers》。传统的目标检测是基于Proposal、Anchor或者None Anchor的方法,并且至少需要非极大值抑制来对网络输出的结果进行后处理,涉及到复杂的调参过程。而DETR使用了Transformer E

#计算机视觉#算法#3d
深度学习框架YOLOv3的C++调用

深度学习框架YOLOv3的C++调用深度学习框架YOLOv3的C++调用(1)tensorflow版本的YOLOv3的C++调用(失败)(2)darknet版本的YOLOv3的C++调用一(失败)(3)darknet版本的YOLOv3的C++调用二(成功)深度学习框架YOLOv3的C++调用因为项目需要,我需要用C++调用YOLOv3来进行物体检测,本文记录了我尝试的几种调用方法,可能都有些旁..

计算机视觉算法——基于Transformer的目标检测(DN DETR / DINO / Sparser DETR / Lite DETR)

在介绍最终的方法前,论文中首先提到了一种使用Objectness Score的方法,Objectness Score指的是在Backbone的Feature上直接接一个和最终检测头相同的结构的检测头,并同样使用匈牙利计算损失,这个检测头输出的前。

#计算机视觉#算法#transformer
计算机视觉算法——基于深度学习的高精地图算法(HDMapNet / VectorMapNet / MapTR / VectorNet)

高精地图广泛应用于自动驾驶领域,传统的高精地图构建和使用算法通常是基于SLAM实现的,但是最近两年出现了很多基于深度学习的方法,例如HDMapNet、VectorMapNet和MapTR就介绍了如何通过NN直接利用感知信息构建矢量化的高精地图,而VectorNet介绍了如何使用NN直接对矢量化的高精地图信息进行编码,从而能高效地作为一路输入被系统所利用。下面HDMapNet为2021年发表的文章,

#计算机视觉#深度学习#算法
图像降噪算法——稀疏表达:K-SVD算法

图像降噪算法——稀疏表达:K-SVD算法图像降噪算法——稀疏表达:K-SVD算法1. 基本原理2. python代码3. 结论图像降噪算法——稀疏表达:K-SVD算法为了完善下自己降噪算法知识版图的完整性,我打算花一个周末的时间再了解下基于稀疏表达和低秩聚类这两种原理实现的图像降噪算法,因为学习的时间并不长,也没有花太多时间去做实验,所以对算法理解得可能比较肤浅,还愿读者见谅。这里我分享几篇很优秀

计算机视觉算法——BEV Perception算法总结(3D LaneNet / LSS / PON / BEVFormer / GKT / Translating Image to Maps)

最近读了一篇2022年刚发的BEV Perception算法的总结《Vision-Centric BEV Perception: A Survey》,感觉写得非常好,于是打算总结下这方面的工作,作者将BEV Perception算法做如下分类:MLP Based因为精力有限,我很难将所有的的算法都看一遍,我将从每个类别中挑出一到两种我个人认为比较有代表性的方法进行总结分析,主要结合代码具体解读下图

#计算机视觉#自动驾驶
计算机视觉算法——基于Transformer的目标检测(DN DETR / DINO / Sparser DETR / Lite DETR)

在介绍最终的方法前,论文中首先提到了一种使用Objectness Score的方法,Objectness Score指的是在Backbone的Feature上直接接一个和最终检测头相同的结构的检测头,并同样使用匈牙利计算损失,这个检测头输出的前。

#计算机视觉#算法#transformer
视觉SLAM总结——SVO中关键知识点总结

SVO中关键知识点总结SVO中关键知识点总结1. SVO的优缺点是什么?SVO中关键知识点总结SVO是我接触的第一个视觉SLAM框架(按照高博的说法,这个是VO,算不上SLAM),当时和几个小伙伴一起读了源码相互交流下,但是当时没有及时总结,又忘得差不多了,这段时间正在复习,就借此机会一起总结下,复习的时候参看了几位SLAM大佬的笔记,觉得数学这个东西挖深了搞明白了真的很有意思,搞得我甚至有点..

视觉SLAM总结——视觉特征子综述

特征子综述首先需要明确的一个概念是特征描述子是由关键点(keypoints)+特征描述子(feature)两部分构成,下面所介绍的算法中,一部分是同时介绍了关键点和特征描述子的算法,比如SIFT,另一部分是更加强调关键点或者特征描述子的提取算法,比如Harris。第一部分:2D特征子1. Harris性质算法的核心是利用局部窗口在图像上进行移动判断灰度发生较大的变化,其性质主要是(1)...

    共 41 条
  • 1
  • 2
  • 3
  • 4
  • 5
  • 请选择