logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

目标检测之标签分配算法TOOD(TOOD: Task-aligned One-stage Object Detection)

TOOD算法在后来被许多经典算法引用,在yolov6和yolov8中使用了其ASL的方法,在ppyolo中在采用了T-head+ASL,说明了该算法具有强大的适应能力,能够应用于one-stage的目标检测算法中。

文章图片
#目标检测#算法#人工智能
目标检测算法之YOLO(YOLOv7)

从现在的角度去看yolov7,可以发现其ELAN的方法是有效的,在后续的版本中也多次被用到或者改进。而如今标签分配更多的是使用TAL策略。yolov7的热度明显不如yolov8,很多人在v7上fine-tune自己的数据集的效果甚至不如v5。不过这也是现如今新算法的一个普遍问题,许多算法过度追求SOTA从而导致模型的标签只能在某些数据集上取得较好的效果,所以对于新的算法更多的是去了解新的思想。然后

文章图片
#目标检测#算法#人工智能 +1
目标检测算法之RT-DETR

对RT-DETR的encoder部分,整体看下来像是yolo的backbone+neck。RT-DETR的核心还是在增速上,所以这里它的优化思想是值得借鉴的,但是yolo结构跟DETR结构之间的界限越来越模糊了。对query的优化上,只是做了对齐,使其选择的query更加精确。整体而言模型的创新不大。虽然DETR提倡的是NMS-Free,但是对于某些对精装度要求较高的任务中,如果阈值设置过低,导致

文章图片
#目标检测#算法#人工智能 +1
目标检测算法之DETR

从上图可以发现DETR的模型结构比较简单,首先通过CNN层获取图像的特征图,然后与位置向量相加作为Transformer encoder的输入,然后固定object queries作为decoder的query,transformer encoder的输出作为key,value,最后输出。同时在原本的分类结果的基础上添加一个no object的类别,对于一些框分类为no object的,直接去除。

文章图片
#目标检测#算法#人工智能 +2
目标检测算法之YOLO(YOLOv1、YOLOv2、YOLOv3)

本文主要分析算法的模型结构和思想。同时,作者对它们做预测时不是直接采用Darknet输出的特征图,而是将尺度较小的特征图通过上采样的方式和特征图合并,然后进行预测,这种方式也可以认为是特征金字塔,可以加强对特征的提取。DarkNet的模型结构依旧采用了全卷积的方式,引入了残差连接的方式,增加的卷积的层数,模型结构变得更加复杂,整体而言跟DarkNet-19的变化不是很大。的特征图能较好地学习大目标

文章图片
#目标检测#算法
目标检测算法之损失函数(IOU、GIOU、DIOU、CIOU、EIOU)

CIOU是在DIOU的基础上考虑了长宽比,许多目标检测任务中,物体的长宽比相对比较固定,那么将它们考虑进损失函数中,理论上是有利于回归框收敛的。GIOU是IOU的改进方式,它在IOU的基础上,考虑了俩个框之间的位置关系,同时也解决了IOU为0时难以优化的问题。IOU是衡量俩个目标框之间重叠程度的一个指标,常用于目标检测中,用于评估预测框的准确率。IOU损失的缺点有俩个,第一个是不能描述俩个框之间的

文章图片
#算法#目标检测#计算机视觉 +1
目标检测算法之RT-DETR

对RT-DETR的encoder部分,整体看下来像是yolo的backbone+neck。RT-DETR的核心还是在增速上,所以这里它的优化思想是值得借鉴的,但是yolo结构跟DETR结构之间的界限越来越模糊了。对query的优化上,只是做了对齐,使其选择的query更加精确。整体而言模型的创新不大。虽然DETR提倡的是NMS-Free,但是对于某些对精装度要求较高的任务中,如果阈值设置过低,导致

文章图片
#目标检测#算法#人工智能 +1
目标检测之标签分配算法TOOD(TOOD: Task-aligned One-stage Object Detection)

TOOD算法在后来被许多经典算法引用,在yolov6和yolov8中使用了其ASL的方法,在ppyolo中在采用了T-head+ASL,说明了该算法具有强大的适应能力,能够应用于one-stage的目标检测算法中。

文章图片
#目标检测#算法#人工智能
目标检测算法之YOLO(YOLOv4、YOLOv5、YOLOv6)

本文是yolov1-yolov3(https://blog.csdn.net/weixin_52862386/article/details/139563416)的延续,所以有一些内容在上篇文章已经叙述,下面更多的叙述它们的改进和一些新的思想。yolo的损失函数特别多,主要的更新都是框的loss上做改进,所以后面再写一篇关于loss function的。

文章图片
#目标检测#算法#人工智能
目标检测算法之YOLO(YOLOv8)

其中卷积模块是使用了类似于ELAN的CSPlayer_2conv,分类头采用了解耦结构并使用了anchor-free的方法,损失函数中引入了VFL损失,标签分配采取了类似于yolov6的TAL方法,训练策略是采用最后10个epoch关闭Mosaic数据增强的方式。DFL的思想是基于回归任务预测的唯一性导致模型难以精确的回归到目标值上,转而通过求概率分布的方式,使预测值在目标出取得较大的概率,从而实

文章图片
#目标检测#算法#人工智能 +2
    共 12 条
  • 1
  • 2
  • 请选择