logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

MPDIoU: A Loss for Efficient and Accurate Bounding BoxRegression--论文学习笔记

边界框回归(Bounding Box Regression,BBR)在目标检测和实例分割中被广泛应用,是定位目标的重要步骤。然而,大多数现有的边界框回归损失函数在预测框与实际标注框具有相同的宽高比但宽度和高度值完全不同的情况下无法进行优化。为了解决上述问题,作者充分探索了水平矩形的几何特征,提出了一种基于最小点距离的边界框相似度比较度量——MPDIoU,其中包含了现有损失函数中考虑的所有相关因素,

文章图片
#学习#计算机视觉
yolo增加Shape-IoU,完美超越SIoU/EIoU/CIoU

作为检测定位分支的重要组成部分,边界框回归损失在目标检测任务中起着重要作用。现有的边界框回归方法通常考虑GT框和预测框之间的几何关系,通过相对位置和框形来计算损失,而忽略边界框的固有属性(如边界框的形状和尺寸)对边界框回归的影响。为了弥补现有研究的不足,本文提出了一种关注边界框自身形状和尺寸的边界框回归方法。首先,分析了边界框的回归特性,并发现边界框自身的形状和尺寸因素将对回归结果产生影响。基于上

文章图片
#目标检测#计算机视觉
yolo增加Inner-IoU,一文搞定(Inner-SIoU,Inner-WIoU,Inner-EIoU,Inner-MPDIoU)

随着检测器的迅速发展, 边框回归取得了巨大的进步。然而,现有的基于 IoU 的边框回归仍聚焦在通过加入新的损失项来加速收敛,忽视 IoU 损失项其自身的限制。尽管理论上 IoU 损失能够有效描述边框回归状态,在实际应用中,它无法根据不同检测器与检测任务进行自我调整,不具有很强的泛化性。基于以上,我们首先分析了 BBR 模式,得出结论在回归过程区分不同回归样本并且使用不同尺度的辅助边框计算损失能够有

文章图片
#深度学习#算法#人工智能
MobileNetV4-移动设备生态系统的通用模型学习笔记

这篇论文介绍了最新一代MobileNet卷积神经网络,被称为MobileNetV4(MNv4),旨在为移动设备提供通用高效的架构设计。

文章图片
#学习#计算机视觉#人工智能 +1
YOLO-MS: Rethinking Multi-Scale Representation Learning for Real-time Object Detection(论文学习笔记)

性能超越YOLOv8与RTMDet,即插即用代码地址:文中给了github地址,但是暂时打不开(2023.08.15)摘要作者旨在为目标检测社区提供一种高效且性能卓越的目标检测器,称为YOLO-MS。核心设计基于一系列对不同Kernel-Size卷积如何影响不同尺度上目标检测性能的研究。研究结果是一种可以显著增强实时目标检测器多尺度特征表示的新策略。为了验证作者策略的有效性,作者构建了一个名为YO

文章图片
#目标检测#学习#计算机视觉 +2
解决 Exception: ROM is missing for pong, see https://github.com/openai/atari-py#roms for instructions

解压后根据上述提示将rom包添加到对应的环境中。比如,我将rom文件夹直接放在我的工程路径下。顺利的话是不会报错并直接结束的。,点进去可以看到ROMs那一栏。

mmcv中出现TypeError: FormatCode() got an unexpected keyword argument ‘verify‘

主要是因为最新版的yapf(0.40.2)中删除了verify的验证功能。最近安装Co-DETR项目环境时遇到如下的问题。

#python
yolov5增加AFPN-全新特征融合模块AFPN,效果完胜PAFPN

论文中提到使用AFPN的效果要比PAN的好,暂时还没有验证,先肝代码。可以看最上面的图,参数确实是少了。先上配置文件yolov5s-AFPN.yaml。在models/common.py增加。

文章图片
#人工智能#深度学习#目标检测 +1
AFPN: Asymptotic Feature Pyramid Network for Object Detection-全新特征融合模块AFPN,完胜PAFPN

直接看图说话代码地址:多尺度特征在目标检测任务中对具有尺度方差的目标进行编码时具有重要意义。多尺度特征提取的一种常见策略是采用经典的自上而下和自下而上的特征金字塔网络。然而,这些方法遭受特征信息的丢失或退化,削弱了非相邻 Level 的融合效果。本文提出了一种渐近特征金字塔网络(AFPN)来支持非相邻层的直接交互。AFPN是通过融合两个相邻的Low-Level特征来启动的,并渐进地将High-Le

文章图片
#深度学习#人工智能#计算机视觉 +1
IoU Loss综述(IOU,GIOU,CIOU,EIOU,SIOU,WIOU)

边界框回归(BBR)的损失函数对于目标检测至关重要。它的良好定义将为模型带来显著的性能改进。大多数现有的工作假设训练数据中的样本是高质量的,并侧重于增强BBR损失的拟合能力。

#深度学习#人工智能
暂无文章信息