【CVPR2023】映射退化遇上标签演化：学习具有单点监督的红外小目标检测

论文标题：Mapping Degeneration Meets Label Evolution: Learning Infrared Small Target Detection with Single Point Supervision代码：https://github.com/XinyiYing/LESPS导读&动机本文探讨了红外小目标检测领域的一个重要问题，即如何在降低标注成本的同时

文章共3,275字 · 阅读需要大约11分钟

一键AI生成摘要，助你高效阅读

问答

woshicver

1117人浏览 · 2023-09-25 18:43:46

woshicver · 2023-09-25 18:43:46 发布

论文标题：Mapping Degeneration Meets Label Evolution: Learning Infrared Small Target Detection with Single Point Supervision

代码：https://github.com/XinyiYing/LESPS

导读&动机

本文探讨了红外小目标检测领域的一个重要问题，即如何在降低标注成本的同时实现高性能的目标检测。红外小目标检测在诸如交通监控、海上救援和军事监视等民用和军用领域具有广泛的应用。然而，由于红外小目标通常具有小尺寸、弱信号、无规则形状和无纹理等特点，并且容易受到复杂背景干扰，因此传统方法需要复杂的手工特征工程和大量标注数据，成本高昂。

为了解决这一问题，本文引入了一种创新的方法，即基于单点监督的弱监督红外小目标检测框架（LESPS）。作者观察到，在单点标签的监督下，卷积神经网络（CNN）首先学会在图像中分割出靠近目标的像素区域，然后逐渐学会以高置信度预测目标的点级别标签。因此，作者提出LESPS 框架，通过迭代地更新标签和网络训练，最终使网络能够自动生成像素级伪标签，实现了端到端的红外小目标检测。

本文贡献

我们首次研究了弱监督SIRST检测，并引入了可以显著降低注释成本的LESPS
我们发现了映射退化现象，并利用这种现象通过LESPS从给定的点标签中自动回归出像素级的伪标签
实验结果表明，我们的框架可以应用于不同的现有红外小目标检测网络，使其在像素级交集联合（IoU）和目标级别检测概率（Pd）方面实现了超过70%和95%的全面监督性能。

映射退化现象：The Mapping Degeneration Phenomenon

’ “映射退化”，即在训练早期，网络预测目标附近的像素时置信度较低，随着训练的进行，网络最终以逐渐增加的置信度逼近真实的目标点标签。如图1。这一现象的原因可以归结为以下三个方面：

红外系统的特殊成像机制：红外小目标只有强度信息，没有结构和纹理细节，导致目标区域内的像素非常相似。
红外小目标的高局部对比度：目标区域内的像素与周围背景杂乱区域相比，强度差异很大。
CNN的易学性质：CNN通常首先学习简单的映射，然后逐渐收敛到更复杂的映射。与区域到点的映射相比，区域到区域的映射更容易学习，因此往往是区域到点映射的中间结果。

图 2 展示了“单一样本训练”和“多样本训练”两种不同的训练方案下，对映射退化现象的影响以及泛化的作用。

多样本训练方案：在多样本训练方案中，使用了包含丰富的不同大小和形状的目标的所有图像来训练U-Net。结果显示，这种训练方案需要更长的时间来收敛，因为模型需要适应更多不同的情况。如图2(a).

泛化的影响：实验结果图2(b)显示，多样本训练方案下的平均IoU结果（橙色）稍低于单一样本训练方案下的结果（蓝色），特别是在较大的IoU值范围（0.5-1.0）上。这表明泛化会减缓但加重映射退化现象。

可视化：图2(c)展示了两种训练方案下的一些目标区域的图像示例及其预测结果。可以观察到，CNN在两种训练方案下都能够以尺寸感知的方式有效地分割目标像素。

本文方法

框架概述：LESPS框架的基本思想是通过迭代地更新标签并进行网络训练，使CNN能够逐渐逼近更新的伪掩码标签，从而实现像素级别的红外小目标检测。具体地，在每一轮标签更新中，当前的网络预测被用于更新当前的单点标签，生成下一轮的更新标签，然后用于监督网络训练，如此往复。这个过程有助于CNN逐渐学习局部对比度先验，防止映射退化，并促使CNN收敛到更容易学习的区域到区域映射。如图3。

标签更新过程：

在每一轮标签更新中，给定当前标签 Ln 和网络预测 Pn，对每个目标进行标签更新，包括三个步骤：候选像素提取、误报排除和候选像素与当前标签的加权求和。

具体来说，对于标签 Ln 和预测 Pn 中的每个目标，首先根据标签中正像素的质心（即