logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

CVPR 2023 | Consistent-Teacher:面向半监督目标检测中不一致伪目标的消减方法

本文提出Consistent-Teacher方法解决半监督目标检测中的伪目标不一致问题。通过分析发现,教师模型生成的伪框不稳定、传统IoU分配策略失效、分类回归任务不匹配以及固定阈值不合理等问题会导致严重过拟合。为此,作者设计了自适应样本分配策略稳定伪框匹配,开发三维特征对齐模块校准分类与回归结果,并采用高斯混合模型动态调整伪标签阈值。实验表明,该方法在COCO数据集不同标注比例下均显著提升检测精

文章图片
#目标检测#人工智能#计算机视觉
AAAI 2025 | DiffCorr:用于无监督点云形状对应,基于可靠伪标签引导的条件扩散模型

摘要: 本文提出DiffCorr,一种基于条件扩散模型的无监督点云形状对应方法,针对大位移匹配难题。通过Transformer架构的条件扩散模型(T-CDM)实现多步优化,结合可靠伪标签生成器(RPLG)筛选高质量对应点对作为监督信号。实验表明,DiffCorr在SURREAL等四个基准数据集上超越现有方法,尤其在处理大位移场景时误差降低显著。消融实验验证了各模块的有效性,跨数据集测试展示了强泛化

文章图片
#目标跟踪#目标检测#人工智能
基础知识概括

以Recall(召回率)为横轴、Precision(精确率)为纵轴,绘制的模型在不同置信度阈值下的性能曲线,反映模型在 “漏检” 和 “误检” 之间的综合权衡能力。教师模型不参与任何梯度计算和反向传播,仅通过 EMA 公式,由 Student 模型的最新参数做加权平滑更新,参数更新速度慢且稳定,初始时直接复制 Student 的初始参数。:模型训练的优化核心,通过前向传播的预测结果与真实值计算损失

#计算机视觉
IEEE TPAMI 2026 | 基于检测Transformer的高效半监督目标检测研究

本文提出Semi-DETR++,首个针对DETR架构的半监督目标检测框架。针对DETR一对一匹配对伪标签噪声敏感的问题,创新性地设计了阶段性混合匹配策略(SHM),在训练初期采用抗噪的软一对多匹配,后期过渡到标准一对一匹配。针对基于查询的解码器难以建立稳定对应关系的问题,提出重解码查询一致性(RQC)方法,利用解码器自身的隐式指导实现高效一致性训练。

文章图片
#transformer#目标检测#深度学习
AAAI 2025 | 用于半监督视频动作检测的稳定均值教师模型

本文提出了一种名为Stable Mean Teacher的半监督视频动作检测方法。该方法通过改进的均值教师框架生成稳定的伪标签,并设计了错误恢复(EoR)模块修正空间定位误差,同时引入像素差异(DoP)约束保证时间连贯性。实验表明,该方法在三个动作检测基准上显著优于监督基线,仅用10%标记数据即可超越现有方法,并在视频目标分割任务上展现出良好的泛化能力。特别在低标记场景下,该方法性能提升显著,为解

文章图片
#音视频#均值算法#算法
CVPR 2025 | AKS:自适应关键帧选取

其中,“Frames”(帧数)表示输入至多模态大语言模型(MLLM)的视频帧数,“LLM”(大语言模型)表示该模型中语言部分的参数数量。这些提升不仅使我们的方法超越了其他具有相似计算复杂度的竞争对手(即输入不超过64帧,大语言模型不大于7B),还使其能够达到更大模型所设定的更高水平(例如,借助AKS,LLaVA-Video-7B在LongVideoBench上的成绩为。选取函数表示,在用户问题Q下

文章图片
#目标跟踪#人工智能
到底了