2301_78173237 个人主页

@2301_78173237

2301_78173237

2026-03-24 15:59:38 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

基于深度学习的目标跟踪综述（A review of object tracking based on deep learningq）

随着深度学习技术的快速发展，目标跟踪算法的发展也随之兴起。鉴于目标、骨干网络和应用方法的多样性，本研究旨在综合整合现有的目标跟踪方法。我们提出了一种基于应用场景和主要方法的系统分类方案，伴随着对每个类别的透彻分析和简明摘要。这种方法提供了更广泛的跟踪技术覆盖面，便于新手研究人员更快地理解该领域。此外，我们提出了标准化的评估指标和广泛使用的数据集，包括在相同的基准上对选定算法进行跨方法性能比较，以增

#深度学习 #目标跟踪 #人工智能

LLMDet:在大型语言模型的监督下学习强开放词汇目标检测器

最近的开放词汇检测器利用丰富的区域级标注数据取得了令人满意的性能。在这项工作中，我们表明，通过为每张图像生成图像级别的详细字幕，开放词汇检测器与大型语言模型共同训练可以进一步提高性能。为了实现这一目标，我们首先收集了一个数据集GroundingCap-1M，其中每个图像都伴随着相关的接地标签和图像级详细说明。有了这个数据集，我们对一个开放词汇检器进行了调，其训练目标包括一个标准的接地损失和一个标题

#语言模型 #学习 #人工智能

基于深度学习的目标跟踪综述（A review of object tracking based on deep learningq）

#深度学习 #目标跟踪 #人工智能

5MeMOTR：用于多目标跟踪的长期记忆增强Transformer（MeMOTR: Long-Term Memory-Augmented Transformer for Multi-Object T）

多目标跟踪（MOT）作为一种视频任务，期望能够有效地捕捉目标的时间信息，但现有的方法大多只利用相邻帧间的目标特征，缺乏对目标长时间信息建模的能力。一个长期的记忆增强Transformer，对象跟踪。我们的方法是能够使同一个对象的跟踪嵌入更稳定和可区分的，通过利用长期记忆注入与定制的在DanceTrack上的实验结果表明，MeMOTR在HOTA和AssA指标上分别比现有方法高出7.9%和13.0%，

#transformer #深度学习 #人工智能

4-多目标跟踪的轨迹长尾分布研究（DelvingintotheTrajectoryLong-tailDistributionforMuti-objectTracking）

多目标跟踪(MOT)是计算机视觉中的一个关键领域, 具有广泛的实际实现。目前的研究主要集中在跟踪算法的开发和后处理技术的增强上。然而,关于跟踪数据本身的性质,一直缺乏彻底的检查。在这项研究中,我们对跟踪数据的分布模式进行了探索,并在现有的MOT 数据集中发现了一个明显的长尾分布问题。我们注意到不同行人的轨迹长度分布存在显著的不平衡,我们将这种现象称为“行人轨迹长尾分布”。为了应对这一挑战,

#目标跟踪 #人工智能 #计算机视觉

SDDGR：基于稳定扩散的深度生成重放，用于类增量对象检测（CVPR 2024）

在类增量学习（CIL）领域，随着生成模型的不断改进，生成重放作为一种减轻灾难性遗忘的方法越来越受到重视，但其在类增量目标检测（CIOD）中的应用受到了很大的限制，主要原因是涉及多个标签的场景的复杂性。我们提出了一种新的CIOD方法，称为稳定扩散深度生成重放（SDDGR）。我们的方法利用基于扩散的生成模型和预先训练的文本到图像扩散网络来生成逼真和多样化的合成图像。SDDGR结合了迭代细化策略，以产生

#神经网络 #深度学习 #计算机视觉 +2

Mr. DETR++：混合专家为检测Transformer提供指导性多路线培训(CVPR 2025)

现有方法通过引入辅助的一对多分配来增强检测Transformer的训练。在这项工作中,我们将模型视为一个多任务框架,同时执行一对一和一对多预测。我们在这两个训练目标上研究了Transformer解码器中每个组件的作用,包括自注意、交叉注意和前馈网络。我们的实证结果表明,即使在共享其他组件的情况下,解码器中的任何独立组件都可以有效地同时学习两个目标。这一发现促使我们提出了一种多路径训练机制,其特征是

#mr

SinSR：基于扩散的单步图像超分辨率（SinSR: Diffusion-Based Image Super-Resolution in a Single Step）

基于扩散模型的超分辨率（SR）方法具有良好的效果，但其实际应用受到大量推理步骤的限制。最近的方法利用初始状态下的退化图像，从而缩短马尔可夫链。然而，这些解决方案要么依赖于精确的退化过程公式，要么仍然需要相对较长的生成路径（例如，15次迭代）。为了提高推理速度，我们提出了一种简单而有效的方法来实现单步SR生成，称为SinSR。具体地说，首先，我们从最新的用于加速基于扩散的SR的最先进的（SOTA）方

#人工智能 #深度学习

群体事件中群体异常行为的检测与量化（DetectingandQuantifyingCrowd-LevelAbnormalBehaviors inCrowdEvents）

人群异常行为（crowd-levelanomalbehaviors，CAB）是导致群体灾难的重要原因，不同于个体异常行为，在局部观察时，CAB通常不会表现出与正常行为的显著差异，并且CAB的规模可能因场景而异为了从视频监控中量化这些CAB的风险水平，本文提出了一种改进的用于CAB检测的人群运动学习框架--多尺度运动一致性网络提出了一种基于双注意力融合的多尺度感知算法（MSMC-Net），我们提出了

#人工智能

数据驱动的学习，以增强苦恼人群动力学的动力学模型（Data driven learning to enhance a kinetic model of distressed crowd dynam）

群体的数学建模是复杂的，因为群体具有根据环境发展和调整移动策略的行为能力。例如，在紧急情况下，人们倾向于改变他们的行走策略以应对恐惧。为了能够模拟这些情况，我们考虑了一个以压力水平为参数的人群动力学动力学模型，并提出通过求解一个逆人群动力学问题来估计这个关键参数。阐述了这一数学问题，并给出了一种数值求解方法，给出了一些基于合成数据集的初步结果，即，通过求解一个向前的人群动力学问题，在已知确切应力水

#学习

共 16 条

请选择