logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【视频异常检测】Weakly Supervised Video Anomaly Detection and Localization with Spatio-Temporal Prompts 论文阅读

当前的弱监督视频异常检测(WSVAD)任务旨在仅利用粗粒度的视频级别标注来实现帧级别的异常事件检测。现有工作通常涉及从全分辨率视频帧中提取全局特征,并训练帧级别分类器以在时间维度上检测异常。然而,大多数异常事件往往发生在局部空间区域而非整个视频帧中,这意味着基于现有帧级别特征的工作可能会被主导的背景信息误导,且缺乏对检测到的异常的解释能力。

文章图片
#音视频#论文阅读#人工智能 +2
【视频异常检测】Towards Interpretable Video Anomaly Detection 论文阅读

我们提出了一种新颖的框架,可以解释监控视频中检测到的异常事件。大多数视频异常检测方法基于数据密集型的端到端训练的神经网络,这些网络从视频中提取时空特征。在这种方法中提取的特征表示不具有解释性,这阻碍了对异常原因的自动识别。为此,我们提出了一种新颖的框架,可以解释监控视频中检测到的异常事件。除了独立监测对象外,我们还监测它们之间的相互作用,以检测异常事件并解释其根本原因。具体来说,我们证明了通过监测

文章图片
#论文阅读#深度学习#python +1
【图像异常检测】Visual Anomaly Detection via Partition Memory Bank Module and Error Estimation 论文阅读

基于存储模块的视觉异常检测的重建方法试图缩小正常样本的重建误差,同时扩大异常样本的重建误差。不幸的是,现有的存储模块并不完全适用于异常检测任务,异常样本的重建误差仍然较小。为此,本工作提出了一种新的无监督视觉异常检测方法,共同学习有效的正常特征并消除不利的重建误差。具体来说,提出了一种新颖的分区存储库(PMB)模块,用于有效地学习和存储具有语义完整性的正常样本的详细特征。它开发了一种新的分区机制和

文章图片
#论文阅读#深度学习#神经网络 +2
【视频异常检测】多层记忆增强外观-运动对齐框架用于视频异常检测 论文阅读

基于AutoEncoder的帧预测在无监督视频异常检测中发挥着重要作用。理想情况下,在正常数据上训练的模型可以产生更大的异常预测误差。然而,外观和运动信息之间的相关性没有得到充分利用,这使得模型缺乏对正常模式的理解。此外,由于深度AutoEncoder不可控制的可推广性,这些模型不能很好地工作。为了解决这些问题,我们提出了一个多级记忆增强外观运动对应框架。通过外观-运动语义对齐和语义替换训练,探索

文章图片
#音视频#论文阅读#计算机视觉 +3
【视频异常检测】Appearance-Motion Memory Consistency Network for Video Anomaly Detection 论文阅读

监控视频中的异常事件检测是一项重要但具有挑战性的任务,已经提出了许多方法来解决这个问题。以前的方法要么只考虑外观信息,要么直接整合外观和运动信息的结果,而不明确地考虑它们的内生一致性语义。受人类从多模态信号中识别异常帧的规则的启发,我们提出了一种外观-运动-记忆一致性网络(AMMC-Net)。我们的方法首先充分利用外观和运动信号的先验知识,明确地捕捉它们在高级特征空间中的对应关系。然后,它将多视图

文章图片
#论文阅读#深度学习#神经网络 +1
【视频异常检测】MIST: Multiple Instance Self-Training Framework for Video Anomaly Detection 论文阅读

弱监督视频异常检测(WS-VAD)旨在基于具有区分性的表示来区分异常事件和正常事件。大多数现有的工作在视频表示方面存在不足。在这项工作中,我们开发了一个多实例自训练框架(MIST),以仅基于视频级别注释有效地完善任务特定的区分性表示。具体而言,MIST由以下两部分组成:1)多实例伪标签生成器,该生成器采用稀疏连续抽样策略来生成更可靠的片段级伪标签;以及2)自引导注意力增强的特征编码器,旨在在提取任

文章图片
#音视频#论文阅读#深度学习 +2
【视频异常检测】EXPLORING DIFFUSION MODELS FOR UNSUPERVISED VIDEO ANOMALY DETECTION 论文阅读

这篇论文调查了扩散模型在视频异常检测(VAD)中的性能,特别关注最具挑战性但也是最实际的场景,即在没有使用数据注释的情况下进行检测。由于数据往往是稀疏、多样化、具有上下文并且常常含糊不清,精确检测异常事件是一项非常雄心勃勃的任务。为此,我们仅依赖于信息丰富的时空数据和扩散模型的重建能力,通过高重建误差来判断异常性。在两个大规模视频异常检测数据集上进行的实验证明了所提方法相对于最先进的生成模型的一致

文章图片
#论文阅读#深度学习#python
【视频异常检测】VideoPatchCore: An Effective Method to Memorize Normality for Video Anomaly Detection 论文阅读

视频异常检测(VAD)是计算机视觉中视频分析和监控领域的一项关键任务。近年来,基于存储正常帧特征的记忆技术使得VAD受到了越来越多的关注。这些存储的特征被用于帧重建,当重建帧与输入帧之间存在显著差异时即可识别异常。然而,这种方法在优化上面临着诸多挑战,因为需要同时优化记忆模块和编码器-解码器模型。这些挑战包括优化难度增加、实现复杂性高以及性能对记忆大小的依赖性较强。为了解决这些问题,我们提出了一种

文章图片
#论文阅读#深度学习#人工智能 +3
一种基于外观-运动语义表示一致性的视频异常检测框架 论文阅读

视频异常检测是一项重要但具有挑战性的任务。目前流行的方法主要研究正常模式和异常模式之间的重构差异,而忽略了行为模式的外观和运动信息之间的语义一致性,使得结果高度依赖于帧序列的局部上下文,缺乏对行为语义的理解。为了解决这个问题,我们提出了一个外观-运动语义表示一致性框架,该框架利用正常数据和异常数据之间的外观和运动语义表示的一致性差距。设计了双流结构来对正常样本的外观和运动信息表示进行编码,并提出了

文章图片
#音视频#论文阅读#深度学习 +2
【视频异常检测】Region-based Appearance and Flow Characteristics for Anomaly Detection in Infrared...

我们提出了一种利用视觉外观和光流的局部运动特征进行异常检测的方法,在自动视觉监控中,异常检测是一个经典问题,即在操作数据可用性极不平衡的情况下(正常类别的样本量不足,并且对另一类别(异常)的分布覆盖不足),确定正常和异常。通过利用来自区域提议网络的已建立的对象定位技术,从每个对象区域提取光流,并将其与远红外(热)波段中的外观结合起来,为每个对象提供一个3通道时空张量表示(1×热-空间外观;2×光流

文章图片
#论文阅读#人工智能#python +2
    共 81 条
  • 1
  • 2
  • 3
  • 9
  • 请选择