logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【视频异常检测】Cross-Modal Fusion and Attention Mechanism for Weakly Supervised Video Anomaly Detection

近年来,弱监督视频异常检测(WS-VAD)成为仅使用视频级标签识别视频中暴力、裸露等异常事件的当代研究方向。然而,这项任务面临着巨大的挑战,包括处理不平衡的模态信息和一致地区分正常和异常特征。在本文中,我们针对这些挑战,提出了一个多模态WS-VAD框架来准确检测暴力和裸露等异常。在提出的框架内,我们引入了一种新的融合机制,称为跨模态融合适配器(CFA),它能够动态选择并增强与视觉模态高度相关的视听

文章图片
#音视频#论文阅读
【视频异常检测】VadCLIP: Adapting Vision-Language Models for Weakly Supervised Video Anomaly Detection

WSVAD任务假设在训练阶段只有视频级别的标签可用。给定视频vvv,如果该视频的所有帧都不包含异常事件,则将该视频定义为正常视频,并标记y0y=0y0;否则,如果至少有一帧包含异常事件,则将该视频标记为异常,标记为y1y=1y1。WSVAD任务的目标是训练一种在仅提供视频级注释的情况下能够预测帧级异常置信度的检测模型。

文章图片
#论文阅读
到底了