
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
人群异常行为(crowd-levelanomalbehaviors,CAB)是导致群体灾难的重要原因,不同于个体异常行为,在局部观察时,CAB通常不会表现出与正常行为的显著差异,并且CAB的规模可能因场景而异为了从视频监控中量化这些CAB的风险水平,本文提出了一种改进的用于CAB检测的人群运动学习框架--多尺度运动一致性网络提出了一种基于双注意力融合的多尺度感知算法(MSMC-Net),我们提出了
群体的数学建模是复杂的,因为群体具有根据环境发展和调整移动策略的行为能力。例如,在紧急情况下,人们倾向于改变他们的行走策略以应对恐惧。为了能够模拟这些情况,我们考虑了一个以压力水平为参数的人群动力学动力学模型,并提出通过求解一个逆人群动力学问题来估计这个关键参数。阐述了这一数学问题,并给出了一种数值求解方法,给出了一些基于合成数据集的初步结果,即,通过求解一个向前的人群动力学问题,在已知确切应力水
人群计数是指估计特定区域内的人数的任务,它提供了对人群动态和分布的见解。该任务在公共安全、城市规划、交通管理等领域有着广泛的应用。深度学习的最新进展,特别是卷积神经网络和Transformer架构,以及多模态预训练模型,如CLIP和SAM,大幅提高了计数精度。然而,现有的模型主要是基于高复杂度的架构进行设计的,这会带来巨大的计算和数据需求,并阻碍实时部署和增加成本。因此,轻量级的人群计数方法已经成
人群计数在各个领域引起了越来越多的关注。然而,现有的人群计数任务主要集中在估计总体人群,而忽略了人群中不同社会群体的行为和语义信息。在本文中,我们的目标是解决一个新提出的研究问题,即细粒度人群计数,该问题涉及识别不同类别的个体并在静态图像中对其进行准确的计数。为了充分利用静态人群图像中的类别信息,我们提出了一种两层显著特征传播模型,用于从人群及其周围环境中顺序地提取语义信息;此外,我们引入了类别差
最近的开放词汇检测器利用丰富的区域级标注数据取得了令人满意的性能。在这项工作中,我们表明,通过为每张图像生成图像级别的详细字幕,开放词汇检测器与大型语言模型共同训练可以进一步提高性能。为了实现这一目标,我们首先收集了一个数据集GroundingCap-1M,其中每个图像都伴随着相关的接地标签和图像级详细说明。有了这个数据集,我们对一个开放词汇检器进行了调,其训练目标包括一个标准的接地损失和一个标题
监督式人群计数在很大程度上依赖于成本高昂的人工标注,这种标注既困难又昂贵,尤其是在密集的场景中。为了缓解这个问题,我们提出了一个新的无监督的人群计数框架,名为CrowdCLIP。核心思想是建立在两个观察结果之上的:1)最近的对比预训练视觉语言模型(CLIP)在各种下游任务上表现出令人印象深刻的性能;2)人群补丁和计数文本之间存在自然映射。据我们所知,CrowdCLIP是第一个研究视觉语言知识来解决
基于检测的方法由于在密集人群中表现不佳,在人群分析中被认为是不利的。然而,我们认为这些方法的潜力被低估了,因为它们为人群分析提供了经常被忽视的关键信息。具体来说,输出提案和边界框的面积大小和置信度得分提供了对人群规模和密度的洞察。为了利用这些未被充分利用的功能,我们提出出了CrowdHat,这是一个即插即用的模块,可以很容易地与现有的检测模型:集成。该模块使用混合2D-1D压缩技术来细化输出特征,
由于使用广泛的高斯核来创建地面真密度图,这种方法受到背景噪声积累和密度损失的影响。现有的方法在使用具有广泛核的地面真值密度图进行训练时表现不佳。扩散过程的中间时间步是有噪声的,扩散模型有随机性。基于密度的方法更容易在最终结果中引入背景噪声,受到人群密度分布变化的影响;基于定位的方法需要人群密度启发式来设置提案。尽管基于生成对抗网络 (GAN)的架构已被用于密度图预测[8,40,57],但这些方法仍







