
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
致力于为客户提供高效、可靠的解决方案。业务范围涵盖智慧园区、智慧安防、智慧高校、智慧社区、智慧农业等领域。
核心创新包括:1)双语义增强通道权重分配模块(DECA)和双空间增强像素权重分配模块(DEPA),通过双重增强机制在特征空间聚合跨模态信息,减少两种模态间的相互干扰;该方法在不增加推理开销的情况下,显著提升了DETR系列模型的性能,在COCO数据集上达到了新的SOTA水平。实验表明,该方法在COCO和LVIS数据集上零样本和微调设置下均优于原始YOLO-World,在保持相当参数量和计算量的同时,
点击蓝字关注我们关注并星标从此不迷路计算机视觉研究院公众号ID|计算机视觉研究院学习群|扫码在主页获取加入方式计算机视觉研究院专栏Column of Computer Vision Institute相关研究提出一种基于 YOLO 的水下图像目标检测方法,引入一种改进的无锚点 YOLO 检测方法,将检测特征与识别特征分离,以减少特征间的相互干扰,提高检测精度。还提出一种基于 Retinex 的图像
点击蓝字 关注我们关注并星标从此不迷路计算机视觉研究院公众号ID|计算机视觉研究院学习群|扫码在主页获取加入方式计算机视觉研究院专栏Column of Computer Vision Institute无人机图像中的目标检测是各个研究领域的重要基础。然而,无人机图像带来了独特的挑战,包括图像尺寸大、检测对象尺寸小、分布密集、实例重叠和照明不足,这些都会影响对象检测的有效性。01前景概要今天分享中,
近两年AIGC的爆发,掀起了视觉领域的范式革命,最先进的生成模型Diffusion Models,也开始运用至目标检测任务中,多项工作获得了重点关注,比如,基于YOLO和扩散模型的抗噪声目标检测模型DiffYOLO,使用了核心算法DDPM提取特征;CVPR最新收录的扩散模型检测工作DiffusionDet,在推理阶段利用了DDPM加速采样的DDIM,去除马尔可夫链后,速度提升将近百倍!为了帮助大家
点击蓝字关注我们关注并星标从此不迷路计算机视觉研究院公众号ID|计算机视觉研究院学习群|扫码在主页获取加入方式计算机视觉研究院专栏Column of Computer Vision InstituteHyper-YOLO在其骨干网络中引入了所提出的混合聚合网络(MANet)以增强特征提取能力,并在其颈部引入了基于超图的跨层和跨位置表征网络(HyperC2Net)。HyperC2Net可在五个尺度.
2022点击蓝字 关注我们关注并星标从此不迷路计算机视觉研究院学习群|扫码在主页获取加入方式01概述研究者研究了视觉物体检测器的可解释性问题。具体来说,研究者在YOLO目标检测器的示例中演示了如何将Grad-CAM集成到模型架构中并分析结果。最后展示了如何计算个体检测的基于归因的解释,并发现结果的归一化对其解释有很大影响。02背景当今复杂的计算机视觉模型需要解释其行为的机制。这推动了可扩展人工智能
然而,由于不同的输入特征对网络的贡献不同,我们使用三明治融合模块对每个特征分支进行加权融合,使模型能够根据特征的重要性自主选择,并有效整合上下文信息。此外,考虑到特征图越大,包含的小目标信息越丰富,我们专门添加了一个小目标检测头,将原来的。从多尺度融合的角度改善了小目标的检测性能。因此,本研究不同于上述工作,专注于解决小目标检测中的特征信息丢失问题,并系统探索多尺度特征融合的优化潜力。从无人机视角
同时,为让AIFI模块更高效地提取关键信息,我们在输入处添加了1×1卷积层以实现通道压缩——这既完成了通道压缩、过滤冗余信息,也确保模块能高效聚焦于无人机检测中最显著的特征。为此,我们采用注意力驱动的尺度内特征交互(AIF)模块替代骨干网络中的SPPF模块——该模块通过单尺度注意力机制捕捉同尺度特征间的依赖关系,增强网络的聚焦能力。随后,经骨干网络增强的特征被输入颈部网络,由我们专门设计的DIDP
计算机视觉研究院专栏作者:Edison_G现阶段的人脸检测识别技术已经特别成熟,不管在什么领域都有特别成熟的应用,比如:无人超市、车站检测、犯人抓捕以及行迹追踪等应用。但是,大多数应用都是...
点击蓝字 关注我们关注并星标从此不迷路计算机视觉研究院公众号ID|计算机视觉研究院学习群|扫码在主页获取加入方式计算机视觉研究院专栏Column of Computer Vision Institute目前的目标检测模型在许多基准数据集上都取得了良好的效果,在夜晚或者黑暗条件下检测目标仍然是一个巨大的挑战。01简介为了解决这个问题,有研究者提出了一个金字塔增强网络(pyramidenhanced.







