logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

YOLOv8改进 - 注意力机制 | LS-YOLO MSFE:新颖的多尺度特征提取模块 | 小目标/遥感

本文介绍了用于滑坡检测的 LS-YOLO 模型及其核心多尺度特征提取模块(MSFE)。该模块融合了高效通道注意力(ECA)、平均池化及空间可分离卷积,通过多分支并行结构充分提取滑坡的多尺度特征信息。我们将 MSFE 模块成功集成进 YOLOv8,增强了模型对复杂背景下滑坡特征的捕捉能力。

文章图片
#人工智能#计算机视觉#目标检测
YOLOv8改进 - 注意力机制 | NAM:基于归一化的注意力模块,将权重稀疏惩罚应用于注意力机制中,提高效率性能

本文介绍了基于归一化的注意力模块(NAM),旨在通过抑制不显著特征来提升模型效率。该方法利用批量归一化的缩放因子衡量通道与像素重要性,替代了传统注意力中的全连接层,并引入权重稀疏惩罚以降低计算成本。我们将 NAM 模块及 C2f_NAM 变体成功集成进 YOLOv8,优化了特征提取过程。实验证明,结合 NAM 的 YOLOv8 在保持精度的同时显著提升了计算效率,性能优于 SE 及 CBAM 等主

文章图片
#人工智能#目标检测#计算机视觉 +1
YOLO26改进 - 特征融合 | Slim-neck:目标检测新范式,既轻量又涨点

本文介绍了轻量级卷积技术GSConv和设计范式Slim-Neck与YOLO26的结合,以解决车载边缘计算平台模型实时检测和准确性的难题。GSConv通过减少冗余和重复信息降低计算复杂性,Slim-Neck则设计纤细颈部结构,在维持准确性的同时提高计算成本效益。我们将相关代码集成进YOLO26,在`ultralytics/nn/`目录新建`featureFusion`并创建`Slimneck.py`

文章图片
#目标检测#人工智能#计算机视觉
【TMM 2026 】 FDFAM(频域特征聚合模块):频域注意力、多尺度频谱混合、跨模态融合增强

FDFAM(Frequency Domain Feature Aggregation Module)是 FreDFT 中负责跨模态深度融合的核心模块,用于将经过 LFEM 与 CGMM 处理后的 RGB/IR 特征进一步聚合。论文指出,现有方法大多在空间域用 Transformer 建模模态互补性,却忽略了频域在纹理细节与热结构信息解耦方面的优势。为此,FDFAM 由多模态频域注意力 MFDA 和

文章图片
#目标检测#人工智能#计算机视觉
YOLOv8改进 - 注意力机制 | SENetV2: 用于通道和全局表示的聚合稠密层,结合SE模块和密集层来增强特征表示

本文介绍了将SENetV2与YOLOv8结合的方法,以提升图像分类性能。SENetV2是结合Squeeze-and-Excitation(SE)模块和密集层的图像分类模型,引入聚合稠密层用于通道和全局表示。其SE模块重新校准通道特征,密集层优化特征表示,还提出SaE模块增强关键特征捕获。我们将SENetV2的SaELayer集成进YOLOv8,在相关位置嵌入该模块。实验表明,结合SENetV2的Y

文章图片
#人工智能#计算机视觉#深度学习 +1
YOLOv8改进 - 注意力机制 | SimAM:轻量级注意力机制,解锁卷积神经网络新潜力

本文介绍了将SimAM注意力模块与YOLOv8结合的方法。SimAM是一种简单且无参数的注意力模块,其设计灵感源自神经科学理论,通过优化能量函数找出每个神经元的重要性,进而为特征图推断3D注意力权重。该模块无需添加额外参数,且多数操作符基于能量函数的解选择,避免了大量结构调整工作。我们将SimAM集成进YOLOv8,替换部分模块。实验证明,结合SimAM的YOLOv8在相关视觉任务中展现出良好的效

文章图片
#cnn#人工智能#计算机视觉
YOLO11 改进 - 注意力机制 | DSSA双稀疏自注意力,降低计算量,并精准聚焦高信息量特征交互

本文介绍了双稀疏自注意力(DSSA),一种通过空间与通道双重稀疏约束优化自注意力计算的高效模块。该方法利用局部窗口与稀疏锚点进行空间筛选,并结合动态通道门控,在大幅降低计算复杂度的同时精准聚焦关键特征。我们将 DSSA 成功集成进 YOLO11,在检测头部分对 P3、P4、P5 尺度的特征进行双稀疏增强。实验证明,集成 DSSA 的 YOLO11 在检测任务中表现优异,有效提升了模型的特征提取能力

文章图片
#交互#人工智能#计算机视觉 +1
YOLOv8改进 - 注意力机制 | SimAM:轻量级注意力机制,解锁卷积神经网络新潜力

本文介绍了将SimAM注意力模块与YOLOv8结合的方法。SimAM是一种简单且无参数的注意力模块,其设计灵感源自神经科学理论,通过优化能量函数找出每个神经元的重要性,进而为特征图推断3D注意力权重。该模块无需添加额外参数,且多数操作符基于能量函数的解选择,避免了大量结构调整工作。我们将SimAM集成进YOLOv8,替换部分模块。实验证明,结合SimAM的YOLOv8在相关视觉任务中展现出良好的效

文章图片
#cnn#人工智能#计算机视觉
YOLO26改进 - SPPF模块 | AIFI基于注意力的尺度内特征交互:替代SPPF构建高效混合编码器,提升模型综合效能

本文介绍了实时检测Transformer(RT-DETR)及其核心AIFI模块在YOLO26中的结合应用。RT-DETR旨在解决YOLO速度和准确性受NMS负面影响、DETRs计算成本高的问题,通过设计高效混合编码器和解码器层数调整来提升性能。AIFI作为Transformer编码器层,通过构建2D正弦 - 余弦位置嵌入处理多尺度特征。我们将AIFI集成进YOLO26,实验表明,改进后的模型在CO

文章图片
#交互#人工智能#机器学习 +1
YOLO26改进 - C3k2 | C3k2融合LWGA轻量分组注意力(Light-Weight Grouped Attention):四路径并行架构破解通道冗余难题 | AAAI 2026

本文介绍了轻量级骨干网LWGANet及其核心模块LWGA在YOLO26中的结合。现有用于遥感(RS)视觉质量分析的轻量级神经网络存在空间初始冗余和通道冗余问题,无法应对RS场景挑战。LWGA采用异构分组策略,将通道划分为4个不重叠子集,每个子集对应特定特征尺度,通过专用子模块处理并融合多尺度特征。我们将相关代码加入指定目录,在`ultralytics/nn/tasks.py`中注册,配置`YOLO

文章图片
#人工智能#目标检测#机器学习
    共 13 条
  • 1
  • 2
  • 请选择