logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

YOLO26改进 | MSHC多尺度异构卷积:用方形核与条带核捕获复杂空间纹理,以清晰动机打造超强创新!

本文介绍了YOLO26改进中引入的MSHC多尺度异构卷积模块的创新应用。该模块通过方形核与条带核的组合,有效捕捉复杂空间纹理特征,在保持YOLO26原有检测框架的同时增强了特征表达能力。文章详细阐述了模块的数学原理、网络融合位置选择以及在医学图像、工业缺陷检测等场景中的优势。特别强调了该改进具有清晰的理论动机和可解释性,不仅提升了模型性能,更为SCI论文写作提供了完整的"动机-方法-验证

#transformer#目标检测
RT-DETR最新创新改进系列:4D辅助细化为检测颈部注入额外表达,融合后再增强,解码前再提纯,精度提升从特征质量开始!【细化特征,稳住精度】

本文为 RTDETR 改进系列纯净发布稿,写法采用模块化技术博文形式:先讲痛点,再讲结构,再给配置、训练方式、实验表格和注意事项。全文仅保留技术正文,便于直接发布。 摘要 本文围绕 4D 辅助细化 展开。该版本属于 结构增强 方向,目标是在 RTDETR 端到端检测框架中完成可复现、可对照、可训练的结构设计。相比只给模型文件,本文更关注为什么这样改、改在什么位置、如何训练、如何做消融,以及实验时应

#人工智能#深度学习#目标检测 +1
RT-DETR最新创新改进系列:2D轻量解码结构重塑检测颈部,减少下采样链路,降低计算冗余,让端到端检测更快更轻!【轻装上阵,实时优先】

本文为 RTDETR 改进系列纯净发布稿,写法采用模块化技术博文形式:先讲痛点,再讲结构,再给配置、训练方式、实验表格和注意事项。全文仅保留技术正文,便于直接发布。 摘要 本文围绕 2D 轻量解码 展开。该版本属于 结构裁剪 方向,目标是在 RTDETR 端到端检测框架中完成可复现、可对照、可训练的结构设计。相比只给模型文件,本文更关注为什么这样改、改在什么位置、如何训练、如何做消融,以及实验时应

#人工智能#深度学习#目标检测 +1
RT-DETR最新创新改进系列:从YOLO26到RT-DETR的无缝迁移,先搭好基线实验底座,AIFI与RTDETRDecoder协同建模,速度、精度、消融一文理清!【基线先行,改进有据】

本文为 RTDETR 改进系列纯净发布稿,写法采用模块化技术博文形式:先讲痛点,再讲结构,再给配置、训练方式、实验表格和注意事项。全文仅保留技术正文,便于直接发布。 摘要 本文围绕 RTDETRl 基线 展开。该版本属于 基线配置 方向,目标是在 RTDETR 端到端检测框架中完成可复现、可对照、可训练的结构设计。相比只给模型文件,本文更关注为什么这样改、改在什么位置、如何训练、如何做消融,以及实

#深度学习#人工智能#计算机视觉 +1
YOLOv13最新创新改进系列:YYOLOv13主干改进GhostNetV3 ,以极致轻量化之躯,赋能边缘AI实时检测,速度与精度完美融合,重新定义新一代视觉感知!【幽灵疾速,洞察无界】

华为诺亚实验室最新推出GhostNetV3,通过优化训练策略显著提升轻量级模型性能。该研究针对紧凑模型特点,提出专用训练方案:采用重参数化技术增强1×1和深度卷积,优化知识蒸馏策略,并发现传统数据增强方法(如Mixup)会损害小模型性能。实验显示,GhostNetV3 1.3×仅用269M FLOPs即在ImageNet达到79.1%准确率,移动端延迟仅14.46ms,较原训练方案提升显著。该策略

文章图片
#人工智能#目标检测
YOLOv11最新创新改进系列:YOLOv11多模态(RGB+IR)融合BoTNet,保留CNN在特征提取、平移不变性等方面的优势,同时注入Transformer强大的全局建模能力!

YOLOv11多模态(RGB+IR)融合BoTNet创新性地结合CNN与Transformer优势,通过多头自注意力机制增强全局建模能力,同时保留CNN的局部特征提取优势。该模型采用改进的BoTNet瓶颈结构,在ResNet基础上用MHSA层替换3x3卷积,并引入2D相对位置编码。配置支持双模态输入(可见光+红外图像),提供开箱即用的M3FD.yaml数据集配置,包含6类常见目标检测任务。这种混合

#cnn#transformer#人工智能 +1
RT-DTER最新创新改进系列:BiFormer(CVPR 2023最新提出),基于动态稀疏注意力构建高效金字塔网络架构,用动态、查询感知的方式实现计算的有效分配,嘎嘎提升目标检测效果!

BiFormer是一种新型动态稀疏注意力视觉Transformer架构,通过双层路由机制实现高效计算分配。该模型采用查询感知方式自动筛选相关区域,在保持性能的同时显著降低计算复杂度。实验表明,BiFormer在图像分类、目标检测等任务中表现优异,尤其擅长小目标检测。文章详细介绍了模型结构、实现方法(包括YAML修改和模块注册)及可视化效果,并提供了相关代码资源。作者团队还提供持续更新的科研工具和一

文章图片
#目标检测
YOLOv11最新创新改进系列:多模态融合RGB+红外线(IR),融合最新顶会提出的HCANet网络中卷积和注意力融合模块(CAFM),有效提升多模态小目标检测性能,大幅度拉升目标检测效果!遥遥领先!

YOLOv11最新改进系列引入多模态融合技术,结合RGB和红外(IR)图像,并集成HCANet网络中的卷积和注意力融合模块(CAFM),显著提升小目标检测性能。该改进通过多尺度特征提取和全局-局部特征融合,使检测效果大幅提升。实验采用M3FD数据集,包含6类目标,提供可见光和红外图像对。改进后的模型支持40+单模态和20+多模态组合方案,可生成上千万种排列组合。相关代码和配置已开源,便于研究者快速

文章图片
#目标检测
RT-DTER最新创新改进系列:(购买资料的粉丝反馈涨点的TOP1模块)我们将BiFPN的加权双向融合之力,注入RT-DETR的端到端Transformer架构,创新与涨点的双丰收!!!!!!

特性描述全称核心创新1.加权特征融合:引入可学习权重,让网络自适应学习不同输入特征的重要性。2.简化双向网络:移除冗余节点,添加快捷连接,形成高效的双向流动路径。3.可重复结构:将BiFPN设计为一个可堆叠的模块。关键公式O∑iwiϵ∑jwj⋅IiO∑i​ϵ∑j​wj​wi​​⋅Ii​主要优势在更低的计算成本下,实现了更高的多尺度特征融合效率,从而提升了目标检测的精度。经典应用EfficientD

文章图片
#深度学习#人工智能#目标检测 +1
RT-DTER最新创新改进系列:C2f+ ICCV 2023 - 动态蛇形卷积(Dynamic Snake Convolution)采用管状结构,拉升模型小目标、遮挡目标检测效果!

本文介绍了动态蛇形卷积(Dynamic Snake Convolution)在管状结构分割任务中的创新应用。针对细长管状结构特征微弱、形态复杂的特点,该方法通过动态调整卷积核形状,结合多视角特征融合和拓扑约束损失,显著提升了小目标和遮挡目标的检测效果。文章探讨了专用分割模型与大模型结合的价值,并提供了详细的改进教程和验证步骤。作者强调该方法可扩展至3D/4D数据,为特殊结构分割提供新思路。文末附有

#目标检测#人工智能#计算机视觉
    共 219 条
  • 1
  • 2
  • 3
  • 22
  • 请选择