logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

为YOLOv11引入Anchor-Free分支(SimOTA标签分配)

摘要: 为解决YOLOv11在边缘设备部署时因anchor设置与目标分布不匹配导致的漏检问题,本文提出增加Anchor-Free分支并采用SimOTA动态标签分配的改进方案。通过保留原有anchor-based分支并融合输出,有效覆盖极端宽高比目标。关键实现包括:1)构建独立Anchor-Free检测头;2)基于目标大小动态分配正样本的SimOTA算法;3)训练时动态调整分支权重。改进后模型在工业

文章图片
YOLO系列Head结构演变:从YOLOv1到YOLOv11

本文系统梳理了YOLO系列检测头(Head)的演进历程。从YOLOv1的朴素全连接设计开始,历经v2/v3引入Anchor机制和多尺度预测,v4/v5采用解耦头和自适应Anchor,v6/v7引入Rep结构和隐式知识蒸馏,到v8/v9实现任务对齐和可编程梯度,直至最新的v10/v11完全解耦和动态Head设计。文章不仅详细解析了各版本Head的技术特点,还总结了工程实践经验:模型升级需注意Head

文章图片
特征金字塔的轻量化改进:GSConv与Slim-neck实战笔记

摘要:针对YOLO模型在边缘设备上特征金字塔(Neck)模块计算量过大的问题,提出基于GSConv(分组混洗卷积)的轻量化方案。GSConv通过分组卷积降低计算量,配合通道混洗保持信息交互,在Jetson Nano实测中实现帧率提升82%而精度仅下降0.011。文章详细解析了GSConv代码实现、Slim-neck结构设计,以及在树莓派4B上的性能对比数据(参数量减少42.7%,计算量降低45.3

文章图片
#深度学习#计算机视觉
目标检测 Neck 结构演进:FPN, PAN, BiFPN

本文梳理了目标检测模型中Neck结构的演进历程,重点分析了FPN、PAN和BiFPN三种典型架构。FPN通过自顶向下融合实现多尺度特征交互,PAN增加自底向上路径形成双向信息流,BiFPN则引入加权融合机制优化特征选择。作者结合工程实践指出:轻量化场景优选PAN,小目标检测需保留浅层特征,部署时应注意算子兼容性。文章强调Neck设计本质是优化特征传递效率,合理选择结构能显著提升模型性能。

文章图片
#目标检测#人工智能#计算机视觉
轻量化改进综合实验:速度-精度权衡分析

边缘设备模型轻量化实战:本文针对YOLOv11在Jetson Nano上无法达到实时检测要求的问题,对比测试了骨干网络替换、通道剪枝和INT8量化三种轻量化方案。实验表明,MobileNetV3替换速度提升明显但精度下降2.1%,30%剪枝后精度仅降0.8%,INT8量化速度最快但需量化感知训练。最终采用剪枝+量化组合方案,在保持92.9%mAP的同时将推理速度从180ms优化到41ms。文章总结

文章图片
#linux#数据库#php
模型量化基础:PTQ与QAT——从调试现场的浮点误差说起

本文总结了模型量化技术的核心要点与实践经验。量化通过低精度数据类型(如INT8)近似表示高精度数据(FP32),关键在于找到合适的缩放系数和零点。后训练量化(PTQ)虽快捷但面临校准数据选择、量化粒度和敏感层处理等挑战。量化感知训练(QAT)让模型适应低精度表示,需注意训练技巧如分阶段处理和调整学习率。实际项目中常混合使用PTQ和QAT,并辅以权重聚类、激活值监控等策略。建议从PTQ入手建立量化直

文章图片
#人工智能#机器学习#深度学习
模型剪枝(Pruning)原理与YOLOv11剪枝实践

摘要: 本文探讨了YOLOv11模型在边缘设备部署时的内存优化策略,重点介绍了结构化剪枝方法。通过分析BN层gamma系数确定剪枝目标,详细说明了模型重建过程中的关键点(如深度可分离卷积的groups参数调整)以及剪枝后的微调技巧(学习率重置、分层训练等)。文章提供了完整的Python实现代码,包括敏感度分析、剪枝阈值计算和权重复制逻辑,特别强调了在资源受限环境下部署时的注意事项和常见陷阱。

文章图片
#剪枝#算法
神经网络轻量化技术概览:从一次深夜调试说起

《嵌入式AI轻量化实战:从技术碎片到系统思维》摘要:本文揭示了轻量化技术的三大核心矛盾与解决方案。1)硬件适配性:不同架构对模型结构有独特需求,需平衡精度、速度和功耗;2)技术路线选择:结构化剪枝、量化校准与知识蒸馏需协同优化,校准集必须匹配真实场景;3)工程落地挑战:需跨框架兼容性、内存布局优化和功耗控制三重关卡。作者提出"设计-压缩-蒸馏"的渐进式工作流,强调早期部署约束评

文章图片
#神经网络#人工智能#深度学习
卷积改进模块的融合策略与消融实验设计

本文分享了深度学习模型优化与部署的实战经验。作者通过YOLOv11在边缘设备上的性能优化案例,总结了三种模块融合策略:同质化替换、分层适配和动态组合,并提供了具体代码示例。文章重点剖析了消融实验设计中常见的三个陷阱(只比精度不比速度、测试集单一、忽略部署兼容性),给出了包含多指标的实验模板。最后提出五点实用建议,强调要根据设备特性设计模型,在项目初期明确约束条件,避免盲目追求最新技术。全文以工程实

文章图片
RepVGG式重参数化结构原理与在YOLOv11中的实践

摘要: 文章探讨了YOLOv11模型优化中的结构重参数化技术。通过借鉴RepVGG的"训练多分支-推理单分支"思路,将训练时的多分支结构(3x3卷积、1x1卷积和恒等连接)在推理时数学等价合并为单一3x3卷积。实战中在YOLOv11关键位置替换为RepVGG块,实现训练mAP提升0.8%、推理速度提升22%的效果。重点强调了BN层在合并中的关键作用、实现细节中的常见陷阱,以及验

文章图片
#深度学习#机器学习
    共 41 条
  • 1
  • 2
  • 3
  • 4
  • 5
  • 请选择