logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

075.小目标检测优化:针对YOLO的小目标检测改进策略

摘要: 针对YOLO小目标检测漏检问题,本文提出系统性优化方案。数据层面建议过滤过小目标、过采样小目标图像及模糊标签处理;模型改进包括重聚类锚框、增加P2浅层检测头及解耦分类回归任务;损失函数引入尺度权重和温度系数;后处理推荐Soft-NMS或分尺度NMS。强调数据质量优先,网络改动需平衡速度与精度,并指出降低分辨率可能提升小目标检测。最终指出小目标检测需结合业务场景验证,避免过度追求指标提升。(

#目标检测#目标跟踪#机器学习 +2
035.移动端部署探索:将YOLO模型部署到Android/iOS的可行性分析

移动端AI模型部署的实战挑战与优化策略 摘要:移动端部署AI模型面临计算资源与模型复杂度的核心矛盾。以YOLOv5为例,即便轻量级模型在移动设备上仍会遇到内存暴涨、帧率骤降等问题。Android和iOS平台存在生态差异,需针对性选择推理引擎(如NCNN/TFLite或Core ML)。关键优化包括:算子替换、动态量化(优先FP16)、输入尺寸调整及内存管理。工程实践中需注意预处理一致性、多线程优化

#android#ios#深度学习 +3
034.前端界面开发:用HTML/CSS/JS搭个检测结果展示页面

本文介绍了如何将YOLO模型的终端输出转换为可视化网页界面。作者通过HTML/CSS/JS搭建了一个检测结果展示页面,主要解决了三个关键问题: 数据转换:将终端输出的坐标和置信度数据转换为可视化元素 界面设计:包含图片展示区、检测框绘制和结果列表,采用响应式布局 交互功能:支持图片上传、摄像头调用和示例加载 核心实现包括: 使用绝对定位的div元素绘制检测框 通过CSS媒体查询实现响应式布局 Ja

#前端#html#css +4
033.API服务优化:异步处理、批处理、GPU内存管理

本文分享了CV模型线上服务的优化经验。针对YOLOv5检测服务的高延迟和内存溢出问题,提出三个维度的优化方案:1) 通过异步处理和消息队列解耦IO与GPU计算,避免阻塞;2) 实现动态批处理提高GPU利用率,平衡吞吐与延迟;3) 排查显存泄漏并建立显存池化管理。文章还强调了监控指标、熔断机制的重要性,并给出客户端配合、压测模拟、降级方案等实用建议。作者指出,模型部署需要算法与工程并重,对生产环境保

#python#开发语言#人工智能 +2
031.YOLOv5推理脚本详解:detect.py每一行代码的作用

本文详细拆解了YOLOv5推理脚本detect.py的关键实现细节与常见陷阱。重点包括:1)路径处理与参数解析的注意事项;2)模型加载时需确保输入尺寸是stride整数倍;3)预处理归一化与数据格式转换的易错点;4)NMS参数设置对结果的影响;5)坐标映射与后处理的常见错误。作者通过实际案例指出,训练与推理的预处理不一致、阈值设置不当、坐标转换错误等细节问题可能导致线上部署失败,建议封装关键操作并

#人工智能#深度学习
030.知识蒸馏:用大模型指导小模型训练,提升小模型精度

摘要:在嵌入式设备部署YOLOv5n模型时,通过知识蒸馏技术将大模型知识迁移到小模型,解决了测试集与产线性能差距问题。实验表明,蒸馏后的模型mAP从72%提升至76.8%,误检率降低50%。关键技巧包括:分阶段训练策略、特征图对齐、温度参数调优(T=3)、FP32训练+FP16导出等。特别指出教师模型并非越强越好,与学生模型性能差距10-15%时效果最佳。该方案成功在2G显存GPU上实现>3

#深度学习#人工智能#机器学习
029.模型剪枝实战:减少模型参数,提升推理速度

摘要: 在边缘设备部署YOLOv5时,模型推理速度从PC端的30ms骤降至300ms,亟需优化。模型剪枝成为关键解决方案,通过移除冗余参数(如低激活值的卷积核)来提升效率。实战中,基于BN层Gamma值的通道剪枝效果稳定,剪枝后需微调以恢复精度。部署时需注意推理引擎对稀疏模型的支持差异,如TensorRT默认不支持稀疏计算。经验教训包括:逐步剪枝、处理残差连接、保护敏感层等。剪枝是工程手艺,需结合

#剪枝#算法#机器学习
028.OpenVINO部署:把YOLO模型“钉”在Intel CPU/GPU上的那些事儿

本文分享了使用OpenVINO优化YOLOv5模型部署的实战经验。重点包括:正确转换ONNX模型为OpenVINO IR格式的技巧、设备选择与初始化配置、预处理和后处理的性能优化、异步推理实现高吞吐量,以及针对不同硬件的调优策略。文章特别强调了动态batch处理、FP16量化、线程绑定等关键技术,并提供了Docker部署和调试建议。通过合理配置,在i7-12700上可将YOLOv5s的推理速度从1

#openvino#人工智能
025.模型导出:从PyTorch到ONNX/TorchScript的实战与踩坑手记

PyTorch模型导出实战经验分享:文章总结了从训练到部署过程中模型导出的关键问题与解决方案。重点对比了TorchScript(追踪与脚本化模式)和ONNX两种导出方式的特点与适用场景,详细说明了动态尺寸、自定义算子、后处理集成等常见问题的处理方法。针对YOLO系列模型,特别强调了Focus层处理、NMS集成等注意事项,并提供了导出参数配置、结果验证的实用代码示例。文章还分享了导出失败时的调试技巧

#pytorch#人工智能#python +2
023.混淆矩阵分析:如何从错误中学习,改进模型

摘要:文章通过工业质检案例揭示模型评估的常见误区,指出仅看mAP等汇总指标容易掩盖关键问题。作者提出混淆矩阵是模型诊断的核心工具,并给出Python实现示例,强调要重点分析非对角线的高风险误判。文章总结四种实战改进方法:处理样本不平衡、优化类别定义、分设类别阈值和特征可视化,最后给出工程化建议——应结合业务代价动态优化,通过混淆矩阵反推数据问题。实际案例表明,模型表现异常往往源于数据而非算法本身。

#矩阵#学习#python +1
    共 30 条
  • 1
  • 2
  • 3
  • 请选择