登录社区云,与社区用户共同成长
邀请您加入社区
本文面向智慧课堂人员检测与计数任务,系统梳理 YOLOv5–YOLOv12 的关键演进,并在同一教室数据集上对 8 个版本进行统一训练与指标对比,分析精度、速度与模型规模的取舍。基于 Python 3.12 与 PySide6 实现可视化应用,支持图片/视频/摄像头输入、实时人数统计、阈值调节与结果保存,附完整代码、界面与数据集工程。
本文面向草莓成熟度识别场景,基于 YOLOv5 至 YOLOv12 构建可部署的目标检测系统,并给出完整代码、数据集与可复现训练推理流程。系统采用 PySide6 实现桌面端界面,支持图片/视频/摄像头输入、阈值调节、检测可视化、成熟度统计与结果导出,并结合 SQLite 提供登录注册与历史记录管理。通过同一数据集上的多版本对比实验,分析不同 YOLO 模型在精度与速度上的权衡,为草莓成熟度检测的
本文面向体育赛事视频的实时目标检测需求,基于 YOLOv5–YOLOv12 构建可复现的检测系统,实现多模型一键切换与统一评测。系统采用 PySide6 提供图片/视频/摄像头输入、检测结果可视化、Conf/IOU 调节与类别统计,并结合 SQLite 完成登录注册与结果持久化。文末给出完整代码、界面工程与数据集组织方式,便于快速复现与二次开发。
自动驾驶目标检测需兼顾精度与实时性。本文基于 YOLOv5–YOLOv12 搭建一套可复现的目标检测系统,提供完整代码、数据集与 PySide6 可视化界面。系统支持多版本模型一键切换与统一评测,覆盖图片/视频/摄像头推理,支持置信度与 IOU 阈值调节、检测结果可视化、类别统计及导出存储,形成从数据构建、训练评估到部署应用的完整闭环,便于快速落地与二次开发。
本文实现石头剪刀布手势识别系统,基于 YOLOv5–YOLOv12 完成检测与分类,并对多版本模型进行精度与速度对比。系统采用 PySide6 构建桌面界面,支持图片/视频/摄像头输入、结果可视化与参数调节,配套 SQLite 用户管理与结果导出,提供完整代码与数据集资源。
稻田虫害检测在田间光照变化、虫体小目标密集与背景复杂等条件下易出现漏检与误检。本文以 YOLOv5 到 YOLOv12(共 8 种模型)为主线,完整讲解稻田虫害检测系统的训练、对比与部署实现,并给出可复现实验配置。系统采用 PySide6 构建桌面端界面,支持图片、视频与摄像头输入,提供检测框与置信度显示、Conf/IoU 调节、类别统计与可视化分析等功能;同时结合 SQLite 实现用户注册登录
遥感目标检测面临尺度跨度大、小目标密集与背景复杂等挑战。本文围绕 YOLOv5 至 YOLOv12 的关键升级路线,在统一数据集与一致训练配置下完成 8 个模型的对比评测,并给出可复现的工程实现。系统基于 Python 3.12 与 PySide6 构建图形界面,支持图片/文件夹/视频/摄像头输入,提供检测结果可视化、Conf/IoU 调节、类别统计、结果保存与导出等功能;同时引入 SQLite
商品识别在零售与仓储中需求突出。本文基于 YOLOv5–YOLOv12 构建商品识别系统,给出数据集与预处理流程,对比各模型性能(mAP/F1/PR/训练曲线)并分析遮挡、反光与细粒度相似带来的影响;系统采用 PySide6+SQLite,实现图片/视频/摄像头检测、阈值调节、结果可视化、统计与导出。附完整代码、界面、数据集与权重,便于复现与二次开发。
在工业视觉检测场景中,YOLOv12凭借超快推理速度、极致轻量化、高精度小目标检测成为工业缺陷/目标识别的首选模型,但C#原生集成、工控机部署、多线程稳定运行、内存泄漏规避、PLC联动是绝大多数工控开发者的头号难题。本人深耕工业视觉上位机开发3年,在3C电子、锂电、汽车零部件产线落地了数十套C#+YOLOv12系统,踩过了模型导出、推理崩溃、内存泄漏、性能拉胯、部署失败等90%以上的坑。本文从零到
摘要:工业场景中像素尺寸<32×32的小目标检测是YOLO模型的痛点,Java生态缺乏成熟的优化方案。本文提出基于Java+ONNX Runtime的YOLOv8/v10部署方案,通过数据增强(Copy-Paste、多尺度裁剪)、模型改造(新增P2检测头)、多尺度推理及后处理校准(NMS阈值调整)四步优化,显著提升小目标检测精度。在PCB元件检测中,mAP提升超40%,漏检率降至4%以下,提供完整
很多人做二维码检测时,只给模型标一个整体框,但这篇论文发现:二维码的局部结构信息同样重要。作者把 Finder Patterns 引入训练过程,结果证明,在自然场景下,子部件辅助监督能明显提升二维码检测效果,尤其在复杂背景和倾斜视角下更稳。这篇文章最大的价值,不只是换了个 CNN,而是提醒我们:二维码不是普通目标,结构先验本身就是提升检测性能的重要线索。
首先定义一个// 边界框坐标 private float x1;// 置信度 private float confidence;// 类别ID private int classId;// 类别名称 private String className;Data;@Data// 边界框坐标// 置信度// 类别ID// 类别名称本文详细介绍了Java原生部署YOLOv8的完整流程,从环境搭建、模型转换
汽车零部件缺陷检测系统基于YOLOv13轻量级模型实现工业级部署,在低功耗工控机上达到28FPS实时检测性能。系统采用分层架构设计,涵盖数据采集、模型推理、结果处理和产线联动全流程。通过工业级优化(剪枝+INT8量化)使模型参数量降至0.8M,在N5105工控机上实现98.7%检测精度和0.3%低漏检率。C#上位机集成ONNX Runtime引擎,支持Modbus TCP协议与PLC联动,为汽车制
YOLO26推出重大更新:集成K折交叉验证技术,显著提升模型稳定性和泛化能力。该方法将数据均匀分为K份,轮流作为验证集进行训练评估,最终取平均结果作为性能指标。文章详细介绍了目标检测中K折验证的特殊处理方式(以图片为单位划分),并提供了5折验证的完整示例流程(含mAP计算公式)。同时给出三种训练模式的一键运行代码指令,支持从零训练或迁移学习。配套资源包含45+改进源码组合方案及多款科研绘图工具(雷
摘要: 本文介绍了YOLO26结合EfficientNetV2的创新改进,通过全新设计的主干网络EfficientNetV2-BackBone,引入渐进式学习策略和自适应正则强度调整机制,显著优化了训练速度和参数效率。EfficientNetV2通过训练感知的神经架构搜索和Fused-MBConv结构,在ImageNet等数据集上实现87.3%的Top-1准确率,训练速度比ViT快5-11倍。改进
本文提出了一种新型可变核卷积AKConv,突破了传统卷积运算的固定形状限制。通过创新的坐标生成算法,AKConv实现了任意大小和形状的卷积核采样,为特征提取提供了更灵活的选择。相比标准卷积和可变形卷积,AKConv在参数数量上仅呈线性增长趋势,显著降低了计算开销。实验证明,该方法在COCO2017、VOC和VisDrone-DET2021等目标检测数据集上表现出色。AKConv可作为即插即用模块替
Ai学术叫叫兽在所有B站资料中留下联系方式以便在科研之余为家人们答疑解惑,本up主获得过国奖,发表多篇SCI,擅长目标检测领域,拥有多项竞赛经历,拥有软件著作权,核心期刊等经历。因为经历过所以更懂小白的痛苦!因为经历过所以更具有指向性的指导!祝所有科研工作者都能够在自己的领域上更上一层楼!
场景:一张足球比赛的照片图像分类(Week 2 学的):你问:"这是什么场景?AI 答:"足球场" ❌ 只有整体标签问题:- 场上有多少人?不知道- 球在哪里?不知道- 球门在哪个位置?不知道目标检测(今天要学的):你问:"图里有什么?在哪里?AI 答:- 左上角有个人(边界框 + 95% 置信度)✅- 中间有个足球(边界框 + 88% 置信度)✅- 右下角有球门(边界框 + 92% 置信度)✅既
摘要: 食品包装喷码识别是工业视觉中的常见需求,但传统OCR在模糊、变形、倾斜等场景下准确率仅60%-70%。本文分享了一套基于YOLOv11+CRNN的工业级喷码识别方案,通过两阶段定位与识别,在酸奶产线上实现99.2%准确率,26ms延迟,彻底取消人工复检。内容涵盖数据集制作、模型训练(YOLOv11定位+CRNN字符识别)、C#上位机集成等全流程,提供生产验证代码,帮助低成本替代进口设备,解
Java+YOLO已经成为工业视觉领域的事实标准,它完美解决了Python方案在产线落地时的对接、稳定性和运维问题。对于大厂来说,技术选型的第一原则不是"哪个技术最先进",而是"哪个技术最适合产线"。导出模型时一定要开启NMS,这会节省你大量的时间和精力保持宽高比填充是保证模型精度的关键所有资源都要正确释放,避免内存泄漏异步解耦是工业系统稳定性的基石可观测性比功能更重要,没有监控的系统不要上线这套
纯C#方案是工业缺陷检测的最佳选择,它兼顾了开发效率、运行速度和集成性,能够快速落地并产生实际收益。关键经验总结:DirectML是零依赖GPU推理的最佳选择导出模型时一定要开启NMS,这会节省你大量的时间和精力保持宽高比填充是保证模型精度的关键所有Mat对象都要正确释放,避免内存泄漏AOT编译是提升启动速度和降低内存占用的有效手段这套系统我们已经成功应用在汽车刹车片、PCB板、手机外壳等多个缺陷
工业视觉缺陷检测系统实战:C#+YOLOv8全流程解析 核心摘要 本文分享了基于C#和YOLOv8的工业视觉缺陷检测系统开发经验,针对工业场景的特殊需求(实时性、稳定性、集成性)提出了一套完整解决方案。系统采用ONNX Runtime直接调用YOLOv8模型,在研华工控机上实现了42ms延迟、98.7%准确率的检测效果。 关键亮点: 技术选型:对比Python API和C++方案后,采用C#+ON
本文系统介绍了三种主流的注意力机制(CBAM、ECA、CA)在YOLOv11中的应用效果与实现方法。通过对比分析,CA在小目标检测上表现最优,ECA计算量最小,CBAM通用性最强。作者提供了详细的代码实现方案,可直接集成到YOLOv11模型中,无需修改骨干网络即可提升mAP 5%-12%。文章还总结了三种方法的优缺点和适用场景,为工业视觉缺陷检测中的注意力机制选型提供了实用参考。
医疗影像AI辅助诊断系统采用Java+DJL+YOLOv11技术栈,解决传统Python方案在医疗场景下的部署难题。系统从PACS获取DICOM影像,通过预处理后使用YOLOv11模型检测病灶,并生成结构化报告。技术优势包括:纯Java环境便于医院系统集成、DJL框架保障数据安全、YOLOv11算法提升小病灶检测精度。系统架构包含影像采集、预处理、病灶检测、分级分析和报告生成等模块,通过dcm4c
纺织面料瑕疵检测系统采用Java+DJL+YOLOv11技术栈,解决了传统人工检测效率低、漏检率高的问题。系统通过线阵工业相机采集图像,利用YOLOv11模型实现高精度瑕疵检测,并集成报警控制模块实现自动化标记。相比Python方案,该技术栈具有部署简单、运行稳定、易与工业系统集成等优势。系统架构包含图像采集、视觉处理、结果分析和报警控制等模块,支持高速实时检测,显著提升了纺织行业的质量控制水平。
本文介绍了基于Java+DJL+YOLO的工业机器人视觉引导抓取系统解决方案。针对传统Python方案在工业场景中的部署复杂、实时性不足等问题,采用纯Java技术栈实现高性能视觉处理。系统通过工业相机采集图像,利用YOLOv11模型进行目标检测,计算工件坐标并规划机器人抓取路径。文章详细阐述了系统架构、开发环境搭建(包括硬件配置和Maven依赖)以及核心功能实现,重点展示了如何使用DJL框架加载Y
/ 加载自定义模型,指定类别名称var classNames = new[] { "针孔", "划痕", "短路" };如果需要自定义后处理逻辑,可以继承// 自定义后处理逻辑// 使用自定义后处理器TensorRT引擎生成慢:第一次加载模型时,TensorRT会生成引擎文件,这个过程可能需要几分钟。生成的引擎会缓存到本地,下次启动直接加载,速度会快很多。CUDA版本兼容问题:YoloSharp要
摘要:本文分享了工业质检场景下C#调用YOLOv8s ONNX模型的性能优化实战经验。原始单帧推理耗时300ms无法满足产线需求,通过全链路分析定位瓶颈(预处理85ms、推理180ms、后处理30ms)。重点优化措施包括:使用OpenCVSharp CUDA加速预处理(85ms→12ms),开启ONNX Runtime ALL级别图优化,选用TensorRT执行提供程序(180ms→22ms),以
【摘要】本数据集聚焦零售场景中的空货架检测问题,包含1500张真实超市货架图像,采用单类别标注规范("空"类别标识缺货区域)。数据集覆盖多种货架类型、光照条件和拍摄角度,标注精确符合YOLO标准格式,可直接用于主流目标检测模型训练。其核心价值在于通过计算机视觉技术解决传统人工巡检效率低、缺货发现不及时等痛点,适用于智能零售系统中的实时货架监控、自动补货预警等应用场景。数据集结构
随着人工智能与计算机视觉技术的快速发展,基于目标检测的自动垃圾分类方案正成为行业的重要突破口。通过视觉模型对垃圾进行识别与分类,不仅可以显著提升分类效率,还能降低人工成本,实现智能化、规模化应用。而这一切的前提,是拥有一个**高质量、标准化且贴近真实场景的数据集**。
本文介绍了一个包含2500张图像的鸡行为检测数据集,专为YOLO等目标检测模型训练设计。数据集涵盖进食、休息、站立三类核心行为,严格遵循YOLO标注规范,具有高质量、标准化和真实场景多样性的特点。该数据集可应用于智慧养殖系统、鸡群健康监测、养殖环境优化等领域,推动传统养殖向智能化升级。数据集采用标准结构设计,开箱即用,能有效降低开发门槛,提升模型训练效率和实际应用价值。
摘要: 本数据集包含3600张高质量标注图像,涵盖牛只4类核心行为(喝水、进食、卧下、站立),采用标准YOLO格式组织,适用于智慧养殖场景下的行为识别与健康监测。数据经过人工严格标注,覆盖多场景真实环境,支持精准饲喂、牧场数字化管理等应用。结构规范可直接用于YOLO系列模型训练,助力农业AI研究与产业化落地。数据集聚焦实用价值,平衡数据规模与类别区分度,为畜牧智能化提供可靠数据支撑。
为了满足道路巡检与移动机器人的避障需求,本文开发了一款基于PySide6的障碍物智能检测桌面工作站。系统流畅接入图、视、机多路实时视流,提供动态进度、耗时反馈与阈值微调功能。依托内置SQLite,平台构建了支持免登录跳过的本地数据追溯闭环,允许一键归档CSV统计台账及带框的PNG与AVI可视化影像。在算法核心上,本文横向剖析了YOLOv5至YOLOv12八大模型的mAP、F1等关键性能指标,实现了
为攻克高杆监控等远视距场景下的车位识别难题,本文推出了一款基于PySide6的高效桌面检测平台。该系统针对复杂透视与遮挡痛点进行了深度优化,不仅流畅兼容图、视、机多路实时推理,更配备了精准的耗时统计与进度追踪。在工程管理层面,平台依托内置SQLite实现了灵活的免登录追溯机制,并支持一键导出CSV报表及带框的可视化影像(PNG单帧/AVI序列)。其核心算法引擎横向打通了YOLOv5至YOLOv12
🔥本文给大家介绍使用 CmDRM跨模态差异强化模块 改进YOLO26网络模型,通过跨模态差分建模强化特征表达能力,在特征提取阶段突出不同模态之间的互补信息,从而提升对小目标和弱目标的感知能力。该模块利用差异信息引导注意力机制,有效抑制冗余与噪声干扰,在复杂背景或低对比度场景下显著提高检测的鲁棒性与定位精度。同时,CmDRM结构轻量、易于集成,在不显著增加计算开销的前提下,能够整体提升YOLO26
YOLOv11论文解析:高性能目标检测新突破 这篇论文深入分析了YOLOv11目标检测框架的创新设计与性能优势。作为YOLO系列最新迭代,YOLOv11通过三大核心模块显著提升了检测性能: C3K2模块采用3×3小卷积核优化计算效率 SPPF模块实现高效多尺度特征融合 C2PSA注意力机制增强小目标检测能力 研究显示,在COCO基准测试中,YOLOv11相比前代YOLOv8实现了2.2%的mAP提
瞄准PCB板缺陷自动化质检痛点,本文构建了一套端到端的深度学习桌面检验平台。系统前端搭载PySide6,流畅兼容图、视、摄像头多源输入,并辅以精准的进度与耗时监控以契合工业节拍。依托内置SQLite,软件打造了支持免登录跳过的本地数据闭环,允许质检员一键归档CSV台账及带框影像(PNG或AVI格式)。核心算法详尽评测了YOLOv5至YOLOv12八代模型的mAP、F1等关键指标,更实现了运行态下的
本文详细介绍 YOLOv26 模型在昇腾 NPU 上的完整部署流程,涵盖从模型转换到分布式推理的各个环节。首先,用户使用 ultralytics 框架将训练好的 YOLOv26 best.pt 模型导出为 ONNX 格式,再通过华为 CANN 工具包中的 ATC 命令将 ONNX 模型转换为 Ascend 310B4 NPU 可运行的 OM 模型。转换过程中需要指定输入形状、模型版本等参数。部署采
工业PCB微缺陷检测的挑战与优化方案 摘要:针对PCB板0.3mm微缺陷检测难题,本文提出了一套完整的工业级解决方案。通过对比主流目标检测模型,最终选用YOLO12n作为基础架构,并针对微缺陷特点进行了10项关键优化:包括960×960输入尺寸、P2层特征增强、GAM注意力机制、NWD损失函数等。系统实现了98.7%的召回率和1.8%的误检率,单帧检测时间控制在45ms内,完全满足产线120块/分
YOLOv2(YOLO9000)是目标检测领域的重要突破,在保持实时性的同时显著提升精度。其核心创新包括:引入Anchor Boxes提升边界框预测能力,采用多尺度训练增强模型鲁棒性,设计轻量级主干网络Darknet-19,以及通过联合训练COCO和ImageNet实现9000+类别检测。相比YOLOv1,mAP提升13.4%达到76.8,FPS增至67帧。但仍存在小物体检测不足、Anchor设计
工业场景下YOLO模型全链路优化实践 摘要:针对工业质检场景对检测速度的严苛要求,本文系统性地分享了YOLOv8模型从11.2FPS到102.7FPS的全链路优化方案。通过骨干网络轻量化(RepVGG-A0替换)、结构化剪枝(参数量减少50%)、知识蒸馏(精度恢复至97.6%mAP)、INT8量化(计算量降低4倍)以及TensorRT加速等关键技术,在精度仅下降0.8%的前提下实现9倍性能提升。特
摘要 工业视觉检测中,光照不均是导致60%以上项目失败的核心问题。传统方法(如调整光源、固定阈值等)缺乏自适应性,难以应对复杂多变的光照条件。本文提出基于Java+YOLOv11的系统性解决方案,从数据、模型、推理三个层面优化: 数据层面:通过随机亮度/对比度调整、阴影模拟等增强方法,结合真实产线多时段数据采集,提升模型对光照变化的泛化能力。 模型层面:引入CBAM注意力机制、多尺度训练和迁移学习
摘要: C#与YOLO深度学习的组合已成为工业视觉系统的黄金标准,满足工业场景对稳定性、实时性、集成性和部署便捷性的严苛需求。C#凭借.NET运行时的稳定性、丰富的工业生态和高效GUI开发能力,成为工业上位机开发的首选;YOLO则以其单阶段检测架构、高精度和轻量化特性,适配工业目标检测需求。通过ONNX Runtime实现跨框架模型部署,C#调用YOLO模型时性能优于Python,支持毫秒级实时推
本文面向施工与工业场景的安全合规需求,基于YOLOv5–YOLOv12构建个人防具(PPE)检测系统,实现对安全帽、反光背心/工装、口罩/护目镜、手套等目标的检测与统计,支持Conf/IoU阈值调节与可视化输出(目标框、类别、置信度)。系统采用Python 3.12与PySide6实现桌面端,覆盖图片/视频/摄像头多源输入、播放控制与结果保存导出,并以SQLite提供登录注册与历史记录持久化。文中
摘要: 论文《InceptionNeXt》提出了一种新型CNN架构,通过融合Inception思想与ConvNeXt的大核卷积优势,解决了传统大核卷积内存访问成本高的问题。核心创新是Inception深度卷积,将大核分解为并行的小方核、带状核和恒等映射分支,在保持大感受野的同时显著降低计算复杂度。实验显示,InceptionNeXt-T在ImageNet-1K上比ConvNeXt-T快1.6倍且精
目标检测
——目标检测
联系我们(工作时间:8:30-22:00)
400-660-0108 kefu@csdn.net