登录社区云,与社区用户共同成长
邀请您加入社区
本文系统介绍了人工智能(AI)的基础知识框架,帮助零基础学习者快速入门。首先阐明AI是让机器模拟人类智能的技术,核心在于数据+算法+算力。重点区分了AI、机器学习和深度学习的层级关系,并概述了计算机视觉、自然语言处理等四大核心技术分支。文章通过鸢尾花分类项目演示了AI学习的基本流程,强调实战驱动学习的重要性。最后提供了新手学习路线和工具推荐,指出AI本质是数据驱动的规律拟合,建议从基础逐步深入,避
《零基础入门深度学习指南》 本文为AI初学者提供了一份通俗易懂的深度学习入门指南。首先厘清了人工智能、机器学习和深度学习三者的层级关系,指出深度学习作为机器学习的子集,凭借自动特征提取能力成为主流AI技术。重点解析了神经网络的核心原理,包括神经元结构、三层网络架构以及激活函数、损失函数和反向传播三大关键概念。 文章提供了PyTorch实现MNIST手写数字识别的完整实战代码,通过5轮训练即可达到9
茶叶病害的快速、准确识别是智慧农业的重要组成部分。本研究基于YOLOv8目标检测算法,构建了一套茶叶病害检测系统,涵盖黑腐病、褐枯病、叶锈病、红蜘蛛 infestation、茶角盲蝽 infestation、茶叶健康叶片、白斑病及病害区域共8个类别。实验采用4,736张训练图像、273张验证图像和406张测试图像进行模型训练与评估。
在Tomato-Village和Tomato-Disease数据集上,相比YOLOv11n,平均mAP@50分别提高4.1%和3.6%,mAP@50:95分别提高6.0%和3.9%,超越现有SOTA模型。
深度学习是突破传统机器学习瓶颈、处理复杂数据(图像、文本、语音等)的核心技术,支撑着当前主流AI应用。与传统机器学习相比,深度学习能自动提取特征,无需人工干预,更适合真实世界的复杂场景。其核心原理是通过多层神经网络进行前向传播、损失计算和反向传播,不断优化模型。主要网络类型包括全连接网络、CNN(计算机视觉)、RNN(时序数据)和Transformer(大模型)。入门只需掌握基础数学和PyTorc
YOLO(You Only Look Once)是目前最主流的实时目标检测算法,相比传统两阶段算法具有速度快、全局感知、易部署等优势。新手建议从YOLOv8或最新YOLOv11入手,环境搭建仅需10分钟,通过3行代码即可实现图像/视频检测。进阶学习包括自定义数据集训练、模型优化和部署等步骤。文章提供了完整的学习路线和常见问题解决方案,帮助零基础用户快速掌握YOLO目标检测技术。
铁路轨道缺陷检测是保障铁路运输安全的关键环节。传统的人工巡检方式效率低下且易受主观因素影响,难以满足现代化铁路运维需求。本文基于YOLO26目标检测算法,构建了一个针对四种常见轨道缺陷(Crack、Putus、Spalling、Squat)的自动识别检测系统。系统采用YOLO26架构,使用1593张标注图像进行训练、验证和测试,其中训练集1312张、验证集184张、测试集97张。实验结果表明,模型
草莓在生长过程中易受多种病害侵袭,严重影响果实品质与产量。本研究基于YOLO26目标检测算法,构建了一套草莓果实病害识别检测系统,实现对五种关键状态的自动检测与分类:Benh cao su(橡胶病)、Benh dom den(黑斑病)、Benh moc xam(灰霉病)、Benh phan trang(白粉病)以及Qua binh thuong(正常果实)。实验数据集包含884张标注图像,其中训练
本研究报告基于YOLO26目标检测算法,构建了一个面向10类常见手势的实时识别检测系统。系统采用Ultralytics YOLO26框架,在包含1400张标注图像的数据集上进行训练与验证,其中训练集1200张,验证集200张。实验结果表明,模型在验证集上达到了98.9%的mAP50,推理速度高达1.0ms/张(约1000 FPS),展现了卓越的检测精度与实时性能。通过对精度-召回率曲线、混淆矩阵及
皮肤癌是全球范围内最常见的恶性肿瘤之一,早期准确诊断对提高患者生存率至关重要。本文基于YOLO26目标检测算法,构建了一个针对七类常见皮肤病变的自动识别检测系统。研究数据集包含681张训练图像、97张验证图像和195张测试图像,涵盖Bowen‘s Disease、Basal Cell Carcinoma、Benign Keratosis Lesions、Dermatofibroma、Melanom
道路坑洼检测是智能交通系统和道路养护管理中的关键任务。本研究基于YOLO26目标检测算法,构建了一个针对道路坑洼的单类别检测系统。实验采用1265张图像进行训练,401张图像进行验证,118张图像进行测试。模型在验证集上的平均精度(mAP50)达到68.6%,精度为76.2%,召回率为61.5%。混淆矩阵分析显示,模型对坑洼的识别准确率为63%。训练过程稳定,损失函数持续下降,无明显过拟合现象。
本研究构建了基于YOLOv8的大豆幼苗与杂草检测系统,旨在实现农田环境中两种目标的精准识别。数据集共包含1302张标注图像,其中训练集908张、验证集260张、测试集134张,类别为大豆幼苗(soy plant)和杂草(weed)。实验结果表明,系统对大豆幼苗的检测性能优异,精确率达92%、召回率86%、mAP@0.5为0.887;但对杂草的检测召回率仅为61%,mAP@0.5为0.61。本研究为
本文构建并训练了一种基于YOLOv8的手势识别检测系统,用于识别10类常见手势(A、number 7、D、I、L、V、W、Y、I love you、number 5)。系统采用YOLOv8作为目标检测框架,在包含1200张训练图像和200张验证图像的数据集上进行训练。实验结果表明,模型整体取得了优异的检测性能:mAP50达到0.995,召回率为0.972,精确率为0.95,mAP50-95为0.8
水下鱼类识别是海洋生态监测和渔业资源管理的关键技术之一。本文基于YOLO26目标检测算法,构建了一个单类水下鱼类识别系统。该系统使用包含35242个标注实例的水下图像数据集进行训练,数据集共分为训练集1170张、验证集146张和测试集147张。实验结果表明,模型在IoU=0.5时的平均精度(mAP50)达到0.72,精确率最高可达1.00,能够有效识别水下环境中的鱼类目标。然而,模型在召回率(76
YOLOv11农田烟草叶片病害检测数据集摘要 该数据集包含470张烟草叶片图像,标注6种病害类型:黑胫病、健康叶片、烟草卷叶病、烟草花叶病毒、棕色斑点和靶斑病。数据集划分为382张训练集、48张验证集和40张测试集,采用YOLO格式标注,提供data.yaml配置文件。数据集可用于训练YOLOv11模型进行农业病害智能识别,支持从边缘设备(yolo11n)到高性能服务器(yolo11x)的不同规模
YOLOv11医学影像脑部病变检测数据集包含371张标注图像(训练253/验证79/测试39),支持阴性/阳性二分类。数据集提供规范的YOLO格式标注和data.yaml配置,适用于脑部病变智能诊断研究。训练流程包括环境配置、数据准备(需符合YOLO目录结构)、模型选择(n/s/m/l/x五种尺度)和参数优化(支持Python API/CLI两种方式),提供验证与推理脚本模板。该数据集通过专业标注
摘要: CANN ops-cv是昇腾NPU专用的计算机视觉算子仓库,包含Resize、NMS、ROIAlign等核心算子,用于图像缩放、目标检测等任务。该仓库解决了视觉推理中的两大痛点:图像前处理的高计算量(如4K图像缩放)和目标检测后处理的高延迟(如NMS的O(n²)复杂度)。通过Ascend C原生实现,算子直接在NPU上运行,避免CPU-NPU数据传输开销。ops-cv算子分为image类(
之前做过一个小目标检测的项目,模型精度和推理速度都调得差不多了,最后发现瓶颈居然在图像预处理上。resize、normalize、augmentation 这些操作每帧都要跑,累积起来的时间比 inference 还多。NV 的 DALI 可以用,但那是 GPU 专用。昇腾上有 VIC(Vision Image Compute)引擎专门解决这个问题,这篇文章把 CV 预处理的所有门道一次性讲清楚。
YOLOv11农场羊只面部检测数据集包含275张图像,分为5类羊只(斑点羊、杰米羊等),采用YOLO格式标注。数据集结构清晰,包含训练/验证/测试集,并配有data.yaml配置文件。该数据集可用于训练精准的羊只面部检测模型,支持智慧农业应用。训练步骤包括环境配置、数据集准备、模型选择和训练验证,提供Python API和CLI两种方式。关键参数如epochs、batch size等需根据硬件调整
YOLOv11农田土豆检测数据集摘要 该数据集包含803张农田土壤环境中的土豆图像,用于目标检测任务。数据集分为训练集(698张)、验证集(69张)和测试集(36张),包含5个目标类别。所有图像都经过精确标注,边界框与实际物体轮廓高度吻合。数据集配置了标准的YOLO格式data.yaml文件,支持直接用于YOLOv11模型的训练。该数据集特别适用于智慧农业应用,如土豆自动化收获规划、产量预估和质量
本文介绍了在昇腾NPU上使用ops-cv算子库优化YOLOv8目标检测后处理流程的方法。重点分析了NMS、ROIAlign和BboxTransform三个关键算子的作用及实现难点,并提供了完整的YOLOv8后处理代码示例。通过将后处理算子迁移到NPU执行,可显著降低30%的CPU处理延迟至5%以下。文章还介绍了DVPP硬件预处理模块的使用方法,展示了从图像输入到最终检测结果的完整NPU加速流程。
空间智能是 AI 的下一个前沿——不只是看懂图片里的内容,还要理解三维空间中的物体位置、空间关系、深度感知。cann-recipes-spatial-intelligence 覆盖三大应用:3D 目标检测(自动驾驶/机器人)、NeRF/3DGS(神经辐射场/高斯泼溅,新型三维重建)、SLAM(同步定位与地图构建)。三个方向的共性:输入是图像或视频,输出是空间中的几何信息。
本文介绍了YOLO26学习者的社区资源指南,重点包括: 官方资源:代码仓库、文档和预训练模型是核心学习材料,建议从README开始逐步深入代码结构。 社区生态:包含开发者、贡献者、应用者和研究者等多层次群体,提供了丰富的实践经验分享。 学习路径:推荐从快速入门开始,逐步掌握模型架构、数据流程、训练和推理等核心模块。 预训练模型:介绍了不同规模的模型变体及其适用场景,为实际应用提供参考。 实用建议:
YOLOv11养殖场羊群目标检测数据集是一个专门用于智能养殖管理的专业数据集,包含66张标注图像(60张训练集,3张验证集,3张测试集)。数据集标注了11个羊只类别,采用YOLO格式标注,每个目标都有精确的边界框。该数据集可用于训练深度学习模型实现羊群数量统计、个体追踪等功能,具有重要的智慧农业应用价值。配套提供了完整的data.yaml配置文件和训练指南,支持从环境安装到模型验证的全流程操作,包
本文分享了将Llama-3-70B模型训练从8卡GPU迁移到64卡昇腾NPU集群的实战经验。首先强调正确安装NPU驱动和CANN工具包的重要性,并详细说明了环境配置步骤。接着介绍了如何逐步推进训练任务,从7B模型开始验证流程,重点讲解了数据集准备、配置文件修改和训练启动方法。文章还总结了三个关键性能调优参数(通信拓扑、梯度累积步数和激活重计算)以及训练不稳定的排查清单。最后简要说明了checkpo
中药饮片的自动识别是推动中医药现代化、智能化发展的关键技术之一。本文基于YOLO26目标检测算法,构建了一个包含45类常见中药饮片的高效识别检测系统。系统采用1500张验证图像进行性能评估,整体达到了0.912的mAP50和0.877的召回率,其中蒲公英、地肤子、天麻等多类药材的mAP50达到0.995以上。训练过程中损失函数收敛平稳,F1值最高达到0.87,表明模型在检测精度与覆盖率之间取得了良
《时空AI赋能智慧港区:一屏统览的智能化革新》摘要:面对全球贸易增长带来的港口运营压力,时空AI技术为传统港区转型升级提供创新解决方案。通过三维重建、实时定位与AI拓扑技术融合,构建"一屏看全局"的智能管控平台,实现船舶、集装箱、车辆等全要素厘米级精准追踪。该方案突破信息孤岛,以数字孪生技术1:1还原港区实景,支持360°无盲区监控和毫秒级数据更新,显著提升作业效率与安全管理水平,推动港区从分散监
结合你之前的问题(ConfigureAwait、异步编程优化、卷积、目标检测),我将详细讲解并行编程技术的核心概念、在贴片机中的应用,重点围绕与异步编程的结合,并提供完整的 C# 示例代码和测试用例。如果你需要更复杂的实现(例如 GPU 并行、YOLO 异步推理、相机流处理或特定贴片机硬件集成),或者有实际图像数据,请提供更多细节,我可以进一步定制代码或建议!4. 测试用例以下测试用例验证并行编程
训练完 YOLOv8,单张推理 15ms,看起来很快。但业务要求每秒处理 100 张图,单张推理只能跑到 66 FPS,离 100 FPS 还差得远。改成批量推理,batch_size=32,结果吞吐量反而降到 50 FPS——批量处理比单张还慢?这篇文章记录批量推理的优化过程——为什么 batch 大了反而慢,以及怎么用 ops-cv 和 AIPP 把吞吐量提到 500 FPS。
本文介绍了多模态图像预处理的优化方法,重点针对图文对、检测框ROI提取和RGB-D深度图融合三种场景。通过ops-cv工具实现了高效的批量处理:CLIP风格的图文对预处理支持同步处理图像和文本;检测框ROI提取在NPU上实现快速裁剪缩放;深度图处理包含配准、归一化和缺失值填充。性能测试显示,批量处理相比串行方式可提升10倍以上吞吐量。文章还提供了CLIP训练pipeline的代码示例,展示了如何统
摘要: 针对YOLO小目标检测漏检问题,本文提出系统性优化方案。数据层面建议过滤过小目标、过采样小目标图像及模糊标签处理;模型改进包括重聚类锚框、增加P2浅层检测头及解耦分类回归任务;损失函数引入尺度权重和温度系数;后处理推荐Soft-NMS或分尺度NMS。强调数据质量优先,网络改动需平衡速度与精度,并指出降低分辨率可能提升小目标检测。最终指出小目标检测需结合业务场景验证,避免过度追求指标提升。(
模型调优(Model Tuning)是指通过调整机器学习模型的参数和结构,以提高其性能和准确性的过程。在目标检测任务中,调优可以帮助模型在特定类别上达到更高的精度(如AP值),同时减少不必要的计算开销。例如,YOLO模型默认支持多类别检测,但有时我们只需要检测单一类别,并要求该类别的检测效果最佳。通过以上步骤,我们成功从YOLOv8s预训练模型中调优出一个专门检测电视的模型。利用COCO数据集提取
YOLOv11城市道路摩托车目标检测数据集包含1462张图像,涵盖10个类别(1-9及自行车),划分为训练集(1098)、验证集(292)和测试集(72)。数据集采用YOLO格式标注,提供data.yaml配置文件。训练步骤包括环境安装、数据集准备、模型选择和训练(支持Python API和CLI两种方式),提供不同规模模型选项(n/s/m/l/x)。训练后可通过验证脚本评估模型性能,关键指标包括
YOLOv11城市道路车辆与行人目标检测数据集包含7015张图像,涵盖12类交通目标(如汽车、行人、卡车等)。数据集分为6468张训练集和547张验证集,提供规范的YOLO格式标注和data.yaml配置文件。该数据集适用于智能交通和自动驾驶领域,支持YOLOv11模型的训练与验证。训练步骤包括环境配置、数据准备、模型选择和参数设置,提供Python API和命令行两种训练方式,并详细说明关键训练
YOLOv11超市牛奶检测数据集摘要 该数据集包含463张超市货架牛奶产品图像,涵盖10种不同品牌和类型的牛奶包装(包括盒装和瓶装)。数据集划分为训练集324张、验证集93张和测试集46张,采用YOLO格式标注,边界框精确贴合产品轮廓。数据集可用于训练目标检测模型,支持零售场景下的智能货架管理和商品识别应用。配套提供data.yaml配置文件,包含类别名称和路径信息。训练建议使用YOLOv11系列
在工业质检领域,汽车零件的缺陷检测是保障产品质量的关键环节。传统人编辑CSDN同步助手工检测效率低、误检率高,难以满足规模化生产需求。本文将结合YOLOv10 目标检测算法与PyQt5 GUI 框架,开发一套集图片检测、视频检测、摄像头实时检测于一体的汽车零件缺陷检测系统,实现工业质检的智能化、可视化与高效化。本项目分为两部分核心实现:基础检测脚本(验证模型效果)+ 可视化 GUI 系统(落地实
目标跟踪
——目标跟踪
联系我们(工作时间:8:30-22:00)
400-660-0108 kefu@csdn.net