登录社区云,与社区用户共同成长
邀请您加入社区
本文分享了一个适用于YOLO系列深度学习模型的单车/共享单车标注数据集。该数据集包含多样化场景下的图像,已按7:1.5:1.5比例划分为训练集、验证集和测试集,并提供VOC/COCO格式的标注文件。数据集支持单车和共享单车两类目标的检测任务,适用于智能交通监控、城市治理、自动驾驶等应用场景。文中详细介绍了数据集的构建背景、规模、标注方式及典型应用流程,并提供了YOLOv8模型训练的示例代码。该数据
随着人工智能与计算机视觉技术的快速发展,基于目标检测的自动垃圾分类方案正成为行业的重要突破口。通过视觉模型对垃圾进行识别与分类,不仅可以显著提升分类效率,还能降低人工成本,实现智能化、规模化应用。而这一切的前提,是拥有一个**高质量、标准化且贴近真实场景的数据集**。
本文介绍了一个基于MATLAB的旋转机械故障诊断项目,采用压缩与激励网络(SENet)进行端到端分类预测。项目针对工业设备在复杂工况下的非平稳信号特点,通过时频变换和通道注意力机制提升弱故障特征的识别能力。主要内容包括:1) 数据预处理流程,含信号分段、归一化和时频图生成;2) SENet模型架构设计,通过通道重标定突出关键特征;3) 工程实现方案,覆盖数据增强、训练策略和评估指标。该系统能够有效
在电商场景中,商品标题通常包含丰富的描述信息,例如“唯美小清新连衣裙 吊带 短裙 无袖 网纱”。人工判断其所属类目(如“服装鞋包 > 女装/女士精品 > 连衣裙”)需要经验和时间。输入商品标题,自动输出其对应的商品分类标签。从机器学习角度看,这是一个典型的文本多分类问题。我们将使用BERT模型作为编码器,在其顶部添加一个全连接分类层,通过微调(Fine-tuning)使模型适应商品标题分类任务。
《感知机:从逻辑门到深度学习的桥梁》摘要 本文通过类比数字电路中的逻辑门,揭示了感知机的本质是一个可学习的阈值逻辑门。与固定功能的传统逻辑门不同,感知机通过权重和偏置的可调性实现了自适应决策能力。文章重点探讨了三个核心认知:1)感知机实质上是参数可调的逻辑门单元;2)激活函数的核心作用在于制造非线性"决策断裂"而非简单放大差异;3)所有深度学习模型最终都可归结为非线性映射后的二
迁移学习是一种将预训练模型的知识迁移到新任务的机器学习方法。文章详细介绍了迁移学习的核心概念、应用场景和实现策略,包括特征提取和微调两种主要方法。通过PyTorch代码示例展示了如何使用ResNet18进行迁移学习,包括模型加载、层替换、数据预处理和训练流程。关键点包括:1)冻结预训练层参数;2)替换全连接层适配新任务;3)合理设置学习率和优化器;4)使用数据增强防止过拟合。实验表明迁移学习能显著
复现NGAFID论文中MiniRocket模型的完整过程。任务是对航空维护数据进行维护前/后的二分类预测。从数据理解、smoke test验证开始,逐步完成了baseline复现,并进行了三个改进实验:对比全局/分折归一化、输入长度消融和补充评价指标。通过错误分析发现不同维护类别的错误率差异显著,长度影响较小。最后总结了环境配置、数据路径等实践中的关键坑点,并分享了从单纯跑代码到建立系统实验思维的
本文以综合练习为主线,系统梳理递归、搜索与回溯算法中的高频题型,围绕子集、排列、组合、括号生成、路径搜索、数独、N皇后等经典问题,归纳搜索树的展开方式、递归参数的设计思路、回溯中的恢复现场方法,以及常见剪枝技巧。文章不仅总结不同题型之间的联系与区别,也强调如何从题目表象中提炼出统一的搜索模型,帮助读者从“会写模板”进一步走向“会识别题型、会分析模型、会独立解题”,真正建立清晰、完整、可迁移的回溯解
本文介绍了一个基于孪生网络的故障诊断MATLAB实现项目。针对工业设备故障诊断中面临的小样本、多噪声、工况多变等挑战,该项目利用孪生网络在相似性度量方面的优势,构建了一个端到端的智能诊断系统。文章详细阐述了从数据预处理、网络架构设计到模型训练优化的完整流程,包括信号标准化、双分支共享权重结构、对比损失函数等关键技术。该方法通过有限样本即可实现高精度诊断,特别适合早期微弱故障检测。项目提供了完整的M
摘要: 企业级大模型应用常面临输出不可控、业务对接困难等问题。本文介绍了核心范式:分类→结构化输出→业务执行,有效解决AI系统落地的关键痛点。
TIDE(Tool for Identifying Detection Errors)是专门为目标检测任务设计的错误分析工具,由伯克利AI研究实验室开发。它就像一个"检测错误诊断医生",能够系统性地分解模型预测结果中的各种错误类型,帮助我们理解模型到底错在哪里。传统评估指标如mAP(mean Average Precision)只能告诉我们模型的整体性能,但无法解释性能瓶颈的具体原因。TIDE则将
核心目标:利用 Python 3.11 抓取非结构化的特种设备标准目录,将其转化为具备“父-子”血缘关系的结构化 JSON/CSV 字典。技术栈Httpx(异步请求) +(解析) +Pandas(数据重组) +Pydantic(模型验证)。读完获得掌握**层级数据提取(Parent-Child Extraction)**的通用状态机算法。学会处理 HTML 中复杂的“标题-内容”交替结构。获得一份
本文提出了一种协同CNN-Transformer网络(SCTNet)用于高光谱图像分类,通过双分支特征提取模块(TBFE)并行利用2D和3D卷积捕获局部空间-光谱特征,并设计混合池化注意力模块(HPA)增强特征表示。该网络还引入跨层特征融合机制(CFF)聚合Transformer编码器的多层输出,有效保留浅层关键信息。实验结果表明,SCTNet在五个基准数据集上超越了现有方法,包括最新的SS-Ma
本文介绍了一个基于LSTM模型的微博情绪分类系统,实现了对"喜悦、愤怒、厌恶、低落"四种情绪的自动识别。系统采用字符级处理方式,通过双向LSTM捕捉文本上下文语义信息,并包含完整的数据预处理、模型训练和交互预测流程。项目亮点包括轻量化设计、可复现性和交互式演示功能,为NLP入门者提供了文本分类的实战案例。文章还探讨了将该系统扩展为预训练模型和可视化工具的可行性。
本文介绍了使用PyTorch实现基于CNN的Fashion-MNIST图像分类任务。主要内容包括:1)数据预处理,将CSV格式数据转换为28×28张量;2)构建LeNet风格CNN模型,包含两个卷积层和三个全连接层;3)采用Xavier初始化优化参数;4)使用交叉熵损失和SGD优化器进行训练;5)实现了完整的训练循环,包括实时监控训练/验证指标;6)提供单样本预测和可视化功能。该实现展示了从数据处
本文深入探讨了MixUp与CutMix数据增强策略在YOLO目标检测模型中的应用效果差异。通过27组消融实验发现:CutMix能提升分类精度但会降低边界框回归稳定性,而MixUp则相反。在工业缺陷检测等对边界精度要求高的场景中,建议采用低CutMix(0.15)与高MixUp(0.25)的组合;通用目标检测则可使用CutMix 0.4与MixUp 0.1的平衡配置。实验表明,模型越大对增强强度的容
计算机-人工智能-基于空间注意力的眼科手术视频技能评估
在ViT出现之前,CV界是CNN一家独大,ResNet、EfficientNet等卷积架构统治图像分类多年。做视觉必须用卷积,纯Transformer不行。直到Google Brain团队扔出这篇ICLR 2021的封神之作——,直接用纯Transformer在图像分类任务上干翻SOTA卷积模型,正式开启Transformer统治CV的新纪元。今天这篇精读,从背景痛点→模型结构→公式推导→图解架构
共 C 个类别:ω1,…,ωC通过函数值大小直接判断类别,无需估计分布。直接计算高维内积,不显式映射分类是监督学习核心任务,从贝叶斯最优决策到线性判别,再到核方法与 SVM,核心是用判别边界划分特征空间;SVM 通过最大间隔 + 核技巧成为最强线性模型扩展,能高效处理非线性、高维、小样本任务。
本文介绍了一个包含1100张图像的农作物识别数据集,涵盖小麦、甘蔗、黄麻、玉米和水稻五大类。数据集特点包括:类别均衡分布(每类约200张)、四种数据增强方式(原始、移位、翻转、旋转)、完整结构化标注。该数据集适用于深度学习模型训练、农业遥感分析、移动端识别应用和农业机器人开发等场景,能有效提升作物分类精度和模型泛化能力。所有图像已预处理为标准格式,可直接用于计算机视觉算法研发。
本文介绍了一种基于经验小波变换(EWT)和支持向量机(SVM)的智能故障诊断方法。该方法通过EWT自适应分解非平稳信号,提取多尺度特征,再结合SVM的分类优势实现高精度故障识别。项目针对工业设备故障诊断中的信号非平稳性、噪声干扰等挑战,提出了完整的解决方案架构,包括信号预处理、EWT特征提取、SVM建模和参数优化等模块。实验结果表明,该方法在小样本情况下仍能保持较高诊断准确率,可广泛应用于旋转机械
fit=auto.arima(as.numeric(datanew[,j]),# 第j列数据转数值。coef=matrix(0,16,12)# 新建16行12列的0矩阵,存12个序列的AR系数。max.q=0,d=1,# 强制q=0,不做MA。xlab='',ylab='',zlab='')# 不显示轴标签。# 核心:拟合 ARIMA(p,1,0) 模型 = 一阶差分后的 AR(p)coef=co
文章摘要 船舶旋转目标检测数据集包含约2000张高分辨率图像,支持细粒度分类与旋转目标检测,适用于海上监控、军事侦察等场景。数据集覆盖16类船舶(如航空母舰、驱逐舰、医院船等),标注格式包含旋转角度信息。推荐使用YOLOv8-obb模型进行训练,该模型专为旋转目标设计,支持OBB任务。训练需配置CUDA环境,准备标注数据转换为(cx, cy, w, h, angle)格式,并定义YAML配置文件。
在传统视频智能体系中,AI仅停留在二维图像识别阶段,缺乏真实空间建模能力,导致跨镜追踪断裂、行为不可预测、决策无法前置。像素 → 空间坐标(空间反演)目标 → 连续轨迹(轨迹张量)轨迹 → 行为预测(空间认知)认知 → 主动决策(空间智能体)该体系构建了从感知 → 建模 → 推演 → 控制的完整空间智能闭环,标志着视频系统从“记录世界”向“计算世界”跃迁。轨迹张量是对目标在时空中的高维表达:一个目
摘要: 本文提出一种结合循环神经网络(RNN)和线性判别分析(LDA)的多特征分类预测方法RNN-LDA。该方法利用RNN处理时序数据的优势提取特征,再通过LDA进行降维和判别分析,有效解决了高维数据分类中的维度灾难和过拟合问题。项目详细介绍了模型架构设计、MATLAB实现过程及优化策略,包括数据预处理、RNN特征提取、LDA降维和分类预测等关键环节。实验结果表明,该方法在保持分类精度的同时显著降
识别词库:100个常用词汇识别准确率:90%以上通信接口:UART优点:体积小、功耗低、识别速度快工作频率:2.4GHz通信距离:约10米通信速率:3Mbps优点:价格低廉、使用简单、通信稳定。
本文介绍了NXP和逐飞科技联合推出的eIQ工具在智能车竞赛中的应用,重点讲解如何利用该工具训练轻量级分类模型MobileNet_v2。文章详细拆解了从数据导入、增强、模型训练到验证优化的全流程,特别针对竞赛中多方向手写数字识别的挑战,提供了数据增强和参数设置建议。该工具简化了嵌入式AI开发流程,帮助参赛者快速构建适配OpenART mini的高效分类模型,提升竞赛成绩。
虽然不是强制性的,但符合EU Ecolabel标准有助于满足未来可能的法规要求(如ESPR)。认证是一项自愿性环保认证计划,旨在帮助消费者识别符合高环保标准的产品和服务。于1992年设立,适用于多种产品类别,包括清洁剂、纺织品、电子产品、家具、纸张等。:通过后,企业可在产品上使用EU Ecolabel标志。:强制性,设定产品最低环保要求(如耐用性、可维修性)。鼓励企业生产更环保的产品,减少对环境和
本文系统介绍了电机的分类体系,从工作原理(同步/异步电机、有刷/无刷电机)、电源类型(直流/交流)、结构特点(转子/定子)、应用领域(汽车/工业/家用)等多个维度进行详细解析。重点分析了各类电机的技术特点、性能参数和典型应用场景,并提供了电机选型的技术与经济考量因素。最后展望了电机技术在新材料应用、智能控制和节能环保等方面的发展趋势,为电机选型和应用提供全面参考。
聚焦6G“通信+感知”深度融合的核心需求,覆盖自动驾驶V2X、智能安防、工业物联网、微观工业监测(如芯片制造)、全息远程手术等场景;解决传统“通信与感知分离”导致的资源浪费(重复占用频谱/算力)、动态环境适配差(如单一感知在雨雾中失效)等问题,需同时满足“高可靠通信”与“高精度环境感知”双重目标。针对毫米波(mmWave)车车通信的核心痛点:毫米波信号带宽窄、易受遮挡(车辆、行人、建筑物)导致衰减
真实土地地块在大小和复杂性方面表现出高度多样化。现有技术方法在进行土地利用二级类别分类时难以满足土地利用分类的实际需求,存在一定局限性。如今,多模态大语言模型的出现为图像分类带来了新的技术手段,然而当前研究缺乏多模态大语言模型技术在土地利用分类领域上的应用相关研究。因此,本研究首次引入多模态大语言模型技术,基于CN-MSLU-100K数据集训练了LandGPT模型,并提出“跨级判别”框架,使Lan
FoodX-251 食物分类计算机视觉数据集-130,470张图片 食物识别 图像分类 深度学习 智能餐饮 健康管理 食品电商 多模态学习
随着《网络数据安全管理条例》正式施行与 GB/T 43697-2024《数据安全技术 数据分类分级规则》的落地实施,数据分类分级已成为企业数据安全合规的核心基础。在国产化替代进入深水区的背景下,工具不仅需满足 "芯 - 云 - 边 - 端" 全栈适配要求,更要应对数据多模态爆发、实时流转的业务挑战 —— 传统静态规则驱动的产品已难以解决非结构化数据识别、增量数据分级滞后等痛点。
【摘要】在多分类任务中,准确率(Accuracy)容易因类别不平衡产生误导。本文解析三种关键评估指标:Macro平均(平等对待每个类别,适合关注小类别的场景)、Micro平均(平等对待每个样本,反映整体准确率)和Weighted平均(按样本数加权,折中方案)。通过混淆矩阵分析单类别指标(精确率、召回率、F1)后,演示如何聚合为全局指标。提供Python代码示例和决策树,指导根据业务场景选择指标:医
当前,多模态数据融合在故障识别和分类领域展现出巨大的潜力。然而,如何有效地整合来自不同模态的数据,并充分利用其内在特征,仍然是一个具有挑战性的问题。
多模态模型CLIP原理与图片分类,文字搜索图像实战演练
计算马氏距离的一个小例子,包含具体的计算过程:1.计算样本差向量。2.计算协方差矩阵的逆矩阵。3.计算马氏距离
CLIP的核心不是“复杂公式”,而是“让图文学会对话”的简单逻辑。今天这个手写数字项目,从原理到代码都做到了“小白友好”——零数据下载、零环境踩坑、服务器自动保存结果图,10分钟就能跑通。多模态入门不用怕,跟着这个项目练一遍,你就已经掌握了CLIP的核心玩法!
带你深入了解 NVIDIA 的专业芯片分类和应用场景,结合真实案例,让你对 NVIDIA 的科技魅力有更清晰的认识。是很多自动驾驶汽车(如特斯拉、宝马)的 AI 计算核心,它处理摄像头、雷达数据,做出行车决策。服务器级 GPU,这些 GPU 让 AI 通过数百万小时的文本学习,最终能像人一样对话。显卡上,你可以玩 4K 画质的《赛博朋克 2077》,画面超级细腻,支持光线追踪技术。,在数字空间里模
分类
——分类
联系我们(工作时间:8:30-22:00)
400-660-0108 kefu@csdn.net