登录社区云,与社区用户共同成长
邀请您加入社区
AI算子和存储层级分类与特性分析 本文系统性地阐述了AI计算中的算子分类和存储层级结构。计算层算子按计算密集度分为三类:计算密集型(如GEMM、Conv2D)、访存密集型(如ReLU、Pooling)和通信密集型(如AllReduce)。存储层分为片上存储器(寄存器、Cache)、片外主存(DDR、HBM)和外部存储(SSD、HDD),详细说明了各层的容量、延迟和带宽特性。重点介绍了Conv2D、
摘要 本文档为医疗科研机构提供70B参数多模态大模型预训练落地的工程化指南,覆盖数据治理、硬件配置、训练优化、合规审计等全流程。核心内容包括: 数据工程:细粒度数据盘点、自动化去标识化流程(DICOM/文本/波形)、高效存储方案(WebDataset/Lustre/NVMe缓存) 硬件设计:8×H200 GPU节点配置、400Gb InfiniBand组网、Lustre并行文件系统与灾备策略 训练
本项目基于YOLOv8深度学习框架,开发了一套先进的船舶分类识别检测系统,能够自动识别并分类五种主要船舶类型:集装箱船(Container Ship)、邮轮(Cruise Ship)、军用舰艇(Military Ship)、滚装船(RORO)和油轮(Tanker)。系统采用包含3,721张高质量标注图像的数据集(训练集3,232张、验证集339张、测试集150张),通过精细的模型调优和迁移学习技术
本项目基于最先进的YOLOv10目标检测算法,开发了一套高精度的船舶分类识别检测系统,能够准确识别并分类五大类船舶:集装箱船(Container Ship)、邮轮(Cruise Ship)、军用舰艇(Military Ship)、滚装船(RORO)和油轮(Tanker)。系统采用包含3,721张高质量船舶图像的专业数据集进行训练和评估,其中训练集3,232张,验证集339张,测试集150张。该系统
在机器学习分类任务中,直接的机器学习分类仅提供类别标签,而模型包含的概率输出能量化模型置信度,识别分类不确定区域。本期以GEE+随机森林进行水体分类为例,介绍机器学习模型预测的概率输出功能及其应用。
摘要:本文介绍了基于HarmonyOS 6.0+开发的智能垃圾分类APP,通过端侧AI图像识别和本地数据库技术解决传统垃圾分类查询的痛点问题。APP采用轻量化YOLOv8-nano模型实现92%以上的识别准确率,结合CameraKit实现实时拍摄识别,利用RelationalStore构建离线查询数据库,并通过ArkUI优化交互体验。开发过程涵盖环境搭建、模块开发到测试验证全流程,重点解决了图像识
一、引言:环保需求下,CNN 赋能智能垃圾分类1.1 垃圾分类的痛点与技术解决方案传统垃圾分类依赖人工识别,存在效率低、准确率差、成本高等问题:垃圾类别多(可回收、厨余、有害、其他等细分 10 + 类);相似垃圾难区分(如纸类 vs cardboard、塑料瓶 vs 玻璃瓶);环境干扰大(污渍、遮挡、光照变化影响识别)。
本项目基于YOLOv10目标检测算法开发了一套高精度的扑克牌识别检测系统,能够准确识别和定位52种标准扑克牌(包括13个点数×4种花色)。系统在包含24,233张图像的数据集上进行了训练和验证,其中训练集21,203张,验证集2,020张,测试集1,010张。该系统可实时检测扑克牌的种类、位置和数量,可广泛应用于赌场监控、扑克游戏自动计分、魔术教学分析、智能机器人抓取等多个领域,具有重要的实用价值
本项目基于YOLOv8目标检测算法开发了一套专业的篮球比赛场景智能分析系统,能够实时检测和识别比赛中的9类关键元素:篮球(Ball)、篮筐(Hoop)、比赛节次(Period)、运动员(Player)、裁判(Ref)、进攻计时器(Shot Clock)、队名(Team Name)、球队得分(Team Points)和剩余时间(Time Remaining)。系统使用包含1,196张标注图像的数据集
技术栈:python语言、Flask框架、requests爬虫、线性回归预测算法、Echarts可视化、情感分析、朴素贝叶斯分类器数据采集模块是系统的数据基础,通过requests库编写爬虫脚本,自动抓取汽车销售平台的销量数据、车辆行驶里程与价格关联数据、用户评论等核心信息,支持定时增量采集,保障数据的实时性与完整性,为后续分析提供可靠数据源。数据可视化模块借助Echarts实现多维度数据展示:销
本次实战是一个食物分类任务,我们要让许多模型学习食物图片数据,然后进行分类。本次实战会采用模块化思想,通过data.py model.py train.py 和main.py四个python模块进行编写,其实思路基本就是第三节 回归实战的升级拓展,所以如果出现重复内容就不赘述了。这是监督学习模型的数据类,它包含基本三要素 init ,getitem , len,以及一个读文件方法readfilei
3 *224 *224-> 512*7*7 -> 拉直 -》全连接分类nn.ReLU(),nn.ReLU(),nn.ReLU(),return x模型定义相对简单且相似。值得一提的是,数据作为新时代的石油资源,我们训练的模型通常难以与投入数百万美元训练的大模型相媲美,因此可以采用迁移学习策略。迁移学习主要分为微调和线性探测两种方式,二者的核心区别在于是否冻结主干网络的参数。
本文主要介绍了AI Agent与Agentic AI的原理与应用。AI Agent是一种具备环境感知、智能决策乃至自主行动能力的智能实体,而Agentic AI则是追求更高阶的智能,强调AI系统的自主性、目标驱动、环境交互和学习能力。文章详细解析了AI Agent的核心技术栈,包括感知模块、认知与决策模块、行动模块以及Agent架构模式。同时,文章还探讨了主流的AI Agent平台、框架与项目,如
【代码】kaggle竞赛-大模型分类微调。
在现代产品开发过程中,收集到的用户需求往往数量庞大且形式多样。如何高效地组织和分析这些需求,成为产品规划阶段的关键挑战。本文旨在介绍如何利用机器学习技术,特别是自然语言处理(NLP)和聚类算法,对产品需求进行智能分类和聚类,从而帮助产品团队更高效地进行需求优先级排序和版本规划。需求分类与聚类的基本概念相关算法原理和技术实现实际应用案例和代码示例行业最佳实践和工具推荐第2节介绍核心概念与联系第3节详
一、研究背景与意义在当今数据驱动的时代,数据分类预测技术已广泛应用于故障识别、图像识别、语音识别、金融风险评估等众多领域。其中,故障识别作为保障工业设备安全稳定运行的关键环节,对数据分类预测的准确性、高效性和鲁棒性提出了极高要求。传统的数据分类预测方法,如支持向量机(SVM)、决策树、K 近邻(KNN)等,在处理低维、结构简单的数据时表现出一定的优势。
深度学习CNN卷积神经算法垃圾分类系统 TensorFlow大数据 OpenCV 毕业设计(建议收藏)✅
本文档针对OTFS(正交时频空)通信系统相关的12个MATLAB代码文件进行功能解读,涵盖信道建模、数据生成、信号检测与均衡等核心模块。该代码集由莫纳什大学研究团队开发,支持ZF(迫零)、MMSE(最小均方误差)、MPA(消息传递算法)等多种检测算法,适用于高斯白噪声信道下的OTFS系统性能仿真,可灵活配置QPSK、16QAM、64QAM等调制方式,以及ZP(零填充)、CP(循环前缀)、RCP(循
摘要: 本文提出动态识别的本质是时间戳状态序列的因果单元抽象,并给出可运行实现方案。核心创新在于通过二次特征提取(量化速度、位移等)形成动态指纹,结合动态记忆库实现动作识别与分类。系统架构包含带时间戳的状态记录、最小动态差分、特征抽象器(6位量化处理扰动)和动态概念编码(如"D001"),最终实现从感知到意识的关键跃迁。代码采用RealSense D455+OpenCV Viz
随着城市化进程的加速,城市声环境日益复杂,涵盖了车辆、行人、施工、自然等多种声音类型。对城市声音进行有效的分类不仅有助于环境监测、噪声污染治理,还对智慧城市建设、公共安全预警、甚至个性化服务(如基于声音的智能导航)具有重要意义。传统的城市声音分析方法往往依赖于人工特征提取和基于规则的系统,效率低下且泛化能力有限。近年来,机器学习(Machine Learning, ML)和深度学习(Deep Le
RAG的架构虽然有所不同,但其原理都是相同的,都是通过检索来增强模型的生成能力,只不过在不同的环节做了不同的优化。从事RAG技术的工作也有一两年时间了,但在此之间都是这学一点那学一点,感觉自己好像什么都会,但从来没有对整个RAG系统进行过梳理。所以,今天就从RAG的迭代过程开始梳理一下RAG的架构升级过程,了解不同种类RAG的区别和联系,以及适用场景。RAG的几种类型从技术的本质来说,RAG就是检
他们提出了一种名为BOB(Beyond Objects)的新方法,旨在解决一个困扰业界已久的难题:如何利用文生图(T2I)模型,为细粒度分类任务生成高质量的训练数据,尤其是在只有少量真实样本(即“少样本学习”)的情况下。它不仅仅是简单地生成图片,而是通过因果干预的思想,从根本上提升了合成数据的质量和多样性,对于推动AIGC技术在严肃的科研和工业场景中的落地,具有非常重要的价值。例如,提示语不再是简
本课程介绍了如何创建和使用自定义spaCy管道组件。主要内容包括:1) spaCy管道组件的工作原理和基本概念;2) 通过工厂函数创建自定义组件,如关键词检测组件;3) 将自定义组件集成到处理管道中,并调整组件顺序;4) 实际案例演示如何修改实体标签。通过学习,可以掌握扩展spaCy功能的方法,满足特定文本处理需求。课程包含代码示例,展示了从组件创建到集成的完整流程。
本文专为AI小白和程序员群体打造,通俗解读GraphRAG核心技术——这是将知识图谱与传统RAG深度融合的创新方案。通过结构化知识与大语言模型(LLM)的协同,GraphRAG不仅解决了传统RAG的信息割裂问题,还能提供更精准、可解释、强推理的AI回答,是企业级AI应用落地的关键技术,更是开发者进阶大模型领域的必备知识点。GraphRAG不是传统RAG的替代者,而是大模型时代的"升级包"。它通过知
fastText是一种高效的文本分类工具,其核心原理是将词向量与线性分类器结合,通过监督学习训练。它采用简洁的文本格式(标签以__label__开头),支持快速训练和预测,适用于情感分析、新闻分类等场景。fastText优势在于训练速度快、模型体积小,支持多语言和进阶技巧如2-gram优化。工业中常用于评论分析、商品分类等低延迟需求场景。该工具通过简单接口实现高效文本分类,是处理大规模语料的理想选
本文介绍了基于人工智能的图像分类技术,涉及深度学习、OpenCV和卷积神经网络(CNN)。首先概述了CNN的基本结构和工作原理,包括卷积层、池化层、全连接层等组件。随后介绍了VGG和GoogleNet两种典型网络模型的特点,VGG通过增加网络深度提升性能,GoogleNet则采用Inception模块优化结构。文章还提供了完整的代码实现方案,涵盖数据预处理、模型构建与训练等关键步骤,使用Tenso
本文介绍了如何对预训练的大语言模型进行微调以适应垃圾邮件分类任务。首先构建平衡数据集,使用GPT2 tokenizer构建数据加载器。模型微调时冻结大部分参数,仅微调最后一层transformer块、归一化层和修改后的输出层(2分类)。实验展示了模型在垃圾邮件分类上的应用效果,并提供了模型保存和加载方法。该方法有效利用预训练模型的特征提取能力,通过有限微调实现特定分类任务。
分类
——分类
联系我们(工作时间:8:30-22:00)
400-660-0108 kefu@csdn.net