登录社区云,与社区用户共同成长
邀请您加入社区
这篇文章详细介绍了LabelMe标注工具的数据集转换脚本配置指南,主要内容包括: 目录结构配置 提供了完整的Python脚本文件清单(dataset/voc/coco/yolo/labels转换) 给出了Anaconda环境下的典型目录结构示例 核心功能脚本 包含5个主要Python脚本的完整源码。
这篇文章带你走完了PyTorch → Transformer → LLM训练 → 推理 → 量化 → 部署全流程。先跑通代码,再理解原理;先用LoRA,再玩大模型;先量化,再部署。
开会的时候,你有没有过这种冲动——眼睛盯着领导,手在桌子底下悄悄划拉着什么?手机太显眼,电脑屏幕会反光,但手腕上的那块小屏幕,谁也注意不到你在干嘛。没错,今天我们要在 HarmonyOS 手表上写一个贪吃蛇游戏。这事儿听起来挺酷的,做起来其实也不难——你只需要了解 Canvas 绘图、定时器、方向控制这几样东西,一两个小时就能搞定。写完之后你就会发现,手表开发没想象中那么玄乎,那些用来水文章的时间
摘要:该项目基于PyTorch框架开发了樱桃病虫害识别系统,采用ResNet50、VGG16、ResNet34三种卷积神经网络模型及模型融合方案。系统提供GUI(PySide6)和Web(Flask+Vue)双界面,支持训练过程可视化、模型评估(混淆矩阵、准确率等指标)及热力图生成。项目包含完整代码、预训练模型和数据集,可在PyCharm/VS Code+Anaconda环境中运行,输出训练曲线、
本文介绍了在ARM架构(aarch64)系统上安装PyTorch和torch_npu插件的完整流程。首先通过清华镜像源下载并安装Anaconda,创建Python 3.10环境。然后逐步安装PyTorch 2.6.0和torch_npu 7.3.0,详细说明了可能遇到的问题及解决方法,如缺少yaml包、gcc环境等。最后提供了升级和配置pip源的方法,并指引用户参考官方文档进行模型训练。整个过程涵
Torchvision 0.26是PyTorch生态中的核心计算机视觉库,提供六大功能模块:1)数据增强Transforms支持多模态处理;2)Models提供主流视觉架构及预训练权重,采用新版Weights API管理模型版本;3)Datasets集成常见视觉数据集;4)Operators包含高效底层算子;5)IO模块实现高速数据读取;6)Training References提供官方训练脚本。
摘要:本文介绍了一个基于YOLOv8的家禽检测系统,使用PyTorch框架实现。项目包含完整代码、数据集、预训练模型权重、训练记录和GUI界面(采用PySide6开发)。系统支持笔记本/USB摄像头输入,可进行图像/视频实时检测,并提供了精确率、召回率等评估指标。用户可选择使用预训练模型或自行训练(通过修改配置文件路径即可完成)。GUI界面简洁实用,包含目标检测、坐标显示等功能。项目结构清晰,附带
本文介绍了一个基于卷积神经网络的咖啡豆缺陷识别系统,采用PyTorch框架实现,包含ResNet50、VGG16和ResNet34三种模型。系统支持GUI(PySide6)和Web(Flask+Vue)两种界面,功能相同。项目结构完整,包含数据集、训练代码和模型评估功能,可输出训练曲线、混淆矩阵、热力图等指标。系统支持自定义数据集训练,操作简单,只需指定数据集路径、模型和训练轮数即可运行。项目提供
基于TransU-Net的遥感图像语义分割与分类,遥感建筑物数据集,基于Pytorch框架,针对不同城市建筑物精准提取,包含一万多字报告,如图所示,有代码+数据集+模型
本文详细介绍了如何使用PyTorch从零搭建神经网络。核心要点包括:1)继承nn.Module并重写__init__和forward方法;2)采用层堆叠思想构建网络结构;3)重点解析全连接层的参数计算与初始化方法;4)提供完整的四层神经网络实现代码。文章强调网络搭建只是深度学习流程中的一环,完整的任务还需包含数据准备、模型训练和测试评估。通过清晰的图示和代码示例,本文为初学者提供了神经网络构建的实
本文介绍了一个基于YOLOv8的停车场空位与突发状况检测系统,包含完整项目代码、数据集、预训练模型和GUI界面。系统支持图像/视频实时检测,提供精确率、召回率等评估指标。项目采用PyTorch框架,GUI由PySide6开发,界面简洁实用。用户可选择直接使用预训练模型或自行训练(需修改数据集路径)。核心功能包括:图像上传检测(处理速度0.3秒内)、目标定位与分类显示、多目标追踪等。项目结构完整,提
本文介绍了PyTorch框架中的自动微分和梯度下降法在深度学习中的应用。首先讲解了自动微分模块的作用机制,包括定义参数、计算损失、反向传播和参数更新等步骤。其次详细说明了梯度下降法的实现过程,通过迭代计算损失梯度并更新参数来寻找最优解。文章还介绍了detach()函数解决梯度计算张量转换问题的方法。最后以线性回归为例,展示了PyTorch构建模型的完整流程:数据准备、模型搭建、损失函数设置、优化器
上周工作聚焦于文献解析与智能平台搭建。在PDF解析方面,通过正则匹配实现了文献元数据提取功能,解决了作者识别、机构过滤等问题。技术架构上引入LangGraph框架构建多智能体系统,完成了Router路由节点和QA、Retrieval等基础Agent节点的搭建,采用DeepSeekLLM和本地Embedding模型,实现了论文分块向量化存储(ChromaDB)。前端重构新增功能导航栏,平台从单一解析
特性正则化 (L1, L2, 权重衰减)优化算法 (SGD, Momentum, AdaGrad, Adam)首要目标提高泛化能力,防止过拟合。控制模型复杂度。加速训练,促进收敛。高效找到损失函数最小值。作用对象模型参数 (θ) 本身。施加一个指向零的力。梯度 (∇L)。调整梯度的大小和方向用于更新。数学本质在优化问题中增加一个约束项(先验)。求解无约束优化问题的数值迭代方法。关键项-ηλ * θ
Transformer论文精读和从零开始的完整代码复现(PyTorch),超长文预警!将介绍模型架构中的所有组件,并解答可能的困惑
PyTorch神经网络参数初始化全攻略:深度学习模型训练中,参数初始化直接影响模型收敛性、训练效率和最终性能。本文系统讲解7种初始化方法,分为无法打破对称性(全零、全一、固定值)和可打破对称性(随机均匀、正态分布、凯明、Xavier)两类,重点剖析凯明初始化(适配ReLU)和Xavier初始化(适配Sigmoid/Tanh)的原理与适用场景。通过PyTorch代码演示各初始化方法的实现,并提供选择
摘要:本项目基于YOLOv8实现水果分级系统,包含完整代码、数据集、预训练模型及GUI界面。系统支持图像/视频实时检测,提供精确率、召回率等指标评估。采用PySide6+OpenCV开发简洁功能型界面,支持笔记本/USB摄像头输入。项目结构清晰,包含模型训练、验证和使用全流程,用户可选择直接使用预训练模型或重新训练。核心功能包括图像上传、目标检测、结果显示及坐标定位等。提供完整文档资料,开箱即用,
《基于YOLOv11的葡萄串检测系统》项目介绍 该项目实现了一个完整的葡萄串检测系统,采用YOLOv11目标检测算法,基于PyTorch框架开发。系统支持图像检测、视频检测和实时摄像头检测三种模式,并配有简洁实用的GUI界面(使用PySide6开发)。项目包含完整代码、训练数据集、预训练模型权重及训练指标图表。用户可直接使用提供的模型,也可通过修改data.yaml配置文件自行训练模型。系统部署支
这篇文章介绍了一个基于YOLOv8的公共安全监控系统项目。该项目包含完整的代码、数据集、预训练模型权重和GUI界面,支持目标检测、图像分类识别等功能。系统采用PyTorch框架实现,提供了模型训练、验证的完整流程,并展示了精确率、召回率等评估指标。GUI界面使用PySide6设计,简洁实用,支持图像检测和实时视频检测。项目结构清晰,包含数据预处理、模型训练、验证和应用展示等模块,可直接部署使用。文
本文介绍了一个基于YOLOv11的手势检测识别系统项目。该项目使用PyTorch框架实现,包含完整的代码、数据集、预训练模型权重和GUI界面。系统支持图像检测、视频检测以及实时摄像头检测功能。GUI界面采用PySide6设计,简洁实用。项目提供了详细的环境配置指南和训练流程:从数据集准备、模型训练到验证测试。数据集中包含丰富的手势图像样本,训练结果展示了良好的性能指标。整个项目打包完整,开箱即用,
本仓库开源了本人论文的 PyTorch 实现代码,目前这项研究还在进行中,欢迎感兴趣的研究者共同交流。该工作面向低比特率语音编解码场景下的 VoIP 隐写分析任务,重点关注在低嵌入率、短语音片段以及复杂嵌入条件下,隐写痕迹微弱、稀疏且容易被语音内容波动掩盖的问题。针对这些挑战,本文提出了一个融合嵌入率感知数据增强、原始流/校准流双分支建模、跨视图特征交互以及混合注意力特征精炼的深度神经网络框架。
训练时:计算损失 → 反向传播 → 更新参数验证时:只做前向传播 → 计算准确率 → 不更新参数特征工程:通过增加二次项,让简单模型也能学习复杂关系训练:要梯度,要更新参数,目的是学习验证/预测:不要梯度,不更新参数,目的是评估torch.no_grad() 就是切换这两个模式的开关。
必记原则:权重禁止全零 / 全一 / 固定值,仅偏置可设为 0;ReLU 系列:无脑选凯明初始化,深层网络最优;:选泽维尔初始化,梯度更稳定;浅层简单模型:均匀 / 正态分布随机初始化即可。参数初始化是深度学习的 “起点艺术”,选对方案,能让模型少走 90% 的弯路,从根源避免梯度陷阱与对称僵局,快速收敛到最优解。
迁移学习是一种将预训练模型的知识迁移到新任务的机器学习方法。文章详细介绍了迁移学习的核心概念、应用场景和实现策略,包括特征提取和微调两种主要方法。通过PyTorch代码示例展示了如何使用ResNet18进行迁移学习,包括模型加载、层替换、数据预处理和训练流程。关键点包括:1)冻结预训练层参数;2)替换全连接层适配新任务;3)合理设置学习率和优化器;4)使用数据增强防止过拟合。实验表明迁移学习能显著
的作用是在不牺牲模型精度的前提下,让注意力机制(Attention Mechanism)跑得更快、更省内存。核心痛点:传统 Attention 需要生成巨大的N×NN \times NN×N矩阵,导致 GPU 显存频繁在“慢速大内存 (HBM)”与“快速小内存 (SRAM)”间搬运数据。GPU 算力极强,但因为忙着搬数据,大部分时间在“空转”。核心方案将矩阵切成小块,在高速 SRAM 中完成计算,
增量学习(Incremental Learning,IL)场景中的遥感模型通常需要应对新出现的类和跨领域的特征转移,本文将这种综合挑战称为跨域 IL现有方法通常单独处理类 IL (CIL)或者域 IL (DIL),无法有效处理跨域转换的重复类,并导致跨域的灾难性遗忘或特征错位。为了解决这一问题,本文提出了一种新的CDIL框架,它将具有领域特定的适配器模块(domain-specific adapt
本文系统介绍了大型语言模型(LLM)训练中的资源核算与优化技术。主要内容包括:1)计算资源估算方法,通过FLOPs公式计算训练时间与显存需求;2)张量数据结构及其内存管理策略;3)不同浮点类型(FP32/FP16/BF16/FP8)的特性与选择;4)计算效率指标(FLOPs、MFU)与优化方法;5)模型训练全流程,涵盖参数初始化、数据加载、优化器选择、混合精度训练等技术要点;6)检查点机制确保训练
总的来说,这一章的学习让学习者从一个只关注“模型如何工作”的初级开发者,开始向一个懂得“如何让模型高效工作”的工程实践者转变。工具化资源估算:学习并尝试使用如等工具,来实际监控和分析代码的显存占用,而不仅仅是停留在理论估算。混合精度训练:深入了解 FP16/BF16 混合精度训练的原理及其对内存和计算速度的影响。高级并行策略:学习数据并行、模型并行和流水线并行等分布式训练策略,探究它们如何突破单卡
本文介绍了一个基于YOLOv8的微表情检测系统,包含完整的项目实现。系统采用PyTorch框架,提供训练好的模型权重、数据集和GUI界面。GUI界面使用PySide6设计,支持图像检测、视频实时检测功能。项目结构清晰,包含模型训练、验证及性能指标展示模块。核心代码展示了图像上传、目标检测和结果显示功能。系统支持自定义训练,通过修改配置文件即可重新训练模型。整体项目打包完整,包含所有必要资料,可直接
《基于YOLOv11的樱桃病虫害检测系统》是一个完整的深度学习项目,包含图像/视频/实时摄像头检测功能。系统采用PyTorch框架实现,提供训练好的模型权重和GUI界面(基于PySide6开发),支持USB摄像头和笔记本摄像头接入。项目包含完整代码、数据集、训练记录和验证指标,用户可直接使用预训练模型或自行训练(通过修改data.yaml配置训练集路径)。GUI界面简洁实用,涵盖图像检测、视频处理
摘要:本项目基于YOLOv8实现了一个完整的交通标志检测识别系统,包含数据集、模型权重、GUI界面等功能模块。系统采用PyTorch框架,使用CCTSDB_2021数据集,支持笔记本/USB摄像头输入。项目提供完整的训练流程:数据准备→模型训练→验证→GUI界面展示。GUI采用PySide6+OpenCV开发,支持图像/视频实时检测,并展示精度、召回率等指标。系统可直接部署运行,包含详细的环境配置
本文介绍了一个基于YOLOv11的乳腺癌检测系统,使用PyTorch框架实现,包含完整代码、数据集、预训练模型和GUI界面。系统支持图像检测、视频检测及实时摄像头检测(可外接USB或笔记本摄像头)。项目结构清晰,提供模型训练流程:配置数据集路径、训练模型、验证权重和使用GUI界面展示效果。GUI采用PySide6+Python+OpenCV开发,界面简洁实用,包含图像/视频/实时检测功能模块。项目
本文介绍了深度学习模型微调过程中可视化工具TensorBoard和Weights & Biases(W&B)的使用方法。通过Python代码示例展示了如何集成这两种工具来监控训练指标、记录参数分布和保存模型结构。TensorBoard部分演示了标量、直方图、文本和图像等数据的记录方式;W&B部分则展示了项目初始化、指标跟踪和模型监控功能。文章还提供了一个统一日志接口类,可同时支持两种工具,
数据处理阶段:放心使用NumPy。它生态成熟,配合 Pandas/Matplotlib 处理 CSV、图像预处理非常方便。模型训练阶段:必须转换为PyTorch。利用其 GPU 加速和自动求导能力。避坑指南:不要试图把 GPU 张量直接转 NumPy。注意的内存共享特性,修改原数组可能会意外改变张量数据。矩阵乘法记得用或,别用。
大模型微调技术概述 本文介绍了大语言模型(LLM)微调的特点、挑战及实践方法。LLM微调面临参数量大(7B-180B)、数据需求变化、训练稳定性问题和推理部署复杂等核心挑战。解决方案包括QLoRA、梯度检查点等显存优化技术,以及LoRA等参数高效微调方法。文章详细演示了使用HuggingFace Transformers加载LLaMA、Qwen和ChatGLM等主流大模型的方法,并提供了支持4-b
摘要:参数高效微调(PEFT)技术与LoRA实战 参数高效微调(PEFT)技术通过仅微调少量参数(0.1%-1%)来适配下游任务,解决了大模型全量微调面临的显存占用大、训练速度慢等问题。主流PEFT方法包括Adapter、Prefix Tuning和LoRA,其中LoRA通过低秩分解矩阵实现高效参数更新,具有参数量小、推理无延迟等优势。实战部分展示了使用Hugging Face的peft库配置Lo
文章摘要:预训练模型加载与理解 本文介绍了预训练模型的加载方法与内部结构解析,重点涵盖两个主流模型库:TorchVision(计算机视觉)和HuggingFace Transformers(NLP)。通过代码示例演示了如何加载ResNet、ViT、BERT等典型模型,并比较了不同加载方式(torch.hub、from_pretrained)。文章还详细解析了模型结构,包括参数统计、层数分析等关键信
PyTorch模型微调基础与实践 摘要 本文系统介绍了PyTorch框架下的模型微调技术,包括基本概念、实现方法和实践指导。主要内容涵盖: 模型微调基础:解释了微调(Fine-tuning)的概念及其与从头训练的区别,阐述了迁移学习的基本原理,突出了PyTorch在微调任务中的优势。 微调策略:详细分析了全量微调、冻结主干网络和分层微调三种典型策略的适用场景和技术特点。 实践准备:介绍了PyTor
本文记录PyTorch从零搭建LeNet-5对8类果蔬分类的实践。数据集含苹果、香蕉、黄瓜、坚果、洋葱、橙子、草莓、番茄,每类50张训练、10张验证。首次训练准确率83.75%,但混淆矩阵显示苹果与草莓、洋葱与橙子严重混淆,苹果准确率仅60%,洋葱仅10%。通过增强数据增强(随机旋转、颜色抖动、随机裁剪)并设计辅助分类头(针对混淆对增加二分类损失),准确率提升至96.25%,苹果达90%,洋葱达1
本文介绍了使用PyTorch实现基于CNN的Fashion-MNIST图像分类任务。主要内容包括:1)数据预处理,将CSV格式数据转换为28×28张量;2)构建LeNet风格CNN模型,包含两个卷积层和三个全连接层;3)采用Xavier初始化优化参数;4)使用交叉熵损失和SGD优化器进行训练;5)实现了完整的训练循环,包括实时监控训练/验证指标;6)提供单样本预测和可视化功能。该实现展示了从数据处
从MHA出发,源码级推导MQA、GQA、MLA四种注意力机制的演进路径,用PyTorch实现每一种变体并给出完整的性能基准测试。重点解析DeepSeek MLA的低秩联合压缩原理与解耦RoPE设计
摘要:本文介绍了一个基于YOLOv11的水稻病害检测系统,采用PyTorch框架实现。系统支持图像、视频和摄像头实时检测,包含完整的数据集、预训练模型、GUI界面(PyQt5开发)及各项性能指标。项目提供了详细的模型训练和验证流程,用户可选择使用预训练模型或自行训练。系统功能包括病害检测、结果可视化及目标信息展示,检测速度可达0.3秒/帧。该项目提供完整的开发环境配置指南和全套资源,实现"
摘要:该项目基于PyTorch框架开发了一个枸杞虫害识别和防治系统,采用ResNet50、VGG16、ResNet34等卷积神经网络模型,支持模型融合对比。系统提供GUI(PySide6)和Web(Flask+Vue)两种界面,包含完整的训练测试流程、模型评估指标(准确率、召回率等)及可视化功能(热力图、特征图等)。项目提供完整代码、预训练模型和数据集,支持自定义数据集训练,适合图像分类相关研究和
本文深入解析了HarmonyOS应用开发中的日期时间处理问题。首先揭示了JavaScript中getMonth()方法返回0-11导致的月份显示错误问题,提供了手动加1和封装工具函数两种解决方案。其次,针对国际化需求,详细介绍了如何使用HarmonyOS的i18n模块实现日期时间的本地化格式化,包括基础使用和高级定制方法。文章还涵盖了时区处理技巧,介绍了时间转换工具类的实现。最后总结出四大最佳实践
摘要:本文介绍了一个基于YOLOv10的工地安全帽检测系统,采用PyTorch框架实现。项目包含完整代码、数据集、预训练模型权重、训练记录及PyQt5设计的GUI界面,支持图像、视频和实时摄像检测。系统实现步骤包括数据集路径配置、模型训练(train.py)、验证(val.py)和GUI界面运行(gui.py)。演示了检测效果界面、模型指标(准确率、召回率等)及核心检测代码片段,通过OpenCV处
pytorch
——pytorch
联系我们(工作时间:8:30-22:00)
400-660-0108 kefu@csdn.net