logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

环境配置与基础教程:量化环境配置:从 PyTorch Eager 到 FX 图模式量化,踩坑与兼容性排查

本文深入探讨了PyTorch量化技术的最新发展与实践指南。文章首先指出量化已成为大模型部署的关键技术,能够显著降低资源需求并提升推理速度。随后系统介绍了PyTorch的三种量化模式(Eager Mode、FX Graph Mode和PT2E),重点分析了FX图模式这一平衡易用性与功能性的选择。 在环境配置方面,文章提供了经过验证的安装组合方案,并详细介绍了PyTorch官方量化优化库torchao

#pytorch#人工智能#python +3
环境配置与基础教程:2026 前沿趋势:使用 Pytorch Lightning 重塑 YOLO 训练流程,解耦日志与训练逻辑

文章摘要 深度学习项目中训练脚本的膨胀问题日益严重,从最初的150行代码膨胀到1300行,混杂了模型逻辑、设备管理、日志记录等多种功能,导致代码难以维护和扩展。PyTorch Lightning通过关注点分离解决了这一问题,将模型逻辑(LightningModule)、数据管线(LightningDataModule)和训练工程(Trainer)解耦。最新版本Lightning 2.5进一步优化了

#pytorch#人工智能#深度学习 +3
环境配置与基础教程:图像预处理标准化:深入理解 mean/std 归一化与 Letterbox 操作的底层数值变化

本文深入解析目标检测模型预处理中的两大核心操作:mean/std归一化和Letterbox自适应缩放填充。通过拆解像素级数值变化,揭示不同框架(PyTorch/Ultralytics/MMYOLO/DAMO-YOLO)的预处理参数差异与陷阱。重点包括:1)mean/std归一化的数学原理与ImageNet标准值的计算过程;2)Letterbox算法如何保持图像比例并正确填充;3)颜色通道顺序(BG

#开发语言#人工智能#pytorch +1
环境配置与基础教程:断点续训完全指南:YOLO 突然中断后如何无缝恢复训练并保持优化器状态

YOLO断点续训技术指南(2025-2026) 摘要:本文针对YOLO训练中断问题,详细介绍了2025-2026年YOLO生态在断点续训方面的重大突破。文章首先澄清了断点续训的核心概念,指出完整的训练恢复需要覆盖模型权重、优化器状态、学习率调度等六个维度。随后提供了当前最佳实践的环境配置建议,包括推荐版本矩阵和检查点保存策略。重点讲解了Ultralytics YOLO框架的断点续训实现方法,从基础

#深度学习#python#人工智能 +3
部署与可视化系统:国产芯片高通量方案:YOLOv11 在昇腾 Atlas 200 DK 上的 CANN 迁移与流推理实现

摘要:本文提出了一套基于华为昇腾Atlas 200 DK平台的YOLOv11高效部署方案。通过分析YOLOv11端到端无NMS设计特性与CANN 8.0软件栈的适配性,详细阐述了从模型导出、ONNX转换到昇腾OM模型的全流程实现。方案包含硬件配置指南、黄金版本组合推荐、异构计算架构设计以及多路视频流处理优化,实测显示在Atlas 200 DK上可实现8路1080P视频的实时检测(>30fps

#iphone#ios#人工智能 +1
部署与可视化系统:国产芯片高通量方案:YOLOv11 在昇腾 Atlas 200 DK 上的 CANN 迁移与流推理实现

摘要:本文提出了一套基于华为昇腾Atlas 200 DK平台的YOLOv11高效部署方案。通过分析YOLOv11端到端无NMS设计特性与CANN 8.0软件栈的适配性,详细阐述了从模型导出、ONNX转换到昇腾OM模型的全流程实现。方案包含硬件配置指南、黄金版本组合推荐、异构计算架构设计以及多路视频流处理优化,实测显示在Atlas 200 DK上可实现8路1080P视频的实时检测(>30fps

#iphone#ios#人工智能 +1
部署与可视化系统:国产芯片高通量方案:YOLOv11 在昇腾 Atlas 200 DK 上的 CANN 迁移与流推理实现

摘要:本文提出了一套基于华为昇腾Atlas 200 DK平台的YOLOv11高效部署方案。通过分析YOLOv11端到端无NMS设计特性与CANN 8.0软件栈的适配性,详细阐述了从模型导出、ONNX转换到昇腾OM模型的全流程实现。方案包含硬件配置指南、黄金版本组合推荐、异构计算架构设计以及多路视频流处理优化,实测显示在Atlas 200 DK上可实现8路1080P视频的实时检测(>30fps

#iphone#ios#人工智能 +1
注意力机制模块:2026 热门:SSA(稀疏空间注意力)解决高分辨率输入下自注意力的显存爆炸问题

自注意力机制在高分辨率场景下遭遇显存灾难,其O(N²)复杂度导致GPU资源需求激增。空间稀疏注意力(SSA)通过利用空间先验仅计算有效区域注意力,显著降低了计算开销。Direct3D-S2项目展示了SSA在3D生成中的突破性应用,将1024³分辨率训练所需GPU从32+块降至8块,计算资源需求减少75%。SSA通过3D坐标块划分和空体素剔除,将计算量降至O(N√N),在保持92%精度的同时实现3.

#人工智能#目标检测#目标跟踪 +1
YOLO 系列:半监督学习落地:结合 FixMatch 范式,用少量标注数据训练 YOLOv11,降低标注成本

摘要:本文探讨了如何利用半监督学习FixMatch范式降低目标检测的标注成本,并基于YOLOv11架构实现高效训练。研究表明,FixMatch通过结合伪标签和一致性正则化,可在标注数据仅为20%的情况下达到接近全监督模型的性能。YOLOv11凭借参数效率高、特征提取能力强的优势,成为半监督目标检测的理想基座。实验证明,该方法在零售商品检测任务中,仅用40%标注数据即可达到90%全监督模型的准确率,

#学习#人工智能#目标检测 +1
YOLO 系列:YOLOv9 引入 Mamba 状态空间模块做特征金字塔,线性复杂度长程依赖

摘要:目标检测领域长期面临CNN局部感受野与Transformer高计算复杂度的矛盾。2024-2026年,将状态空间模型(SSM)引入YOLO框架的新方法尝试解决这一难题。Mamba YOLO(AAAI 2025)首次将Mamba SSM嵌入主干和颈部网络,DocMY(Pattern Recognition 2026)进一步将其与YOLOv9的GELAN架构深度融合。这些工作通过选择性扫描机制实

#深度学习#人工智能#语音识别 +3
    共 16 条
  • 1
  • 2
  • 请选择