logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

昇腾AI平台开发实战:从底层架构到分布式训练的深度实践

本文系统介绍了昇腾AI全栈开发平台的核心技术体系与实践路径。主要内容包括:1)昇腾NPU、CANN异构计算架构和MindSpore框架构成的三层技术架构;2)从驱动安装到环境配置的开发环境搭建指南;3)基于CANN的自定义算子开发流程和MindSpore分布式训练实现;4)性能优化策略与常见问题排查方法。通过具体代码案例,展示了昇腾平台在算子开发、模型训练等方面的技术优势,为开发者提供了从入门到进

文章图片
#人工智能#架构#分布式
基于昇腾AI的多模态应用开发实践与技术深度解析

本文介绍了基于昇腾AI平台的多模态应用开发实践,重点阐述了视频知识提取系统的实现过程。文章首先讲解了昇腾AI核心技术栈(CANN、MindStudio等)的配置方法,然后详细展示了视频帧提取、特征提取和多模态融合等关键模块的代码实现,并分享了性能优化技巧(如算子矩阵化优化)。最后通过自定义插值算子的开发案例,演示了昇腾平台的算子开发与调试流程。文章指出昇腾AI平台凭借全栈开源生态和高效计算架构,能

文章图片
#人工智能#python
昇腾AI异构计算实践:从算子优化到模型部署的全流程解析

昇腾AI全栈开发实践:从算子优化到模型部署 本文系统介绍了昇腾AI平台的全栈开发流程,包括: 技术架构:涵盖昇腾NPU、CANN异构计算、MindSpore框架和MindStudio工具链的协同设计 开发实践:详细展示自定义算子开发(Softmax算子案例)、基于MindSpore的图像分类模型训练(ResNet18示例)以及模型推理部署全流程 性能优化:提供混合精度训练、批量推理、图优化等提升效

文章图片
#人工智能
昇腾AI深度学习实践:从模型构建到工业级部署全流程

本文系统介绍了昇腾AI全栈技术体系的核心实践,包括环境搭建、模型构建、训练优化和工业级部署全流程。通过具体代码案例展示了如何基于MindSpore框架开发自定义CNN模型,并利用昇腾NPU的算力优势进行高效训练。重点阐述了模型转换(MindSpore转ONNX/OM格式)和推理服务实现的关键技术,以及CANN架构的自动优化能力如何降低性能调优门槛。实践表明,昇腾AI平台通过芯片、计算架构和框架工具

文章图片
#人工智能#深度学习#python +2
昇腾AI全栈开发实践:从底层算力到行业应用的落地之路

本文系统介绍了昇腾AI全栈技术体系,包括昇腾NPU芯片、CANN异构计算架构和MindSpore框架等核心组件。通过具体案例详细展示了从开发环境搭建、自定义算子开发到模型推理优化的完整流程,并以智能视频分析系统为例演示了行业应用落地实践。文章强调昇腾AI平台通过软硬件协同优化,为开发者提供从底层算力到上层应用的完整解决方案,大幅降低AI开发门槛。最后展望了昇腾生态的发展前景,鼓励开发者充分利用平台

文章图片
#人工智能
昇腾AI 2025开发者生态全面爆发:实习招募+实战训练营+高规格赛事齐上阵,全方位赋能AI创新

其中,昇腾AI创新大赛作为行业内极具影响力的赛事,2025年增设算子挑战赛等专项赛道,聚焦核心技术突破,鼓励开发者围绕算子优化、模型创新、应用落地等方向提交作品,获胜者将获得丰厚奖金、荣誉证书以及与行业大佬面对面交流的机会。除了优质课程,训练营还设置了丰富的社区任务与挑战环节,开发者通过完成指定任务、参与技术讨论、提交实战作品,即可参与华为手机、平板、昇腾开发板、技术书籍等丰厚奖品的抽取。此外,昇

文章图片
#人工智能
昇腾AI全栈技术学习实践:从架构理解到开发落地

华为昇腾AI作为业界领先的全栈技术体系,覆盖从芯片到应用的完整链路,既为开发者提供了高性能的计算底座,也构建了开放灵活的开发生态。昇腾处理器的核心竞争力源于独创的达芬奇架构,其3D Cube技术是性能突破的关键:通过16×16×16的立体阵列设计,每时钟周期可执行4096次FP16乘加运算,相比传统GPU架构,在张量运算等AI核心操作中实现了更高的计算密度和能效比。同时,昇腾生态的开源开放特性为开

文章图片
#人工智能#学习#架构
昇腾CANN生态实战:多场景AI模型部署与优化核心技巧

昇腾AI生态通过CANN开发平台、MindSpore框架与硬件的深度协同,为多行业提供端到端AI解决方案。文章聚焦多场景模型部署、算子优化和跨框架适配三大模块,结合代码示例展示了昇腾在LLM推理、边缘计算和医疗AI等场景的应用优势。关键优化技术包括动态Shape调度、INT8量化、算子融合和超节点并行等,在互联网、交通、医疗场景中实现了30%性能提升、20ms低延迟和40%推理加速。昇腾全栈协同的

文章图片
#人工智能
昇腾CANN课程实践:ResNet50 INT8量化推理全流程(含动态Batch+性能调优)

本次昇腾课程实践以“智慧园区图像分类”为业务场景,完整覆盖了从模型量化转换→动态Batch调度→批量推理性能优化的全流程。通过CANN生态工具与课程提供的优化技巧,ResNet50在昇腾310B上实现了“10ms级单帧耗时+93.75%准确率”的工业级效果,同时支持1~8路动态并发。昇腾生态的优势在于“软硬件协同”——开发者无需深入硬件底层,仅通过标准化工具与API,即可快速实现模型的高性能部署。

文章图片
#batch#人工智能#开发语言
昇腾AI全栈开发实践:从底层算力到行业应用的落地之路

本文系统介绍了昇腾AI全栈技术体系,包括昇腾NPU芯片、CANN异构计算架构和MindSpore框架等核心组件。通过具体案例详细展示了从开发环境搭建、自定义算子开发到模型推理优化的完整流程,并以智能视频分析系统为例演示了行业应用落地实践。文章强调昇腾AI平台通过软硬件协同优化,为开发者提供从底层算力到上层应用的完整解决方案,大幅降低AI开发门槛。最后展望了昇腾生态的发展前景,鼓励开发者充分利用平台

文章图片
#人工智能
    共 27 条
  • 1
  • 2
  • 3
  • 请选择