logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Ascend C 并行编程深度剖析:从任务切分到流水线优化

承接上篇《Ascend C 算子开发:零基础实战指南》,本文深入探讨如何通过并行编程技术释放昇腾芯片的强大算力。

文章图片
#c语言#开发语言
昇腾AscendC算子昇腾AscendC算子开发:零基础实战指南开发:零基础实战指南

直击传统算子开发高门槛痛点,以 “技术解析 + 实战路径” 双主线,揭秘 Ascend C 如何通过多层接口抽象、自动并行等核心技术降低开发难度,结合 CANN 训练营 2025 第二季专属资源,为 0 基础开发者提供可落地的入门方案,快速开启昇腾算力开发之旅。

深度学习实战:ResNet原理与昇腾C++实践

本文提供了ResNet在昇腾平台上C++推理的完整实现方案,涵盖从原理到代码的各个环节,为深度学习模型部署提供实用参考。025年昇腾CANN训练营第二季,基于CANN开源开放全场景,推出0基础入门系列、码力全开特辑、开发者案例等专题课程,助力不同阶段开发者快速提升算子开发技能。获得Ascend C算子中级认证,即可领取精美证书,完成社区任务更有机会赢取华为手机,平板、开发板等大奖。报名链接:htt

#深度学习#c++#人工智能
基于华为昇腾CANN的深度学习房价预测实战

CANN(Compute Architecture for Neural Networks)是华为针对AI场景推出的异构计算架构,在昇腾AI生态中扮演着承上启下的关键角色。简单来说,CANN是对标英伟达CUDA的软硬件协同计算栈,包含运行时、编译器、算子库与SDK,用于将主流AI框架模型编译和加速到昇腾硬件上。下图展示了 CANN 在昇腾 AI 生态中的位置,以及其与上层 AI 框架和底层硬件的关

#华为#深度学习#人工智能
Ascend C 并行编程深度剖析:从任务切分到流水线优化

承接上篇《Ascend C 算子开发:零基础实战指南》,本文深入探讨如何通过并行编程技术释放昇腾芯片的强大算力。

文章图片
#c语言#开发语言
深度学习实战:ResNet原理与昇腾C++实践

本文提供了ResNet在昇腾平台上C++推理的完整实现方案,涵盖从原理到代码的各个环节,为深度学习模型部署提供实用参考。025年昇腾CANN训练营第二季,基于CANN开源开放全场景,推出0基础入门系列、码力全开特辑、开发者案例等专题课程,助力不同阶段开发者快速提升算子开发技能。获得Ascend C算子中级认证,即可领取精美证书,完成社区任务更有机会赢取华为手机,平板、开发板等大奖。报名链接:htt

#深度学习#c++#人工智能
YOLOv8 昇腾平台部署实战:从 ONNX 到边缘推理的全流程解析

摘要:本文详细介绍了YOLOv8目标检测模型在昇腾Atlas系列设备的端到端部署方案。重点阐述了从PyTorch模型到ONNX再到昇腾专属OM格式的转换流程,包括关键参数配置和常见问题解决方法。同时提供了基于AscendC++的推理引擎开发指南,涵盖模型加载、预处理、推理执行和后处理等核心环节。此外,文章还介绍了使用AMCT工具进行8bit量化优化的方法,量化后模型体积减少75%,推理速度提升40

#目标跟踪#人工智能#计算机视觉
大语言模型推理加速神器:华为CANN自定义融合算子原理解析

将多个连续的计算操作合并为单个计算单元。还是以一次性数据加载:将输入数据和所有权重参数加载到芯片高速缓存连续计算:在缓存中依次执行矩阵乘、偏置加、GELU激活一次性结果写回:仅将最终结果写回主内存这种"一气呵成"的计算方式,消除了中间结果的内存读写开销,实现了显著的性能提升。华为昇腾CANN的融合算子技术,通过减少内存访问降低调度开销和提高缓存利用率,为大语言模型推理带来了显著的性能提升。这项技术

#人工智能#大数据
基于华为昇腾CANN的深度学习房价预测实战

CANN(Compute Architecture for Neural Networks)是华为针对AI场景推出的异构计算架构,在昇腾AI生态中扮演着承上启下的关键角色。简单来说,CANN是对标英伟达CUDA的软硬件协同计算栈,包含运行时、编译器、算子库与SDK,用于将主流AI框架模型编译和加速到昇腾硬件上。下图展示了 CANN 在昇腾 AI 生态中的位置,以及其与上层 AI 框架和底层硬件的关

#华为#深度学习#人工智能
Ascend C 并行编程深度剖析:从任务切分到流水线优化

承接上篇《Ascend C 算子开发:零基础实战指南》,本文深入探讨如何通过并行编程技术释放昇腾芯片的强大算力。

文章图片
#c语言#开发语言
    共 24 条
  • 1
  • 2
  • 3
  • 请选择