logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

教育与科研的新基座:使用 CANN 构建高效费比的深度学习实验平台

目标: 指导学生为一个特殊的激活函数(如 Swish 激活函数) 开发一个自定义的昇腾 NPU 算子。# GM 区输入 / 输出# UB 缓冲区numel = prod(shape) # 元素个数burst = numel // 16 # 简单按 16 对齐,真实工程需按 shape 计算# 1) 把 x 从 GM 搬到 UB# 2) 计算 sigmoid(x) = 1 / (1 + exp(-x

文章图片
#深度学习#人工智能#CANN
教育与科研的新基座:使用 CANN 构建高效费比的深度学习实验平台

目标: 指导学生为一个特殊的激活函数(如 Swish 激活函数) 开发一个自定义的昇腾 NPU 算子。# GM 区输入 / 输出# UB 缓冲区numel = prod(shape) # 元素个数burst = numel // 16 # 简单按 16 对齐,真实工程需按 shape 计算# 1) 把 x 从 GM 搬到 UB# 2) 计算 sigmoid(x) = 1 / (1 + exp(-x

文章图片
#深度学习#人工智能#CANN
创新应用构想:用 CANN 构建未来的智能交通系统

全栈效率: CANN 提供了从模型转换 (ATC) 到设备调用 (AscendCL) 的全套工具链,确保 AI 算法能在昇腾 NPU 上获得极致的性能。实时性保障: 通过异步执行和高性能算子,满足了边缘侧对毫秒级实时决策的苛刻要求。开发运维友好: 专业的性能分析工具和标准化的 API,极大地简化了 AI 应用的开发和运维难度。openEuler 作为 CANN 的稳定运行底座,与昇腾生态的深度融合

文章图片
#学习#CANN
创新应用构想:用 CANN 构建未来的智能交通系统

全栈效率: CANN 提供了从模型转换 (ATC) 到设备调用 (AscendCL) 的全套工具链,确保 AI 算法能在昇腾 NPU 上获得极致的性能。实时性保障: 通过异步执行和高性能算子,满足了边缘侧对毫秒级实时决策的苛刻要求。开发运维友好: 专业的性能分析工具和标准化的 API,极大地简化了 AI 应用的开发和运维难度。openEuler 作为 CANN 的稳定运行底座,与昇腾生态的深度融合

文章图片
#学习#CANN
创新应用构想:用 CANN 构建未来的智能交通系统

全栈效率: CANN 提供了从模型转换 (ATC) 到设备调用 (AscendCL) 的全套工具链,确保 AI 算法能在昇腾 NPU 上获得极致的性能。实时性保障: 通过异步执行和高性能算子,满足了边缘侧对毫秒级实时决策的苛刻要求。开发运维友好: 专业的性能分析工具和标准化的 API,极大地简化了 AI 应用的开发和运维难度。openEuler 作为 CANN 的稳定运行底座,与昇腾生态的深度融合

文章图片
#学习#CANN
CANN训练营第二季笔记(4)Ascend C算子开发与性能优化

我正在深入学习2024 CANN训练营第二季,这门课程作为昇腾AI生态的核心实践指南,系统性地揭示了高性能算子开发的底层逻辑——通过Ascend C精准操控AI Core的计算与内存资源,不仅让算法真正“跑得快”,更让我理解了如何将数学表达高效映射到硬件执行单元,架起从模型设计到芯片加速的关键通路。

文章图片
#性能优化
CANN训练营第二季笔记(4)Ascend C算子开发与性能优化

我正在深入学习2024 CANN训练营第二季,这门课程作为昇腾AI生态的核心实践指南,系统性地揭示了高性能算子开发的底层逻辑——通过Ascend C精准操控AI Core的计算与内存资源,不仅让算法真正“跑得快”,更让我理解了如何将数学表达高效映射到硬件执行单元,架起从模型设计到芯片加速的关键通路。

文章图片
#性能优化
CANN训练营第二季笔记(4)Ascend C算子开发与性能优化

我正在深入学习2024 CANN训练营第二季,这门课程作为昇腾AI生态的核心实践指南,系统性地揭示了高性能算子开发的底层逻辑——通过Ascend C精准操控AI Core的计算与内存资源,不仅让算法真正“跑得快”,更让我理解了如何将数学表达高效映射到硬件执行单元,架起从模型设计到芯片加速的关键通路。

文章图片
#性能优化
Rust 中的解构元组、结构体与枚举以及匹配守卫的使用

Rust 是一门系统级编程语言,以其内存安全、并发性能和强大的类型系统而受到广泛关注。解构元组、结构体与枚举以及匹配守卫是 Rust 语言中非常有特色的特性,它们使得 Rust 代码在处理复杂数据结构和进行模式匹配时更加灵活和强大。

文章图片
#rust#android#开发语言
Rust中的生命周期:省略规则与‘static特殊含义深度剖析

Rust编译器允许在某些情况下省略生命周期注解,这就是生命周期省略规则。这些规则基于常见的编程模式,使得代码更加简洁易读。每个输入引用都有一个独立的生命周期参数:如果函数有多个输入引用,每个引用都会有一个对应的生命周期参数。如果只有一个输入生命周期参数,那么它被赋予所有输出生命周期参数:当函数只有一个输入引用时,输出引用的生命周期将与输入引用的生命周期相同。如果有多个输入生命周期参数,但其中一个是

文章图片
#rust#开发语言#后端
    共 37 条
  • 1
  • 2
  • 3
  • 4
  • 请选择