霖705 个人主页

@weixin_71147864

霖705

2022-11-04 17:05:41 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

深度架构解析：高性能计算平台中 Host 侧运行时环境对设备异常脱离的容错机制

在昇腾 AI 软件栈中，不仅仅是一个简单的 API 转发层，它更是一个健壮的资源管家。通过精密的异常捕获机制、严格的状态机管理以及高效的线程唤醒策略，它优雅地解决了 NPU 热插拔带来的复杂一致性问题。对于开发者而言，深入理解这部分源码，不仅有助于编写更健壮的 AI 应用，也能在遇到硬件故障排查时，通过 Runtime 返回的错误码精准定位问题根源。欢迎广大开发者访问CANN 组织参与共建，共同提

#harmonyos #算法 #git

深度架构解析：高性能计算平台中 Host 侧运行时环境对设备异常脱离的容错机制

#harmonyos #算法 #git

深度架构解析：高性能计算平台中 Host 侧运行时环境对设备异常脱离的容错机制

#harmonyos #算法 #git

异构多核编程模型：计算图任务下发至 Cube/Vector 核心的逻辑架构

昇腾的异构多核编程模型，以 AIR 作为核心的中间表示，成功地在抽象的计算描述与底层的 Cube/Vector 硬件执行之间架起了桥梁。AIR 不仅仅是一种中间语言，更是一种指导编译器进行资源分配、调度优化和指令生成的框架。通过深入理解CANN 组织提供的工具链和AIR 仓库中的设计哲学，我们可以看到，高效的异构编程依赖于对数据流、硬件特性和编译时优化的精妙平衡。未来，随着昇腾架构的演进，AIR

#harmonyos #算法 #git

异构多核编程模型：计算图任务下发至 Cube/Vector 核心的逻辑架构

#harmonyos #算法 #git

异构多核编程模型：计算图任务下发至 Cube/Vector 核心的逻辑架构

#harmonyos #算法 #git

核心效能分析：从热点图洞察计算平台核心利用率

昇腾 CANN Profiler 及其提供的数据可视化工具，特别是热点图，是深入理解 NPU 核心利用率的利器。通过将抽象的执行时间转化为直观的颜色分布，开发者能够快速识别出计算瓶颈、数据依赖延迟以及资源调度不均等问题。要充分发挥 NPU 的极致性能，必须紧密结合社区提供的工具和技术，深入分析仓库中的原理，将可视化分析结果转化为具体的优化行动，从而实现模型推理效率的最大化。对热点图的精细解读，是迈

#算法

核心效能分析：从热点图洞察计算平台核心利用率

#算法

核心效能分析：从热点图洞察计算平台核心利用率

#算法

算子定义元数据框架：metadef 如何保障计算图的向前兼容性与高性能

深度学习框架（如 MindSpore, TensorFlow-AIPU）在不同版本中，对算子的输入输出格式、属性（Attributes）定义可能会发生细微的变化。为了应对这种变化，ops-nn采用了明确的算子版本号机制。在 CANN 的设计中，算子的定义通常遵循一个规范的 ID 和版本结构。当框架调用一个算子时，它会携带目标算子的名称和期望的版本号。ops-nn内部维护了一个映射表，将特定的 (O

#算法

共 114 条

请选择