logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

pto-isa仓库概览:昇腾NPU的虚拟指令集架构定义

第一次看到pto-isa这个仓库名,以为是"PTO-ISA总线"或者"PCI-ISA插槽"什么的。后来才知道,pto-isa是的缩写,中文叫"可移植张量操作指令集架构"。它是昇腾CANN社区搞的一套虚拟指令集,让算子代码能跨代NPU运行(910/950PR/950DT)。如果你写的算子要跑在多代NPU上,pto-isa是你必须搞懂的仓库。pto-isa定义了一套与硬件无关的虚拟指令集。比如,矩阵乘

文章图片
pto-isa仓库概览:昇腾NPU的虚拟指令集架构定义

第一次看到pto-isa这个仓库名,以为是"PTO-ISA总线"或者"PCI-ISA插槽"什么的。后来才知道,pto-isa是的缩写,中文叫"可移植张量操作指令集架构"。它是昇腾CANN社区搞的一套虚拟指令集,让算子代码能跨代NPU运行(910/950PR/950DT)。如果你写的算子要跑在多代NPU上,pto-isa是你必须搞懂的仓库。pto-isa定义了一套与硬件无关的虚拟指令集。比如,矩阵乘

文章图片
driver仓库概览:昇腾NPU的底层驱动程序

做昇腾NPU开发,driver是最底层的那个"黑盒"。它住在CANN五层架构的最底层(第五层),上面隔了Runtime、AscendCL、PyTorch三层抽象。我第一次看driver的代码,差点劝退——满屏的readlwritel、DMA、中断处理、PCIe探针。后来发现,driver的设计很讲究:把NPU的硬件复杂性封装成统一的ioctl接口,让你不用懂达芬奇架构的寄存器配置,就能用NPU做计

文章图片
driver仓库概览:昇腾NPU的底层驱动程序

做昇腾NPU开发,driver是最底层的那个"黑盒"。它住在CANN五层架构的最底层(第五层),上面隔了Runtime、AscendCL、PyTorch三层抽象。我第一次看driver的代码,差点劝退——满屏的readlwritel、DMA、中断处理、PCIe探针。后来发现,driver的设计很讲究:把NPU的硬件复杂性封装成统一的ioctl接口,让你不用懂达芬奇架构的寄存器配置,就能用NPU做计

文章图片
AI推理的NPU加速:cann-recipes-harmony-infer实战

cann-recipes-harmony-infer这个仓库,就是CANN社区专门为鸿蒙生态优化的推理配方集。它支持鸿蒙原生应用、鸿蒙元服务、鸿蒙轻量级设备三大类场景的NPU推理。鸿蒙AI推理为什么必须用NPU(从功耗和延迟两个维度推导)cann-recipes-harmony-infer的架构设计(为什么它能做到无缝适配鸿蒙)手把手部署一个鸿蒙原生应用的NPU推理(包含模型转换全流程)真实性能数

文章图片
AI推理的NPU加速:cann-recipes-harmony-infer实战

cann-recipes-harmony-infer这个仓库,就是CANN社区专门为鸿蒙生态优化的推理配方集。它支持鸿蒙原生应用、鸿蒙元服务、鸿蒙轻量级设备三大类场景的NPU推理。鸿蒙AI推理为什么必须用NPU(从功耗和延迟两个维度推导)cann-recipes-harmony-infer的架构设计(为什么它能做到无缝适配鸿蒙)手把手部署一个鸿蒙原生应用的NPU推理(包含模型转换全流程)真实性能数

文章图片
AI推理的NPU加速:cann-recipes-harmony-infer实战

cann-recipes-harmony-infer这个仓库,就是CANN社区专门为鸿蒙生态优化的推理配方集。它支持鸿蒙原生应用、鸿蒙元服务、鸿蒙轻量级设备三大类场景的NPU推理。鸿蒙AI推理为什么必须用NPU(从功耗和延迟两个维度推导)cann-recipes-harmony-infer的架构设计(为什么它能做到无缝适配鸿蒙)手把手部署一个鸿蒙原生应用的NPU推理(包含模型转换全流程)真实性能数

文章图片
CANN社区开发工具指南:cmake/sip/skills等仓库的使用

Navigation Timing API 提供了高精度时间戳,用于度量当前页面加载速度。浏览器会在导航事件发生时自动记录PerformanceNavigationTiming 条目。加载资源时自动记录PerformanceResourceTiming。这个对象会捕获大量时间戳,用于描述资源加。Resource Timing API 提供了高精度时间戳,用于度量当前页面加载时请求资源的速度。通过计

文章图片
多Agent交叉代码审查实战:架构师+安全+风格Agent分工协作方案

JiuwenSwarm多智能体协同框架通过组建专业评审团队(Code Reviewer、Adversarial Critic、Architect)实现高效代码审查。相比传统单Agent模式,该系统能并行执行基础正确性检查、安全风险分析和架构评估,显著提升审查覆盖率和准确性。实战案例显示,该系统可快速识别鸿蒙项目中的致命缺陷(如密码明文存储漏洞),并提供分级修复建议(MUST-FIX/SHOULD-

文章图片
#安全#人工智能
多Agent交叉代码审查实战:架构师+安全+风格Agent分工协作方案

JiuwenSwarm多智能体协同框架通过组建专业评审团队(Code Reviewer、Adversarial Critic、Architect)实现高效代码审查。相比传统单Agent模式,该系统能并行执行基础正确性检查、安全风险分析和架构评估,显著提升审查覆盖率和准确性。实战案例显示,该系统可快速识别鸿蒙项目中的致命缺陷(如密码明文存储漏洞),并提供分级修复建议(MUST-FIX/SHOULD-

文章图片
#安全#人工智能
    共 261 条
  • 1
  • 2
  • 3
  • 27
  • 请选择