logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

CANN生态安全保障:cann-security-module的访问控制

本文介绍了CANN生态中cann-security-module的访问控制机制。该模块通过身份认证、权限分配、访问检查和访问审计四个步骤实现系统安全保护。文章详细解析了用户认证和令牌认证两种认证方式,包括用户信息结构体定义、密码哈希生成、令牌管理等核心功能实现代码。该安全模块支持多种访问控制类型,为AI系统提供完善的安全保障。

#安全#性能优化
驾驶疲劳/分心状态检测数据集:含1000张已划分标注图,支持YOLO目标检测

本文介绍了一个用于驾驶疲劳/分心状态检测的数据集,包含3000张已标注图片,支持YOLO等目标检测模型。数据集聚焦驾驶员眼睛和嘴部状态(闭眼、睁眼、张嘴、闭嘴),可用于识别疲劳驾驶行为。数据已划分为训练集和验证集,采用YOLO格式标注。该数据集适用于智能驾驶辅助系统、车载预警系统等场景,能有效提升行车安全。通过实时监测驾驶员状态,可及时预警疲劳驾驶风险。

文章图片
#目标检测#人工智能
CANN模型部署:model-zoo的模型转换技术

摘要 本文深入探讨了CANN生态中model-zoo项目的模型转换技术。模型转换是AI部署的关键环节,涉及格式解析、结构转换、参数转换和格式生成四个核心原理。文章详细介绍了框架转换(如PyTorch/ONNX互转)、格式转换(如ONNX/OM互转)的具体实现方法,并分析了逐层转换和图优化转换两种策略。通过代码示例展示了转换过程中的关键操作,包括算子融合、常量折叠等技术。这些转换技术能够有效优化模型

#python#开发语言
CANN MetaDef元数据定义框架在算子描述与注册中的核心作用

摘要:CANN MetaDef框架作为算子元数据定义的核心组件,通过标准化描述和注册机制连接算子实现与使用。该框架采用模块化设计,包含算子描述、注册和发现三大功能模块,支持功能定义、输入输出描述、属性配置等完整算子信息。MetaDef提供静态/动态注册、版本管理和兼容性检查机制,并与CANN其他组件深度集成。实践表明,该框架可显著提升算子开发效率(注册时间减少80%)和可发现性(提升90%),为A

文章图片
#开源
基于CANN的HCCL集合通信库深度技术解析与架构设计分析

HCCL(Huawei Collective Communication Library)是CANN生态中的高性能集合通信库,专为CANN AI处理器优化。本文分析了HCCL的分层架构设计,包括通信原语层、拓扑管理层和传输层等核心模块,深入探讨了AllReduce等关键通信原语的实现原理及优化策略。HCCL采用智能拓扑选择机制,支持Ring、Tree等多种通信拓扑,并针对CANN硬件特性实现了数据

文章图片
CANN PyPTO并行张量分块操作编程范式在高效计算中的应用

摘要:PyPTO是CANN提供的并行张量分块操作编程范式,通过分块计算和并行执行实现高效张量操作。其核心技术包括分块策略(静态/动态/自适应分块)、并行执行机制(数据/任务/流水线并行)和内存优化技术(复用/对齐/预取)。PyPTO采用模块化设计,与CANN生态深度集成,已在图像处理、NLP等领域实现2-4倍性能提升。该范式通过优化计算并行度和缓存利用率,有效解决了大规模张量计算性能瓶颈问题。

文章图片
#开源
CANN Ops-Transformer Transformer类大模型算子库加速计算技术解析

摘要: CANN Ops-Transformer是针对Transformer类大模型的专用算子库,通过算子融合、内存优化等技术在NPU上实现高效计算。其核心设计包括自注意力模块和前馈网络模块的深度优化,将传统独立算子合并为融合算子,减少内存访问与同步开销。通过矩阵乘单元加速QKV计算、流水线并行执行注意力分数与softmax等优化手段,显著提升BERT、GPT等模型的推理性能(最高达4倍)。该库与

文章图片
#开发语言
CANN HCCL集合通信库在分布式训练中的高性能通信方案

HCCL(华为集合通信库)是CANN AI处理器生态中的高性能分布式通信解决方案。该库通过分层架构设计,支持AllReduce、Broadcast等多种集合通信操作,并针对不同集群规模优化了环形、树形等通信拓扑算法。HCCL采用通信重叠、压缩等优化技术,深度集成CANN硬件特性,显著提升大模型训练效率,在LLaMA-65B等案例中实现4倍以上的加速。该库提供完善的API和文档支持,为分布式AI训练

文章图片
#分布式#wpf
CANN Infrastructure基础设施组件在CANN生态中的支撑作用

本文深入分析了CANN生态中的Infrastructure基础设施组件。作为CANN生态的基石,Infrastructure通过构建系统、测试框架、文档生成和CI/CD四大核心功能,为整个生态提供了全面的技术支撑。文章详细阐述了其分层架构设计、各功能模块的具体实现方式,以及与其他CANN组件的深度集成关系。通过实际应用案例展示了Infrastructure在提升构建效率(减少60%构建时间)和测试

文章图片
CANN Ops-NLP自然语言处理算子库在文本处理任务中的高效实现

Ops-NLP是CANN提供的自然语言处理算子库,通过分层架构设计实现了文本处理的高效实现。该库包含文本预处理、特征提取、序列建模和文本生成四大核心模块,支持分词、编码、注意力计算、RNN/LSTM等多种算子。Ops-NLP深度集成于CANN生态,提供优化API接口,在BERT等模型应用中实现了3倍以上的性能提升。通过合理的算法选择和算子组合,该库为文本分类、机器翻译等NLP任务提供了高效解决方案

文章图片
#深度学习#人工智能
    共 98 条
  • 1
  • 2
  • 3
  • 10
  • 请选择