
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
输入:用户提示文本 + 相关知识图节点(如实体、属性、关系)。目标:生成连贯且知识准确的回复。模型结构:BERT‑style 文本编码器 + GNN 图编码器 + 交叉注意力 + 解码器。CANN 的ge为 AIGC 任务提供了从图构建到算子执行的完整、高性能解决方案。通过 ge 的高效图算子、动态图构建与混合精度支持,AIGC 开发者可以在保持生成质量的前提下,大幅提升推理速度与资源利用率。无论

摘要:本文探讨了UGC场景中文本生成模型在解码阶段的瓶颈问题,重点分析了TopK/TopP采样过程中的性能挑战。通过设计CANN自定义算子LogitsSelectK,利用NPU硬件特性实现向量化SelectK操作,将时间复杂度从O(VlogV)降至O(VlogK)。该方法通过分块处理、UB内存优化和指令级并行,显著提升了采样效率,解决了传统方法中排序性能差、内存带宽受限等问题,为LLM/Trans

输入:用户提示文本 + 相关知识图节点(如实体、属性、关系)。目标:生成连贯且知识准确的回复。模型结构:BERT‑style 文本编码器 + GNN 图编码器 + 交叉注意力 + 解码器。模型转换将 ONNX 模型通过 CANN ATC 转为.om,在 ge 引擎上直接加载。资源管理使用 ge 的动态分配 GPU/CPU 资源,避免资源浪费。对于大规模知识图,可采用分区加载策略,仅加载当前请求相关

大模型部署面临 “体积大、计算密、资源紧” 的三重挑战,传统压缩方法常陷入 “压缩率与精度不可兼得” 的困境。CANN 生态下的amct仓库(AI Model Compression Toolkit),以 “端到端全流程压缩” 为核心,整合量化、剪枝、蒸馏三大核心技术,通过自适应精度调优算法,在最高压缩 90% 模型体积的同时,将精度损失控制在 3% 以内。本文从技术原理、核心功能、实战案例三个维

分布式训练中,多设备 / 多节点间的数据同步通信是性能瓶颈之一,传统通信实现难以适配高速网络与硬件拓扑。CANN 生态下的hccl仓库(Huawei Collective Communication Library),是分布式训练的核心通信库,提供 AllReduce、AllGather 等集合通信原语,深度优化 RoCE 网络与 PCIe 拓扑,支撑千卡级分布式训练高效执行。c运行// 通信组句
CANN生态下的hccl仓库是一套面向分布式计算场景的高性能通信库代码实现,专注于单机多卡及多机多卡间的数据并行、模型并行通信方案。本文将从代码架构、核心通信原语(AllReduce)的实现逻辑、使用示例等维度,拆解hccl仓库的设计思路,帮助开发者快速理解并复用分布式通信能力,构建高效的并行计算应用。/*** @brief AllReduce操作:对所有进程的输入数据执行规约操作,并将结果分发给

ops-math仓库是一个通用数学算子实现集合,提供加减乘除、矩阵运算等基础数学操作的工程化代码。其采用模块化分层架构,实现接口与逻辑分离,便于维护和扩展。以矩阵乘法为例,通过头文件定义接口,源文件实现核心逻辑,包含参数校验和三层循环计算。使用示例展示了完整的调用流程,包括编译运行步骤。该仓库遵循严格的代码规范,具有高复用性和可维护性,配套单元测试保证正确性,能有效提升数值计算场景的开发效率。

在数值计算类项目开发中,重复编写基础数学算子不仅耗时,还易因细节疏漏导致计算错误。CANN生态下的ops-math仓库封装了经过工程化验证的通用数学算子,覆盖标量、向量、矩阵、统计等全场景数学操作。本文从实际开发视角出发,讲解ops-math仓库的代码复用方法、核心算子调试技巧及工程化集成方案,帮助开发者快速将成熟的数学算子融入自有项目。ops-math仓库并非简单的“数学函数集合”,而是一套经过
在计算图类项目中,分散的算子会带来频繁的数据搬运开销,导致整体计算效率下降。CANN生态下的仓库,是一套面向计算图的算子自动融合工具库,能自动检测计算图中可合并的连续算子并完成融合,减少数据交互成本。本文从代码逻辑、融合规则实现、项目集成流程三个维度,拆解的自动化优化能力,帮助开发者低代码实现计算图性能提升。// 算子类型枚举OP_TYPE_ADD, // 加法算子OP_TYPE_MUL, //
在Transformer模型开发中,注意力机制、前馈网络等核心计算模块的手写实现不仅繁琐,还易因细节差异导致模型性能波动。CANN生态下的仓库,封装了Transformer场景专属的高性能算子集合,覆盖自注意力、层归一化、前馈网络等核心计算逻辑。本文从代码结构、核心算子实现、项目集成流程三个维度,拆解的开发适配方法,帮助开发者快速复用成熟的Transformer计算模块。/*** @brief 自







