
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
ascend-transformer-boost(ATB)是 Transformer 加速库,它封装了 ops-transformer 的算子,提供更上层的 API。ops-transformer 是 CANN(昇腾异构计算架构)第二层——昇腾计算服务层的核心算子库之一。ops-transformer 的算子实现大量复用 opbase 的能力。类别,与 ops-math、ops-nn、ops-cv

ascend-transformer-boost(ATB)是 Transformer 加速库,它封装了 ops-transformer 的算子,提供更上层的 API。ops-transformer 是 CANN(昇腾异构计算架构)第二层——昇腾计算服务层的核心算子库之一。ops-transformer 的算子实现大量复用 opbase 的能力。类别,与 ops-math、ops-nn、ops-cv

Transformer 的核心是注意力机制,计算量是序列长度的平方级增长。在昇腾 NPU 上,要让 Transformer 跑得快,不能只靠框架层的自动优化。但框架自动生成的算子,往往不是最优的。比如 FlashAttention 这种算法,需要手工优化内存访问模式、算子融合策略,才能发挥 NPU 的算力。FlashAttention 算子的实现,就是精心设计数据搬运策略,让计算掩埋在数据传输的延

Transformer 的核心是注意力机制,计算量是序列长度的平方级增长。在昇腾 NPU 上,要让 Transformer 跑得快,不能只靠框架层的自动优化。但框架自动生成的算子,往往不是最优的。比如 FlashAttention 这种算法,需要手工优化内存访问模式、算子融合策略,才能发挥 NPU 的算力。FlashAttention 算子的实现,就是精心设计数据搬运策略,让计算掩埋在数据传输的延

Cube 算子开发是深入昇腾底层技术生态的重要切入点,而 2025・CANN 训练营的专属课程,为开发者提供了从理论到实操的系统化学习方案。对于想要深耕昇腾技术体系的开发者而言,参与本次训练营、掌握 Cube 算子开发秘籍,不仅能提升个人技术硬实力,更能为后续的算子定制、性能优化等工作筑牢基础,在昇腾 AI 生态中实现技术价值的最大化。
在昇腾 AI 异构计算体系中,Ascend C 算子是释放 NPU 算力的核心载体,而 CANN 架构则为算子提供了从编译、调度到部署的全链路支撑。对于企业级开发者而言,Ascend C 算子开发不仅要实现功能正确性,更要满足量产场景的性能、稳定性与兼容性要求。本文将围绕 “工程实现 - 性能调优 - 兼容性适配 - 量产验证” 四大核心环节,拆解 Ascend C 算子从开发到落地的完整流程,结
CANN 异构计算架构与 Ascend C 专用语言的协同创新,是昇腾生态算子开发效率提升的核心驱动力。从一体化工具链、简化编程模型到自动化优化,二者的深度协同让算子开发从 “硬件专家专属” 变为 “普通开发者可及”,大幅缩短了开发周期、提升了性能上限。未来,随着自动化、生态兼容、高阶能力的持续演进,CANN+Ascend C 将进一步降低开发门槛,覆盖更广泛的业务场景与硬件平台。
我将围绕鸿蒙Electron应用的“跨设备数据流转”核心场景,结合鸿蒙分布式软总线特性,打造一篇侧重“实战操作+场景落地”的技术文章,兼顾开发效率与功能实用性。鸿蒙分布式软总线是设备间通信的“高速通道”,负责设备发现、连接建立和数据传输;Electron则通过“主进程调用鸿蒙API+渲染进程处理UI交互”的模式,实现跨设备数据流转。核心优势:低延迟:基于软总线的直接通信,比传统网络传输延迟降低60

在昇腾 AI 异构计算体系中,Ascend C 算子是释放 NPU 算力的核心载体,而 CANN 架构则为算子提供了从编译、调度到部署的全链路支撑。对于企业级开发者而言,Ascend C 算子开发不仅要实现功能正确性,更要满足量产场景的性能、稳定性与兼容性要求。本文将围绕 “工程实现 - 性能调优 - 兼容性适配 - 量产验证” 四大核心环节,拆解 Ascend C 算子从开发到落地的完整流程,结
对于技术开发者与企业用户而言,华为昇腾的登录页面绝非简单的 “身份验证工具”,而是进入其全栈 AI 生态的 “核心入口”。这种分层管理模式,既保障了核心技术资源的安全(如涉密技术文档仅对授权企业开放),也能精准匹配不同用户的需求,提升资源利用效率与服务针对性 —— 而登录页面作为身份验证的 “第一道防线”,为这种分层管理提供了基础保障。技术类官网的核心用户是开发者、工程师、企业技术负责人等群体,这







