logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

ops-transformer 仓库概览

ascend-transformer-boost(ATB)是 Transformer 加速库,它封装了 ops-transformer 的算子,提供更上层的 API。ops-transformer 是 CANN(昇腾异构计算架构)第二层——昇腾计算服务层的核心算子库之一。ops-transformer 的算子实现大量复用 opbase 的能力。类别,与 ops-math、ops-nn、ops-cv

文章图片
#transformer#深度学习#人工智能
ops-transformer 仓库概览

ascend-transformer-boost(ATB)是 Transformer 加速库,它封装了 ops-transformer 的算子,提供更上层的 API。ops-transformer 是 CANN(昇腾异构计算架构)第二层——昇腾计算服务层的核心算子库之一。ops-transformer 的算子实现大量复用 opbase 的能力。类别,与 ops-math、ops-nn、ops-cv

文章图片
#transformer#深度学习#人工智能
ops-transformer:让Transformer在昇腾NPU上跑得更快

Transformer 的核心是注意力机制,计算量是序列长度的平方级增长。在昇腾 NPU 上,要让 Transformer 跑得快,不能只靠框架层的自动优化。但框架自动生成的算子,往往不是最优的。比如 FlashAttention 这种算法,需要手工优化内存访问模式、算子融合策略,才能发挥 NPU 的算力。FlashAttention 算子的实现,就是精心设计数据搬运策略,让计算掩埋在数据传输的延

文章图片
#transformer#深度学习#人工智能
ops-transformer:让Transformer在昇腾NPU上跑得更快

Transformer 的核心是注意力机制,计算量是序列长度的平方级增长。在昇腾 NPU 上,要让 Transformer 跑得快,不能只靠框架层的自动优化。但框架自动生成的算子,往往不是最优的。比如 FlashAttention 这种算法,需要手工优化内存访问模式、算子融合策略,才能发挥 NPU 的算力。FlashAttention 算子的实现,就是精心设计数据搬运策略,让计算掩埋在数据传输的延

文章图片
#transformer#深度学习#人工智能
昇腾 CANN 训练营:解锁 Cube 算子开发的核心秘籍

Cube 算子开发是深入昇腾底层技术生态的重要切入点,而 2025・CANN 训练营的专属课程,为开发者提供了从理论到实操的系统化学习方案。对于想要深耕昇腾技术体系的开发者而言,参与本次训练营、掌握 Cube 算子开发秘籍,不仅能提升个人技术硬实力,更能为后续的算子定制、性能优化等工作筑牢基础,在昇腾 AI 生态中实现技术价值的最大化。

#算法#数据结构
昇腾 CANN 生态下 Ascend C 算子开发:从工程实现到量产落地的全流程指南

在昇腾 AI 异构计算体系中,Ascend C 算子是释放 NPU 算力的核心载体,而 CANN 架构则为算子提供了从编译、调度到部署的全链路支撑。对于企业级开发者而言,Ascend C 算子开发不仅要实现功能正确性,更要满足量产场景的性能、稳定性与兼容性要求。本文将围绕 “工程实现 - 性能调优 - 兼容性适配 - 量产验证” 四大核心环节,拆解 Ascend C 算子从开发到落地的完整流程,结

#算法#数据结构
昇腾 CANN 与 Ascend C 协同创新:算子开发的效率提升与技术演进

CANN 异构计算架构与 Ascend C 专用语言的协同创新,是昇腾生态算子开发效率提升的核心驱动力。从一体化工具链、简化编程模型到自动化优化,二者的深度协同让算子开发从 “硬件专家专属” 变为 “普通开发者可及”,大幅缩短了开发周期、提升了性能上限。未来,随着自动化、生态兼容、高阶能力的持续演进,CANN+Ascend C 将进一步降低开发门槛,覆盖更广泛的业务场景与硬件平台。

#人工智能#大数据
Flutter与原生混合开发深度实战:从通信到架构,打通跨端协作壁垒

我将围绕鸿蒙Electron应用的“跨设备数据流转”核心场景,结合鸿蒙分布式软总线特性,打造一篇侧重“实战操作+场景落地”的技术文章,兼顾开发效率与功能实用性。鸿蒙分布式软总线是设备间通信的“高速通道”,负责设备发现、连接建立和数据传输;Electron则通过“主进程调用鸿蒙API+渲染进程处理UI交互”的模式,实现跨设备数据流转。核心优势:低延迟:基于软总线的直接通信,比传统网络传输延迟降低60

文章图片
#harmonyos#分布式
昇腾 CANN 生态下 Ascend C 算子开发:从工程实现到量产落地的全流程指南

在昇腾 AI 异构计算体系中,Ascend C 算子是释放 NPU 算力的核心载体,而 CANN 架构则为算子提供了从编译、调度到部署的全链路支撑。对于企业级开发者而言,Ascend C 算子开发不仅要实现功能正确性,更要满足量产场景的性能、稳定性与兼容性要求。本文将围绕 “工程实现 - 性能调优 - 兼容性适配 - 量产验证” 四大核心环节,拆解 Ascend C 算子从开发到落地的完整流程,结

#算法#数据结构
登录页面背后的生态逻辑:华为昇腾的 “入口价值”

对于技术开发者与企业用户而言,华为昇腾的登录页面绝非简单的 “身份验证工具”,而是进入其全栈 AI 生态的 “核心入口”。这种分层管理模式,既保障了核心技术资源的安全(如涉密技术文档仅对授权企业开放),也能精准匹配不同用户的需求,提升资源利用效率与服务针对性 —— 而登录页面作为身份验证的 “第一道防线”,为这种分层管理提供了基础保障。技术类官网的核心用户是开发者、工程师、企业技术负责人等群体,这

#华为
    共 61 条
  • 1
  • 2
  • 3
  • 7
  • 请选择