logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

CANNBot开发进阶: Ascend C算子开发实操

本次直播围绕昇腾Kernel直调算子开发实操,重点分享如何通过CANNBot的多Agent协作实现从需求到交付的自动化开发流程。CANNBot可自动完成需求分析、架构设计、代码实现、质量检查和性能验证等关键环节,帮助开发者降低开发成本,提升生成效率与落地能力

文章图片
CANNBot入门:从0到1生成你的第一个算子

手把手带你用 CANNBot 从0到1生成第一个昇腾算子。从环境搭建到算子运行,全程Agent驱动:自动设计方案、编写代码、审查质量,输出可编译的算子代码,让 Ascend C算子开发触手可及。

文章图片
CANNBot发布:畅享算子开发新体验

本期直播将带你揭秘 CANNBot 智能体,在CANN 算子的设计、开发、测试效率优化等领域全面革新,使用多种Skills技能、Teams工作流,快速完成高性能昇腾算子开发

文章图片
本期直播将带你深度拆解Ascend 950硬件架构,从硬件模

本期直播将带你深度拆解Ascend 950硬件架构,从硬件模型到PTO指令集“数据集装箱”式设计,现场编码演示基于PTO ISA的优化技巧,手把手教你用PTO ISA发挥Ascend 950芯片性能。

文章图片
HCCL集合通信专用引擎CCU技术介绍

本次直播HCCL集合通信专用引擎CCU技术原理入手,讲解CCU的关键技术和CCU对昇腾芯片带来的改变。以8Pfull-mesh拓扑场景为例介绍CCU的开发使用和收益。

文章图片
如何探索下一代硬件的性能天花板?

模型的性能很大程度上由算子的性能决定。本次直播将对网络中常见重点算子的优化思路与实现过程进行拆解,帮助开发者清晰理解算子从基础实现到高效优化的完整路径,充分释放昇腾下一代硬件的澎湃性能,提升模型性能。

文章图片
加速开发,提升效率的必备利器

聚焦 CANN 下一代芯片算子开发全链路,深度拆解Cube/Vector 模板库、算子直调、仿真工具核心能力,解锁下一代芯片新特性适配秘籍。助开发者降门槛、提效率,轻松释放芯片澎湃算力!

文章图片
CANN 算子开发全链路体验升级

CANN 算子开发全链路体验升级

文章图片
面向下一代硬件,CANN技术架构的变与不变

Ascend950是昇腾新一代芯片,在继承上一代芯片优势的同时,在计算/通信等方面进行了如ND2NZ、CV融合、SIMT、UB、CCU等多项突破性改进。

文章图片
面向下一代硬件的性能调优

Profiling是开发者进行NPU性能调优的重要工具,本次课程向开发者介绍下一代芯片面向整网和算子性能调优提供的新特性。

文章图片
    共 14 条
  • 1
  • 2
  • 请选择