logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

TileLang-Ascend学习周回顾与激励活动

为期五天的 TileLang-Ascend学习周 已于2月6日圆满落幕。课程自2月2日开播以来,吸引了众多开发者与算法工程师的持续关注与参与。在TileLang核心开发团队老师的带领下,我们从开发环境搭建出发,系统讲解了TileLang编程语法与Developer模式,并最终完成了从算子开发、编译调试到集成的完整工程实践闭环。

文章图片
#CANN#昇腾#开源
TileLang-Ascend“Developer模式” 开启高效新范式

它通过重组循环内的操作顺序,让不同迭代的计算与内存传输重叠执行,从而实现计算与通信的并行化。在昇腾 NPU 算子开发中,共享内存的高效利用是突破性能瓶颈的关键:一方面,昇腾 NPU 将内存划分为多个层次并存在严苛的容量上限,内存资源极度稀缺,而计算过程中需要创建大量临时缓冲区用于存储中间计算结果。TileLang-Ascend Developer模式的发布,标志着一个关键的转折点:昇腾NPU的高性

文章图片
#CANN#开源#昇腾
TileLang-Ascend“Developer模式” 开启高效新范式

它通过重组循环内的操作顺序,让不同迭代的计算与内存传输重叠执行,从而实现计算与通信的并行化。在昇腾 NPU 算子开发中,共享内存的高效利用是突破性能瓶颈的关键:一方面,昇腾 NPU 将内存划分为多个层次并存在严苛的容量上限,内存资源极度稀缺,而计算过程中需要创建大量临时缓冲区用于存储中间计算结果。TileLang-Ascend Developer模式的发布,标志着一个关键的转折点:昇腾NPU的高性

文章图片
#CANN#开源#昇腾
TileLang-Ascend“Developer模式” 开启高效新范式

它通过重组循环内的操作顺序,让不同迭代的计算与内存传输重叠执行,从而实现计算与通信的并行化。在昇腾 NPU 算子开发中,共享内存的高效利用是突破性能瓶颈的关键:一方面,昇腾 NPU 将内存划分为多个层次并存在严苛的容量上限,内存资源极度稀缺,而计算过程中需要创建大量临时缓冲区用于存储中间计算结果。TileLang-Ascend Developer模式的发布,标志着一个关键的转折点:昇腾NPU的高性

文章图片
#CANN#开源#昇腾
教LLM玩数独:用昇腾NPU实现GRPO强化学习训练

直播时间2026年1月29日19:00 - 20:00B站/微信视频号搜索【昇腾CANN】观看直播,参与直播互动可获CANN周边小礼品。今天我们聚焦LLM强化学习入门,专门为有部分技术基础、并且对大模型强化学习感兴趣的朋友准备。这次会带大家解读GRPO的核心原理,然后从基础的环境配置手把手教起,再到实际的模型训练实操,还会分享实用的调参技巧,把入门阶段的核心能力一次性拿捏。我们都知道大语言模型现在

文章图片
#CANN#昇腾
教LLM玩数独:用昇腾NPU实现GRPO强化学习训练

直播时间2026年1月29日19:00 - 20:00B站/微信视频号搜索【昇腾CANN】观看直播,参与直播互动可获CANN周边小礼品。今天我们聚焦LLM强化学习入门,专门为有部分技术基础、并且对大模型强化学习感兴趣的朋友准备。这次会带大家解读GRPO的核心原理,然后从基础的环境配置手把手教起,再到实际的模型训练实操,还会分享实用的调参技巧,把入门阶段的核心能力一次性拿捏。我们都知道大语言模型现在

文章图片
#CANN#昇腾
教LLM玩数独:用昇腾NPU实现GRPO强化学习训练

直播时间2026年1月29日19:00 - 20:00B站/微信视频号搜索【昇腾CANN】观看直播,参与直播互动可获CANN周边小礼品。今天我们聚焦LLM强化学习入门,专门为有部分技术基础、并且对大模型强化学习感兴趣的朋友准备。这次会带大家解读GRPO的核心原理,然后从基础的环境配置手把手教起,再到实际的模型训练实操,还会分享实用的调参技巧,把入门阶段的核心能力一次性拿捏。我们都知道大语言模型现在

文章图片
#CANN#昇腾
基于CANN开源算子库的二次开发实践:CrossEntropyLoss与Zloss融合

面对这一挑战,客户参考了昇腾CANN开源算子源码仓ops-nn中高性能CrossEntropyLoss算子的实现,该算子已经具备高性能的CE Loss交叉熵损失函数计算能力,客户在此基础上,融入了ZLoss和lseForZLoss计算,分别用于计算辅助损失ZLoss和ZLoss场景下输出给反向传播的值。这两个损失函数的原始实现存在显著的性能瓶颈——它们的计算由一系列串行的小Vector算子构成,导

#CANN
Ascend C算子性能优化实用技巧04——Tiling优化

什么是Tiling简介Ascend C是CANN针对算子开发场景推出的编程语言,原生支持C和C++标准规范,兼具开发效率和运行性能。使用Ascend C,开发者可以基于昇腾AI硬件,高效的实现自定义的创新算法。目前已经有越来越多的开发者使用Ascend C,我们将通过几期“Ascend C算子性能优化”专题分享,围绕开发者最为关心的算子性能优化环节,介绍Ascend C算子常用的优化技巧,帮助开发

文章图片
#c语言#性能优化#开发语言
一文教你如何调用Ascend C算子

介绍基于Ascend C算子编程语言完成自定义算子的开发和部署后,如何调用自定义算子验证算子功能。

文章图片
#人工智能
    共 190 条
  • 1
  • 2
  • 3
  • 19
  • 请选择