logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Ascend C算子开发高阶实战:实现高性能RMSNorm融合算子(支持LLaMA、Qwen等大模型)

Ascend C算子开发高阶实战:实现高性能RMSNorm融合算子(支持LLaMA、Qwen等大模型)

文章图片
#c语言#开发语言
Ascend C算子开发高阶实战:实现高性能GELU激活函数(支持精确模式与快速近似)

Ascend C算子开发高阶实战:实现高性能GELU激活函数(支持精确模式与快速近似)

文章图片
#c语言#开发语言
Ascend C算子开发高阶实战:实现高性能FlashAttention-2风格的Tile-Level融合注意力算子

Ascend C算子开发高阶实战:实现高性能FlashAttention-2风格的Tile-Level融合注意力算子

文章图片
#c语言#人工智能#开发语言
Ascend C算子开发高阶实战:实现高性能Grouped-Query Attention(GQA)融合算子

Ascend C算子开发高阶实战:实现高性能Grouped-Query Attention(GQA)融合算子

文章图片
#c语言#人工智能#深度学习
Ascend C算子开发高阶实战:实现带Mask的Softmax算子(适用于Attention机制)

Ascend C算子开发高阶实战:实现带Mask的Softmax算子(适用于Attention机制)

文章图片
#c语言#开发语言
Ascend C算子开发高阶实战:实现高性能FlashAttention-2风格的Tile-Level融合注意力算子

Ascend C算子开发高阶实战:实现高性能FlashAttention-2风格的Tile-Level融合注意力算子

文章图片
#c语言#人工智能#开发语言
Ascend C算子开发高阶实战:实现带Mask的Softmax算子(适用于Attention机制)

Ascend C算子开发高阶实战:实现带Mask的Softmax算子(适用于Attention机制)

文章图片
#c语言#开发语言
Ascend C算子开发高阶实战:实现高性能RMSNorm融合算子(支持LLaMA、Qwen等大模型)

Ascend C算子开发高阶实战:实现高性能RMSNorm融合算子(支持LLaMA、Qwen等大模型)

文章图片
#c语言#开发语言
Ascend C算子开发高阶实战:实现高性能Grouped-Query Attention(GQA)融合算子

Ascend C算子开发高阶实战:实现高性能Grouped-Query Attention(GQA)融合算子

文章图片
#c语言#人工智能#深度学习
Ascend C算子开发高阶实战:实现高性能GELU激活函数(支持精确模式与快速近似)

Ascend C算子开发高阶实战:实现高性能GELU激活函数(支持精确模式与快速近似)

文章图片
#c语言#开发语言
    共 28 条
  • 1
  • 2
  • 3
  • 请选择