
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
Ascend C算子开发高阶实战:实现高性能RMSNorm融合算子(支持LLaMA、Qwen等大模型)
Ascend C算子开发高阶实战:实现高性能RMSNorm融合算子(支持LLaMA、Qwen等大模型)

Ascend C算子开发高阶实战:实现高性能GELU激活函数(支持精确模式与快速近似)
Ascend C算子开发高阶实战:实现高性能GELU激活函数(支持精确模式与快速近似)

Ascend C算子开发高阶实战:实现高性能FlashAttention-2风格的Tile-Level融合注意力算子
Ascend C算子开发高阶实战:实现高性能FlashAttention-2风格的Tile-Level融合注意力算子

Ascend C算子开发高阶实战:实现高性能Grouped-Query Attention(GQA)融合算子
Ascend C算子开发高阶实战:实现高性能Grouped-Query Attention(GQA)融合算子

Ascend C算子开发高阶实战:实现带Mask的Softmax算子(适用于Attention机制)
Ascend C算子开发高阶实战:实现带Mask的Softmax算子(适用于Attention机制)

Ascend C算子开发高阶实战:实现高性能FlashAttention-2风格的Tile-Level融合注意力算子
Ascend C算子开发高阶实战:实现高性能FlashAttention-2风格的Tile-Level融合注意力算子

Ascend C算子开发高阶实战:实现带Mask的Softmax算子(适用于Attention机制)
Ascend C算子开发高阶实战:实现带Mask的Softmax算子(适用于Attention机制)

Ascend C算子开发高阶实战:实现高性能RMSNorm融合算子(支持LLaMA、Qwen等大模型)
Ascend C算子开发高阶实战:实现高性能RMSNorm融合算子(支持LLaMA、Qwen等大模型)

Ascend C算子开发高阶实战:实现高性能Grouped-Query Attention(GQA)融合算子
Ascend C算子开发高阶实战:实现高性能Grouped-Query Attention(GQA)融合算子

Ascend C算子开发高阶实战:实现高性能GELU激活函数(支持精确模式与快速近似)
Ascend C算子开发高阶实战:实现高性能GELU激活函数(支持精确模式与快速近似)








