
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
Flutter 无障碍(Accessibility)开发完全指南:让每一个用户都能平等使用你的应用
Flutter 无障碍(Accessibility)开发完全指南:让每一个用户都能平等使用你的应用

Flutter 与原生平台深度集成:打通 iOS 与 Android 的最后一公里
Flutter 与原生平台深度集成:打通 iOS 与 Android 的最后一公里

Flutter 性能调优实战:从卡顿到丝滑的系统性优化指南
Flutter 性能调优实战:从卡顿到丝滑的系统性优化指南

Ascend C 算子开发进阶教程:从一个 Add 算子的前世今生到工程化实践
{// 1. 初始化缓冲区// 输入A、B// 输出// 2. 分配UB内存float(1024);// 3. 主循环:分块处理// 向量加法接收用户输入调度 Device 侧 Kernel管理内存与通信在 TBE 框架中,Host 侧通常由工具自动生成,但理解其机制有助于调试与优化。模式适用场景特点Kernel 直调快速验证、调试不需要注册,直接调用自定义算子工程生产环境、框架集成。

Ascend C 算子开发深度实践:从理论模型到工业级部署的完整指南
Ascend C 算子开发深度实践:从理论模型到工业级部署的完整指南

Ascend C算子开发教程(进阶)
Ascend C算子开发教程(进阶)

Ascend C算子开发进阶实战:从Add到Broadcast Add的全链路剖析
Ascend C算子开发进阶实战:从Add到Broadcast Add的全链路剖析

Ascend C 算子开发实战:实现高性能 GELU 算子并支持 FP16/FP32 混合精度
Ascend C 算子开发实战:实现高性能 GELU 算子并支持 FP16/FP32 混合精度

Ascend C 算子开发高阶实战:实现融合型 RMSNorm + SwiGLU 算子,加速大模型前馈网络
Ascend C 算子开发高阶实战:实现融合型 RMSNorm + SwiGLU 算子,加速大模型前馈网络

从概念到Ascend C实战的技术深耕
从概念到Ascend C实战的技术深耕








