
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
Ascend C 的 API 体系是 “性能” 与 “效率” 的平衡:基础 API 让我们能直接操控硬件资源,实现极致性能;高阶 API 让我们能快速开发复杂算子,提升效率。理解 API 的分层逻辑与使用场景,是掌握 Ascend C 算子开发的关键。在实际开发中,建议大家遵循 “高阶 API 搭框架,基础 API 做优化” 的思路:先用高阶 API 快速实现算子的核心逻辑,再针对性能瓶颈用基础
开发好的 Ascend C 算子,最终需要被上层业务代码或框架调用 —— 有的场景需要在 C++ 中直接调用,有的场景需要在 Python 中通过 PyTorch 调用,还有的场景需要通过 Ascend CL(计算库)调用。不同的调用方式对应不同的业务需求,掌握这些方式能让你的算子适配更多场景。Kernel 直调Ascend CL 调用PyTorch 调用MindSpore 调用,并结合实际案例说
在 Ascend C 算子开发中,**Host 侧(CPU)与Device 侧(AI Core)** 是分工明确的两个层级:Device 侧负责执行具体的计算逻辑(Kernel),而 Host 侧则负责算子的 “前置准备” 与 “调度管理”—— 包括参数校验、资源规划、Kernel 调用等。对于很多开发者而言,Host 侧的代码往往被忽略:要么直接复用框架的默认逻辑,要么简单实现参数传递,导致算子
在昇腾 CANN 生态的技术栈中,算子是连接硬件能力与上层 AI 任务的核心载体 —— 小到简单的数值加法,大到复杂的卷积、Transformer 计算,本质都是通过算子实现硬件资源的调度与计算逻辑的执行。而 Ascend C 作为昇腾官方推出的算子开发框架,是开发者深入挖掘昇腾 AI 芯片性能、定制化适配业务场景的关键工具。对于刚入门 Ascend C 的开发者而言,直接上手复杂算子往往会陷入
开源鸿蒙的分布式能力打破了设备壁垒,AI 技术降低了创作门槛,两者的深度融合正在重构 UGC 生态的核心逻辑 —— 从 “人找设备创作” 到 “设备主动服务人”,从 “手动拼接内容” 到 “AI 智能生成”。本文提出的 “分布式 + AI”UGC 2.0 方案,不仅解决了传统 UGC 的割裂、低效、同质化问题,更开辟了全场景智能创作的新赛道。
在 Ascend C 的算子开发实践中,不同的业务场景需要不同的开发流程:有的场景追求 “快速验证”(如算法原型测试),有的场景需要 “生产级稳定性”(如集成到商用模型中)。针对这两种需求,Ascend C 提供了 ** 快速流程(Kernel 直调)和标准流程(自定义算子)** 两种工程化开发方式。很多开发者在选择流程时容易陷入困惑:什么时候用快速流程?什么时候必须用标准流程?两种流程的核心差异
在昇腾 CANN 生态的技术栈中,算子是连接硬件能力与上层 AI 任务的核心载体 —— 小到简单的数值加法,大到复杂的卷积、Transformer 计算,本质都是通过算子实现硬件资源的调度与计算逻辑的执行。而 Ascend C 作为昇腾官方推出的算子开发框架,是开发者深入挖掘昇腾 AI 芯片性能、定制化适配业务场景的关键工具。对于刚入门 Ascend C 的开发者而言,直接上手复杂算子往往会陷入
Ascend C 的 API 体系是 “性能” 与 “效率” 的平衡:基础 API 让我们能直接操控硬件资源,实现极致性能;高阶 API 让我们能快速开发复杂算子,提升效率。理解 API 的分层逻辑与使用场景,是掌握 Ascend C 算子开发的关键。在实际开发中,建议大家遵循 “高阶 API 搭框架,基础 API 做优化” 的思路:先用高阶 API 快速实现算子的核心逻辑,再针对性能瓶颈用基础
开发好的 Ascend C 算子,最终需要被上层业务代码或框架调用 —— 有的场景需要在 C++ 中直接调用,有的场景需要在 Python 中通过 PyTorch 调用,还有的场景需要通过 Ascend CL(计算库)调用。不同的调用方式对应不同的业务需求,掌握这些方式能让你的算子适配更多场景。Kernel 直调Ascend CL 调用PyTorch 调用MindSpore 调用,并结合实际案例说
dartdart@overridetitle: '路由拦截Demo',// 路由生成器:实现拦截逻辑// 需要登录的路由列表// 检查是否需要登录且未登录// 跳转到登录页,并记录目标路由// 正常路由跳转(context),},导航路由是应用的 “骨架”,从基础的页面跳转,到进阶的参数传递、路由拦截,再到开源鸿蒙特有的分布式流转,每个环节都需要结合业务需求和设备特性进行设计。







