logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Ascend C 算子性能优化逆向实战:从 “低效代码” 到 “性能标杆”

Ascend C 的 API 体系是 “性能” 与 “效率” 的平衡:基础 API 让我们能直接操控硬件资源,实现极致性能;高阶 API 让我们能快速开发复杂算子,提升效率。理解 API 的分层逻辑与使用场景,是掌握 Ascend C 算子开发的关键。在实际开发中,建议大家遵循 “高阶 API 搭框架,基础 API 做优化” 的思路:先用高阶 API 快速实现算子的核心逻辑,再针对性能瓶颈用基础

#大数据#java#人工智能 +1
Ascend C 算子的 4 种调用方式:Kernel/CL/PyTorch 全覆盖

开发好的 Ascend C 算子,最终需要被上层业务代码或框架调用 —— 有的场景需要在 C++ 中直接调用,有的场景需要在 Python 中通过 PyTorch 调用,还有的场景需要通过 Ascend CL(计算库)调用。不同的调用方式对应不同的业务需求,掌握这些方式能让你的算子适配更多场景。Kernel 直调Ascend CL 调用PyTorch 调用MindSpore 调用,并结合实际案例说

#c语言#pytorch#开发语言 +1
Ascend C 进阶:Host 侧实现的 4 个核心操作(Tiling/shape 推导 / 注册)

在 Ascend C 算子开发中,**Host 侧(CPU)与Device 侧(AI Core)** 是分工明确的两个层级:Device 侧负责执行具体的计算逻辑(Kernel),而 Host 侧则负责算子的 “前置准备” 与 “调度管理”—— 包括参数校验、资源规划、Kernel 调用等。对于很多开发者而言,Host 侧的代码往往被忽略:要么直接复用框架的默认逻辑,要么简单实现参数传递,导致算子

#microsoft#windows#昇腾
Ascend C 算子开发进阶开篇:从 Add 算子看懂昇腾 AI Core 与算子全流程》

在昇腾 CANN 生态的技术栈中,算子是连接硬件能力与上层 AI 任务的核心载体 —— 小到简单的数值加法,大到复杂的卷积、Transformer 计算,本质都是通过算子实现硬件资源的调度与计算逻辑的执行。而 Ascend C 作为昇腾官方推出的算子开发框架,是开发者深入挖掘昇腾 AI 芯片性能、定制化适配业务场景的关键工具。对于刚入门 Ascend C 的开发者而言,直接上手复杂算子往往会陷入

#c语言#人工智能#开发语言 +1
OpenHarmony Flutter UGC 2.0:分布式创作 + AI 协同,重构全场景内容生态

开源鸿蒙的分布式能力打破了设备壁垒,AI 技术降低了创作门槛,两者的深度融合正在重构 UGC 生态的核心逻辑 —— 从 “人找设备创作” 到 “设备主动服务人”,从 “手动拼接内容” 到 “AI 智能生成”。本文提出的 “分布式 + AI”UGC 2.0 方案,不仅解决了传统 UGC 的割裂、低效、同质化问题,更开辟了全场景智能创作的新赛道。

#wpf#flutter
Ascend C 算子开发工程:快速流程 vs 标准流程,该怎么选?

在 Ascend C 的算子开发实践中,不同的业务场景需要不同的开发流程:有的场景追求 “快速验证”(如算法原型测试),有的场景需要 “生产级稳定性”(如集成到商用模型中)。针对这两种需求,Ascend C 提供了 ** 快速流程(Kernel 直调)和标准流程(自定义算子)** 两种工程化开发方式。很多开发者在选择流程时容易陷入困惑:什么时候用快速流程?什么时候必须用标准流程?两种流程的核心差异

#java#数据库#前端 +1
Ascend C 算子开发进阶开篇:从 Add 算子看懂昇腾 AI Core 与算子全流程》

在昇腾 CANN 生态的技术栈中,算子是连接硬件能力与上层 AI 任务的核心载体 —— 小到简单的数值加法,大到复杂的卷积、Transformer 计算,本质都是通过算子实现硬件资源的调度与计算逻辑的执行。而 Ascend C 作为昇腾官方推出的算子开发框架,是开发者深入挖掘昇腾 AI 芯片性能、定制化适配业务场景的关键工具。对于刚入门 Ascend C 的开发者而言,直接上手复杂算子往往会陷入

#c语言#人工智能#开发语言 +1
Ascend C 算子性能优化逆向实战:从 “低效代码” 到 “性能标杆”

Ascend C 的 API 体系是 “性能” 与 “效率” 的平衡:基础 API 让我们能直接操控硬件资源,实现极致性能;高阶 API 让我们能快速开发复杂算子,提升效率。理解 API 的分层逻辑与使用场景,是掌握 Ascend C 算子开发的关键。在实际开发中,建议大家遵循 “高阶 API 搭框架,基础 API 做优化” 的思路:先用高阶 API 快速实现算子的核心逻辑,再针对性能瓶颈用基础

#大数据#java#人工智能 +1
Ascend C 算子的 4 种调用方式:Kernel/CL/PyTorch 全覆盖

开发好的 Ascend C 算子,最终需要被上层业务代码或框架调用 —— 有的场景需要在 C++ 中直接调用,有的场景需要在 Python 中通过 PyTorch 调用,还有的场景需要通过 Ascend CL(计算库)调用。不同的调用方式对应不同的业务需求,掌握这些方式能让你的算子适配更多场景。Kernel 直调Ascend CL 调用PyTorch 调用MindSpore 调用,并结合实际案例说

#c语言#pytorch#开发语言 +1
OpenHarmony Flutter 导航与路由实战:从基础跳转至分布式流转

dartdart@overridetitle: '路由拦截Demo',// 路由生成器:实现拦截逻辑// 需要登录的路由列表// 检查是否需要登录且未登录// 跳转到登录页,并记录目标路由// 正常路由跳转(context),},导航路由是应用的 “骨架”,从基础的页面跳转,到进阶的参数传递、路由拦截,再到开源鸿蒙特有的分布式流转,每个环节都需要结合业务需求和设备特性进行设计。

#wpf
    共 68 条
  • 1
  • 2
  • 3
  • 7
  • 请选择