狮恒个人主页

@2501_93721151

狮恒

2025-11-28 20:46:41 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

Ascend C 算子性能优化逆向实战：从 “低效代码” 到 “性能标杆”

Ascend C 的 API 体系是 “性能” 与 “效率” 的平衡：基础 API 让我们能直接操控硬件资源，实现极致性能；高阶 API 让我们能快速开发复杂算子，提升效率。理解 API 的分层逻辑与使用场景，是掌握 Ascend C 算子开发的关键。在实际开发中，建议大家遵循 “高阶 API 搭框架，基础 API 做优化” 的思路：先用高阶 API 快速实现算子的核心逻辑，再针对性能瓶颈用基础

#大数据 #java #人工智能 +1

Ascend C 算子的 4 种调用方式：Kernel/CL/PyTorch 全覆盖

开发好的 Ascend C 算子，最终需要被上层业务代码或框架调用 —— 有的场景需要在 C++ 中直接调用，有的场景需要在 Python 中通过 PyTorch 调用，还有的场景需要通过 Ascend CL（计算库）调用。不同的调用方式对应不同的业务需求，掌握这些方式能让你的算子适配更多场景。Kernel 直调Ascend CL 调用PyTorch 调用MindSpore 调用，并结合实际案例说

#c语言 #pytorch #开发语言 +1

Ascend C 进阶：Host 侧实现的 4 个核心操作（Tiling/shape 推导 / 注册）

在 Ascend C 算子开发中，**Host 侧（CPU）与Device 侧（AI Core）** 是分工明确的两个层级：Device 侧负责执行具体的计算逻辑（Kernel），而 Host 侧则负责算子的 “前置准备” 与 “调度管理”—— 包括参数校验、资源规划、Kernel 调用等。对于很多开发者而言，Host 侧的代码往往被忽略：要么直接复用框架的默认逻辑，要么简单实现参数传递，导致算子

#microsoft #windows #昇腾

Ascend C 算子开发进阶开篇：从 Add 算子看懂昇腾 AI Core 与算子全流程》

在昇腾 CANN 生态的技术栈中，算子是连接硬件能力与上层 AI 任务的核心载体 —— 小到简单的数值加法，大到复杂的卷积、Transformer 计算，本质都是通过算子实现硬件资源的调度与计算逻辑的执行。而 Ascend C 作为昇腾官方推出的算子开发框架，是开发者深入挖掘昇腾 AI 芯片性能、定制化适配业务场景的关键工具。对于刚入门 Ascend C 的开发者而言，直接上手复杂算子往往会陷入

#c语言 #人工智能 #开发语言 +1

OpenHarmony Flutter UGC 2.0：分布式创作 + AI 协同，重构全场景内容生态

开源鸿蒙的分布式能力打破了设备壁垒，AI 技术降低了创作门槛，两者的深度融合正在重构 UGC 生态的核心逻辑 —— 从 “人找设备创作” 到 “设备主动服务人”，从 “手动拼接内容” 到 “AI 智能生成”。本文提出的 “分布式 + AI”UGC 2.0 方案，不仅解决了传统 UGC 的割裂、低效、同质化问题，更开辟了全场景智能创作的新赛道。

#wpf #flutter

Ascend C 算子开发工程：快速流程 vs 标准流程，该怎么选？

在 Ascend C 的算子开发实践中，不同的业务场景需要不同的开发流程：有的场景追求 “快速验证”（如算法原型测试），有的场景需要 “生产级稳定性”（如集成到商用模型中）。针对这两种需求，Ascend C 提供了 ** 快速流程（Kernel 直调）和标准流程（自定义算子）** 两种工程化开发方式。很多开发者在选择流程时容易陷入困惑：什么时候用快速流程？什么时候必须用标准流程？两种流程的核心差异

#java #数据库 #前端 +1

Ascend C 算子开发进阶开篇：从 Add 算子看懂昇腾 AI Core 与算子全流程》

#c语言 #人工智能 #开发语言 +1

Ascend C 算子性能优化逆向实战：从 “低效代码” 到 “性能标杆”

#大数据 #java #人工智能 +1

Ascend C 算子的 4 种调用方式：Kernel/CL/PyTorch 全覆盖

#c语言 #pytorch #开发语言 +1

OpenHarmony Flutter 导航与路由实战：从基础跳转至分布式流转

dartdart@overridetitle: '路由拦截Demo',// 路由生成器：实现拦截逻辑// 需要登录的路由列表// 检查是否需要登录且未登录// 跳转到登录页，并记录目标路由// 正常路由跳转(context),},导航路由是应用的 “骨架”，从基础的页面跳转，到进阶的参数传递、路由拦截，再到开源鸿蒙特有的分布式流转，每个环节都需要结合业务需求和设备特性进行设计。

#wpf

共 68 条

请选择