logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

CANN Driver:AIGC 计算资源高效调度与并行优化实践

CANNDriver是华为CANN框架的核心组件,针对AIGC(如文生图、大语言模型)的算力调度挑战,提供了高效的底层计算资源管理方案。通过设备初始化(aclInit)、内存优化(aclrtMalloc)、多流并发(aclrtCreateStream)和异步推理(aclmdlExecuteAsync)等API,显著提升AIGC任务的吞吐量与显存利用率。实践案例展示了如何利用C++ ACL API实

文章图片
#算法
CANN算子开发实战:一次UGC模型中的BiasAdd与ReLU算子融合调优笔记

摘要:本文记录了基于CANN的BERT模型优化实践,重点解决算子间频繁内存读写导致的性能瓶颈。通过分析Profiler数据,发现BiasAdd和ReLU算子的独立执行导致中间结果在全局内存频繁搬运。采用TBE的算子融合技术,将BiasAdd和ReLU合并为单个算子,在Lambda表达式中实现x+bias与max(0,x)的连续计算,避免了中间结果的DDR读写。实验表明,该方法有效减少了内存带宽压力

文章图片
CANN/runtime:AI应用运行时的资源管理与高效执行工具库

AI应用在运行过程中常面临硬件资源分配混乱和算子执行冗余等问题,导致性能下降。CANN生态中的runtime仓库提供了一套轻量级运行时管理工具,通过封装硬件资源调度、算子加载执行和内存复用等核心功能,以标准化接口简化运行时流程,显著提升AI应用的执行效率。本文将从代码结构、核心功能实现和集成示例三个维度,剖析其在AI项目落地中的实用价值。// 运行时句柄/*** @brief 初始化运行时实例(分

文章图片
#开发语言
CANN ops-math:赋能 AIGC 模型核心运算极致加速

大三计算机学生在开发CANN算子时经历了思维转变:从传统C++编程逻辑转向关注NPU数据搬运效率。通过实现ReLU算子,发现性能瓶颈在于数据搬运而非计算,进而学习使用分块(Tiling)策略优化传输。调试过程中利用仿真环境STKN和分段验证方法解决问题。最终认识到实用算子需处理数据类型泛化、动态分块等工程问题。这段经历深化了对底层硬件优化的理解,为后续开发复杂算子打下基础。

文章图片
#开发语言
影视大全骨架实现(Flutter for HarmonyOS)

本文介绍了Flutter影视应用的核心功能实现,包括数据模型定义、模拟数据加载、搜索分类过滤交互、影视卡片UI构建以及状态处理。通过Movie和Category模型承载数据,模拟网络请求生成测试数据,实现搜索和分类双重过滤功能,构建美观的影视卡片界面,并处理加载中和空数据状态。该实现采用Dart语言,遵循Flutter空安全规范,为影视类应用开发提供了基础框架和功能参考。

文章图片
#flutter#harmonyos#华为
【Flutter for HarmonyOS】购物车实战:侧滑交互与骨架屏优化

本文介绍了一个基于Flutter 3.x和Dart 2.18开发的电商应用项目。项目采用橙色主题,主要实现了商品列表展示(含分页、下拉刷新、上拉加载功能)、侧滑式购物车管理(支持商品增减、总价计算)以及加载骨架屏优化体验。文章详细解析了项目架构设计,包括数据模型(Product和CartItem)、UI组件实现(商品卡片、购物车侧滑栏)和交互细节(如SnackBar提示、即时状态更新)。项目采用清

文章图片
#flutter#javascript#开发语言
深入仓颉之魂:访问修饰符的设计哲学与实战精粹

仓颉语言的访问修饰符体现了"默认安全"的设计哲学,通过private、internal和public三级可见性实现严格封装。文章以数据处理引擎为例,对比了滥用public与合理使用internal的差异:前者会导致模块间耦合,后者则通过模块内共享(internal)和统一对外接口(public)实现真正的模块化。这种层级设计能有效降低认知负担、保证内部重构自由,是构建大型可维护

文章图片
#ipython
CANN-ops-cv:计算机视觉基础算子的实用工具库与快速集成

在计算机视觉项目中,图像缩放、边缘检测等基础操作的手写实现不仅耗时,还易因算法细节差异导致效果不一致。CANN生态下的ops-cv仓库,是一套封装了CV常用基础算子的工具库,覆盖图像缩放、卷积、灰度化等核心操作,通过统一接口降低CV项目的开发成本。本文从代码结构、核心算子实现、集成示例三个维度,解读ops-cv的实用价值。/*** @brief 图像最近邻插值缩放* @param src 输入图像

文章图片
#AIGC#人工智能
CANN;计算图元数据标准化利器:metadef

在计算图类项目中,不同模块对图节点、边的描述格式不统一,会导致数据交互成本高。CANN生态下的metadef仓库,是一套专注计算图元数据标准化定义的工具库,通过统一的结构体与接口,规范图节点、图结构的描述格式,降低跨模块图数据交互的复杂度。本文从代码结构、核心元定义实现、图构建示例三个维度,解读metadef的实用价值。metadefmetadef/├── include/ # 接口头文件:预定义

#AIGC
CANN/metadef:计算图元数据定义的轻量工具库与代码实践

在计算图类项目中,不同模块对图节点、边的描述格式不统一,会导致数据交互成本高。CANN生态下的metadef仓库,是一套专注计算图元数据标准化定义的工具库,通过统一的结构体与接口,规范图节点、图结构的描述格式,降低跨模块图数据交互的复杂度。本文从代码结构、核心元定义实现、图构建示例三个维度,解读metadef的实用价值。metadefmetadef/├── include/ # 接口头文件:预定义

#microsoft
    共 41 条
  • 1
  • 2
  • 3
  • 4
  • 5
  • 请选择