logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

鸿蒙Electron开发指南:跨平台桌面应用实战

摘要:鸿蒙系统支持Electron框架开发跨平台桌面应用,实现一次开发多端部署。通过JavaScript/HTML/CSS技术栈,开发者可调用鸿蒙底层API如分布式能力。配置环境需安装Node.js和HarmonyOS SDK,创建包含主进程脚本、预加载脚本的项目结构。示例展示了系统信息获取、鸿蒙特性集成及打包发布流程。优化建议包括使用Vite加速构建、启用硬件加速等。常见问题解决方案涵盖字体渲染

#harmonyos#electron#华为
《第11讲:获取设备信息:型号、OS版本、屏幕DPI》

本文介绍了在Flutter与鸿蒙(OpenHarmony)混合开发中获取设备信息的方法。通过@ohos.systemParameter和@ohos.display系统API,可以获取设备型号、制造商、OS版本、API版本和屏幕DPI等信息。文章详细展示了ArkTS桥接实现代码,包括设备信息获取和WebView注册过程,以及Flutter侧的调用示例。这些信息可用于UI适配(如根据DPI加载不同资源

#flutter#harmonyos
《Ascend C 进阶篇:内存复用、Mask 与 Atomic 优化技巧》

本文分享了AscendC编程的三个进阶优化技巧:内存复用通过TQueBind接口实现输入输出共享内存,节省50%UB存储;SetMaskCount简化Mask处理逻辑,减少标量指令开销;MatMul中启用AtomicAdd避免多Tile累加时的数据竞争。实测显示这些技巧能显著提升性能,包括降低内存占用、减少指令数量并保障正确性。文章强调性能优化在于细节处理,并预告下期将实战实现高性能RMSNorm

#c语言#开发语言
跟着昇腾CANN训练营学Ascend C:从入门到高性能算子开发》

本文介绍了AscendC算子开发入门指南,重点讲解如何搭建开发环境并实现VectorAdd算子。内容包括开发环境配置(需安装CANNToolkit≥8.0)、算子目录结构、Kernel侧和Host侧代码实现、编译测试方法及常见问题解答。通过AscendC编写自定义算子可优化新型激活函数、融合操作等场景的性能。文章最后预告了进阶内容,并介绍了2025年昇腾CANN训练营的认证奖励活动。

#c语言#开发语言
《第9讲:调用鸿蒙文件系统:读写本地文件(@ohos.file.fs)》

本文介绍了如何在Flutter应用中调用鸿蒙文件系统(@ohos.file.fs)实现本地文件读写功能。针对Flutter Web无法直接访问设备文件系统的问题,通过ArkTS桥接鸿蒙API实现解决方案。文章详细说明了权限申请配置、ArkTS实现文件读写操作的具体代码,以及如何将功能注册到WebView供Flutter调用。同时指出该方案仅能访问应用私有目录的安全限制,并预告了后续网络请求桥接的内

#harmonyos#华为
《Ascend C 进阶篇:内存复用、Mask 与 Atomic 优化技巧》

《Ascend C进阶优化技巧:内存复用、Mask简化与Atomic实战》分享了三种提升NPU性能的高级技巧:1)通过TQueBind实现VECIN/VECOUT内存复用,节省50%片上存储;2)使用SetMaskCount简化Mask逻辑,减少标量指令30%;3)在矩阵乘法中启用AtomicAdd避免数据竞争。实测显示这些优化能显著提升性能,其中内存复用支持更大Tiling,Mask简化使Ker

#开发语言#c语言
《Ascend C 优化篇:Tiling 与双缓冲实战》

本文介绍了Ascend C算子性能优化的两大核心技术:Tiling切分与双缓冲(Double Buffering)。针对昇腾NPU有限的UB存储空间,详细阐述了Tiling设计原则,包括Tile大小限制、对齐要求和计算单元吞吐考量。重点对比了单缓冲与双缓冲的差异,通过流水线并行实现计算与数据传输重叠,使矩阵乘性能提升89%(从180TFLOPS到340TFLOPS)。文章还提供了双缓冲的关键代码实

#c语言#开发语言
《Ascend C 架构篇:揭秘 AI Core 与三大编程范式》

本文深入解析了昇腾AI Core架构与Ascend C编程模型,重点介绍了三大高性能编程范式。首先剖析了达芬奇架构的核心组件(标量/向量/立方计算单元)及其协同工作机制,强调片上内存管理的重要性。随后详细阐述了分块(Tiling)、流水(Pipelining)和融合(Fusion)三大优化策略,通过具体案例说明如何组合使用这些方法提升算子性能。文章还总结了Kernel编写的关键要点和SPMD并行模

#人工智能#c语言#架构
跟着昇腾CANN训练营学Ascend C:从入门到高性能算子开发》

本文介绍了如何从零开始搭建Ascend C开发环境并实现第一个VectorAdd算子。首先说明了自定义算子的必要性,包括处理新型激活函数和优化计算性能等场景。详细讲解了开发环境配置步骤,推荐使用CANN Toolkit 8.1.RC1及以上版本。通过示例代码展示了算子实现的核心流程,包括Kernel侧的内存分配、数据拷贝和向量加法运算,以及Host侧的调用方法。最后提供了编译测试方法和常见问题解决

#c语言#开发语言
《Ascend C 实战篇:从零实现高性能 RMSNorm 算子》

本文是Ascend C系列收官之作,详细介绍了从零实现高性能RMSNorm算子的全过程。通过数学推导和Kernel设计,展示了融合计算、分块处理(Tiling)和向量归约(ReduceSum)等优化技术。文章提供了简化版Kernel代码,实测显示该实现比PyTorch CPU快10倍(昇腾910B,FP32,Hidden=4096),误差小于1e-5。完整工程已开源,包含CMake配置、Pytho

#c语言#开发语言
    共 46 条
  • 1
  • 2
  • 3
  • 4
  • 5
  • 请选择