logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

OpenHarmony + Flutter 混合开发实战:深度集成 AI Kit 实现端侧图像识别与智能分析

若需专用模型(如“变压器缺陷检测”),可通过// 加载自定义 .om 模型deviceId: 'npu' // 指定 NPU 执行});⚠️ 需提前将.om模型放入目录,并通过ATC 工具转换。通过本文,你已掌握:✅封装 OpenHarmony AI Kit 为 Flutter 插件✅实现人脸、物体、OCR 三大端侧 AI 能力✅构建无网可用的工业巡检 App✅保障数据不出设备,满足信创合规要求?

文章图片
#flutter#人工智能
Flutter 与 OpenHarmony 深度集成:实现跨设备传感器数据协同监测系统

本文介绍了一个基于OpenHarmony分布式硬件虚拟化技术和Flutter跨平台UI的环境监测系统。系统通过DeviceManager和HardwareResourceManager实现远程设备传感器数据的统一访问,使应用能够像调用本地传感器一样使用分布式硬件资源。架构设计包含Flutter UI层、原生插件层和分布式硬件管理层,支持多设备协同工作,当远程节点不可用时自动降级为本地采集。文章详细

文章图片
#flutter#wpf
起航:5分钟搭建你的第一个“鸿蒙Electron”应用

摘要: 本文介绍如何通过鸿蒙OS的Web组件与ArkTS桥接技术,构建类似Electron的混合应用(暂称“鸿蒙Electron”)。开发者只需5分钟即可完成: 在rawfile目录放置Web页面(HTML/JS/CSS) 通过ArkTS的Web组件加载本地页面 使用registerJavaScriptProxy实现Web与原生能力交互(如获取设备信息、文件操作) 最终生成轻量、安全的离线应用。文

文章图片
#harmonyos#electron#华为
昇腾NPU上的NumPy兼容层:asnumpy如何让Python代码自动加速3倍

本文介绍了昇腾CANN生态中的asnumpy库如何通过猴子补丁技术实现NumPy代码向NPU的无缝迁移。该库采用两层架构:模块替换实现透明接管NumPy调用,算子路由将API映射到CANN算子执行。通过惰性拷贝和写时复制策略优化数据搬运,显著减少PCIe传输开销。实战案例展示了一个语音信号处理流程,从原始信号到MFCC特征提取的全过程加速,处理时间从CPU的45分钟缩短至8分钟。asnumpy让现

文章图片
#numpy#python#开发语言
昇腾NPU上的NumPy兼容层:asnumpy如何让Python代码自动加速3倍

本文介绍了昇腾CANN生态中的asnumpy库如何通过猴子补丁技术实现NumPy代码向NPU的无缝迁移。该库采用两层架构:模块替换实现透明接管NumPy调用,算子路由将API映射到CANN算子执行。通过惰性拷贝和写时复制策略优化数据搬运,显著减少PCIe传输开销。实战案例展示了一个语音信号处理流程,从原始信号到MFCC特征提取的全过程加速,处理时间从CPU的45分钟缩短至8分钟。asnumpy让现

文章图片
#numpy#python#开发语言
hicann:昇腾NPU的异构计算网络架构

昇腾hicann架构通过三层网络(HCCS片内互联、RoCE机架互联、RDMA集群互联)解决传统PCIe方案的扩展瓶颈,实现千卡级NPU集群高速通信。其拓扑感知调度技术可自动选择最优路径,分层AllReduce比传统HCCL快2.5-3倍,显著提升大模型训练效率。该架构适用于需要高带宽、低延迟的分布式训练场景,通过计算-存储-网络解耦设计突破传统架构的带宽限制。

文章图片
#网络#架构#php
hicann:昇腾NPU的异构计算网络架构

昇腾hicann架构通过三层网络(HCCS片内互联、RoCE机架互联、RDMA集群互联)解决传统PCIe方案的扩展瓶颈,实现千卡级NPU集群高速通信。其拓扑感知调度技术可自动选择最优路径,分层AllReduce比传统HCCL快2.5-3倍,显著提升大模型训练效率。该架构适用于需要高带宽、低延迟的分布式训练场景,通过计算-存储-网络解耦设计突破传统架构的带宽限制。

文章图片
#网络#架构#php
hicann:昇腾NPU的异构计算网络架构

昇腾hicann架构通过三层网络(HCCS片内互联、RoCE机架互联、RDMA集群互联)解决传统PCIe方案的扩展瓶颈,实现千卡级NPU集群高速通信。其拓扑感知调度技术可自动选择最优路径,分层AllReduce比传统HCCL快2.5-3倍,显著提升大模型训练效率。该架构适用于需要高带宽、低延迟的分布式训练场景,通过计算-存储-网络解耦设计突破传统架构的带宽限制。

文章图片
#网络#架构#php
graph-autofusion:自动算子融合让推理快30%

摘要:深度学习推理中数据搬运成为性能瓶颈,算子融合技术通过合并多个算子减少内存访问次数。昇腾CANN的graph-autofusion引擎自动识别可融合模式(如Conv+BN+ReLU),在编译阶段生成融合核函数,使ResNet-50和BERT推理分别加速30%和25%。实测显示融合后算子数量减少37%,计算密度提升3倍,典型模型加速30-40%。该技术无需修改代码,通过ATC编译自动完成,适用于

文章图片
#opencv#计算机视觉
graph-autofusion:自动算子融合让推理快30%

摘要:深度学习推理中数据搬运成为性能瓶颈,算子融合技术通过合并多个算子减少内存访问次数。昇腾CANN的graph-autofusion引擎自动识别可融合模式(如Conv+BN+ReLU),在编译阶段生成融合核函数,使ResNet-50和BERT推理分别加速30%和25%。实测显示融合后算子数量减少37%,计算密度提升3倍,典型模型加速30-40%。该技术无需修改代码,通过ATC编译自动完成,适用于

文章图片
#opencv#计算机视觉
    共 159 条
  • 1
  • 2
  • 3
  • 16
  • 请选择