
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
若需专用模型(如“变压器缺陷检测”),可通过// 加载自定义 .om 模型deviceId: 'npu' // 指定 NPU 执行});⚠️ 需提前将.om模型放入目录,并通过ATC 工具转换。通过本文,你已掌握:✅封装 OpenHarmony AI Kit 为 Flutter 插件✅实现人脸、物体、OCR 三大端侧 AI 能力✅构建无网可用的工业巡检 App✅保障数据不出设备,满足信创合规要求?

本文介绍了一个基于OpenHarmony分布式硬件虚拟化技术和Flutter跨平台UI的环境监测系统。系统通过DeviceManager和HardwareResourceManager实现远程设备传感器数据的统一访问,使应用能够像调用本地传感器一样使用分布式硬件资源。架构设计包含Flutter UI层、原生插件层和分布式硬件管理层,支持多设备协同工作,当远程节点不可用时自动降级为本地采集。文章详细

摘要: 本文介绍如何通过鸿蒙OS的Web组件与ArkTS桥接技术,构建类似Electron的混合应用(暂称“鸿蒙Electron”)。开发者只需5分钟即可完成: 在rawfile目录放置Web页面(HTML/JS/CSS) 通过ArkTS的Web组件加载本地页面 使用registerJavaScriptProxy实现Web与原生能力交互(如获取设备信息、文件操作) 最终生成轻量、安全的离线应用。文

本文介绍了昇腾CANN生态中的asnumpy库如何通过猴子补丁技术实现NumPy代码向NPU的无缝迁移。该库采用两层架构:模块替换实现透明接管NumPy调用,算子路由将API映射到CANN算子执行。通过惰性拷贝和写时复制策略优化数据搬运,显著减少PCIe传输开销。实战案例展示了一个语音信号处理流程,从原始信号到MFCC特征提取的全过程加速,处理时间从CPU的45分钟缩短至8分钟。asnumpy让现

本文介绍了昇腾CANN生态中的asnumpy库如何通过猴子补丁技术实现NumPy代码向NPU的无缝迁移。该库采用两层架构:模块替换实现透明接管NumPy调用,算子路由将API映射到CANN算子执行。通过惰性拷贝和写时复制策略优化数据搬运,显著减少PCIe传输开销。实战案例展示了一个语音信号处理流程,从原始信号到MFCC特征提取的全过程加速,处理时间从CPU的45分钟缩短至8分钟。asnumpy让现

昇腾hicann架构通过三层网络(HCCS片内互联、RoCE机架互联、RDMA集群互联)解决传统PCIe方案的扩展瓶颈,实现千卡级NPU集群高速通信。其拓扑感知调度技术可自动选择最优路径,分层AllReduce比传统HCCL快2.5-3倍,显著提升大模型训练效率。该架构适用于需要高带宽、低延迟的分布式训练场景,通过计算-存储-网络解耦设计突破传统架构的带宽限制。

昇腾hicann架构通过三层网络(HCCS片内互联、RoCE机架互联、RDMA集群互联)解决传统PCIe方案的扩展瓶颈,实现千卡级NPU集群高速通信。其拓扑感知调度技术可自动选择最优路径,分层AllReduce比传统HCCL快2.5-3倍,显著提升大模型训练效率。该架构适用于需要高带宽、低延迟的分布式训练场景,通过计算-存储-网络解耦设计突破传统架构的带宽限制。

昇腾hicann架构通过三层网络(HCCS片内互联、RoCE机架互联、RDMA集群互联)解决传统PCIe方案的扩展瓶颈,实现千卡级NPU集群高速通信。其拓扑感知调度技术可自动选择最优路径,分层AllReduce比传统HCCL快2.5-3倍,显著提升大模型训练效率。该架构适用于需要高带宽、低延迟的分布式训练场景,通过计算-存储-网络解耦设计突破传统架构的带宽限制。

摘要:深度学习推理中数据搬运成为性能瓶颈,算子融合技术通过合并多个算子减少内存访问次数。昇腾CANN的graph-autofusion引擎自动识别可融合模式(如Conv+BN+ReLU),在编译阶段生成融合核函数,使ResNet-50和BERT推理分别加速30%和25%。实测显示融合后算子数量减少37%,计算密度提升3倍,典型模型加速30-40%。该技术无需修改代码,通过ATC编译自动完成,适用于

摘要:深度学习推理中数据搬运成为性能瓶颈,算子融合技术通过合并多个算子减少内存访问次数。昇腾CANN的graph-autofusion引擎自动识别可融合模式(如Conv+BN+ReLU),在编译阶段生成融合核函数,使ResNet-50和BERT推理分别加速30%和25%。实测显示融合后算子数量减少37%,计算密度提升3倍,典型模型加速30-40%。该技术无需修改代码,通过ATC编译自动完成,适用于








