
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
本文介绍了如何将OCR模型部署到高通跃龙IQ-9075开发板并进行实时推理。主要内容包括:1)通过SCP命令将编译好的QNN模型文件推送到板端;2)使用qnn-net-run工具验证模型在NPU上的正常运行;3)编写完整的Python推理脚本,封装了检测和识别模型调用,实现从摄像头采集到文本识别的端到端流程。脚本采用预处理、NPU推理和后处理流水线设计,并提供了关键性能参数和工程化建议。该方案可直

本文深入探讨了基于高通SEE架构的虚拟传感器开发技术。虚拟传感器通过融合多物理传感器数据,配合AI算法,将原始数据转化为场景语义,实现了从"数据采集"到"场景理解"的跨越。 文章详细介绍了虚拟传感器的核心定义、分类及典型应用场景,并重点阐述了基于SM8550平台的开发流程三部曲:1)定义传感器配置;2)集成数据融合与AI算法;3)封装SEE传感器API。同时
摘要: 本文展示了在Snapdragon X2 Elite NPU上部署Stable Diffusion 3(SD3)的完整流程,重点解析其DiT(Diffusion Transformer)架构优势及性能表现。SD3采用双文本编码器(CLIP-L + T5-XXL)和Transformer加速硬件设计,X2 Elite的Hexagon V77 NPU凭借专用注意力层单元,实现SD3 Medium

本文深入讲解大模型量化的数学原理与NPU性能优化。首先介绍线性量化公式,对比对称/非对称量化方法,分析Per-Tensor/Per-Channel/Per-Group三种粒度。针对QNN量化提出四种方案:基础PTQ量化、增强型PTQ(支持混合精度配置)、混合精度量化(自动敏感度分析)以及量化感知训练(QAT)。通过量化参数优化和NPU架构适配,可解决精度损失、性能瓶颈等问题,为端侧大模型部署提供系

本文介绍了在X2 Elite设备上本地运行Stable Diffusion 1.5模型的实践,实现了2秒生成512×512图片的离线AIGC能力。相比前代X1 Elite,X2 Elite凭借Hexagon V77 NPU(85 TOPS)和228 GB/s内存带宽,性能提升2.25倍。文章对比了SD 1.5(UNet架构)与SD 3(DiT架构)的特性差异,并提供了完整的开发环境配置指南和NPU

本文介绍了在骁龙X2 Elite芯片上实现端到端离线语音助手的全流程技术方案。通过NPU加速,构建包含语音检测(VAD)、语音识别(ASR)、大语言模型(LLM)和语音合成(TTS)的多模型流水线,所有处理均在本地完成。选用Silero VAD(INT8)、Whisper-small(INT8)、Phi-3-mini(INT4)和VITS-Chinese(INT8)等优化模型,采用ONNX Run

高通与Canonical合作推出针对Qualcomm IoT平台的优化Ubuntu系统,为边缘AI提供快速开发环境。该方案支持QCS6490、QCS5430等多款SoC开发套件,具备14 TOPS AI算力,适用于工业4.0、智能零售等场景。系统包含完整的开发工具链,支持主流AI框架转换,并提供企业级安全维护。典型应用包括机器视觉质检、顾客行为分析等边缘AI解决方案。
摘要: 本文详细介绍了在骁龙X2 Elite平台上部署实时目标检测(YOLOv8n)+语义分割模型的完整流程。通过QNN SDK和ONNX Runtime实现NPU加速,支持1080P@30fps输入,端到端延迟<33ms。关键步骤包括:环境配置(QNN EP、OpenCV)、模型导出与INT8量化(静态校准+QNN工具链优化),以及基于多线程的CPU-NPU协同流水线设计(预处理线程池+NPU推

文章摘要 本文介绍了高通跃龙IQ-9100芯片在具身智能机器人中的应用方案。该芯片通过16路ISP接口和100TOPS NPU算力支持多路摄像头感知,采用双Tensor Processor架构实现并行推理,可同时处理6路摄像头输入并达到22fps的检测速度。系统采用分层设计:感知层运行YOLOv8s目标检测模型,理解层部署Llama 2 7B语言模型,决策层通过8核CPU实现实时路径规划,执行层则

Snapdragon X2 Elite NPU开发环境搭建指南 本文详细介绍了高通X2 Elite芯片的AI开发生态系统搭建步骤,重点涵盖: 软件栈架构:展示从应用层到Hexagon NPU的完整技术栈 QNN SDK v3.0新特性:支持INT4量化、模型并行、Transformer加速等 Windows 24H2深度优化:Copilot Runtime 2.0、DirectML 1.14等AI








