logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

鸿蒙 Flutter 语音交互进阶:TTS/STT 全离线部署与多语言适配

本文介绍了在鸿蒙(HarmonyOS)与Flutter混合开发中实现全离线语音交互(TTS/STT)的完整方案。通过整合鸿蒙原生TTS引擎和PocketSphinx开源STT引擎,结合Flutter跨平台特性,构建了支持多语言的离线语音交互系统。文章详细阐述了环境搭建、通信架构设计、核心功能实现(包括TTS语音合成和STT语音识别)、多语言适配方案以及性能优化策略,并提供了可复用的代码示例和常见问

文章图片
#flutter#交互#百度 +4
Ascend C 中级认证核心考点拆解 + 算子开发源码详解(附性能优化工具包)

本文全面解析AscendC中级认证核心考点与算子开发实战技巧。内容涵盖四大模块:算子开发基础(40%权重)、性能优化(35%)、复杂场景开发(15%)和异构架构理解(10%)。重点包括:1)提供Erf和LogsoftmaxV2等完整算子源码;2)详解并行调度、内存复用、向量指令三大性能优化技巧,实测性能提升4倍;3)结合智能驾驶案例展示复杂场景开发流程;4)配套性能分析工具和问题排查指南。通过系统

文章图片
#c语言#性能优化#开发语言
昇腾训练加速的 10 个技巧

摘要:本文介绍了将PyTorch模型导出为ONNX并编译为昇腾NPU模型时常见的算子不兼容问题及解决方案。主要内容包括:1) 分析昇腾不支持的ONNX算子类型(稀疏算子、动态索引算子等)及替代方案;2) 提供算子替换的两种方式(导出前替换和修改ONNX图);3) 针对NMS算子的特殊处理方案;4) 动态shape模型的导出注意事项;5) 详细的排查流程。文章强调优先使用标准算子数学等价替换,并提供

文章图片
#python#分布式#分类 +2
昇腾训练加速的 10 个技巧

摘要:本文介绍了将PyTorch模型导出为ONNX并编译为昇腾NPU模型时常见的算子不兼容问题及解决方案。主要内容包括:1) 分析昇腾不支持的ONNX算子类型(稀疏算子、动态索引算子等)及替代方案;2) 提供算子替换的两种方式(导出前替换和修改ONNX图);3) 针对NMS算子的特殊处理方案;4) 动态shape模型的导出注意事项;5) 详细的排查流程。文章强调优先使用标准算子数学等价替换,并提供

文章图片
#python#分布式#分类 +2
昇腾训练加速的 10 个技巧

摘要:本文介绍了将PyTorch模型导出为ONNX并编译为昇腾NPU模型时常见的算子不兼容问题及解决方案。主要内容包括:1) 分析昇腾不支持的ONNX算子类型(稀疏算子、动态索引算子等)及替代方案;2) 提供算子替换的两种方式(导出前替换和修改ONNX图);3) 针对NMS算子的特殊处理方案;4) 动态shape模型的导出注意事项;5) 详细的排查流程。文章强调优先使用标准算子数学等价替换,并提供

文章图片
#python#分布式#分类 +2
ONNX 模型迁移到昇腾:算子不兼容怎么办

摘要:本文介绍了将PyTorch模型导出为ONNX并编译为昇腾NPU模型时常见的算子不兼容问题及解决方案。主要内容包括:1) 分析昇腾不支持的ONNX算子类型(稀疏算子、动态索引算子等)及替代方案;2) 提供算子替换的两种方式(导出前替换和修改ONNX图);3) 针对NMS算子的特殊处理方案;4) 动态shape模型的导出注意事项;5) 详细的排查流程。文章强调优先使用标准算子数学等价替换,并提供

文章图片
#python#分布式#分类 +2
ONNX 模型迁移到昇腾:算子不兼容怎么办

摘要:本文介绍了将PyTorch模型导出为ONNX并编译为昇腾NPU模型时常见的算子不兼容问题及解决方案。主要内容包括:1) 分析昇腾不支持的ONNX算子类型(稀疏算子、动态索引算子等)及替代方案;2) 提供算子替换的两种方式(导出前替换和修改ONNX图);3) 针对NMS算子的特殊处理方案;4) 动态shape模型的导出注意事项;5) 详细的排查流程。文章强调优先使用标准算子数学等价替换,并提供

文章图片
#python#分布式#分类 +2
ONNX 模型迁移到昇腾:算子不兼容怎么办

摘要:本文介绍了将PyTorch模型导出为ONNX并编译为昇腾NPU模型时常见的算子不兼容问题及解决方案。主要内容包括:1) 分析昇腾不支持的ONNX算子类型(稀疏算子、动态索引算子等)及替代方案;2) 提供算子替换的两种方式(导出前替换和修改ONNX图);3) 针对NMS算子的特殊处理方案;4) 动态shape模型的导出注意事项;5) 详细的排查流程。文章强调优先使用标准算子数学等价替换,并提供

文章图片
#python#分布式#分类 +2
多模态模型在昇腾上的部署架构

本文介绍了在昇腾910上部署多模态模型的架构设计。多模态模型包含视觉编码器、文本编码器/融合层和语言模型三个子网络,其中语言模型占95%的计算量和显存。作者提出三阶段流水线架构,将三个子网络拆分为独立的.om文件,通过HBM内存共享传递中间结果,避免显存浪费并支持独立扩展。实现上采用动态批处理策略,用异步队列解耦编码和生成阶段,生成阶段统一批处理以提高利用率。测试数据显示,双卡TP+PagedAt

文章图片
#架构#transformer#深度学习 +3
多模态模型在昇腾上的部署架构

本文介绍了在昇腾910上部署多模态模型的架构设计。多模态模型包含视觉编码器、文本编码器/融合层和语言模型三个子网络,其中语言模型占95%的计算量和显存。作者提出三阶段流水线架构,将三个子网络拆分为独立的.om文件,通过HBM内存共享传递中间结果,避免显存浪费并支持独立扩展。实现上采用动态批处理策略,用异步队列解耦编码和生成阶段,生成阶段统一批处理以提高利用率。测试数据显示,双卡TP+PagedAt

文章图片
#架构#transformer#深度学习 +3
    共 119 条
  • 1
  • 2
  • 3
  • 12
  • 请选择