logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Qt中实现高准确率的语音识别

将vosk_api.h和vosk库文件添加到项目中,并在CMakeLists.txt中配置vosk库路径。PaddleSpeech:PaddleSpeech是百度的开源语音识别工具,准确率较高,但需要稍微多一点的配置。本示例将使用 Vosk,它支持多平台,且易于集成到C++项目中,满足离线使用、90%以上准确率、开源等要求。Vosk:Vosk是一个开源的语音识别工具,支持中英文及多种语言,具备离线

文章图片
#qt#语音识别#开发语言
VibeVoice 0.5B 本地部署与全链路应用技术解析

本文介绍了微软VibeVoice 0.5B轻量级实时语音合成模型的完整部署方案。该模型采用自回归与扩散混合架构,在仅0.5B参数下实现高质量实时语音生成,支持200+说话人风格迁移。文章详细阐述了技术架构、环境配置、模型优化和推理实现,包括: 混合架构设计:AR模型生成粗略频谱,Diffusion模型精细处理 部署指南:提供从基础环境搭建到模型量化的完整流程 高性能推理引擎:实现16ms级延迟的流

关于DEM土方量算的计算方法

关于DEM土方量算的计算方法最近在写一个关于dem土方计算的功能,网上搜索了下,普遍提到的都是三角网和矩形格网形式进行计算,然后又研究了下arcgis软件的结果,最后发现arcgis中使用的也是格网形式进行了矩形立方计算。于是开始动手编写代码段,其实实现的代码相当简单最后测试结果与arcgis中结果一致,下面是实现的核心函数代码:double caculateElevation(DEMHEADER

#编程语言
Qt中实现高准确率的语音识别

将vosk_api.h和vosk库文件添加到项目中,并在CMakeLists.txt中配置vosk库路径。PaddleSpeech:PaddleSpeech是百度的开源语音识别工具,准确率较高,但需要稍微多一点的配置。本示例将使用 Vosk,它支持多平台,且易于集成到C++项目中,满足离线使用、90%以上准确率、开源等要求。Vosk:Vosk是一个开源的语音识别工具,支持中英文及多种语言,具备离线

文章图片
#qt#语音识别#开发语言
wine 麒麟系统运行Windows编译的exe

国产化的进程加快,国产系统的转换的步伐也在加快,如何能更快更便捷的在国产系统重运行Windows编译程序也是一个困难的问题。本文简单讲解了如何在麒麟系统重借助wine运行Windows的程序,进一步简化代码转换的难度

文章图片
#windows
到底了