logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

为什么语速快了语音识别率会下降?

在语音产品开发中,经常会遇到这样的问题:用户说话语速较快时,语音识别率明显下降,甚至完全无法识别。最近有开发者在技术交流群中反馈:“CI13162 这些的语速快了,识别率不高有办法解决吗?这是一个非常普遍且具有代表性的问题。本文将从语音识别原理出发,系统分析快语速导致识别率下降的根本原因,并提供可行的解决方案和产品建议。当标准模型无法满足需求时,可以考虑定制语音模型训练。快语速导致的语音识别率下降

#语音识别#xcode#人工智能
SmartPi 智能体平台实战:从知识库问答到设备控制的完整闭环

在智能家居和语音交互产品开发中,如何让设备"懂"你的产品?如何让用户通过自然对话完成设备控制?SmartPi 智能体平台提供了一套完整的解决方案——从知识库问答(RAG)到设备控制(MCP),让开发者能够快速打造智能语音交互体验。平台更新说明(2026)智能体平台已升级为统一控制台,支持 API 发布和工作流编排PAT(Personal Access Token)成为推荐鉴权方式MCP 插件支持通

#microsoft
JX-A7T 智能体模组 OTA 在线升级完全指南

在智能硬件产品开发中,固件升级能力是产品生命周期管理的关键环节。传统方式需要拆机连接烧录器,不仅成本高、效率低,对于已经部署到用户手中的设备更是无法维护。用户真实需求(技术交流群反馈):“JX-A7T1 支持手机 OTA 更新语音固件吗?我们需要远程升级功能。JX-A7T 作为新一代离在线语音 AI 大模型模组,内置 WiFi/BLE 模块,天然支持 OTA(Over-The-Air)在线升级功能

#人工智能#语音识别
WS2812灯带语音控制指南:为什么不能直接驱动与替代方案

在智能照明项目开发中,WS2812(及其兼容型号如SK6812、WS2812B等)全彩LED灯带因其单线控制、色彩丰富、价格亲民而广受欢迎。能否直接使用语音模块驱动WS2812灯带?本文基于真实用户案例,深入分析WS2812灯带的技术特性、语音模块的GPIO/PWM输出能力限制,以及几种可行的替代控制方案,帮助开发者在产品设计阶段做出正确的技术选择。SmartPi语音模块无法直接驱动WS2812灯

#语音识别#人工智能
相似命令词误识别问题排查与优化指南

在语音产品开发中,相似命令词的误识别是一个常见的挑战。当两个命令词发音相近时,系统可能无法准确区分,导致用户体验下降。这类问题在量产阶段尤为棘手,往往需要反复调试才能解决。用户真实反馈(技术交流群,2026-02-02):“这种后面带 balls 的容易误识别到 pause。这种能改吗?只要放慢一点语速就会误识别。试产了,客户突然测出这种问题。发音相似的命令词在特定语速下容易混淆。本文将系统性地分

#语音识别#人工智能
CI-03T模块TTS 文本转语音:离线动态语音播报的实现与限制

本文详细解析了CI-03T离线语音模组的TTS功能实现方法。CI-03T支持预定义文本的离线语音播报,可通过串口触发动态变量替换播报,但不支持任意文本实时播报。文章介绍了TTS功能的核心价值、应用场景、平台配置流程、发音人选择、硬件连接方式及常见问题解决方案,重点强调了该模组的限制条件:所有播报内容需预编译,变量播报需提前定义,且TTS功能会占用Flash空间。开发者需合理规划声学模型与TTS资源

#ci/cd
蓝牙广播5分钟后隐藏功能:鸿蒙与安卓手机差异排查指南

设备上电后开启蓝牙配对窗口,一段时间后自动隐藏,以平衡用户体验和安全性/功耗。近期一个案例引发了新的技术问题:厂商实现了"5分钟后隐藏广播"功能,但测试发现纯血鸿蒙手机始终能搜到设备,而安卓手机5分钟后正确隐藏。本文将深入分析蓝牙广播隐藏机制的工作原理、鸿蒙与安卓系统的差异、以及针对这种"反向兼容性"问题的解决方案。固件优先:确保设备真正停止所有广播,不依赖系统清理状态标识:通过广播名称变化明确标

#harmonyos#android
蓝牙广播5分钟后隐藏功能:鸿蒙与安卓手机差异排查指南

设备上电后开启蓝牙配对窗口,一段时间后自动隐藏,以平衡用户体验和安全性/功耗。近期一个案例引发了新的技术问题:厂商实现了"5分钟后隐藏广播"功能,但测试发现纯血鸿蒙手机始终能搜到设备,而安卓手机5分钟后正确隐藏。本文将深入分析蓝牙广播隐藏机制的工作原理、鸿蒙与安卓系统的差异、以及针对这种"反向兼容性"问题的解决方案。固件优先:确保设备真正停止所有广播,不依赖系统清理状态标识:通过广播名称变化明确标

#harmonyos#android
CI-03T模块TTS 文本转语音:离线动态语音播报的实现与限制

本文详细解析了CI-03T离线语音模组的TTS功能实现方法。CI-03T支持预定义文本的离线语音播报,可通过串口触发动态变量替换播报,但不支持任意文本实时播报。文章介绍了TTS功能的核心价值、应用场景、平台配置流程、发音人选择、硬件连接方式及常见问题解决方案,重点强调了该模组的限制条件:所有播报内容需预编译,变量播报需提前定义,且TTS功能会占用Flash空间。开发者需合理规划声学模型与TTS资源

#ci/cd
SmartPi 固件高级功能完全指南:从自然说到声纹识别的深度解析

在智能语音产品开发过程中,开发者往往能够快速掌握基础的唤醒词和命令词配置,但 SmartPi 平台提供的许多高级功能却经常被忽视或误解。这些高级功能包括自然说、声纹识别、声源定位、AEC 打断等,它们能够显著提升产品的识别准确率和用户体验。本文将系统性地介绍 SmartPi 平台固件配置中的各项高级功能,帮助开发者从基础配置进阶到高级应用,打造更专业、更智能的语音交互产品。SmartPi 平台提供

#c语言#语音识别
    共 19 条
  • 1
  • 2
  • 请选择