
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
常见的三大声学模型 CNN+CTC(端到端)、HMM+GMM(传统) 和 DNN-HMM(深度学习)
HMM+GMM:适合简单的语音识别任务,对计算资源要求低,但性能有限。DNN-HMM:适合大词汇量连续语音识别任务,性能优于HMM+GMM,但需要更多数据和计算资源。CNN+CTC:适合端到端的语音识别任务,性能优异,但对数据和计算资源要求高。根据具体任务和资源情况,可以选择合适的模型。
树莓派架构详解与操作
2.0 GHz 就像厨师每秒炒2盘菜,3.5 GHz 每秒炒3.5盘。数字越大,动作越快。架构(Cortex-A78、A55 这些)——厨师的“段位”拍照识别人脸、语音助手全靠它,虽然不是厨师,但帮忙省时间。数字越小,厨房越先进,发热低、耗电少,手机不烫手。缓存越大,厨师拿调料越快,不用来回跑仓库(内存)。:把设备的画面和声音传到电视、显示器、投影仪。制程(5 nm、7 nm)——厨房干净又省电。
常见的三大声学模型 CNN+CTC(端到端)、HMM+GMM(传统) 和 DNN-HMM(深度学习)
HMM+GMM:适合简单的语音识别任务,对计算资源要求低,但性能有限。DNN-HMM:适合大词汇量连续语音识别任务,性能优于HMM+GMM,但需要更多数据和计算资源。CNN+CTC:适合端到端的语音识别任务,性能优异,但对数据和计算资源要求高。根据具体任务和资源情况,可以选择合适的模型。
到底了







