
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
自然语言处理之语音识别(2)
上一节介绍的是LAS模型,标准的seq2seq model,因为decoder每一步其实考虑的是全部的encoder的输出,所以没办法做到online的输出。因此今天看的模型都是为了做online产生的。先上一张李宏毅老师的模型总结图:从上到下,从左到右其实是可以发现模型发展的一些规律的。1. 语音的特点:因为语音的输入vector个数很多,但不一定每一个都会产生输出,所以采用的方法有:1)在vo
自然语言处理之语音识别(2)
上一节介绍的是LAS模型,标准的seq2seq model,因为decoder每一步其实考虑的是全部的encoder的输出,所以没办法做到online的输出。因此今天看的模型都是为了做online产生的。先上一张李宏毅老师的模型总结图:从上到下,从左到右其实是可以发现模型发展的一些规律的。1. 语音的特点:因为语音的输入vector个数很多,但不一定每一个都会产生输出,所以采用的方法有:1)在vo
使用GPU运行代码巨慢,或许是tqdm的锅
现象:我在跑transformer模型的时候,模型跑的很慢,而且可能第一次运行能跑一个batch然后卡了。第二次运行连第一个batch都没跑就卡了。尝试过程:看了模型和参数都是在GPU上,而且使用 top 命令也不是因为CPU占满。结果:发现罪魁祸首竟然是tqdm:换成模型就开始在GPU上欢快的运行起来啦...

到底了








