logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

CTC在语音识别上的应用,loss为nan的处理

ctc在pytorch1.2以上的版本中有集成好的是实现。torch.nn.functional.ctc_loss原理不再介绍,有很多开源的实现。主要说一下自己遇到的问题。在语音上应用时,会遇到loss为nan的情况,如果代码在交叉熵损失或者其他损失的情况下可以正常跑,说明数据没问题。主要原因出在对齐上。在一个batch中一条发音可能比较短,对应的目标文本也比较短,ctc就无法对齐,就会出现los

#python
pytorch的spectral_norm的使用

利用pytorch自带的频谱归一化函数,给设定好的网络进行频谱归一化。主要用于生成对抗网络的鉴别器,效果还是很明显的。import torchimport torch.nn as nnclass TestModule(nn.Module):def __init__(self):super(TestModule,self).__init__()self.layer1 = nn.Conv2d(16,3

#python#人工智能
到底了