logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

如何理解LSTM的输入输出格式

1. 定义LSTM结构bilstm = nn.LSTM(input_size=10, hidden_size=20, num_layers=2, bidirectional=True)定义一个两层双向的LSTM,input size为10,hidden size为20。注:定义过LSTM的结构后,同一个程序下面的input_size,hidden_size,num_layers应该与这里的...

FaceBook-NLP工具Fairseq

1. 简介作为一个通用的序列建模工具,fairseq可以在多个自然语言处理任务上使用,如机器翻译、自动摘要、语音识别等文本生成任务,或者BERT、GPT等语言模型的训练;同时fairseq还实现了目前常用的多数模型,如RNN、CNN、Transformer、RoBERTa、XLM等。除了大量内置的任务和模型,fairseq还提供了极为简洁的接口,以便于使用者扩展已有模型、验证新的想法。开源代码:h

#自然语言处理#机器翻译#深度学习
论文阅读笔记——FastCorrect2

1. 引述考虑到语音识别模型往往可以给出多个备选识别结果,研究员们还进一步提出了 FastCorrect 2 来利用这些识别结果相互印证,从而得到了更好的性能。FastCorrect 1和2的相关研究论文已被 NeurIPS 2021 和 EMNLP 2021 收录。当前,研究员们还在研发 FastCorrect 3,在保证低延迟的情况下,进一步降低语音识别的错误率。2. 存在的问题由于语音识别模

#自然语言处理
如何将.csv文件数据直接读取为numpy array型数据(np.genfromtxt()函数)

1. 函数简介(1)完整形式numpy.genfromtxt(fname, dtype=<type 'float'>, comments='#', delimiter=None, skip_header=0, skip_footer=0, converters=None, missing_values=None, filling_values=None, usecols=None, n

linux下文件编码格式转换方法

1. 使用iconv进行转换将使用gb18030编码的文件file1.txt转换为utf-8编码的文件file2.txt:iconv -f gb18030 -t utf-8 file1.txt -o file2.txt但是这个命令不好使,一方面容易重复转换,另一方面不支持通配符,无法成批转换,还有如果转换出错就会停止转换。可以加上-c来忽视非法字符:iconv -c -f gb18030 -t u

#linux
暂无文章信息