logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

自然语言处理(19:(第五章4.)使用LSTM的语言模型)

Time LSTM 层的实现完成了,现在我们来实现正题——语言模型。一、LSTM的语言模型这里实现的语言模型和上一章几乎是一样的,唯一的区别是,上一章使用 Time RNN层的地方这次使用Time LSTM层,如下图所示。由上图可知,这里和上一章实现的语言模型的差别在于使用了 LSTM。我们将上图右图中的神经网络实现为Rnnlm类。Rnnlm类和上一章介绍的SimpleRnnlm类几乎相同,但是增

文章图片
#自然语言处理#lstm#语言模型
自然语言处理(10:改进版word2vec的学习以及总结)

到目前为止,我们进行了word2vec的改进。首先说明了Embedding层,又介绍了负采样的方法,然后对这两者进行了实现。现在我们进一步来实现进行了这些改进的神经网络,并在PTB数据集上进行学习,以获得更加实用的单词的分布式表示。下面开始更加进一步的改进,如果遇到问题,可以问Deepseek,我都觉得有些地方不需要我来解答了,哈哈!当然最重要的,希望能留下各位的三连加关注!!!一、这里的类推问题

文章图片
#自然语言处理#深度学习#神经网络 +2
自然语言处理(25:(终章Attention 1.)Attention的结构​)

上一章我们使用RNN生成了文本,又通过连接两个RNN,将一个时序数据转换为了另一个时序数据。我们将这个网络称为seq2seq,并用它成功求解了简单的加法问题。之后,我们对这个seq2seq进行了几处改进,几乎解决了这个简单的加法问题。本章我们将进一步探索seq2seq的可能性(以及RNN的可能性)。这里,Attention这一强大而优美的技术将登场。Attention毫无疑问是近年来深度学习领域最

文章图片
#自然语言处理#人工智能#语言模型
自然语言处理(13:RNN的实现)

通过之前的探讨,我们已经看到了RNN的全貌。实际上,我们要实现的是一个在水平方向上延伸的神经网络。另外,考虑到基于Truncated BPTT的学习,只需要创建一个在水平方向上长度固定的网络序列即可,来吧,开始实现(迫不及待!!

文章图片
#自然语言处理#rnn#人工智能
自然语言处理(4:word2vec之基于推理的方法和神经网路)

接着上一章,本章的主题仍是单词的分布式表示。在上一章中,我们使用基于计数的方法得到了单词的分布式表示。本章我们将讨论该方法的替代方法,即基于推理的方法。顾名思义,基于推理的方法使用了推理机制。当然,这里的推理机制用的就是“神经网络这次的目标是实现一个简单的word2vec。这个简单的word2vec会优 先考虑易理解性,从而牺牲一定的处理效率。所以,我们不会用它来处理大规模数据集,但用它处理小数据

文章图片
#自然语言处理#人工智能#神经网络 +2
自然语言处理(4:word2vec之基于推理的方法和神经网路)

接着上一章,本章的主题仍是单词的分布式表示。在上一章中,我们使用基于计数的方法得到了单词的分布式表示。本章我们将讨论该方法的替代方法,即基于推理的方法。顾名思义,基于推理的方法使用了推理机制。当然,这里的推理机制用的就是“神经网络这次的目标是实现一个简单的word2vec。这个简单的word2vec会优 先考虑易理解性,从而牺牲一定的处理效率。所以,我们不会用它来处理大规模数据集,但用它处理小数据

文章图片
#自然语言处理#人工智能#神经网络 +2
到底了