logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

python安装annoy

python安装annoydebug解决ERROR: Command errored out with exit status 1:ERROR: annoy-1.17.0-cp39-cp39-win_amd64.whl is not a supported wheel on this platform.

Encoder-Decoder、Seq2Seq、 以及Transformer之间的关系

结论写在前面:Encoder-Decoder 是一种架构,范围非常广泛,只要是用一个编码结构一个解码结构的模型都是Encoder-Decoder 架构seq2seq 和 Encoder-Decoder基本相同,只不过后者是一种抽象概念,前者是具体的模型,seq2seq可以看做是一种结构,有很多这种结构的模型。seq2seq有多种类型,N VS N,N vs 1, 1vs N, N vs M。最后一

#transformer
visual Studio+CUDA+pytorch安装

今天安装了各pytorch,安装到崩溃。人都傻了,好在最后安装应该成功了。整体分三大步第一大步 安装Visual Studio安装CUDA前需要提前更新好显卡驱动,一定要安装Visual Studio。Visual Studio 2015社区版的联网下载([下载链接](https://download.visualstudio.microsoft.com/download/pr/12135679/

#pytorch#自然语言处理
残差连接 (及 梯度消失 网络退化)详解

本文就说说用残差连接解决梯度消失和网络退化的问题。一、背景1)梯度消失问题我们发现很深的网络层,由于参数初始化一般更靠近0,这样在训练的过程中更新浅层网络的参数时,很容易随着网络的深入而导致梯度消失,浅层的参数无法更新。可以看到,假设现在需要更新b1,w2,w3,w4参数因为随机初始化偏向于0,通过链式求导我们会发现,w1w2w3相乘会得到更加接近于0的数,那么所求的这个b1的梯度就接近于0,也就

Encoder-Decoder、Seq2Seq、 以及Transformer之间的关系

结论写在前面:Encoder-Decoder 是一种架构,范围非常广泛,只要是用一个编码结构一个解码结构的模型都是Encoder-Decoder 架构seq2seq 和 Encoder-Decoder基本相同,只不过后者是一种抽象概念,前者是具体的模型,seq2seq可以看做是一种结构,有很多这种结构的模型。seq2seq有多种类型,N VS N,N vs 1, 1vs N, N vs M。最后一

#transformer
这篇transformer,我愿称之为最强!

阅读目录1 模型的思想2 模型的架构3 Embedding3.1 Word Embedding3.2 Positional Embedding4 Encoder4.1 Muti-Head-Attention4.1.1 Self-Attention4.1.2 Add & Norm4.2 Feed-Forward Network5 Decoder5.1 Mask-Multi-Head-Atte

LSTM、Bilstm、ELMo、openAI GPT、Bert模型简介

把我:LSTM 里面:遗忘门f_t,记忆门i_t,输出门o_t输入:上一个细胞隐藏层状态:h_t-1,本时刻输入参数细胞状态:c_t,临时细胞状态bilstm里面:两层LSTM输入和输出信息的关系。一、介绍1.1 文章组织本文简要介绍了BiLSTM的基本原理,并以句子级情感分类任务为例介绍为什么需要使用LSTM或BiLSTM进行建模。在文章的最后,我们给出在PyTorch下BiLSTM的实现代码,

卷积神经网络(CNN)结构详解

一、CNN的基本结构:1.图像就是输入层2.接着是CNN特有的卷积层(convolution),卷积层的自带激活函数使用的是ReLU3.接着是CNN特有的池化层(pooling),4.卷积层+池化层的组合可以在隐藏层中出现很多次。也可以灵活组合,卷积+卷积+池化、卷积+卷积等5.在若干卷积层+池化层之后是全连接层(fully connected layer),其实就是DNN结构,只是输出层使用了S

#深度学习
隐马尔科夫模型(Hidden Markov Model,HMM)

转载:隐马尔科夫模型(Hidden Markov Model,HMM)介绍定义wiki上有定义:隐马尔可夫模型(Hidden Markov Model,HMM)是统计模型,它用来描述一个含有隐含未知参数的马尔可夫过程。其难点是从可观察的参数中确定该过程的隐含参数。然后利用这些参数来作进一步的分析,例如模式识别。马可夫模型的概率这里用x表示状态, y表示观察值假设观察到的结果为 Y:Y=y(0),y

#自然语言处理
python与anaconda安装(先安装了python后安装anaconda,基于python已存在的基础上安装anaconda

原文出处:https://blog.csdn.net/qq_43529415/article/details/100847887目录一、安装python(python3.7.4)1、下载(1)下载1(32位)(2)下载2(64位)2、安装3、配置python环境变量4、检验python二、安装anaconda(anaconda3)1、下载2、安装3、配置环境变量4、检验anaconda三、扩展——

#自然语言处理
    共 14 条
  • 1
  • 2
  • 请选择