咖乐布小部个人主页

@weixin_42253689

咖乐布小部

2022-10-18 11:10:06 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

python安装annoy

python安装annoydebug解决ERROR: Command errored out with exit status 1:ERROR: annoy-1.17.0-cp39-cp39-win_amd64.whl is not a supported wheel on this platform.

Encoder-Decoder、Seq2Seq、以及Transformer之间的关系

结论写在前面：Encoder-Decoder 是一种架构，范围非常广泛，只要是用一个编码结构一个解码结构的模型都是Encoder-Decoder 架构seq2seq 和 Encoder-Decoder基本相同，只不过后者是一种抽象概念，前者是具体的模型，seq2seq可以看做是一种结构，有很多这种结构的模型。seq2seq有多种类型，N VS N，N vs 1, 1vs N, N vs M。最后一

#transformer

visual Studio+CUDA+pytorch安装

今天安装了各pytorch，安装到崩溃。人都傻了，好在最后安装应该成功了。整体分三大步第一大步安装Visual Studio安装CUDA前需要提前更新好显卡驱动，一定要安装Visual Studio。Visual Studio 2015社区版的联网下载（[下载链接](https://download.visualstudio.microsoft.com/download/pr/12135679/

#pytorch #自然语言处理

残差连接（及梯度消失网络退化）详解

本文就说说用残差连接解决梯度消失和网络退化的问题。一、背景1）梯度消失问题我们发现很深的网络层，由于参数初始化一般更靠近0，这样在训练的过程中更新浅层网络的参数时，很容易随着网络的深入而导致梯度消失，浅层的参数无法更新。可以看到，假设现在需要更新b1，w2,w3,w4参数因为随机初始化偏向于0，通过链式求导我们会发现，w1w2w3相乘会得到更加接近于0的数，那么所求的这个b1的梯度就接近于0，也就

LSTM、Bilstm、ELMo、openAI GPT、Bert模型简介

把我：LSTM 里面：遗忘门f_t，记忆门i_t，输出门o_t输入：上一个细胞隐藏层状态：h_t-1，本时刻输入参数细胞状态：c_t，临时细胞状态bilstm里面：两层LSTM输入和输出信息的关系。一、介绍1.1 文章组织本文简要介绍了BiLSTM的基本原理，并以句子级情感分类任务为例介绍为什么需要使用LSTM或BiLSTM进行建模。在文章的最后，我们给出在PyTorch下BiLSTM的实现代码，

卷积神经网络（CNN）结构详解

一、CNN的基本结构：1.图像就是输入层2.接着是CNN特有的卷积层（convolution），卷积层的自带激活函数使用的是ReLU3.接着是CNN特有的池化层（pooling），4.卷积层+池化层的组合可以在隐藏层中出现很多次。也可以灵活组合，卷积+卷积+池化、卷积+卷积等5.在若干卷积层+池化层之后是全连接层（fully connected layer），其实就是DNN结构，只是输出层使用了S

#深度学习

隐马尔科夫模型（Hidden Markov Model，HMM）

转载：隐马尔科夫模型（Hidden Markov Model，HMM）介绍定义wiki上有定义：隐马尔可夫模型（Hidden Markov Model，HMM）是统计模型，它用来描述一个含有隐含未知参数的马尔可夫过程。其难点是从可观察的参数中确定该过程的隐含参数。然后利用这些参数来作进一步的分析，例如模式识别。马可夫模型的概率这里用x表示状态， y表示观察值假设观察到的结果为 Y:Y=y(0),y

#自然语言处理

python与anaconda安装（先安装了python后安装anaconda，基于python已存在的基础上安装anaconda

原文出处：https://blog.csdn.net/qq_43529415/article/details/100847887目录一、安装python（python3.7.4）1、下载(1)下载1(32位)(2)下载2(64位)2、安装3、配置python环境变量4、检验python二、安装anaconda（anaconda3）1、下载2、安装3、配置环境变量4、检验anaconda三、扩展——

#自然语言处理

LSTM、Bilstm、ELMo、openAI GPT、Bert模型简介

卷积神经网络（CNN）结构详解

#深度学习

共 12 条

请选择