logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

RNN LSTM GRU Attention transformer公式整理总结(超详细图文公式)

整理各种模型的公式,以后面试复习用RNN公式:ht=f(W⋅[ht−1,xt]+b)h_{t}=f\left(W \cdot\left[h_{t-1}, x_{t}\right]+b\right)ht​=f(W⋅[ht−1​,xt​]+b)LSTM公式:遗忘门:ft=σ(Wf⋅[ht−1,xt]+bf)f_{t}=\sigma\left(W_{f} \cdot\left[h_{t-1}, x_{t

文章图片
#深度学习#rnn#lstm +2
矩阵范数与向量范数的公式及其理解

矩阵是什么?我们都知道映射指的是一个空间 Rm\mathbb{R}^mRm到另一个空间 Rn\mathbb{R}^nRn的变换关系,狭义的函数其实是映射的一种特例,特指实数集间 R1\mathbb{R}^1R1的映射关系。在所有映射中,我们最常见的是线性映射,对这种线性映射关系,我们是用矩阵来刻画,比如我们要将一个向量x∈Rmx \in \mathbb{R}^mx∈Rm映射到另外一个空间Rn\..

#线性代数#矩阵#机器学习 +1
机器翻译书籍、教材推荐 ——《机器翻译:基础与模型》肖桐 朱靖波 著

推荐一本来自东北大学自然语言处理实验室 · 小牛翻译的肖桐 (Tong Xiao) 朱靖波 (Jingbo Zhu)撰写的《机器翻译:统计建模与深度学习方法》,这是一个教程,目的是对机器翻译的统计建模和深度学习方法进行较为系统的介绍,对NLP感兴趣的墙裂推荐阅读。书共分为七个章节,章节的顺序参考了机器翻译技术发展的时间脉络,同时兼顾了机器翻译知识体系的内在逻辑。各章节的主要内容包括:第一章:机器翻

#机器翻译#nlp#深度学习 +1
Python Poetry管理包安装速度慢的解决办法

由于Poetry是依靠pip来进行安装的,所以我们可以通过更改pip镜像源来加快速度,但是Poetry没有提供临时更换镜像源的接口,所以我们只能修改pip镜像源配置文件(永久修改,恢复默认删除内容即可)。相关文章:pip临时更换镜像源 https://blog.csdn.net/MoreAction_/article/details/105894344镜像源清华:https://pypi.tuna

#pip#python#linux
带你深入理解期望、方差、协方差的含义

基本概念为了能够更深刻的理解,这里先梳理一下概率论中的几个基本概念。事件事件指某种(或某些)情况的“陈述”,通俗来讲,事件就是一些case,比如A事件定义为,掷出偶数点=(2,4,6),这个case包含了多个结果,其中,每个结果叫做一个基本事件,一个事件是由若干基本事件构成的。由此可见,事件的本质是 集合。有了事件,自然就有事件之间的关系,因为事件的本质是集合,所以我们可以用集合的运算符号来表达事

#概率论#线性代数#深度学习 +1
详解岭回归与L2正则化

最小二乘法存在不可逆和病态问题,导致解析解不可计算或不稳定,岭回归是一种有效的解决方法,以损失无偏性来换取稳定解, 本文介绍详细介绍了岭回归的基本原理,并从L2正则化角度来进行了解释。

#回归#线性代数#矩阵 +2
最小二乘法的原理理解

在上文一文让你彻底搞懂最小二乘法(超详细推导)中我们提到过,发明最小二乘法的勒让德认为,让误差的平方和最小估计出来的模型是最接近真实情形的(误差=真实值-理论值)。换句话说,勒让德认为最佳的拟合准则是使 yiy_{i}yi​与 f(xi)f(x_{i})f(xi​)的距离的平方和最小,即:L=∑i=1n(yi−f(xi))2L=\sum_{i=1}^{n}(y_{i}-f(x_i))^{2}L=i

#深度学习#最小二乘法#机器学习
    共 22 条
  • 1
  • 2
  • 3
  • 请选择