
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
【动手学深度学习】05 线性代数(个人向笔记)
∣∣a∣∣表示向量 a 的范数,课上没有讲范数的概念其中第一条为求向量的二范数第四条表示如果a为标量,那么向量∣∣a⋅b∣∣的长度等于∣a∣⋅∣∣b∣∣的长度。

【动手学深度学习】6.5 汇聚层(个人向笔记)
本节将介绍汇聚(pooling)层,它具有双重目的:降低卷积层对位置的敏感性,同时降低对空间降采样表示的敏感性。

【王树森】RNN模型与NLP应用(7/9):机器翻译与Seq2Seq模型(个人向笔记)
而Decoder则是从 \t(起始符)开始对整句德语进行预测,过程和上节课讲到的文本生成器一致,直到遇到终止符 \n。在预测时,我们用LSTM Encoder把go away转化为状态向量指导Decoder进行翻译。最后对Dense作反向传播的时候可以顺着这张图的链路一直传到Encoder和Decoder。

【动手学深度学习】8.5 循环神经网络从零开始实现
本节将根据 8.4节中的描述, 从头开始基于循环神经网络实现字符级语言模型。 这样的模型将在H.G.Wells的时光机器数据集上训练。 和前面 8.3节中介绍过的一样, 我们先读取数据集。

【王树森深度强化学习】基本概念 Deep Reinforcement Learning (1/5)
本文介绍了强化学习的基本概念和关键术语。主要内容包括:1)随机变量及其概率分布;2)专业术语如状态(s)、动作(a)、策略(π)、奖励(R)和状态转移(p);3)强化学习的两个随机性来源:策略函数和状态转移;4)回报(Ut)和折扣回报的概念,强调未来奖励的价值递减。文章通过游戏示例(如马里奥)阐述了agent与环境的交互过程,包括观测状态、执行动作、获得奖励和状态转移等环节。这些基础概念为理解强化

到底了








