hxdxiaoming 个人主页

@hxdxiaoming

hxdxiaoming

2024-06-04 15:02:11 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

【动手学深度学习】05 线性代数（个人向笔记）

∣∣a∣∣表示向量 a 的范数，课上没有讲范数的概念其中第一条为求向量的二范数第四条表示如果a为标量，那么向量∣∣a⋅b∣∣的长度等于∣a∣⋅∣∣b∣∣的长度。

#深度学习 #线性代数

【动手学深度学习】6.5 汇聚层（个人向笔记）

本节将介绍汇聚（pooling）层，它具有双重目的：降低卷积层对位置的敏感性，同时降低对空间降采样表示的敏感性。

#深度学习 #人工智能

【王树森】RNN模型与NLP应用(7/9)：机器翻译与Seq2Seq模型（个人向笔记）

而Decoder则是从 \t（起始符）开始对整句德语进行预测，过程和上节课讲到的文本生成器一致，直到遇到终止符 \n。在预测时，我们用LSTM Encoder把go away转化为状态向量指导Decoder进行翻译。最后对Dense作反向传播的时候可以顺着这张图的链路一直传到Encoder和Decoder。

#自然语言处理 #rnn #机器翻译

【动手学深度学习】8.5 循环神经网络从零开始实现

本节将根据 8.4节中的描述，从头开始基于循环神经网络实现字符级语言模型。这样的模型将在H.G.Wells的时光机器数据集上训练。和前面 8.3节中介绍过的一样，我们先读取数据集。

#深度学习

【王树森深度强化学习】基本概念 Deep Reinforcement Learning (1/5)

本文介绍了强化学习的基本概念和关键术语。主要内容包括：1）随机变量及其概率分布；2）专业术语如状态(s)、动作(a)、策略(π)、奖励(R)和状态转移(p)；3）强化学习的两个随机性来源：策略函数和状态转移；4）回报(Ut)和折扣回报的概念，强调未来奖励的价值递减。文章通过游戏示例(如马里奥)阐述了agent与环境的交互过程，包括观测状态、执行动作、获得奖励和状态转移等环节。这些基础概念为理解强化

【数据结构】链表

单链表操作插入：传入表头，待插入的值，插入的位置。其中位置 iii 表示原链表第 i−1i-1i−1 到 iii 之间，也可以理解为新插入的数占据原链表的 iii 位置，然后原 iii 位置及以后要向后移。算法流程： ①判边界：由上定义，边界值 111 表示头节点和第一个节点的中间插入，边界值 Head->data+1 表示在最后一个元素之后插入一个数②表头表示链表大小的数据域Head-&g

#数据结构 #链表 #html

到底了