L01_机器学习基本概念（李宏毅机器学习_学习笔记）

文章目录什么是机器学习不同类别的函数(Function)1. 回归(Regression)2. 分类3. 结构化学习如何找到想要的函数(Function)1.建立一个含有位置参数的函数2.定义损失函数3.最优化(Optimization)模型的变形：Sigmoid→ReLUSigmoid\to ReLUSigmoid→ReLU总结什么是机器学习让机器具有寻找一个函数(Function)的功能不同类

cporin

1361人浏览 · 2022-03-24 09:51:01

cporin · 2022-03-24 09:51:01 发布

文章目录

什么是机器学习

让机器具有寻找一个函数(Function)的功能

不同类别的函数(Function)

1. 回归(Regression)

函数输出一个标量

2. 分类

给出不同的选项，函数输出正确的那一个。

3. 结构化学习

产生一个有结构的物件，比如画一张图，写一篇文章。

如何找到想要的函数(Function)

1.建立一个含有位置参数的函数

我们可以使用线性的函数进行训练，但是使用线性模型太过简单，无法很好的模拟出现实的情况，我们需要更加复杂的模型我们可以使用***constant + sum of a set of Sigmoid Function***逼近不同的曲线

Sigmoid Function(S型曲线)：
$c\dfrac{1}{1+e^{-(b+wx_{1})}}\\ = c\cdot sigmoid(b+wx_{1})$
不同参数的影响如下图所示:
请添加图片描述

所以我们可以进一步写出新的Model：
$y=b+\sum_{i}c_{i}\cdot sigmoid(b_{i}+w_{i}x_{1})$
如果我们利用多个已知的数据(features)进行预测，则有：
$y=b+\sum_{i}c_{i}\cdot sigmoid(b_{i}+\sum_{j} w_{ij}x_{j})$
其中， $j$ 是 $f e a t u r e s$ 的编号， $i$ 是 $s i g m o i d$ 的编号。

使用线性代数的知识对式子进行化简可以得到：
请添加图片描述

可以将所有的未知参数构成一个向量 $\theta$ ：
请添加图片描述

2.定义损失函数

损失函数是所有参数的函数 $L(\mathbf{\theta})$ ，表示使用一组参数建立起的模型的好坏。
$e=\hat{y}-y \\ Loss:\quad \frac{1}{N}\sum_{n}e_{n}$

3.最优化(Optimization)

找一组最优的参数 $\theta^{*}=arg\quad \mathop{min}\limits_{\theta}L$

使用梯度下降(Gradient Descent)

随机选取一个初始值 $\mathbf{\theta^{0}}$
计算梯度 $\mathbf{g}=\nabla L(\mathbf{\theta^{0}})$

接着计算

$\mathbf{\theta^{1}}\gets \mathbf{\theta^{0}} - \eta\mathbf{g}$

$\mathbf{\theta^{2}}\gets \mathbf{\theta^{1}} - \eta\mathbf{g}$

$\cdots\cdots$
迭代更新 $\mathbf{\theta}$ 的值