神经网络基础－感知机

1. 人工神经元如图1是大脑神经元（左）和人工神经元（右），人工神经元是大脑神经元抽象出来的数学模型，被称为M-P模型。树突相当于人工神经元的输入（Inputs），细胞核是人工神经元的operation区域（包含由weights得到的sum求和、threshold非线性判断段处理），轴突末梢是人工神经元的输出（Output）。图1 人类神经元与人工神经元2. 人工神经网络人工神经网络是大量神经

贪心西瓜

2616人浏览 · 2021-11-25 22:32:07

贪心西瓜 · 2021-11-25 22:32:07 发布

1. 人工神经元

如图1是大脑神经元（左）和人工神经元（右），人工神经元是大脑神经元抽象出来的数学模型，被称为M-P模型。

树突相当于人工神经元的输入（Inputs），细胞核是人工神经元的operation区域（包含由weights得到的sum求和、threshold非线性判断段处理），轴突末梢是人工神经元的输出（Output）。

图1 人类神经元与人工神经元

2. 人工神经网络

人工神经网络是大量神经元以某种连接方式构成的机器学习模型。

人工神经网络的种类繁多

图2 人工神经网络的种类

3 感知机

感知机（Perceptron）是人工神经网络中最简单的一类，也称单层神经网络。

图3 感知机原理

感知机与M-P模型相似，二者包含Input和Output，感知机的计算过程相当于M-P模型的operatron部分，由一个线性变换<w,x>+b 和一个非线性函数 $\sigma ()$ 组成。Perceptron模型改进之处在于，引入了输入和输出层的概念，也就是Input layer 和Output layer。

首先，线性变化部分，<w,x>表示权重矩阵w 与输入矩阵x 的乘法，b是偏置项。<w,x>+b可以理解为b的权重是1，x1*w1 + x2*w2 + ...... + xn*wn + 1*b，计算图表示为：

图4 感知机线性变换的理解

然后，将线性变换的结果放入非线性函数 $\sigma ()$ ，这里称为激活函数。得到最终的output。

4 感知机的缺点

x1*w1 + x2*w2 + ...... + xn*wn + 1*b 是线性变换。

为了容易可视化，以二维变量为例，x1和x2是输入变量，计算 sum=x1*w1 + x2*w2 + b ，根据 $\sigma ()$ 非线性函数，如果sum>0，output=1，否则output=0。

实际上，以x1和x2为坐标，在二维平面画图，x1*w1 + x2*w2 + b是一条直线，x1*w1 + x2*w2 + b>0时，output=1；另一侧x1*w1 + x2*w2 + b<=0，output=0。

二位平面被一条直线分割，直线的两侧是分类预测的结果。

图5 感知机模型二分类原理（引自《统计学习方法》）

那么，为什么不能解决异或问题呢？

首先明确分类结果由一条直线分割。

假设输入变量 x1 和 x2 的取值范围都是{ 0 ，1} ，0是假，1是真。

坐标轴为x1、x2，圈和三角形代表由逻辑运算得到的不同类型的真实值。

我们的目标是，用x1*w1 + x2*w2 + b这条直线，把不同类型的真实值分开。

逻辑变量的与非、异或问题可以表示

图 6 异或问题分类结果

可见，逻辑变量x1和x2与或问题可以用直线分类，分类结果是正确的。

但异或问题无法用一条直线将不同类型的真实值分类，如果用一条直线将两个三角形和两个圆圈分开，只会得到错误的预测结果，因此不能解决异或问题。

点击阅读全文

腾讯云开发者社区

腾讯云面向开发者汇聚海量精品云计算使用和开发经验，营造开放的云计算技术生态圈。

更多推荐

cover

动物识别系统 python实现+UI

腾讯云开发者社区

cover

VSOMEIP — SOME/IP 开源实现

腾讯云开发者社区

cover

DeepSeek 大爆发，带来了哪些新希望？

腾讯云开发者社区

所有评论(0)

贪心西瓜

@weixin_43217427

已为社区贡献2条内容

目录