深度学习图像预处理中为什么使用零均值化(zero-mean)

在深度学习中，一般我们会把喂给网络模型的训练图片进行预处理，使用最多的方法就是零均值化(zero-mean) / 中心化，即让所有训练图片中每个位置的像素均值为0，使得像素值范围变为[-128,127]，以0为中心。举个例子，假设训练图片有5000张，图片大小为32*32，通道数为3，则用python表示如下：x_train = load_data(img_dir)# 读取图片数据 x...

会意

22780人浏览 · 2018-08-22 15:41:12

会意 · 2018-08-22 15:41:12 发布

在深度学习中，一般我们会把喂给网络模型的训练图片进行预处理，使用最多的方法就是零均值化(zero-mean) / 中心化，即让所有训练图片中每个位置的像素均值为0，使得像素值范围变为[-128,127]，以0为中心。

举个例子，假设训练图片有5000张，图片大小为32*32，通道数为3，则用python表示如下：

x_train = load_data(img_dir)  # 读取图片数据 x_train的shape为(5000,32,32,3)
x_train = np.reshape(x_train, (x_train.shape[0], -1))  # 将图片从二维展开为一维，x_train 变为(5000,3072)
mean_image = np.mean(x_train, axis=0)  # 求出所有图片每个像素位置上的平均值 mean_image为(1, 3072)
x_train -= mean_image  # 减去均值图像，实现零均值化

这样做的优点是为了在反向传播中加快网络中每一层权重参数的收敛。为什么能加快呢？李飞飞的cs231n课程中给出了很好的解释。
这里写图片描述
我们来看一下神经网络中的计算过程，如上图所示通常每一层的计算公式都可以表示成上面这个式子。假设上游返回的梯度为L，运用链式法则，反向传播时权重的梯度可以表示如下：

$\frac{∂L_i}{∂w_i} = \frac{∂L_i}{∂f}\frac{∂f}{∂w_i} = \frac{∂L_i}{∂f}x_i$
这里写图片描述

假设图中蓝色箭头方向理想最优w向量，根据上述公式，我们可以想一想：

当x全为正或者全为负时，每次返回的梯度都只会沿着一个方向发生变化，即梯度变化的方向就会向图中红色箭头所示，一会向上太多，一会向下太多。这样就会使得权重收敛效率很低。

但当x正负数量“差不多”时，就能对梯度变化方向进行“修正”，使其接近上图中蓝色箭头的方向，加速了权重的收敛。

参考自：李飞飞深度学习课程cs231n

解释得可能没有老师清楚 w(ﾟДﾟ)w，跑-_-||

CSDN学习社区

CSDN联合极客时间，共同打造面向开发者的精品内容学习社区，助力成长！

更多推荐

嵌入式作业（七）：基于Ardunio的STM32串口通信

嵌入式作业（七）0作业要求1Ardunio 完成STM32的串口通信（1）安装Ardunio IDE（2）stm32串口通信2关于 stduino IDE0作业要求安装 Ardunio IDE 和相关软件支持库，在Ardunio 完成STM32板子的串口通信程序：（1）持续向串口输出“Hello world！”；（2）当接收到“stop!”时，停止输出。网上有一个国人版的MCU集成开发平台， st

CSDN学习社区

JDBC详解

JDBC文章目录JDBC什么是JDBC?JDBC驱动程序:Java使用JDBC访问数据库的步骤:设置classpath:Oracle连接字符串的书写格式:简单的例子:常用数据库的驱动程序及JDBC URL:Oracle数据库:SQL Server数据库MySQL数据库Access数据库PreparedStatement接口:JNDI-数据源（Data Source）与连接池（Connection

CSDN学习社区

“模式识别与机器学习”学习笔记no2.再谈感知机

接**上篇：上篇主要进行了PLA，Pocket算法的理论过程分析和在给定数据集上利用pocket算法对数据集进行分类学习，得到错分数量最少的分类面。上篇中pocket算法的过程已经进行了编程和测试，框架已经建立了起来，这一篇主要上篇中没有提到或涉及不深的几个问题。1.数据集的构造。上篇是直接使用了题目给的向量，这次来根据正态分布来产生数据集。np.random.normal函数可以根据均值和方差生