深度学习概念——Epoch, Batch, Iteration

基本概念

文章共906字 · 阅读需要大约4分钟

一键AI生成摘要，助你高效阅读

问答

乁羐

7496人浏览 · 2022-09-17 09:14:38

乁羐 · 2022-09-17 09:14:38 发布

定义

在这里插入图片描述
Epoch（时期）
所有训练样本在神经网络中都进行了一次正向传播和一次反向传播的过程，称为1个Epoch

Batch（批）
将训练样本分为若干个Batch

Batch_size（批大小）
每批样本的大小，即训练样本的大小除以Batch等于Batch_size
举个例子
需要鉴定100个苹果的好坏（这100个苹果就是训练样本），将其分成4批鉴定（这4批就是Batch等于4），那么每批鉴定25个苹果。（Batch_size=25）

Iteration（迭代）
训练一个Batch就是一次Iteration

示例

在这里插入图片描述
梯度下降的几种方式的根本区别就在于上面公式中的Batch_size不同

mnist 数据集有60,000张图片作为训练数据，10,000张图片作为测试数据。假设现在选择 Batch_Size =100 对模型进行训练。迭代30,000次。

每个 Epoch 要训练的图片数量：60,000(训练集上的所有图像)
训练集具有的 Batch 个数：60,000/100=600
每个 Epoch 需要完成的 Batch 个数：600
每个 Epoch 具有的 Iteration 个数：600（完成一个Batch训练，相当于参数迭代一次）
每个 Epoch 中发生模型权重更新的次数：600
训练 10 个Epoch后，模型权重更新的次数： 600*10=6,000
不同Epoch的训练，其实用的是同一个训练集的数据。第1个Epoch和第10个Epoch虽然用的都是训练集的60,000张图片，但是对模型的权重更新值却是完全不同的。因为不同Epoch的模型处于代价函数空间上的不同位置，模型的训练代越靠后，越接近谷底，其代价越小。
总共完成30000次迭代，相当于完成了30,000/600=50个Epoch