训练正常&异常的GAN损失函数loss变化应该是怎么样的

这里以个人用到的一个网络为例，仅供参考，不代表所有情形。用tensorboard记录loss曲线的走向，横轴为迭代次数(iter)，纵轴为损失(loss)值。

文章共838字 · 阅读需要大约3分钟

一键AI生成摘要，助你高效阅读

问答

xiongxyowo

22457人浏览 · 2022-08-02 11:21:43

xiongxyowo · 2022-08-02 11:21:43 发布

这里以个人用到的一个网络为例，仅供参考，不代表所有情形。
用tensorboard记录loss曲线的走向，横轴为迭代次数(iter)，纵轴为损失(loss)值。

正常的

判别器loss
在这里插入图片描述
loss在2.6到3.4之间来回上下波动。注意，在tensorboard中，最好将Smoothing值调整为0，如果使用了Smoothing将比较难观察到loss的波动趋势，这里以Smoothing为0.999为例，还是展示判别器损失：

这个时候容易误判为判别器loss在稳步下降。不过实际上可以发现这个"下降"从3.25降到了3.05，所以本质上还是小范围波动。
生成器loss
在这里插入图片描述
loss在3.0到3.6之间来回上下波动。类似的，观察Smoothing为0.999时的情况：

给人的感觉是生成器loss一直在往上跑，可能会怀疑生成器没在进一步学习；但实际上仔细看容易发现只是从3.25跑到了3.35，依旧是在一个小区间内波动，生成器的能力确实是在继续逐步增强的。

生成器崩溃

判别器loss
在这里插入图片描述
可以发现从3一路下降到了0.8，在训练一开始就有在快速下降。观察Smoothing为0.999时的情况：

生成器loss

可以发现从4一路上升到了6.5，在训练一开始就有在快速上升。观察Smoothing为0.999时的情况：

从结果的角度出发，在生成器loss快速上升的时候，其已经开始生成无意义的噪声图像：
在这里插入图片描述

小结

从原理上来说，生成器和判别器从一开始都是非常弱的，因此一般不会在训练一开始两者损失就非常剧烈的波动。在训练一段时间达到稳定期后，生成器和判别器的损失都应该在一个小区间内波动，而不会有明显的持续上升/下降趋势。
如果生成器损失持续明显上升，表明其无法学习怎么欺骗判别器，体现在结果上就是开始生成噪声。
如果判别器损失持续明显上升，表示其无法学习怎么识别生成器，体现在结果上就是生成器可能会生成一致的，无意义的但是能欺骗判别器的图像(比如直接输出训练集中的样本)。

GitCode 开源社区

旨在为数千万中国开发者提供一个无缝且高效的云端环境，以支持学习、使用和贡献开源项目。

更多推荐

【目标检测】目标检测的一些常用神经网络模型及方法

我的阶段性总结????文章目录1.概述1.2 目标检测的任务1.3 目标检测的分类2.R-CNN系列2.1 [R-CNN（Region with CNN features）](https://arxiv.org/pdf/1311.2524.pdf)2.2 [Fast R-CNN](https://www.cv-foundation.org/openaccess/content_iccv_2015/