生成对抗网络GAN损失函数loss的简单理解

原始的公式长这样：min⁡Gmax⁡DV(D,G)=Ex∼pdata (x)[log⁡D(x)]+Ez∼pz(z)[log⁡(1−D(G(z)))]\min _{G} \max _{D} V(D, G)=\mathbb{E}_{\boldsymbol{x} \sim p_{\text {data }}(\boldsymbol{x})}[\log D(\boldsymbol{x})]+\m

文章共4,624字 · 阅读需要大约16分钟

一键AI生成摘要，助你高效阅读

问答

xiongxyowo

14233人浏览 · 2021-09-26 18:23:18

xiongxyowo · 2021-09-26 18:23:18 发布

原始的公式长这样：
$\min _{G} \max _{D} V(D, G)=\mathbb{E}_{\boldsymbol{x} \sim p_{\text {data }}(\boldsymbol{x})}[\log D(\boldsymbol{x})]+\mathbb{E}_{\boldsymbol{z} \sim p_{\boldsymbol{z}}(\boldsymbol{z})}[\log (1-D(G(\boldsymbol{z})))]$ 首先可以明确一点，这种公式肯定是从里面算到外面的，也就是可以先看这一部分： $\max _{D} V(D, G)=\mathbb{E}_{\boldsymbol{x} \sim p_{\text {data }}(\boldsymbol{x})}[\log D(\boldsymbol{x})]+\mathbb{E}_{\boldsymbol{z} \sim p_{\boldsymbol{z}}(\boldsymbol{z})}[\log (1-D(G(\boldsymbol{z})))]$ 我们知道，在每个epoch中，GAN的生成器与判别器是分别训练的，即先固定生成器 $G$ ，去训练判别器 $D$ ，那么上面这个式子实际上就是判别器的"损失函数"。继续拆分上面这个式子，可以发现主要就是加号左右两个部分。

先看左边。左边这一部分的作用是保证判别器的基础判断能力：对于 $\mathbb{E}_{\boldsymbol{x} \sim p_{\text {data }}(\boldsymbol{x})}[\log D(\boldsymbol{x})]$ ， $\boldsymbol{x}$ 为从真实数据分布 $p_{\text {data }}$ 中采样得到的样本。 $\mathbb{E}_{\boldsymbol{x} \sim p_{\text {data }}(\boldsymbol{x})}[\log D(\boldsymbol{x})]$ 越大，相当于意味着 $D(\boldsymbol{x})$ 越大，即判别器越能准确地将真实样本识别为真实样本；因此有 $max _{D}$ ；

再看右边。右边这一部分的作用是保证判别器能够区分出虚假样本：对于 $\mathbb{E}_{\boldsymbol{z} \sim p_{\boldsymbol{z}}(\boldsymbol{z})}[\log (1-D(G(\boldsymbol{z})))]$ ， $\boldsymbol{z}$ 为从某一特定分布 $p_{\boldsymbol{z}}$ 中得到的采样， $G(\boldsymbol{z})$ 为生成器生成的虚假样本。 $\mathbb{E}_{\boldsymbol{z} \sim p_{\boldsymbol{z}}(\boldsymbol{z})}[\log (1-D(G(\boldsymbol{z})))]$ 越大，相当于意味着 $D(G(\boldsymbol{z}))$ 越小，即判别器越能够正确区分虚假样本，将其标为False；因此有 $max _{D}$ 。

再来看生成器G的"损失函数"。到了训练生成器G的阶段，此时判别器D固定。如果G更强，那么判别器会进行误判，此时 $D(G(\boldsymbol{z}))$ 会变大， $\mathbb{E}_{\boldsymbol{z} \sim p_{\boldsymbol{z}}(\boldsymbol{z})}[\log (1-D(G(\boldsymbol{z})))]$ 更接近于零，即整个式子的值会更小；因此有 $min _{G}$ 。