生成对抗网络GAN:原理与实践
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

1.2 显式与隐式生成模型

生成模型内容丰富多彩,我们可以按照概率密度函数的处理方式对其进行分类。总体而言,把对概率密度函数进行显式处理的模型称为显式生成模型,而把隐式处理概率密度函数的模型称为隐式生成模型,如图1-1所示。显式生成模型出于训练模型的原因,需要精确或者近似给出样本的似然函数表达式,而隐式生成模型通过样本间接控制概率分布,训练过程不出现似然函数,是一种间接控制概率密度的方式。无论是显式还是隐式生成模型,其核心均是对p(x)进行建模,只是显式生成模型直接优化p(x),其建模难度比较大,而隐式生成模型避开了直面p(x)的困难,通过p(x)生成的样本间接优化p(x)。在本节,我们将从最基本的极大似然估计法开始,顺着脉络深入、详细地介绍一些具有代表性的显式和隐式生成模型,例如完全可见置信网络、变分自编码器、生成对抗网络等。

图1-1 生成模型分类

在生成模型中,概率密度函数px)一直处于核心的位置。对于一批从pdatax)中独立采样得到的训练样本集{x(1),x(2),…,xN}(注意,我们要求训练样本集的数据是独立同分布的),我们希望用训练数据来训练一个生成模型pgx),这个生成模型可以显式或隐式地学习数据的分布pdatax)或者获得pdatax)的(近似)表达式,即pdatax)≈pgx)。那么接下来在前向推断过程中,可以通过在pgx)上显式或隐式地采样而得到一批样本,并且使获得的样本(近似)符合概率分布pdatax)。