上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人
1.2 显式与隐式生成模型
生成模型内容丰富多彩,我们可以按照概率密度函数的处理方式对其进行分类。总体而言,把对概率密度函数进行显式处理的模型称为显式生成模型,而把隐式处理概率密度函数的模型称为隐式生成模型,如图1-1所示。显式生成模型出于训练模型的原因,需要精确或者近似给出样本的似然函数表达式,而隐式生成模型通过样本间接控制概率分布,训练过程不出现似然函数,是一种间接控制概率密度的方式。无论是显式还是隐式生成模型,其核心均是对p(x)进行建模,只是显式生成模型直接优化p(x),其建模难度比较大,而隐式生成模型避开了直面p(x)的困难,通过p(x)生成的样本间接优化p(x)。在本节,我们将从最基本的极大似然估计法开始,顺着脉络深入、详细地介绍一些具有代表性的显式和隐式生成模型,例如完全可见置信网络、变分自编码器、生成对抗网络等。
图1-1 生成模型分类
在生成模型中,概率密度函数p(x)一直处于核心的位置。对于一批从pdata(x)中独立采样得到的训练样本集{x(1),x(2),…,x(N)}(注意,我们要求训练样本集的数据是独立同分布的),我们希望用训练数据来训练一个生成模型pg(x),这个生成模型可以显式或隐式地学习数据的分布pdata(x)或者获得pdata(x)的(近似)表达式,即pdata(x)≈pg(x)。那么接下来在前向推断过程中,可以通过在pg(x)上显式或隐式地采样而得到一批样本,并且使获得的样本(近似)符合概率分布pdata(x)。