机器学习实战:模型构建与应用
上QQ阅读APP看书,第一时间看更新

3.2 池化

池化是在保持图像中内容的语义信息的同时,减少图像中像素的过程。它最好是通过可视化来解释。图3-4展示了最大化池化(max pooling)的概念。

在这个例子中,考虑左边的框是一张单色图像里的像素。我们接下来把它分组为2×2的矩阵,于是这16像素被分组为四个2×2的矩阵。这些矩阵叫作池。

我们接下来选择每一组中的最大值,并把它们重组到一个新的图像中。因此,由于每个池中的最大值构成了新的图像,所以左边的像素减少了75%(从16变成了4)。

图3-4:最大化池化

图3-5展示了在图3-2版本的ascent图像上使用了最大化池化之后,竖直的直线被增强了。

图3-5:经过竖直滤波和最大化池化的ascent图像

注意,这些过滤后的特征不但保存下来了,并且还被进一步增强了。同时,图像的大小从512×512变成256×256—是原始大小的四分之一。

equa池化还有其他的方法,例如最小化池化,它从池中选择最小的像素值;以及平均池化,它选择整体的平均值。