机器学习实战:模型构建与应用
上QQ阅读APP看书,第一时间看更新

第3章
图像特征检测

在第2章中你学习了计算机视觉的基础知识,通过创建一个简单的神经网络来匹配Fashion MNIST数据集的输入像素到10个标签,每个标签代表一种(或者一类)服装。虽然你创建了一个非常擅长检测服装类型的网络,但是该网络有个明显的缺陷。你的神经网络是在小型单色图像上训练的,每张图像只包含一件服装,并且这件物品处于图像的中心。

为了将这个模型提升到下一层,你需要能够检测图像中的特征。例如,不再是仅仅观察图像中的原始像素,假如我们有一种方法把图像过滤出组成元素会怎么样呢?通过匹配这些元素(而不是原始像素),能够帮助我们更有效地检测图像中的内容。考虑Fashion MNIST数据集—当检测一只鞋子时,神经网络可能已经被聚集在图像底部的大块黑色像素激活,这可以被视为鞋子的底部。但是当鞋子不再充满并处于图像的中心时,这个逻辑就不成立了。

有一种用于检测特征的方法来自你可能熟悉的摄影学和图像处理方法论。如果你曾经使用过类似Photoshop或者GIMP的工具来锐化一张图像,那么你使用的正是一个工作于图像像素的数学滤波器。这些滤波器的另一种说法叫作卷积,并且通过在神经网络中使用它们,你会创建一个卷积神经网络(CNN)。

在本章中,你将会学习如何使用卷积来检测图像中的特征。然后你会深入学习根据图像中的特征对图像进行分类。我们将会探索增强图像来获取更多的特征,以及探索迁移学习来使用我们从别人那里学到的预先存在的特征,然后简单看一下通过使用dropouts来优化你的模型。