上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人
第2章 计算机视觉简介
虽然本书的目的不是教你构建和训练机器学习模型的所有基础知识,但我确实想涵盖一些基本场景,以便本书仍然可以独立使用。如果你想了解更多关于使用TensorFlow的模型创建过程,我推荐我的书籍AI and Machine Learning for Coders(由O'Reilly出版),如果你想深入探究,那么Aurélien Géron的优秀著作《机器学习实战:基于Scikit-Learn、Keras和TensorFlow》一书是必需的!
在本章中,我们将越过你在第1章创建的非常基本的模型,查看两个更复杂的模型,你将在其中处理计算机视觉——计算机如何“看到”对象。与术语“人工智能”和“机器学习”类似,短语“计算机视觉”和“看”可能会导致人们误解模型的基本原理。
计算机视觉是一个巨大的研究领域,本章我们将重点关注几个核心场景,我们将使用技术来解析图像的内容,或者标记图像的主要内容,或者在图像中查找物体。
它并不是真正的“视觉”或“看”,而是更多的结构化算法,允许计算机解析图像的像素。它不会“理解”图像,就像它将单词解析为单个字符串时理解句子的含义一样!
如果我们尝试使用传统的基于规则的方法来完成这项任务,即使是最简单的图像,我们最终也会有很多代码行。机器学习是这里的关键参与者,正如你在本章中看到的,通过使用我们在第1章用到的相同代码模式,更深入一点,我们可以创建解析图像内容的模型……只需几行代码。让我们开始吧。