上QQ阅读APP看书，第一时间看更新

第3章
数形结合——图像处理基础知识

通过上一章的学习，读者对于机器学习的基本概念有了一定的了解，此时如果拿到一个简单的M×N矩阵化数据集（M个特征，N个样本），总体流程应该怎么走，心里已经有了一个基本的概念。

不过，如果要分类的样本不是简单的几个数字，如鸢尾花数据集中花瓣、花萼的长宽，而是一张图片（如图3-1所示），这时应该怎么办？

图3-1　分类的样本是图片

（图片来源：https://www.tensorflow.org/get_started/estimator）

这里提供三种解决问题的思路：

（1）手动提取重要的特征，用数字表示。如鸢尾花数据集，当年就是用尺子量出来的长度、宽度，交给机器学习分类器。

（2）用简单的图像处理操作，将图片转换为少数几个简单的轮廓特征，交给机器学习分类器。

（3）用深度神经网络，让深度学习模型自动提取图片的各种特征，再用模型自动提取的特征训练分类器。

我们在上一章主要介绍了第（1）种思路，本章主要讨论第（2）种思路，后面的部分则重点讨论第（3）种基于深度学习的方法。而对图像进行简单处理操作，实际上就是利用计算机程序实现类似Photoshop的粗略操作，当然这里用Photoshop的目的并非是让图像更加美观，而是要让图像尽可能简单，只保留最重要的特征，方便模型提取特征。

第3章 数形结合——图像处理基础知识

第3章
数形结合——图像处理基础知识