上QQ阅读APP看书,第一时间看更新
第3章
数形结合——图像处理基础知识
通过上一章的学习,读者对于机器学习的基本概念有了一定的了解,此时如果拿到一个简单的M×N矩阵化数据集(M个特征,N个样本),总体流程应该怎么走,心里已经有了一个基本的概念。
不过,如果要分类的样本不是简单的几个数字,如鸢尾花数据集中花瓣、花萼的长宽,而是一张图片(如图3-1所示),这时应该怎么办?
图3-1 分类的样本是图片
(图片来源:https://www.tensorflow.org/get_started/estimator)
这里提供三种解决问题的思路:
(1)手动提取重要的特征,用数字表示。如鸢尾花数据集,当年就是用尺子量出来的长度、宽度,交给机器学习分类器。
(2)用简单的图像处理操作,将图片转换为少数几个简单的轮廓特征,交给机器学习分类器。
(3)用深度神经网络,让深度学习模型自动提取图片的各种特征,再用模型自动提取的特征训练分类器。
我们在上一章主要介绍了第(1)种思路,本章主要讨论第(2)种思路,后面的部分则重点讨论第(3)种基于深度学习的方法。而对图像进行简单处理操作,实际上就是利用计算机程序实现类似Photoshop的粗略操作,当然这里用Photoshop的目的并非是让图像更加美观,而是要让图像尽可能简单,只保留最重要的特征,方便模型提取特征。