模式识别与人工智能(基于MATLAB)
上QQ阅读APP看书,第一时间看更新

第1章 模式识别概述

1.1 模式识别的基本概念

模式识别(pattern recognition)也称机器识别,就是通过计算机用数学技术方法来进行模式的自动处理和判读。该学科的主要任务是利用计算机进行模拟人的识别能力,提出识别具体客体的基本理论与实用技术。其最基本的方法是计算,即计算要识别的事物与已知的标准事物的相似程度,从而让机器能判别事物。因此,找到度量不同事物差异的有效方法是研究的关键。随着计算机技术的发展,人类有可能研究复杂的信息处理过程。我们把环境与客体统称为“模式”。信息处理过程的一个重要形式是生命体对环境及客体的识别。对人类来说,特别重要的是对光学信息(通过视觉器官来获得)和声学信息(通过听觉器官来获得)的识别。这是模式识别的两个重要方面。模式识别是确定一个样本的类别属性的过程,即把某一样本归属于多个类型中的某个类型。例如,数据分类,结果就是将待分类数据按属性分类;指纹识别,就是使用指纹的总体特征如纹形、三角点等来进行分类,再用局部特征如位置和方向等来进行识别用户身份;还有语音识别、生物认证、字符识别等。

1.1.1 模式的描述方法

对于模式的描述方法有两种:定量描述和结构性描述。其中,定量描述通过对事物的属性进行度量,用一组数据来描述模式;结构性描述是对事物所包含的成分进行分析,用一组基元来描述模式。

针对定量描述方法,一个具体的研究对象称为样品。对于一个样品来说,必须确定一些与识别有关的因素作为研究的根据,毎一个因素称为一个特征。模式用样品的一组数据来描述。模式的特征集一般可以用特征向量表示。特征向量中的每个元素称作特征。假设一个样品Xn个特征,若用小写字母x来表示特征,则可以把X看作一个n维列向量,该向量X称为特征向量,记作:

模式识别问题就是根据Xn个特征来判别模式X属于ω1ω2,…,ωM类中的哪一类。其目的是在特征空间和解释空间之间建立一种特殊的对应关系。其中,特征空间由特征向量构成,包括模式的度量、属性等,通过对具体对象进行观测得到;解释空间由所属模式类别的集合构成。

1.1.2 模式识别系统

模式识别的关键是如何利用计算机进行模式识别,并对样本进行分类。执行模式识别的基于计算机的系统(可以是各种有计算能力的处理器系统)称为模式识别系统。该系统具有两种工作方式,训练方式和识别方式。

图1-1是一个典型的模式识别系统,由数据获取、预处理、特征提取、分类决策及分类器设计等部分组成。该系统各个组成部分的功能概括如下。

图1-1 模式识别系统

(1)数据获取:一般情况下,获取的信息类型有以下几种。

• 一维波形:心电图、脑电波、声波、震动波形等。

• 二维图像:文字、地图、照片等。

• 物理参量:体温、化验数据、温度、压力、电流、电压等。

(2)预处理:对由于信息获取装置或其他因素所造成的信息退化现象进行复原、去噪,加强有用信息。

(3)特征提取:由信息获取部分获得的原始信息,其数据量一般相当大。为了有效地实现分类识别,应对经过预处理的信息进行选择或变换,得到最能反映分类本质的特征,构成特征向量。其目的是将维数较高的模式空间转换为维数较低的特征空间。

(4)分类决策:在特征空间中用模式识别方法(由分类器设计确定的分类判别规则)对待识别模式进行分类判别,将其归为某一类别,输出分类结果。这一过程对应于特征空间向类别空间的转换。

(5)分类器设计:为了把待识别模式分配到各自的模式类中,必须设计出一套分类判别规则。基本做法是收集一定数量的样本作为训练集,在此基础上确定判别函数、改进判别函数和误差检验。

其中分类器设计在训练方式下完成,利用样本进行训练,确定分类器的具体参数,而分类决策在识别方式下起作用,对待识别的样本进行分类决策。