1.3 模式识别系统
1.3.1 模式与模式识别
模式(Pattern)是指具有某种特定性质的感知对象。一般情况下,待观察的事物都具有时空分布信息。模式识别(Pattern Recognition)又称为模式分类,指对待观察事物的各种信息进行处理、描述、分类和解释的过程。按照有无训练样本,模式识别可分为监督模式识别和非监督模式识别两种。
模式识别的研究方向主要有两个:第一个是研究生物体是如何感知世界的;第二个是研究如何用机器(包括计算机)识别特定对象的模式。这些特定对象可以是字符、语音、图像等具体的事物,也可以是状态、程度、范围等抽象的表达。模式识别与数学、医学、心理学、语言学、物理学及计算机科学等都有关系。
1.3.2 模式识别系统
模式识别在各领域的应用很多。一般来说,模式识别系统包括信息获取、预处理、特征选择与提取、分类器设计(或聚类)和分类决策(或结果解释)5个部分,如图1-3所示。
图1-3 模式识别系统组成
信息获取:由于计算机只能处理数字信号,计算机要获取模式信息就意味着要实现观察对象的数字化表达;机器通过各类传感器来获取信息,从而将光、图像、声音和其他非电信号转换为电信号;获取的信息可以是三维或二维的视觉信息,也可以是一维的声波、心电图、脑电图等,还可以是一些物理量与逻辑值等。
预处理:在得到模式的数字化表达后,需要对它进行预处理,以便去除或减小噪声的影响,突出有用信息;对于图像,可采用二值化、图像平滑、变换、增强、恢复、滤波、几何校正等数字图像处理技术对其进行预处理。
特征选择与提取:它的任务是在测量空间中,通过对原始数据进行相应的变换,获得在特征空间最能反映分类本质的特征。
分类器或聚类及后处理过程:分类器主要包括分类器设计和分类决策两部分,其中,分类器设计通过样本训练来确定判决规则,并把判决规则变成后续分类决策的标准,实现对目标对象的识别和分类;聚类是在非监督模式下对样本数据按照一定的方法进行分析;后处理过程则主要是结果解释,即根据专业知识来分析聚类结果的合理性,并对聚类做出解释。