第一节 引言
随着三维感知技术的发展,基于三维人脸模型的研究逐渐成为计算机视觉、计算机图形学领域的研究热点。国内外许多研究机构先后建立了自己的三维人脸数据库。由于建立三维人脸数据库使用的设备、手段和目标不尽相同,且样本采集对象的性别、年龄、种族也各不相同,使得不同三维人脸数据库中的样本在拓扑结构、表达形式和信息含量上都具有较大的差别。不同的建模方法对三维人脸样本结构有着不同的要求,要想使用某个三维人脸数据库中的样本,必须对库中的样本进行规格化处理,使得规格化后的样本达到研究所需的要求。
目前的三维人脸数据库主要是基于两类感知设备建立的:基于结构光的深度相机和基于激光的三维扫描仪。使用深度相机获取的三维人脸样本通常只包含人脸的深度信息,这些样本也被称为2.5维样本,基于这类设备构建的三维人脸数据库有3D-RMA[73]、XM2VTS[74]、Ga-vabDB[75]、Bosphorus[76]、York-3D[77]和FRGC-3D[78]。FRGC-3D是这类数据库中的典型代表,也是目前应用最为广泛的三维人脸数据库。由于深度相机的采集特性,使得基于该设备获取的三维人脸样本只含有人脸的点云信息,且只含有面部正向区域的信息,侧向区域和耳朵区域的信息由于视点的原因而出现大面积的缺失。除此之外,使用深度相机获取的三维人脸样本通常会含有较大的噪声。如图2-1所示,FRGC-3D中的样本是由三维点云构成的,且主要包含面部的正向区域信息,面部侧向区域只包含部分的耳朵信息,样本的眉毛处和脸颊处含有大量的噪声信息。使用该数据库中的样本必须首先对初始样本进行规格化处理,使得样本达到算法所需的数据形式要求。
图2-1 FRGC-3D人脸数据库的样本
使用三维激光扫描仪通过一次扫描就可以获得头部的完整数据,而且该样本具有真实感强、分辨率高和精确度高等特点,目前基于三维激光扫描仪建立的三维人脸样本库有德国tuebingen大学建立的MPI三维人脸数据库,[31]该数据库总共包含200人的样本信息,每人有7个不同姿态的样本,共计1400个三维人脸样本。由北京工业大学多媒体与智能软件技术实验室建立的BJUT-3D[52,53]人脸数据库,其采集目标全部是中国人。总共包含500人中性表情的样本信息,其中男性有250人,女性有250人,年龄变化范围在16—49岁,每人有3个样本。该数据库的样本使用多边形的集合来对人脸进行表示,并且样本包含纹理信息。虽然使用激光扫描仪获取的样本精度和分辨率要远远高于基于深度相机获取的样本,但是这些样本中还是不可避免地存在噪声信息,如毛刺、空洞等。这些噪声的出现主要是由面部复杂的几何结构和纹理特性造成的。如图2-2所示,BJUT-3D数据库中的样本在发梢和眼角部出现了毛刺现象。
图2-2 BJUT-3D人脸数据库的样本
从以上的分析中可以看出,不同的三维人脸数据在拓扑结构、表达形式和信息含量上存在着较大的差异,因此研究三维人脸样本规格化方法具有重要的理论意义和应用价值。三维人脸样本规格化通常包含样本预处理和样本规格化两个过程。样本预处理是指对样本中存在的毛刺、空洞等信息进行处理,并对所有样本实施坐标对齐操作。这一步的工作使得所有的初始样本达到基本对齐的状态。样本规格化是将不同格式的三维人脸样本转化为具有相同的点数、面数、网格关系和基于特征的稠密对应关系的样本,规格化的三维人脸样本可以用统一的向量形式进行表示。