2.3 特征级融合目标识别的关键问题分析
2.3.1 特征数据库
多传感器信息融合目标识别的识别率和实时性在很大程度上取决于特征数据库建立的完备程度。现有的目标识别算法模式,都需要与先验模式进行比较。将各种可能存在的目标特征信息存放在特征数据库中。因为目标特征数据库构成了目标识别分类器的先验模式集。它包含了各种目标的特征信息,也可以包含目标的身份信息和辐射源参数等详细信息。特征信息是可被各种传感器直接或间接测量的实变量提取的特征数据,如幅度的直观特征、统计特征、变换系数特征、代数特征等。身份信息属于非实值变量,是对目标的详细分类描述,例如目标的类型、种类、级别和发射机型号等。辐射源参数包括可被电子支援措施(ESM)检测到的辐射源名字和类别,例如载频、重频、脉宽和脉幅等。
2.3.2 特征提取
面对各种异质传感器组合的多传感器系统,传感器的物理探测原理不同,获取的目标信息有图像和非图像类等较大的性质差异,并且信息量巨大。如何选择特征提取方法,能提取出目标独有的、可用于区别其他目标的最本质的信息属性是特征级融合目标识别的难点,也是关键点。多传感器获取的目标特征有代数特征、图像视觉特征、图像统计特征、变换特征等。
2.3.3 特征融合
特征融合的过程就是将特征提取后特征信息通过融合处理,获得多个特征数据的特征综合——种新的联合特征量,为目标的识别处理﹑决策提供服务。
特征融合算法是对提取的原始目标特征空间降低了特征空间维数,消除提取的特征空间中特征表示向量之间的冗余信息,并且保证维数压缩后特征数据的熵、能量、相关性不改变,利于后继的目标识别。总之,特征融合算法就是获得有利于目标识别的有效的、低维的特征表示向量。
特征融合在部分文献和研究者中也称为特征选择,特征提取和特征选择有些系统是合在一起,有些是分开,算法中它们没有明确的界限,即特征提取和特征选择、特征融合是融合在一起的算法。特征融合分为目标状态信息融合和目标特性信息融合。目标状态信息融合用于目标跟踪,主要是实现状态矢量的估计和参数的相关。而特征级目标特性融合主要实现目标属性特性的联合,实现目标属性种类的判定。
特征融合算法按特征向量的产生方式可划分为特征选择和特征组合两类实现方法。特征选择方法是将待融合的所有特征量放在一起,用某种方法从原向量选择产生一个新的特征向量,例如,遗传算法、Tabu搜索算法等。特征组合方法将所有特征向量按某种规则组合成新的特征向量,例如,串行和并行融合策略。遗传算法详见第9章,串行和并行融合策略是简单而有效的特征融合方法,其缺点就是所有大量特征信息全部保留,存在大量的冗余特征量,数据维数高,计算复杂,影响识别的精确性和实时性。
1)串行特征融合方法:设样本模式空间Ω的两个特征空间为A和B,对Γ∈Ω的任意样本,特征量可以表示为α∈A和β∈B。串行特征融合方法就是将α、β串成了一个特征量γ,公式如下:
由式(2-1)可知,若α是n维的,β是m维,那么串行组合的特征量γ是(m+n)维。因此,由串行融合而成的特征量构成(m+n)维的融合特征空间,后续的目标分类识别就是在这个融合特征空间中进行。
2)并行特征融合方法:设样本模式空间Ω的两个特征空间为A和B。对于Γ∈Ω的任意样本,特征量可以表示为α∈A和β∈B。并行特征融合方法将α、β两个特征量并成了一个复合量γ,公式如下:
γ=α+iβ(2-2)式中,i为虚数单位。α和β特征量维数不一致时,低维的特征量需要补0,两个特征量才能并行融合。例如,α=(α1,α2,α3)T,β=(β1,β2)T,则首先将β变为β=(β1,β2,0)T,然后融合成融合特征量γ=(α1+iβ1,α2+iβ2,α3+i0)。
定义一个在Ω上的并行融合特征空间C={α+iβα∈A,β∈B}。这是一个n维的复向量空间,其中n=max{dimA,dimB}。在这个空间里,内积可定义为
(X,Y)=XHY(2-3)式中,X,Y∈C,H表示共轭转置。
定义以上内积的复向量空间,称为酉空间。在酉空间可引入以下范数:
式中,Z=(α1+iβ1,α2+iβ2,…,αn+iβn)T。相应地,复向量Z1和Z2之间的距离可定义为
遗传算法等优化算法的特征融合方法与串行、并行特征融合方法相比,可以获得更有效的、低维的融合特征表示向量,但是融合过程较串行、并行特征融合方法耗费的时间长,但是降低了后续的目标识别分类时间。
2.3.4 目标识别
特征级融合的目标识别算法目前都是基于模式识别的方法,可分为统计模式识别、句法模式识别、模糊模式识别、人工智能方法。统计模式识别、句法模式识别这两种方法比较成熟,发展得较早,但是自身缺点很多,现在用得较少。后两种方法目前都是研究的热点,应用也较多,由于模糊模式识别和人工智能方法都允许样本有较大的缺损、畸变,目前这两种方法都在积极的探索中。
(1)统计模式识别
统计模式识别又称统计决策法,它的理论基础是概率论和数理统计。其主要方法包括线性分类、非线性分类、贝叶斯决策、聚类分析等分类方法,是发展较早、也比较成熟的一种方法。为此而引入鉴别函数,由特征矢量计算出对应于各类别的鉴别函数值,通过鉴别函数值的比较实行分类。其主要优点是比较成熟、能考虑干扰噪声等影响、识别模式基元能力强;缺点是对结构复杂的模式抽取特征困难、不能反映模式的结构特征,难以描述模式的性质,难以从整体角度考虑识别问题。
(2)句法模式识别
句法模式识别也称为语言学方法、结构方法。句法模式识别的方法是用简单的子模式组合描述一个模式,更简单的子模式的组合又可描述子模式,结构描述最终得到一个树形,模式基元就是在底层的最简单的子模式。在句法模式中选取基元就是目标识别中选取特征。对模式提供紧凑并反映其结构关系的描述就是基元的要求,并且抽取可以用非句法方法。重要的结构信息并不包含在基元本身。模式描述语句就是一组基元与基元的组合关系形成模式的描述,类似于语言中词组合成为短语和句子的作用,而词是用字符组合而成的。语法来指定基元组合成模式的规则。一旦基元被鉴别,识别过程可通过句法分析进行,即分析给定的模式语句是否符合指定的语法,满足某类语法的即被分入该类。
(3)模糊模式识别
面对甲、乙两类归属问题,传统的二值逻辑模式,对样本A或者属于甲,或者属于乙。Zadeh在1965年提出模糊集理论,将传统的二值0和1的逻辑模式转化为逻辑(0,1)区间,此种对事物刻画的模式改变了片面、单纯的通过事物内涵描述其特征的方式,并且提出了综合事物内涵与外延性态的数学模型,构建了隶属度函数。模糊逻辑面对甲、乙两类归属问题,认为A既属于甲,又属于乙,判断两者归属的结果是根据A在甲、乙两类中的隶属度即归属程度不同。模糊模式识别与普通的模式识别方法相比,具有客体信息表达更加合理,信息利用充分,各种算法简单灵巧,识别稳定性好,推理能力强的特点。模糊模式识别思想方法对解决模式识别问题起到了很大的推动作用。
如何建立隶属度函数是模糊模式识别的关键,但是如何建立比较合理的隶属度函数目前还是难点,是需要进一步解决的问题。模糊统计法、模糊分布法、二元对比排序法、相对比较法和专家评分法等是目前的主要方法。这些方法虽然具有一定的客观规律性与科学性,也已经开始应用并取得巨大成果,但建立时也需要人为的主观因素,因此怎样建立准确合理的隶属度函数还需要进一步摸索出合理的、普适的理论和方法。
(4)人工神经网络识别
人工神经网络是模拟动物神经系统的某些功能,采用软件或硬件的方法,建立了许多以大量处理单元为节点,处理单元间实现(加权值的)互联的拓扑网络,进行模拟,称为人工神经网络。这种方法可以看作是对原始特征空间进行非线性变换,产生一个新的样本空间,使得变换后的特征线性可分。同传统统计方法相比,其分类器是与概率分布无关的。人工神经网络的主要特点在于其具有信息处理的并行性、自组织性和自适应性,具有很强的学习能力和联想功能以及容错性能等,在解决一些复杂的模式识别问题中显示出了其独特的优势。
人工神经网络是一种复杂的非线性映射方法,其物理意义比较难解释,在理论上还存在一系列亟待解决的问题。例如在设计上,网络层数的确定和节点个数的选取带有很大的经验性和盲目性,缺乏理论指导,网络结构的设计仍是一个尚未解决的问题。在算法复杂度方面,神经网络计算复杂度大,在特征维数比较高时,样本训练时间比较长;在算法稳定性方面,学习过程中容易陷入局部极小,并且存在欠学习与过学习的现象,范化能力不容易控制。这些也是制约人工神经网络进一步发展的关键问题。