2.5.1 信息融合技术
信息融合起初被称为数据融合,起源于1973年美国国防部资助开发的声呐信号处理系统。20世纪80年代,为了满足军事领域中作战的需要,多传感器数据融合MSDF技术应运而生。在20世纪90年代,随着计算机技术的广泛发展,具有更广义化概念的信息融合被提出来,应用领域也从军事迅速扩展到了民用,主要包括机器人和智能仪器系统、智能制造系统、战场任务与无人驾驶飞机、航天应用、目标检测与跟踪、图像分析与理解、惯性导航、模式识别等领域。
(1)信息融合模型
人们提出了多种信息融合模型,共同点是在信息融合过程中进行多级处理。现有融合模型大致可以分为两大类:①功能型模型,主要根据节点顺序构建;②数据型模型,主要根据数据提取加以构建。在20世纪80年代,比较典型的功能型模型主要有UK情报环、Boyd控制回路(OODA环);典型的数据型模型则有JDL模型,20世纪90年代又发展了瀑布模型和Dasarathy模型。1999年Mark Bedworth综合几种模型,提出了一种混合模型。
UK情报环把信息处理作为一个环状结构来描述,包括4个阶段:①采集,包括传感器和人工信息源等的初始情报数据;②整理,关联并集合相关情报报告,在此阶段会进行一些数据合并和压缩处理,并将得到的结果进行简单打包,以便在下一阶段使用;③评估,在该阶段融合并分析情报数据,同时分析者还直接给情报采集分派任务;④分发,在该阶段军事指挥官把融合情报发送给用户,以便决策行动,包括下一步采集工作。该模型的优点是可以对处理过程和情报收集策略不断回顾,随时加以修正,缺点是应用范围有限。
1984年,美国国防部成立了数据融合联合指挥实验室,提出了JDL模型,经过逐步改进和推广使用,该模型已成为美国国防信息融合系统的一种实际标准。JDL模型把数据融合分为3级:第1级处理为目标优化、定位和识别目标;第2级处理为态势评估,根据第1级处理提供的信息构建态势图;第3级处理为威胁评估,根据可能采取的行动来解释第2级处理结果,并分析采取各种行动的优缺点。其中,过程优化是一个反复过程,可以称为第4级,它在整个融合过程中监控系统性能,识别增加潜在的信息源,以及传感器的最优部署。其他的辅助支持系统还包括数据管理系统、存储与检索、预处理数据和人机界面等。
Boyd控制回路,即OODA环(观测、定向、决策、执行环),由John Richard Boyd提出,最初应用于军事指挥处理,现在已经大量应用于信息融合。Boyd控制回路使得问题的反馈迭代特性十分明显,包括4个处理阶段:①观测,获取目标信息,相当于JDL的第1级和情报环的采集阶段;②定向,确定方向,相当于JDL的第2级和第3级,以及情报环的采集和整理阶段;③决策,制定反应计划,相当于JDL的第4级过程优化和情报环的分发行为,还有诸如后勤管理和计划编制等;④行动,执行计划,和上述模型都不相同的是,只有该环节在实用中考虑了决策效能问题。OODA环的优点是它使各个阶段构成了一个闭环,表明了数据融合的循环性。可以看出,随着融合阶段不断递进,传递到下一级融合阶段的数据量不断减少。OODA模型不足之处在于决策和执行阶段对OODA环的其他阶段的影响能力欠缺,并且各个阶段也是顺序执行的。
扩展OODA模型是加拿大的洛克西德马丁公司开发的一种信息融合系统结构,该结构已经在加拿大哈利法克斯导弹护卫舰上使用。该模型综合了上述各种模型的优点,同时又给并发和可能相互影响的信息融合过程提供了一种机理。
瀑布模型是一个项目开发架构,开发过程是通过设计一系列阶段顺序展开的,从系统需求分析开始直到产品发布和维护,每个阶段都会产生循环反馈,因此,如果有信息未被覆盖或者发现了问题,那么最好“返回”上一个阶段并进行适当的修改,项目开发进程从一个阶段“流动”到下一个阶段,这也是瀑布模型名称的由来。
Dasarathy模型则包括表2.3所示的5个融合级别。
表2.3 Dasarathy模型的5个融合级别
综上所述,瀑布模型对底层功能做了明确区分,JDL模型对中层功能划分清楚,而Boyd控制回路则详细解释了高层处理。情报环涵盖了所有处理级别,但是并没有详细描述。Dasarathy模型是根据融合任务或功能加以构建,可以有效地描述各级融合行为。
混合模型综合了情报环的循环特性和Boyd控制回路的反馈迭代特性,同时应用了瀑布模型中的定义,每个定义又都与JDL和Dasarathy模型的每个级别相联系,在混合模型中可以很清楚地看到反馈。该模型保留了Boyd控制回路结构,从而明确了信息融合处理中的循环特性,模型中观测、定向、决策、执行环4个主要处理任务的描述取得了较好的重现精度。
(2)信息融合的层次
信息融合的定义可以概括为把分布在不同位置的多个同类或不同类传感器所提供的局部数据资源加以综合(来自同一检测源信号的数据信息),采用计算机技术对其进行分析,消除多传感器信息之间可能存在的冗余和矛盾,加以互补,降低其不确实性,获得被测对象的一致性解释与描述,从而提高系统决策、规划、反应的快速性和正确性,使系统获得更充分的信息。信息融合在不同层次上出现,包括数据层融合、特征层融合、决策层融合。
①数据层融合 数据层融合是使来自多个来源的信息结合起来形成统一的图像的一种技术[26]。数据固有的缺陷是数据融合系统最根本的挑战性问题,因此大部分的研究工作都集中在解决这个问题上。有许多数学理论可以用来表示数据的不完美性,如概率论、模糊集合理论、可能性理论、粗糙集理论、D-S证据理论(Dempster-Shafer Evidence Theory,DSET)、模糊D-S证据理论和随机有限集理论等,这些方法中的大多数能够表示不完美数据的某些特定方面,例如,概率论表示数据的不确定性,模糊集合理论可以表示数据的模糊性,证据理论可以表示不确定性以及模糊数据。图2.26概述了上述处理数据缺陷的数学理论,横轴介绍了数据不完美性的各个方面。
图2.26 不完美数据及其对应的处理方法
针对传感器采集的数据,根据传感器类型进行同类数据的融合。数据层融合要处理的数据都是在相同类别的传感器下采集,所以数据融合不能处理异构数据。
②特征层融合 特征层融合是提取所采集数据包含的特征向量,用来体现所监测物理量的属性,这是面向监测对象特征的融合。如在图像数据的融合中,可以采用边沿特征信息代替全部数据信息。
③决策层融合 决策层融合是指根据特征层融合所得到的数据特征,进行一定的判别、分类以及简单的逻辑运算,根据应用需求进行较高级的决策,是高级的融合。决策层融合是面向应用的融合。比如在森林火灾的监测监控系统中,通过对于温度、湿度和风力等数据特征的融合,可以断定森林的干燥程度及发生火灾的可能性等。这样,需要发送的数据就不是温度和湿度的值以及风力的大小,而只是发送发生火灾的可能性及危害程度等。
决策层融合执行从多个输入到较少数量输出的数据缩减映射。决策层融合通常不会假设任何本地数据处理器输出的参数统计模型[27]。决策层融合方法的目标是将所使用的一组模型的结果合成单一的共识,三种一般的决策层融合方法有线性意见库、对数意见库、投票或排名方法。
决策层融合通常基于数据融合领域中积累的知识来做出决定。这些技术旨在对检测到的目标产生的事件和活动做出高层次的推断。这些技术通常使用符号信息,融合过程需要合理解释不确定性和约束条件。这些方法属于JDL数据融合模型的第2级和第4级,如贝叶斯方法、D-S证据理论、语义方法等。
在传感网络的具体数据融合实践中,可以根据应用的特点来选择融合方式。
(3)信息融合的算法
多传感器信息融合的常用方法基本上可概括为随机和人工智能两大类,随机类方法有加权平均法、卡尔曼滤波法、贝叶斯估计法、D-S证据推理、产生式规则等,而人工智能类则有模糊逻辑理论、神经网络、粗糙集理论、专家系统等。
加权平均法是信号级融合方法最简单、最直观的方法。该方法将一组传感器提供的冗余信息进行加权平均,结果作为融合值,是一种直接对数据源进行操作的方法。
卡尔曼滤波法主要用于融合低层次实时动态多传感器冗余数据。该方法用测量模型的统计特性递推,决定统计意义下的最优融合和数据估计。如果系统具有线性动力学模型,且系统与传感器的误差符合高斯白噪声模型,则卡尔曼滤波法将为融合数据提供唯一统计意义下的最优估计。卡尔曼滤波法的递推特性使系统处理不需要大量的数据存储和计算。采用单一卡尔曼滤波器对多传感器组合系统进行数据统计时,存在很多严重问题:在组合信息大量冗余情况下,计算量将以滤波器维数的三次方剧增,实时性不能满足;传感器子系统的增加使故障随之增加,在某一系统出现故障而没有来得及被检测出时,故障会污染整个系统,可靠性降低。
贝叶斯估计法是融合静态环境中多传感器高层信息的常用方法,使传感器信息依据概率原则进行组合。测量不确定性以条件概率表示,当传感器组的观测坐标一致时,可以直接对传感器的数据进行融合,但大多数情况下,传感器测量数据要以间接方式采用贝叶斯估计进行数据融合。多贝叶斯估计将每一个传感器作为一个贝叶斯估计,将各个单独物体的关联概率分布合成一个联合的后验概率分布函数,通过使用联合分布函数的似然函数为最小,提供多传感器信息的最终融合值,融合信息与环境的一个先验模型提供整个环境的一个特征描述。
D-S证据推理是贝叶斯估计的扩充,其3个基本要点是:基本概率赋值函数、信任函数和似然函数。D-S证据推理的结构是自上而下的,分三级。第1级为目标合成,其作用是把来自独立传感器的观测结果合成为一个总的输出结果。第2级为推断,其作用是获得传感器的观测结果并进行推断,将传感器观测结果扩展成目标报告。这种推理的基础是:一定的传感器报告以某种可信度在逻辑上会产生可信的某些目标报告。第3级为更新,各种传感器一般都存在随机误差,所以,在时间上充分独立地来自同一传感器的一组连续报告比任何单一报告可靠。因此,在推理和多传感器合成之前,要先组合(更新)传感器的观测数据。
产生式规则采用符号表示目标特征和相应传感器信息之间的联系,与每一个规则相联系的置信因子表示它的不确定性程度。当在同一个逻辑推理过程中,2个或多个规则形成一个联合规则时,可以产生融合。应用产生式规则进行融合的主要问题是每个规则的置信因子的定义与系统中其他规则的置信因子相关,如果系统中引入新的传感器,需要加入附加规则。
模糊逻辑是多值逻辑,通过指定一个0~1之间的实数表示真实度,相当于隐含算子的前提,允许将多个传感器信息融合过程中的不确定性直接表示在推理过程中。如果采用某种系统化的方法对融合过程中的不确定性进行推理建模,则可以产生一致性模糊推理。与概率统计方法相比,逻辑推理存在许多优点,它在一定程度上克服了概率论所面临的问题,对信息的表示和处理更加接近人类的思维方式,一般比较适合于在高层次上的应用(如决策),但是,逻辑推理本身还不够成熟和系统化。此外,由于逻辑推理对信息的描述存在很大的主观因素,所以,信息的表示和处理缺乏客观性。模糊逻辑理论对于数据融合的实际价值在于它外延到模糊逻辑,模糊逻辑是一种多值逻辑,隶属度可视为一个数据真值的不精确表示。在MSDF(多传感器数据融合)过程中,存在的不确定性可以直接用模糊逻辑表示,然后,使用多值逻辑推理,根据模糊集合理论的各种演算对各种命题进行合并,进而实现数据融合。
神经网络具有很强的容错性以及自学习、自组织及自适应能力,能够模拟复杂的非线性映射。神经网络的这些特性和强大的非线性处理能力,恰好满足了多传感器数据融合技术处理的要求。在多传感器系统中,各信息源所提供的环境信息都具有一定程度的不确定性,对这些不确定信息的融合过程实际上是一个不确定性推理过程。神经网络根据当前系统所接受的样本相似性确定分类标准,这种确定方法主要表现在网络的权值分布上,同时,可以采用神经网络特定的学习算法来获取知识,得到不确定性推理机制。利用神经网络的信号处理能力和自动推理功能,即实现了多传感器数据融合。
常用数据融合方法如表2.4所示,通常使用的方法依具体应用而定,由于各种方法之间的互补性,常将2种或2种以上的方法组合进行多传感器数据融合。
表2.4 常用的数据融合方法
(4)当前存在的问题
信息融合技术在国内外虽经多年研究取得了不少成果,也已经成功地应用于多个领域,但目前仍未形成一套完整的理论体系和有效的融合算法。绝大部分都是针对特定的问题、特定的领域来研究,也就是说现有研究都是根据问题的种类、特定的对象、特定的层次建立自己的融合模型和推理规则,有的在此基础上形成所谓的最佳方案。但多传感器数据融合系统的设计带有一定盲目性,有必要建立一套完整的方法论体系来指导数据融合系统的设计。不足之处如下。
①未形成基本的理论框架和广义融合算法。目前,绝大多数的融合研究都是针对特定的应用领域的特定问题开展的(分布式混合结构),即根据问题的种类,各自建立直观的融合准则,形成“最佳”融合方案,未形成完整的理论框架和融合模型,使得融合系统的设计具有一定的盲目性。统一的数据融合理论必然是以传感器信号和数据处理理论、C3I系统情报处理理论和指挥决策理论等在工程实践基础上的,研究上一层次融合机理的再创造过程。难点在于在大量随机与不确定问题中的融合准则的确定,这些不确定性反映在测量不精确、不完整、不可靠、模糊,甚至信息冲突中。
②关联的二义性。关联的二义性是数据融合的主要障碍。在进行融合处理前,必须对来自多传感器的观测结果进行关联,保证所融合的信息是来自同一观测目标或事件,以保证融合信息的一致性。传感器测量的不精确性和干扰都是引起关联二义性的因素。如何降低关联二义性是数据融合研究领域亟待解决的问题。
③融合系统的容错性或稳健性没有得到很好的解决。
④对数据融合的具体方法的研究尚处于初步阶段。
⑤数据融合系统的设计还存在许多实际问题,如传感器测量误差模式的建立、复杂动态环境下的系统实时响应等。