4.1 引言
当前,无线传感器网络的应用范围大致可概括为监测(Monitoring)和追踪(Tracking)两大领域[5]。监测领域主要包括环境监测、健康监测、电网监测、工业自动化监测、地震监测等,追踪领域主要涉及目标跟踪,如动物跟踪、特定人员跟踪、车辆跟踪等。为了支持这些应用,如何保证无线传感器网络的安全是首先要解决的问题。采用基于密码学的方法是一种传统的网络安全技术,这种技术常称为硬安全(Hard Security)[42],主要解决数据机密性、数据完整性和传感器节点的身份认证等问题。另一种是采用称为软安全(Soft Security)[42]的信任和声誉管理系统,这种机制能有效地应对部分已通过硬安全检查的正常节点为了自己能获取更大的利益而提供错误或虚假信息的欺骗行为。因此,信任和声誉管理系统是硬安全技术的有效补充,对保障无线传感器网络正常安全地运行具有重要作用。
作为最近几年应用到无线传感器网络中的安全技术,基于信任的安全机制有其自身的特点。与加解密、监测非法入侵等安全技术相比,信任机制是在以无线传感器网络传感器节点为中心的环境中,帮助各传感器节点建立信心,推动传感器节点之间的协作,降低与其他传感器节点合作的风险。通常,一个无线传感器网络信任和声誉管理系统需要解决如何确定传感器节点的信任度及传感器节点之间的信任如何进行演化的问题。这是由于一旦在无线传感器网络中部署信任管理系统后,传感器节点间的信任决策及其动力学演化将决定传感器节点间是否采取合作的行为,从而影响整个无线传感器网络的稳定和安全。在这个过程中,无线传感器网络信任管理系统需要收集并存储用于确定信任度的相应凭据,需要记录传感器节点的动作行为,再计算得到对应传感器节点的信任度值。根据其他传感器节点的信任度值,一个传感器节点将通过信任决策确定是否与其他传感器节点进行合作,使得那些有欺骗行为(相应的信任度要低)的传感器节点在试图进行通信时得不到其他节点的合作通信支持,从而减少传感器节点的欺骗行为,保障无线传感器网络的正常通信。因此,研究无线传感器网络传感器节点的信任决策和信任演化动力学过程对保障无线传感器网络的稳定和安全起重要作用[111]。
博弈论作为研究参与者之间理性决策的有效工具[112],已广泛用于无线传感器网络优化的多个方面,如能量消耗优化[113]、功率优化分配[114]等问题。使用博弈论工具,能得到参与者采取策略的均衡点,从而决定各参与者的最优行动。与传统博弈类型不同的是,演化博弈认为一个种群(Population)中的参与者具有进化能力并能为满足自身利益而重复地进行博弈,直至整个种群达到一定程度的均衡。根据演化博弈理论,一个种群的动力学演化反映的是那些选择具有较高收益策略的个体(Individual),将逐步增加它们在整个种群中的比例,而那些选择具有较低收益策略的个体比例将逐步减少。通过使用演化博弈这种工具,可以分析一个种群中各参与者对不同策略进行的选择演化,从而揭示整个种群在假定利益前提下的决策动力学演化规律。
本章将利用演化博弈研究传感器节点间的信任决策过程,从而揭示无线传感器网络各传感器节点间的信任演化原理。根据演化博弈论的特点,本章将整个无线传感器网络看作一个种群,并将每个传感器节点看作这个种群中的一个个体。然后根据各个传感器节点能选择不同策略的实际情况建立“无线传感器网络信任博弈”模型,并且为了研究激励机制对传感器节点选择动作Trust(即可以合作通信)的影响,在“无线传感器网络信任博弈”模型中整合激励机制参数。为了说明“无线传感器网络信任博弈”模型的稳定性,通过复制动态动力学方程探索“无线传感器网络信任博弈”的演化稳定策略。
在扩展作者前期工作[115]的基础上,本章的工作主要包括以下内容:
(1)建立适用于传感器节点信任决策的“无线传感器网络信任博弈”模型,该模型能在传感器节点进行信任决策时正确地反映传感器节点选择不同动作的收益情况。
(2)在“无线传感器网络信任博弈”模型中绑定激励机制参数后,也就是说,若在实际的无线传感器网络信任管理系统中引入激励机制,能有效地减少传感器节点选择动作Distrust(即对相互通信采取不合作的行为)的比例,从而使各传感器节点向选择动作Trust转化,达到改善无线传感器网络的稳定性和安全性的目的。
(3)得到与“无线传感器网络信任博弈”相关的演化稳定策略定理,这些定理给出了达到演化稳定策略的条件,并且能为无线传感器网络信任管理系统的实际设计提供理论基础。
本章其余章节安排如下:4.2节说明相关工作;4.3节建立“无线传感器网络信任博弈”模型并利用复制动态方程寻求相应的演化稳定策略及揭示传感器节点信任演化机理;4.4节通过实验验证“无线传感器网络信任博弈”的演化稳定策略和激励机制的有效性;4.5节给出本章小结。
本章涉及的符号含义如下:
si表示第i个纯策略。
S表示给定种群中各个体可选择的纯策略集合。
φi(t)表示在时刻t选择纯策略si的个体数量。
θi(t)表示在时刻t选择纯策略si的个体比例。
θ(t)表示种群在时刻t的混合策略。
u(si,θ(t))表示个体在时刻t选择纯策略si的期望收益。
(θ(t),θ(t))表示种群的平均期望收益。
T表示一个传感器节点的信任度。
α表示一个传感器节点选择某个动作后产生的收益和它的信任度之间的调节因子。
GT表示一个传感器节点选择动作Trust后得到的收益。
GD表示一个传感器节点选择动作Distrust后得到的收益。
GC表示一个传感器节点在相邻节点选择Trust时所得到的合作收益。
C表示一个传感器节点在发送自身数据或转发其他传感器节点的数据时所产生的成本。
L表示一个传感器节点在相邻传感器节点选择动作Distrust时对其造成的损失。
=(P,N,S,U)表示“无线传感器网络信任博弈”。
θ表示选择动作Trust的传感器节点在整个无线传感器网络中所占的比例。