国际政治科学(2013年第2期/总第34期)
上QQ阅读APP看书,第一时间看更新

二、博弈模型与均衡分析

隐藏在“狐假虎威”现象背后的是三类国家行为体之间的策略互动,其中两类国家行为体签订了军事同盟条约,盟内弱国为挑战者,盟内强国为庇护者,作为第三方的盟外国家是威慑者。下文将展开博弈分析。

(一)基本博弈模型

三方不对称军事威慑博弈基本模型可以表示为图1所示。三个行为体之间进行一个分阶段的动态博弈过程。第一阶段(在节点1),挑战者选择是否挑战,如果不挑战,结局为现状(SQ);如果挑战者选择挑战,这时挑战者通常被视为修正主义国家,它对现状不满。挑战的方式主要包括三类:①对不曾拥有或不曾有效控制的领土提出权利主张;②试图推翻或改变另一个国家的政府;③宣布不再遵守另一个国家的政策。第二阶段(在节点2),针对挑战者的挑战行为,威慑者选择让步还是反抗,如果选择让步,挑战者的要求得到满足,结局是挑战者胜利(CS);如果威慑者选择反抗,则表示威慑者实施即时威慑行动。即时威慑的目的有两个,一是让挑战者让步,二是让庇护者不干预。第三阶段(在节点3),庇护者选择干预还是不干预,如果选择干预,则会导致三边冲突或战争(TW),威慑者的即时威慑行动失败;如果庇护者选择不干预,则表示威慑者对庇护者的即时威慑成功。第四阶段(在节点4),挑战者将选择究竟是让步还是升级行动,当挑战者选择升级行动时,结局为威慑者和挑战者之间的双边冲突或战争(BW),威慑者对挑战者的即时威慑失败;如果挑战者选择让步,结局为挑战者失败(CD),威慑者对挑战者的即时威慑成功。三方博弈的结局共分五种情况,按照威慑者的军事威慑成功或失败的类型来划分,现状(SQ)结局是威慑者一般威慑的成功,其他结局(CS,CD,BW,TW)是威慑者一般威慑的失败;挑战者失败(CD)是威慑者即时威慑的成功;双边冲突或战争(BW)、三边冲突或战争(TW)是威慑者即时威慑的失败。

图1 三方不对称军事威慑博弈基本模型

(二)国家偏好结构

在三方不对称军事威慑博弈中,不同国家行为体对五种博弈结局具有相异的偏好,这些不同偏好关系构成的整体可称为国家偏好结构,当某一国家的偏好关系出现变化时,预示着国家偏好结构产生转变,对博弈结局产生决定性影响。军事威慑理论揭示,国家偏好关系能够反映国家的实力和决心。在威慑理论中,实力主要是指威慑性威胁的实力,这和通常所理解的国家实力的概念是不同的。谢林(Schelling)指出,有实力的威胁是能够产生伤害的威胁。[12]扎加雷(Zagare)提出,一个行为体的威胁是有实力的,仅当受威胁方更喜欢现状,而不是威胁实施后的结局;一个威胁是缺乏实力的,当被威胁方在威慑性威胁被执行后仍然愿意行动。[13]简而言之,威慑者有威慑实力,说明挑战者更愿意维持现状,而不是和威慑者发生冲突或战争。也就是说,威慑者相对挑战者而言是有实力的,则表明挑战者对现状(SQ)和双边冲突或战争(BW)两个结局之间的偏好关系为SQ>chBW。[14]对威慑者而言,决心是其实施威胁的意志,是一个主观变量;对挑战者而言,决心反映了威慑者实施威胁的可信性(credibility),是一个客观变量。如果一个威胁在挑战者看来是不可信的,那么该威胁通常被认为是一种虚张声势,威慑将很难成功。斯莫克(Smoke)认为,可信威胁一般等同于应该被相信的威胁。[15]贝茨(Betts)指出,只有当威胁是理性实施的,这些威胁才能够被相信。[16]勒博(Lebow)也认为,只有理性威胁是可信的。[17]扎加雷和基尔戈(Zagare and Kilgour)将以上观点进行了总结[18]:威胁是可信的当且仅当其能够被相信,并且威胁是可理性实施的,可信威胁是满足塞尔腾(Selten)的完美标准[19]的威胁,即威胁方更愿意执行它。如果威慑者是理性的,那么它有无决心不是由主观愿望决定,而是取决于它对不同结局的效用权衡,如果威慑者认为让步的效用高于冲突的效用,则威慑者的决心是不可信的,相反,如果威慑者认为冲突的效用高于让步的效用,则威慑者的决心是可信的。因此,威慑者是否有决心,不是建立在主观愿望而是客观利益权衡基础上的。威慑者是有决心的,则其在双边冲突或战争与让步之间的偏好关系为:BW>DefCD。在威慑博弈中,庇护者的偏好关系中最重要的是它对于三边冲突或战争(TW)和双边冲突或战争(BW)两者的偏好。我们可以假定具有军事同盟的国家之间,如果盟友是可靠的,即当发生冲突或战争时,盟友站在自己一边参战,则该盟友的偏好关系为TW>ProBW;如果盟友是不可靠的,则说明该盟友的偏好关系为BW>ProTW。

笔者根据实力、决心和可靠性等指标将参与三方不对称军事威慑博弈的国家偏好结构归纳为表1。在表1中,笔者没有列出挑战者更偏好于现状而不试图挑战威慑者以求获胜的情况,因为在这种情况下博弈的结局非常容易预测。如果挑战者的偏好为SQ>ChCS,即现状优于挑战者胜利,则挑战不会发生,结局为现状(SQ)。当威慑者属于有决心类型时,还可以根据它对双边冲突或战争(BW)与三边冲突或战争(TW)之间的不同偏好关系细分为有完全决心(U)和有部分决心(C)两种子类型,当威慑者的偏好关系为BW>DefTW>DefCS时,则表示有完全决心,即无论是双边还是三边的冲突或战争,都优于让步;当威慑者的偏好关系为BW>DefCS>DefTW时,则表示有部分决心,即威慑者面对双边冲突或战争时有决心,但是面对三边冲突或战争时表现为缺乏决心。

表1 三方不对称军事威慑博弈国家偏好结构

在三方不对称军事威慑博弈中,如果威慑者不具有威慑实力,不能使挑战者认识到维持现状优于冲突或战争,而是使挑战者的偏好关系为BWChSQ时,则挑战者必然会发起挑战,威慑者的军事威慑必然会失败,因此,威慑实力是威慑成功的必要条件。对于威慑者不具备威慑实力的情景,逻辑推理非常简单,博弈结局一目了然。基于以上原因,在军事威慑理论研究中,一般假定威慑者具有威慑实力,重点研究威慑者的决心大小对于威慑成功或失败的影响。“狐假虎威”现象通常发生在威慑者具备威慑实力的情况下,此时挑战者更喜欢现状而非冲突或战争,同时要求威慑者的决心类型属于有部分决心(CH)类型或者无决心(S)类型,即在庇护者不干预的情况下有决心而当庇护者干预时威慑者表现为无决心,或者无论庇护者干预与否威慑者都无决心。论文在讨论三方不对称军事威慑各博弈方策略选择时,将讨论重点放在威慑者具备威慑实力的情形,对于无威慑实力的情形,由于预测相对简单,笔者不再做详细分析。

(三)完全信息条件下博弈均衡分析

在完全信息条件下,参与博弈的各方都知道自己和其他方的偏好关系。在不完全信息条件下,我们假定参与者仅知道自己的偏好关系,但是对于其他两方的实际偏好关系具有不完全信息,只是对其他各方所属类型的概率具有完全信息。博弈各种解的概念是建立在两个重要假定基础之上的,一是理性(rationality)假定,二是共同知识(common knowledge)假定。理性假定是指博弈者能够正确计算出各种不同行为组合会带来什么样的结局,并总是采用效用最大化的行为。共同知识假定是指如果每个博弈者都知道该事实,每个博弈者都知道每个博弈者都知道该事实,这样无穷推演下去。也就是说,(每个博弈者都知道)k每个博弈者都知道该事实,k=0,1,2,…,∞。[20]三方不对称军事威慑博弈属于多阶段动态博弈,在完全信息条件下对应的均衡概念为“子博弈完美纳什均衡”。[21]求解子博弈完美纳什均衡的方法是逆向归纳法(backward induction),最后解出的均衡结果如表2所示。

表2 完全信息条件下三方不对称军事威慑博弈均衡结果

根据表2,我们可以发现,若威慑者想要确保威慑成功,需要满足以下条件:

首先,威慑者必须具备威慑实力,这是确保威慑成功的必要条件。即挑战者在现状和冲突或战争之间的偏好关系为SQ>ChTWChBW。

其次,在庇护者不可靠的情况下,威慑者的决心必须高于或者等于挑战者的决心。这里包括两种情况。一是威慑者有决心(UH或者CH类型),即威慑者在冲突和让步之间的偏好关系为BWDefCS;二是当威慑者无决心(S类型)时,挑战者必须无决心(S类型)。

最后,在庇护者可靠的情况下,威慑者必须是有完全决心类型(UH类型),即威慑者在冲突和让步之间的偏好关系为BW>DefTW>DefCS。

以上条件说明,在完全信息条件下,三方不对称军事威慑博弈结局主要由挑战者、威慑者两类国家行为体在实力、决心方面的差异以及庇护者是否可靠等因素所共同决定。只有当威慑者具有威慑实力和完全威慑决心(属于UH类型)时,威慑才能够确保成功;如果威慑者不具备完全威慑决心,则要求庇护者属于不可靠类型(U类型),同时挑战者不能属于有决心类型(H类型),而属于无决心类型(S类型),此时才会威慑成功,否则威慑会失败。

(四)不完全信息条件下博弈均衡分析

如果博弈各方对彼此决心具有不完全信息,则需要进行“海萨尼转换”,[22]将不完全信息转化为不完美信息处理。假定在不完全信息条件下三方不对称军事威慑博弈中,挑战者为H类型和S类型的先验概率分别为pHChpSCh,满足pHCh+pSCh=1,0<pHCh<1,0<pSCh<1;威慑者为H类型和S类型的先验概率为和,满足pHDef+pSDef=1,0<pHDef<1,0<pSDef<1;庇护者为R类型和U类型的先验概率为pRPropUPro,满足pRPro+pUPro=1,0<pRPro<1,0<pUPro<1。以上先验概率为共同知识。使用一个九元组[xHxSyHySqzHzSwRwU]表示三方不对称军事威慑博弈的完美贝叶斯均衡。其中q为后验概率,表示威慑者关于挑战者属于H类型的后验概率。xHxS分别表示H类型和S类型的挑战者在博弈模型节点1选择挑战的概率,yHyS分别表示H类型和S类型的威慑者在博弈模型节点2选择反抗的概率,zRzU分别表示R类型和U类型的庇护者在博弈模型节点3选择干预的概率,wHwS分别表示H类型和S类型的挑战者在博弈模型节点4选择升级行动的概率。假定在威慑者有威慑实力的情况下,使用cXdXiX分别表示挑战者、威慑者和庇护者对于X结局的效用。对于三方不对称军事威慑博弈而言,分别使用H表示博弈者有决心,S表示博弈者无决心,使用R表示庇护者是可靠的,使用U表示庇护者是不可靠的。使用cHTWcHBWcSTWcSBWdHTWdHBWdSTWdSBW分别表示挑战者和威慑者属于H和S类型时关于结局TW和BW的效用;使用iRTWiUTW表示庇护者属于R和U类型时关于结局TW的效用。三方不对称军事威慑博弈中不同国家对博弈结局的效用如下所示。

挑战者:cCScSQcHTWcHBW>[cSTWcCD]>cSBW

威慑者:dCDdHBW>[dCSdHTW]>dSBWdSTW

庇护者:iRTW>[iBWiCD]>iUTW

我们求解不完全信息条件下三方不对称军事威慑博弈均衡,可以得出表3所示的结果。

表3 三方不对称军事威慑博弈完美贝叶斯均衡*

在表3中,有关博弈均衡存在条件的重要参数值主要有四个,[23]分别为:

根据表3,三方不对称军事威慑博弈共存在四类均衡形态:威慑均衡、分离均衡、攻击均衡和虚张声势均衡,根据pHChpHDefpRProq的不同,以上四类博弈均衡所在位置可以用图2表示。

图2 三方不对称军事威慑博弈均衡位置示意图

1.威慑均衡

威慑均衡包含两类,一个是确定威慑均衡,另一个是不确定威慑均衡。威慑者威慑决心的先验概率较高时(pHDefc1t),挑战者将不实施挑战,博弈结局为现状(SQ)。从c1t函数可以看出,在其他条件不变的情况下,随着庇护者可靠性(pRPro)的增加,c1t的值增大,威慑者威慑成功的门槛值上升,要求威慑者展示更高的决心(pHDef),才能确保威慑的成功。确定威慑均衡不受挑战者决心大小的影响,即c1t这一函数和挑战者决心的先验概率(pHCh)无关。在其他条件不变的情况下,当现状的效用(cSQ)对于挑战者而言变大时,c1t的值变小,威慑者威慑成功的门槛值下降,即在威慑者决心保持不变的情况下,威慑者更可能威慑成功。在其他条件不变的情况下,当三边冲突或战争的效用(cHTW)对于挑战者而言更高时,c1t的值增大,威慑者威慑成功的门槛值升高。在其他条件不变的情况下,当挑战者关于双边冲突或战争的效用(cHBW)变大时,c1t的值增大,威慑者威慑成功的门槛值升高。

当威慑者决心的先验概率较低时(pHDefc1t),仍然可能威慑成功,因为存在一个不确定威慑均衡。在不确定威慑均衡中,要求威慑者必须以足够高的概率选择反抗(yHf1ySf2)不过这一威慑均衡是非常不确定的,因为当威慑者决心的先验概率较小时,还可能存在其他均衡。威慑者选择反抗还是让步,取决于挑战者属于H类型的后验概率q。当威慑者不考虑挑战者决心的大小,而承诺一旦挑战者发起挑战,将以较大的概率实施反抗,这时也会促使挑战者放弃挑战,获得现状的结局。

2.分离均衡

分离均衡在两种情况下存在。当威慑者决心的先验概率低于确定威慑均衡的门槛值,高于某一门槛值,同时庇护者的先验概率低于某一门槛值(即pRProdtc2tpHDefc1t)时,或者当庇护者的先验概率等于某一门槛值,同时威慑者决心的先验概率高于某一门槛值(pRPro=dtpHDefc3t)时,H类型挑战者将实施挑战,S类型的挑战者将不实施挑战,而是维持现状。在分离均衡中,挑战者的偏好关系可以通过它的策略选择揭示出来,H类型和S类型的挑战者在策略选择上是不同的。从最低门槛值(c2t)的特征可以发现,在其他条件不变的情况下,当现状的效用(cSQ)增大时,c2t的值变小,即威慑者威慑住S类型的挑战者的可能性增大;当挑战者让步的效用(cCD)变小时,c2t的值变小,威慑者威慑住S类型的挑战者的可能性增大。

3.攻击均衡

当威慑者决心的先验概率低于分离均衡的门槛值(pHDefc2t),同时挑战者的先验概率高于某一门槛值时(pHChqSt),则无论是H类型的挑战者还是S类型的挑战者都会实施挑战。根据qSt函数形式可以发现,随着庇护者的可靠性(pRPro)上升,挑战者实施挑战的门槛值qSt降低,所以挑战者实施挑战的可能性上升。当威慑者让步的效用(dCS)增大时,挑战者实施挑战的门槛值qSt降低,挑战者实施挑战的可能性上升。在其他条件不变的情况下,当双边冲突或战争的效用(dSBW)对于S类型的威慑者而言增大时,挑战者实施挑战的门槛值qSt升高,挑战者实施挑战的可能性下降。当三边冲突或战争的效用(dSTW)对于S类型的威慑者而言增大时,挑战者实施挑战的门槛值qSt升高,挑战者实施挑战的可能性下降。

4.虚张声势均衡

当威慑者决心的先验概率等于威慑均衡的门槛值(pHDef=c1t),同时庇护者的先验概率低于某一门槛值(pRProdt);或者当威慑者决心的先验概率低于威慑均衡的门槛值(pHDef=c1t),同时庇护者的先验概率等于某一门槛值(pRProdt)时,此时H类型的挑战者将实施混合策略,S类型的挑战者选择不挑战。当威慑者决心的先验概率低于分离均衡的门槛值(pHDef=c2t),并且挑战者的先验概率低于某一门槛值时(pHChqSt),则H类型的挑战者将实施挑战,而S类型的挑战者将实施混合策略,即以一定的概率实施挑战。从d1d2两个公式可以看出,在其他条件不变的情况下,随着庇护者可靠性(pRPro)的上升,d1d2值增大,S类型的挑战者以更高的概率实施挑战。在S类型的挑战者实施混合策略时,H类型的威慑者和S类型的威慑者也会实施混合策略,即以一定的概率(yH=f3yS=f4)选择反抗。