4.2 特征函数_合作博弈引论-QQ阅读男生轻小说网

上QQ阅读APP看书，第一时间看更新

4.2 特征函数

从定义4.1可以看出，特征函数在联盟博弈中将会起到重要的作用。在以后讨论联盟博弈的求解问题时更能体现出这一点。因此，如何导出特征函数的问题摆在了我们的面前。

许多情况下，特征函数是由现实生活直接生成的。因为博弈关心的就是联盟S所能创造的财富或者必须承担的成本。例4.1中的机场跑道成本和例4.2的S中能匹配成对手套的市场价格，都是属于直接生成的一类。

但是在另外的不少情况，局中人本身面临一场“游戏”。在这场游戏中，子联盟S可能得到的盈利将随着N\S中成员的行动而发生变化，也随着S自己的策略而变化。然而，我们在前面曾经提到，v（S）应该是S自身创造且不受N\S成员影响的值，为了做到这一点，在这种场合下确定v（S）时，不能不考虑到对S与N\S各种可能策略综合之后的结果，相当于在两人讨价还价问题中，意见不一致点v的确定要考虑局中人及其对手的策略行动再进行综合一样，许多学者为此提出了v（S）的各种导出方法。

假设有一个可转移效用的策略型博弈Γ={N, （Ci）i∈N, （ ui）i∈N}。其中Ci表示局中人i的策略空间，ui则是局中人i的盈利函数。对任何一个联盟S, S中局中人i（i∈S）策略的乘积空间构成了S的策略空间CS=Χi∈SCi，由于涉及混合策略，因此联盟S可用的策略集记为Δ（CS）。Δ（CS）中的任意策略记作σS。这些记号其实与非合作博弈中的记号完全一致。当S实施σS, N\S实施σN\S时，“货币”转让之前局中人i的期望盈利为

注意，在公式（4.7）中，σS是来自Δ（CS）的混合策略，这个混合策略取cS∈CS的概率为σS（cS）, σN\S（cN\S）的意义类同于σS（cS）。

冯·诺依曼和摩根斯坦在他们创造性的著作《博弈论与经济行为》（1944）中提出一种观点，将特征函数定义为式（4.8）下存在的v（S）为具有可转移效用的策略型博弈Γ的联盟化最小最大表示。

式（4.8）中最后一个求和号，表示在（σS, σN\S）下，S中所有局中人的盈利之和，它符合“v（S）体现了S中成员共同创造财富和获得由此而产生的全部盈利”的基本想法。第二个符号是取最大值，它提示了，在N\S采取行动σN\S时，S中成员将选择Δ（CS）中某个行动以使自身的盈利之和达到最大值，反映了博弈中S成员的理性行为。由于N\S可以采取不同的σN\S，因此这个最大值随着σN\S的变化而变动。但是如果能取到这些最大值中的一个最小值，这个值将使S中成员认为无论N\S的策略如何变化，S总共能取得的最低保障。无论σN\S如何千变万化，S的最低保障作为盈利的“底线”再也不会受到进一步损害，这样定义的v（S）“自动脱离”了N\S的干扰，因此符合特征函数的定义。我们称在

max表示S最大化自身，min表示N\S采取了最遏制S利益的“进攻”手段σN\S，因此，最小最大化的特征函数v（S）体现了S成员在面临N\S的最猛烈攻击和威胁时所能保证自己获得的最大盈利之和。

在两人讨价还价问题中确定意见不一致点时，有一个办法是利用两人策略型博弈中的纳什均衡，因为“一旦谈不拢就开打”，一开打，各个局中人总是想方设法使自己的盈利达到最大，其合理的结局往往是纳什均衡。这种想法也很自然地延伸到联盟博弈的特征函数的建立。但是，从合作博弈的定义可知，特征函数带有盈利的特性，而均衡这个概念又依赖于盈利。因此，如果想用均衡来引出特征函数，所使用的均衡显然不能建立在联盟的总盈利基础上面。如冯·诺依曼和摩根斯坦在提出特征函数的最小最大表示一样，由于在具有可转移效用的策略型博弈Γ中，各个局中人的盈利函数ui是已知的，在某个策略剖面（σS,σN\S）下，我们考虑S中局中人的盈利之和，并且把这个“盈利和”看做S在这个剖面的盈利。同样把N\S中局中人的盈利之和看做N\S在这个剖面的盈利。实际上我们将（σS,σN\S）看做“局中人”S与“局中人”N\S的攻防策略剖面，于是我们就可以考虑纳什均衡了。具体地说，对于联盟S和它的互补联盟N\S，如果存在策略和，使得

那么，我们指定

式（4.9）蕴涵着是关于的最优反应之一（在S中的局中人的“盈利之和”的意义下），式（4.10）则蕴涵了是N\S关于S的的最优反应之一。倘若把S和N\S视作博弈中的两个局中人的话，那么，（σS, σN\S）相当于这个“新”博弈的纳什均衡。纳什均衡相应的“盈利对”则被定义为特征函数值v（S）和v（N\S）。式（4.9）与式（4.10）都意味着，当对手采取某个行动时，局中人联盟将采取最优的防御手段。因此，这样导出的特征函数v被称为具有可转移效用的策略型博弈Γ的联盟型防御均衡表示（defensive-equilib-rium representation）。

如果针对N\S的行动σN\S，联盟S考虑的不是最大化自己成员的盈利之和，而是考虑最大化这个盈利之和与N\S的盈利之和二者之间的差。一旦考虑这个差异，S与N\S两个联盟之间的攻防意图赫然在目。这就导出了联盟型理性威胁表示形式的特征函数（rational-threatsrepresentation）。它的充分必要条件是：对于每一对S与N\S，如果存在和，使得

那么，我们可以定义

再一次强调，合作博弈最基本的假设是，大联盟N是可能生成的。没有这个基本假设，就没有必要去研究合作博弈。因此，在上述几种方法导出特征函数时，我们很关心大联盟N的特征函数值v（N）。注意到与N互补的联盟是空集∅，因此，无论是最小最大表示，还是防御均衡表示，或者是理性威胁表示，从它们的定义公式着手，我们容易发现它们所定义的v（N）是相同的：

式（4.15）蕴涵了，v（N）是集合N中n个局中人可能的盈利之和的最大值。

特征函数的各种导出方法都有着问题的实际背景与意义。以最小最大表示为例，某些局中人如果决定相互合作从而形成联盟S，并且他们不希望与其他人，即N\S中的成员，进行合作。那么他们必定应该考虑到N\S对他们的攻击和因此造成的伤害。这可以归结为日常生活中常说的“防人之心不可无”。在N\S选择了他们的最优攻击策略的情况下，S会极力保证自己能得到最大的“盈利之和”，这种想法很自然地导致了最小最大表示。但是，从N\S的角度，他们采取了进攻手段使S中的局中人的“盈利之和”尽可能地小。在不少情况下，减少对手效用并不等于增加自己的利益，有时候存在着两败俱伤的可能。例如美苏当初的核谈判，美国有实力发动核战争置苏联于死地，然而核战争的结果同样可能使美国自己遭到灭顶之灾。理性的局中人一般不愿意采取这种手段。一般情况下，采取进攻或威胁进攻的一方总是希望借此增加自己的效用。那么，在上述三种导出特征函数的过程中是否都考虑了假设N\S进攻或威胁是合理的呢？在合作博弈中，我们总是强调假设N\S进攻或威胁是合理的。因为在合作博弈中存在着所有局中人一起合作的可能性。通俗地讲，n个局中人的合作增大了蛋糕，然而合作博弈研究的第二个方面是如何分配这块增大了的蛋糕。于是，有可能发生矛盾与冲突，自然会产生“分配蛋糕”的谈判。N\S发起攻击或发出威胁，这种攻击和威胁要能起到震撼S成员的作用，使得S中的成员愿意让步，从而让N\S中的成员获得较大的份额（增加了自己的效用）。

例4.3 考虑三人策略型博弈：中人来说，（a1, a2, a3）是个不错的选择，因为它使他们的盈利之和达到最大的12。非合作博弈预测的结局是纳什均衡（b1, b2, b3），每个局中人只能获得1。众所周知，合作博弈关注令人诱惑的（a1, a2, a3），因为这个结局使得三人相互合作并取得最好的共同利益。为了能达到这个结局，三人之间需要进行谈判。

这是一个三人两策略博弈。每个格子中的三个数字从左到右分别表示在该策略剖面中局中人1,2,3的盈利。这个博弈有一个特点：每当其他两个局中人的策略给定时，第三个局中人从自己的策略集{ai, bi}中选择的能极大化自己盈利的策略一定是bi。因此我们称bi是“自私”策略，使局中人自己处于劣势的策略ai则称为“慷慨”策略。正是由于bi是“自私”的策略，不难求得该策略型博弈的纳什均衡是（b1, b2, b3）。其实，对于三个局

因为要谈判，要合作，就必须建立特征函数。现在我们试图按照上面提到的三种方法导出特征函数。

无论哪一种方法，毫无疑问，v（N）=v（{1,2,3}）=12。因为我们的目的就是要使这三个人形成大联盟。

首先使用最小最大表示方法来导出特征函数。先考虑两人联盟的特征函数取值，以子联盟{2,3}为例。在上述盈利表中将局中人2与局中人3的盈利相加，可以得到如下盈利表：

当局中人1取a1时，{2,3}取（a2, a3）,（b2, a3）,（a2, b3）和（b2, b3）时的盈利之和分别为：8,7,7和6，其最大值是8。而当局中人1取b1时，{2,3}取（a2, a3）,（b2, a3）,（a2, b3）和（b2, b3）时的盈利之和分别为：4,3,3和2，其最大值是4。因此当局中人1取b1时，{2,3}取（a2, a3）获得的4是联盟{2,3}的特征函数值。使用同样的办法可以推得v（{1,2}）=v（{1,3}）=v（{2,3}）=4。

现在考虑单人“联盟”，以局中人1为例，局中人1取b1是他对付互补的两人联盟的最优策略，因此我们只要观察新盈利表的最后一行，不难看出使局中人1得到最小盈利的一列是（b2, b3），即局中人2与局中人3分别采取“自私”策略，于是可得v（{1}）=1，这等于说，局中人1在其互补联盟的成员都自私的情况下，能够保证自己得到的最大盈利为1。同理可以推定v（{2}）=v（{3}）=1。事实上，如果三个人之间就合作问题的谈判破裂，而且他们互相之间谁也不想跟其他人组成联盟时，那么博弈进入非合作状态，此时，纳什均衡应该是一个合理的结局。所以v（{1}）=v（{2}）=v（{3}）=1是特征函数的合理取值。

再来计算防御均衡表示情况下的特征函数。

从盈利表可以看出，每当一个局中人单干时，不管其他局中人是否联合，“自私”策略总是他的所爱。因此，我们考虑S={1个局中人}与N\S（另外两个局中人的联盟）之间博弈时，只要考虑单干的局中人拥有占优策略就不难得到这个博弈的纳什均衡。例如，当S={1}和N\S={2,3}时，其盈利矩阵为本题中的第二张盈利表。容易看到，S与N\S之间的非合作博弈的纳什均衡是（b1, a2×a3），因此

v（{1}）=5, v（{2,3}）=4

同理可以推得其他形式的S与N\S之间博弈的纳什均衡，从而求得

v（{1,2}）=v（{1,3}）=v（{2,3}）=4

v（{1}）=v（{2}）=v（{3}）=5和v（N）=12

特征函数的这个表示反映了，当博弈中的两人合作以排斥第三人时，第三人用“自私”的策略来对付他们。而当第三人用“自私”策略试图肥己的时候，两人联盟中的成员会以慷慨来维护自己的利益。

最后，我们考虑同时存在进攻和防御，即考虑联盟型理性威胁表示形式的特征函数。仍然以S={1}和N\S={2,3}为例。根据理性威胁表示形式的定义，很容易构造相应的盈利矩阵，只要把第二张盈利表中每一格子里的两个盈利互相相减就可以了。得到下表：

这是一个零和博弈。由于理性威胁考虑的是博弈双方的盈利之差，互相的盈利之差必然导致一个零和博弈。显然，这个博弈的纳什均衡是（b1, b2×b3），理性威胁准则使得这个博弈中凡小于大联盟的所有小联盟的成员全都选择“自私”。它对应于原博弈的结局的盈利向量（1,1,1）。因此，v（{1}）=1, v（{2,3}）=2。所以博弈的理性威胁表示的特征函数为

v（N）=12, v（{1,2}）=v（{1,3}）=v（{2,3}）=2

v（{1}）=v（{2}）=v（{3}）=1

例4.4 拥有三家厂商的扩大了的古诺模型

假设这三家厂商生产同一样产品。厂商1是小型的，每天只能生产1个单元或者不生产，厂商2与3比较大一些，其能力是每天每家厂商可生产2或3个单元。产品的市场价格由下述需求公式确定：

p=8-（c1+c2+c3）

其中ci（i=1,2,3）为厂商i的生产量。显然，厂商每天盈利是pci（i=1,2,3）。我们很容易将这个问题建模为策略型博弈：

如果我们考虑合作博弈，那么，大联盟的特征函数取值是显然的：v（N）=16。但是，如果三家厂商追求这样一个大联盟的结果，厂商1会有所怨言，因为不生产产品是厂商1的劣策略，将使它一无所有。为了达到大联盟的效果，有必要进行谈判，商定合理的分配方案，使厂商1得到一定的补偿。现在，我们试图建立特征函数。

（1）最小最大表示

观察已知的盈利表，不妨先考虑S={2,3}和N\S ={1}，即大厂商互相合作，将厂商1排斥在外。

在厂商1取0时，S最大的盈利之和等于8 +8 =16，他们各生产2个单元；

在厂商1取1时，S最大的盈利之和等于6 +6 =12，他们仍然各生产2个单元。因此，v（{2,3}）=min（16,12）=12。

又若S={1,2}，即一大一小两家厂商互相合作，排斥另一家大厂商，N\S={3}。

当厂商3取2时，厂商1与厂商2的盈利之和的最大值为3 +6 =9；

当厂商3取0时，厂商1与厂商2的最大盈利之和为2 +4 =6。因此，v（{1,2}）=min（9,6）=6。

由厂商2与厂商3的对称性，可得v（{1,3}）=6。

考虑S只包含一家厂商的情况。先考虑S={1}，此时N\S ={2,3}。由于生产1个单元是厂商1的优策略，所以v（{1}）=min（3,2,2,1）=1。

考虑S={3}, N\S取（0,2）时，maxu3=9，取（0,3）时，maxu3=6，取（1,2）时，maxu3=6，取（1,3）时，maxu3=4，因为min（9,6,6,4）=4，故v（{3}）=4 =v（{2}）。

总结一下，特征函数的最小最大表示为v（N）=16, v（{1,2}）=v（{1,3}）=6, v（{2, 3}）=12, v（{1}）=1, v（{2}）=v（{3}）=4。

（2）联盟型防御均衡表示

对于S={1}, N\S={2,3}，只考虑厂商1的优策略——生产1个单元，此时两家大厂商组成的联盟的最优反应是各生产2个单元，因此v（{1}）=3, v（{2,3}）=12。对于S={3}, N\S={1,2}。可以考虑下述策略型博弈：

这个博弈有多个纳什均衡，应该考虑有否合理的“焦点均衡”，摈弃弱均衡之后，存在两种可能一是联盟生产3个单元而厂商3生产2个单元，另一个是联盟生产2个单元而厂商3生产3个单元。由于厂商2与厂商3都是同样的大型公司，因此，前者成为焦点应该是合理的仲裁。于是，我们得到v（{3}）=6, v（{1,2}）=9。同理可得v（{2}）=6, v（{1,3}）=9。

总结一下，特征函数的联盟型防御均衡表示为：v（N）=16, v（{1,2}）=v（{1,3}）=9, v（{2,3}）=12, v（{1}）=3, v（{2}）=v（{3}）=6。

（3）理性威胁表示

对于S={1}, N\S={2,3}，相应博弈的盈利矩阵为：

显然，该博弈的纳什均衡是：厂商1生产1个单元，厂商2×厂商3共生产4个单元，因此，v（{1}）=3, v（{2,3}）=12。再考虑S={3}, N\S={1,2}情况，相应的理性威胁零和博弈如下：

我们发现该博弈唯一的纳什均衡是：厂商3生产3个单元，厂商1×厂商2联合生产1 +3 =4个单元。因此，v（{3}）=3, v（{1,2}）=4。

我们得到理性威胁表示的特征函数为：v（N）=16, v（{1}）=v（{2}）=v（{3}）=3, v（{1,2}）=v（{1,3}）=4, v（{2,3}）=12。

例4.3和例4.4中，特征函数的三种表示方法不全相同。本章在对“核”的讨论中将谈到“交换经济”的问题，其特征函数是完全确定的，用这三种方法导出的v是一样的。如果一个博弈的特征函数的三种联盟型表示完全相同，则称这个博弈具有正交联盟（orthogonal coalitions）。

在以后讨论合作博弈的各种解概念时，无疑会发现，特征函数对于“解”将起着非常重要的作用。一般地，在合作博弈的研究中，有一类重要的特征函数引起人们的重视，那就是超可加特征函数。如果v是超可加的，那么博弈〈N,v〉就称为超可加的。其定义如下：

定义4.2 我们称特征函数v为超可加的（superadditive），其充分必要条件是，对于局中人所组成的任意两个联盟S1和S2，如果S1∩S2=∅，那么必有v（S1∪S2）≥v（S1）+v（S2）。

根据定义4.2，所谓超可加特征函数的博弈，是指N中任何两个不相交的联盟中的所有局中人组成一个新的更大联盟时，他们所创造的财富或可获得的盈利不小于原先这两个联盟各自创造的财富或可获得的盈利之和。超可加博弈之所以在合作博弈中极其受人关注，正是它的这个特性隐含着较大联盟乃至大联盟存在的可能性。从前面的叙述我们知道，特征函数的导出可以有各种办法，假如局中人面临一个策略型博弈并考虑是否应该合作时，我们介绍了三种方法，它们是否都导出了超可加的特征函数呢？答案是未必。例如，例4.3中，特征函数的联盟型防御均衡为v（{1,2}）=v（{1,3}）=v（{2,3}）=4, v（{1}）=v（{2}）=v（{3}）=5和v（N）=12。显然，v（{1,2}）＜v（{1}）+v（{2}）。但是，在例4.4中，理性威胁表示的特征函数为：v（N）=16, v（{1}）=v（{2}）=v（{3}）=3, v（{1,2}）=v（{1,3}）=4, v（{2,3}）=12。我们有v（{1,2}）＜v（{1}）+v（{2}）。

然而，对于最小最大表示，其结论是v必定为超可加的。这个结论的证明需要用到最小最大表示的定义公式（4.8）以及ui的公式（4.7），并且注意到σ是混合策略的概率。另一个事实也是重要的，即S1和S2不相交。对于数学工作者来说，证明是简单的，而对于经济管理类读者，让他们纠缠在数学处理上，未免有些“折磨”人的感觉，因此，这里干脆略去证明。

由超可加的定义，可引出次可加概念：

定义4.3 博弈v∈GN，如果-v是超可加的，那么v就是次可加的。

在超可加博弈中，如果S1, …,Sk是N中两两互不相交的子联盟，那么，用归纳推断的方法，容易证明。特别地，对于N中的任何一组分割（或称划分）（S1, …,Sk），我们有，更特别地，由于n个局中人构成了N的最小也是最基本的分割，从而成立。注1在超可加博弈中，由于合作对局中人整体有利，因此局中人最好是合作，至于合作的成果如何分配，正是合作博弈的解概念需要解决的问题。

注1我们称一组子联盟（S1, …, Sk）为N的分割，是指它满足条件：，并且对于其中的任何一对Si, Sj，有Si∩ Sj=∅。

正如具有超可加的特征函数的博弈称为超可加博弈一样，许多博弈由于其特征函数所具有的特性而被命名。例如：

定义4.4 如果对所有的S∈2 N和T∈2 N且S⊂T，我们有v（S）＜v（T），那么称v∈GN为单调博弈。

定义4.5 如果对每个联盟S∈2 N，成立v（S）≥0，那么称v∈GN为非负博弈。

定义4.6 博弈v∈GN称为加法博弈，如果对所有的S∈2 N和T∈2 N且S∩T=∅，成立v（S∪T）=v（S）+v（T）。

显然，加法博弈v由n维向量a =（v（{1}）, v（{2}）, …, v（{n}））所确定，对于任意S∈2N，特征函数。我们称加法博弈是“无关紧要”的平凡博弈，之所以这样称呼，是因为在这样的博弈中，每个局中人对任何联盟的贡献就是他“单干”时自己创造的财富，从而在大联盟的分配过程中，最合理的方案是各人取走自己创造的财富。也就是说，对于每个局中人来说，参加不参加任何联盟，对人对己都没有任何影响。