2.1 博弈论_基于信号博弈和MAS的交易行为研究-QQ阅读男生武侠网

上QQ阅读APP看本书，新人免费读10天

设备和账号都新为新人

2.1 博弈论

2.1.1 博弈论概述

1．概念

“博弈论”译自英文“Game Theory”，又称为对策论，它是一门研究相互影响着的局中人在进行策略选择时的行为规律的科学。著名博弈论专家海萨尼认为：博弈论是关于相互作用的理论，即它是关于社会形势中理性行为的理论，其中，每个局中人对行动的选择必须以他对其他局中人将如何反应的判断为基础。

博弈论试图将研究内容数学化、理论化，以便更确切地理解其中的逻辑关系，为清晰地描述与解决现实问题提供理论工具。它研究的重点是决策主体的诸多策略集中使局势均衡的策略，研究其存在性和性质、解法，其分析的目的是使参与者在给定的战略集中进行选择，从而获得最大的效用。

博弈论包括以下几方面内容：

1）参与人

参与人是博弈中选择行动以最大化自己效用的决策主体。

2）行动

行动是参与人的决策变量。

3）战略

战略是参与人选择行动的规则，它规定参与人在什么时候选择什么行动。

4）信息

信息是参与人在博弈中的知识，特别是有关其他参与人的特征和行动的知识。

5）支付函数

支付函数是参与人从博弈中获得的效用水平，它是所有参与人战略或行动的函数。

6）结果

结果是博弈分析者感兴趣的要素的集合。

7）均衡

均衡是所有参与人的最优战略或行动的组合。

2．博弈论的发展过程

1994年的诺贝尔经济学奖授予纳什、海萨尼和泽尔滕三位博弈论专家，1996年的诺贝尔经济学奖授予在博弈论研究方面做出突出贡献的维克里和莫里斯，2001年的诺贝尔经济学奖由信号博弈方面的专家斯宾塞、阿克洛夫和斯蒂格利茨获得，这意味着博弈论的重要性已得到了学术界的公认。

博弈论的思想最早可以追溯到中国古代。我国春秋时期孙武所著《孙子兵法》一书中的军事思想，以及“田忌赛马”事例是最早的博弈论思想和应用案例。

现代博弈论大致分为以下几个发展阶段：

1）萌芽阶段

20世纪初期，博弈论的研究对象主要是从竞赛与游戏中引申出来的严格竞争博弈，即二人零和博弈。在这类博弈中，不存在合作或联合行为，对弈双方的利益严格对立，一方有所得必定意味着另一方有等量损失。在这一阶段，最重要的成就有泽梅罗定理、逆推归纳法与冯·诺依曼的最小最大定理，以及博弈扩展型策略、混合策略等概念。

2）建立阶段

20世纪30年代至40年代，博弈论作为一门学科而确立，其形成标志就是美国数学家冯·诺依曼与奥斯卡·摩根斯顿在1944年合著的《博弈论与经济行为》一书。他们在该书中建立了一些基本的博弈模型，研究了博弈解的概念和分析方法，构建起了博弈论的基本理论框架。在这一时期，合作博弈的研究有了长足的进步，并提出了联盟博弈、稳定集、解概念、可转移效用、核心等概念和思想。

3）成长阶段

20世纪50年代，非合作博弈理论发展起来，纳什为非合作博弈的一般理论奠定了基础，提出了博弈论中最为重要的概念——纳什均衡，阿尔伯克·塔克提出了囚徒困境、重复博弈概念。同时，合作博弈理论也得到了进一步发展，如沙普利值概念、核概念等。博弈论的研究队伍开始扩大，兰德公司在盛基尼卡开业，在随后的许多年里，这里成为博弈论的研究中心。在本阶段初期，博弈论的重要应用领域是军事战术问题及冷战策略。此后，经济学逐渐成为博弈论最重要的应用领域。

4）成熟阶段

20世纪60年代，不完全信息与非转移效用联盟博弈的扩充使博弈论更具广泛应用性。针对纳什均衡假设博弈双方的信息是完全的这一与大多数情况不符的问题，海萨尼提出了不完全信息理论。

1965年，泽尔滕将纳什均衡的概念引入动态问题研究，提出了精炼纳什均衡、子博弈精炼纳什均衡、颤抖手均衡等概念。海萨尼在1967年提出了不完全信息动态博弈和贝叶斯均衡等概念。

5）壮大阶段

20世纪70年代至今，博弈论在很多领域的研究都取得了重大突破，在理论上，博弈论从基本概念到理论推演均形成了完整的、内容丰富的体系。非合作博弈论应用到了大批特殊的经济模型、生物学、计算机科学等领域。

3．博弈论的经济学应用

博弈论在经济学中的成功应用概括起来有以下几个方面：

1）产业组织理论

博弈分析改写了整个产业组织理论的基本内容，主要有寡头竞争理论、价格歧视理论、垄断理论等。

2）一般均衡理论

博弈论为探索一般均衡存在性的问题找到了一条比较简单明了的解决途径。

3）不完全信息条件下的委托代理理论或经济机制设计理论

该理论对现实经济生活具有强有力的解释能力和实践指导能力，其实质是不完全信息动态博弈的求解问题。

纵观学者们将博弈理论与方法应用在市场行为上时，都是将市场看成一个整体或者一个单一的消费者，并将消费者的信息作为共同知识、将企业的知识作为私有信息。这在消费者偏好一致的情况下是可行的。

2.1.2 不完全信息动态博弈及海萨尼转换

1．不完全信息动态博弈

不完全信息动态博弈是博弈的类型之一。参与人的行动有先后顺序，且后行动者能够观察到先行动者所选择的行动；每个参与人对其他所有参与人的特征、策略空间及支付函数并没有准确的认识。

在不完全信息动态博弈中，参与人可以在有限信息的条件下，通过前面的博弈结果来修正自己关于其他参与人类型的信息，从而更好地把握博弈局势。参与人的行动选择与其私人信息有关，选择的也是与其类型有关的行动，在他之后行动的参与人就可以通过对历史行动的观察来推断他的类型，即使不能完全消除不确定性，也可以得到概率分布上的改进。

具体来讲，不完全信息动态博弈中的信息不完全性指的是：各博弈方都有关于自己收益的完全信息；至少有一个博弈方不完全清楚其他某些博弈方在某些情况（策略组合）下的收益；当博弈方属于没有完全信息时，他至少有其他博弈方收益分布的可能范围和分布概率的知识。

不完全信息动态博弈中的动态性指的是：在博弈过程中，参与人的行动有先后顺序，且后行动者在自己行动之前能观测到先行动者的行动。

通常用扩展式表述来描述和分析动态博弈。博弈的扩展式表述包括以下要素：

（1）参与人集合：i＝1, …, n。此外，用N代表虚拟参与人——“自然”。

（2）参与人的行动顺序：各参与人行动的先后顺序。

（3）参与人的行动空间：每次行动时，参与人的可选择范围。

（4）参与人的信息集：每次行动时，参与人所知道的信息。

（5）参与人的支付函数：行动结束后，每个参与人所得到的收益。

（6）外生事件（即自然的选择）的概率分布。

具有上述特征的博弈过程称为不完全信息动态博弈。

2．海萨尼转换

海萨尼转换是指这样一种处理方法：将博弈方具有几种不同的收益可能，理解为博弈方有不同的类型，并引进一个为博弈方选择类型的虚拟博弈方——“自然”，从而把不完全信息博弈转化成完全但不完美信息动态博弈。其具体过程是：

（1）引进一个虚拟的博弈方——“自然”，其作用是在博弈中进行实际博弈的博弈方选择之前，为每个实际博弈方按随机方式选择（或者说抽取）他们各自的类型。抽取的这些类型构成类型组合T＝｛t1, …, tn｝，其中，ti∈T。

（2）这个“自然”博弈方让每个实际博弈方知道自己的类型，但不让（全部或部分）博弈方知道其他博弈方的类型。

（3）在前述基础上，再进行原来的博弈，即各个实际博弈方根据顺序从

各自的行为空间选择行动组合｛a1, …, an｝。

除了虚拟博弈方“自然”外，其余博弈方各自的收益为ui＝ui（a1, …, an, ti），其中，i＝1, …, n。

2.1.3 信号博弈及贝叶斯均衡

1．信号博弈

信号博弈是不完全信息动态博弈中的一种，它是深入研究具有信息传递作用的信号机制的一般博弈模型，其中，信号是具有信息传递作用的行为，通过信号传递信息的过程则称为信号机制。信号博弈中有两个（或两类，每类有数个）博弈方，分别为信号发出者和信号接收者。他们先后各选择一次行为，其中信号接收者具有不完全信息，但它们都可以从信号发出者的行为中获取部分关于信息发出者的信息，并把这种部分信息作为自己选择下一步行为的依据。

信号传递是现代企业经营过程中常见的现象。例如，作为生产率信号的昂贵广告和全面担保；作为市场力量信号的主动降价；作为个人能力信号的各种资格证书；作为质量信号的激光防伪标志；作为经营业绩信号的股票价格；等等。

信号博弈中有两个参与者，具有信息优势的一方称为信号发出者S，另一个称为信号接收者R，博弈顺序为：

（1）“自然”从可行的类型集Θ＝｛1,2, …, n｝中赋予信号发出者S类型θi的先验概率为p（θi）＞0，并将p（θi）告知信号接收者R，将θi告知信号发出者S，信号接收者R不知道发出者的类型θi, 。

（2）信号发出者S从信号集M＝｛m1, …, mJ｝中选择信号mj（j＝1, …, J）发送。

（3）信号接收者R观察到mj后，从可行行动集A＝｛a1, …, aK｝中选择行动ak（k＝1, …, K）。

信号发出者S的效用函数为uS（θi, mj, ak），信号接收者R的效用函数为uR（θi, mj, ak），两者为共同知识。

后验概率μ（θimj）表示观察到信号mj后，信号接收者R相信是类型θi的信号发出者S发出信号的概率。

2．完美贝叶斯均衡

信号博弈的完美贝叶斯均衡是策略组合［m∗（θ）, a∗（m）］和后验概率μ（θ m）的结合，它满足以下要求。

（1）信号接收者R在观察到信号发出者S的信号mj后，必须有对于S的类型判断，即S属于类型θi的概率分布为p（θimj），其和为。

（2）给定R的判断和S的信号，R的行为必使R的期望收益最大，即a∗（mj）是最大化问题的解。

（3）给定R的策略a∗（mj）时，S的选择必须使S收益最大，即m∗（θi）是最大化问题的解。

（4）对于每个mj∈M，无论是否存在θi∈Θ，使得m∗（θi）＝mj, R在对应于mj的信息集处的判断都必须符合S的策略和贝叶斯法则。

上述完美贝叶斯均衡可以分成以下3类：

1）分离均衡

不同类型的信号发出者以概率1选择不同的信号，或者说，没有两种类型选择同一信号。在分离均衡中，信号准确的表现类型。

2）混同均衡

不同类型的信号发出者选择相同的信号，或者说，没有任何类型选择与其他类型不同的信号。

3）准分离均衡

有些类型的信号发出者随机选择信号，另一些类型的信号发出者则选择特定的信号。

3．逆推归纳法

在动态博弈的分析过程中，大多采用一种分析方法，即“逆推归纳法”。

这种方法的逻辑基础如下：动态博弈中先行动的、理性的博弈方，在前面阶段选择行为时，必然会先考虑后行动博弈方在后面阶段中将会怎样选择行为，只有在博弈的最后一个阶段选择的、不再有后续阶段牵制的博弈方，才能直接做出明确选择。而当后续阶段博弈方的选择确定以后，前一阶段博弈方的行为也就容易确定了。

其分析方法如下：从动态博弈的最后一个阶段开始分析，每一次确定出所分析阶段博弈方的选择和路径，然后确定前一个阶段博弈方的选择和路径。由于利用逆推归纳法确定的各个博弈方在各阶段的选择，都建立在后续阶段各个博弈方理性选择基础上，因此就排除了包含不可信威胁或承诺的可能性。但是，这种方法对博弈方理性的要求很高，要求各博弈方了解博弈的结构，包括次序、规则和各方的收益情况。

4．信号博弈在经济管理领域中的具体应用

作为博弈理论中的一个重要组成部分，信号博弈被广泛应用到经济领域，许多学者对这一具有特殊形式的博弈方式进行了诸多研究。

例如，对信号博弈的研究始于Spence M.［61］提出的利用教育水平传递工作能力的劳动力市场模型；肖条军等人［62］建立了一个纵向型企业集团两阶段R&D决策的信号博弈模型，该模型基于创造性毁灭过程，并采用三重逆推归纳法和二重前推法进行求解；同济大学的李宇宏等人［63］建立了一个二维信号博弈模型，将企业是否进行多元化及进行多元化选择的金融方式作为二维信号，传递企业成本状况及市场需求的二维私人信息。受企业经营中的利润最大化目标的制约，信号博弈的均衡需要考虑信号传递的成本与博弈一方数目变化的影响。例如，梁建英等人［64］利用信号博弈建立了信号成本与外包供应商信号传递关系的博弈模型，提出虽然较强的信号传递能够使供应商市场出现分离均衡，有利于外包商的选择，但同时需要考虑高能力供应商与低能力供应商的信号成本问题。Kübler D．等人［65］通过实验分析了Spence的教育信号博弈，得出雇佣者数目的增加将影响信号博弈的分离均衡。

综上所述，对信号博弈均衡的研究需要考虑信号传递的成本、是否进行重复博弈等问题，对信号均衡解的算法研究有助于讨论均衡结果的唯一性。同时，均衡结果的类型起到对所研究领域的决策支持的作用。