第六章 运用混合策略
1.什么是混合策略?
前面讨论过的“零和博弈”或者“常和博弈”,此时博弈参与人之间的关系是竞争性的:如果他人所得多了,你的所得就少了。在这样的博弈中,策略家的策略之中不存在“占优策略”也不存在“被占优策略”。策略家应当如何进行策略选择呢?
表6-1是一个“常和博弈”的例子。甲的策略有“上”、“下”,乙的策略有“左”、“右”。无论是甲,还是乙,均没有“占优策略”,也没有“被占优策略”。
表6-1 常和博弈的一个支付矩阵
处于这种情况下,策略家便应当采取“混合策略”。
混合策略是与纯策略相对的策略,是指策略人随机地选取他的策略;而纯策略是指,策略人对某个策略有一个“确定的”或者说“明确的”选择。
在实际中,如果是一次性博弈,无论是怎样的博弈,你最终要选取一个纯策略。但当你面对的是应当采取混合策略的博弈时,你所做的策略选择不让对方知道,而对方只能通过博弈结构分析出你策略选取的“倾向性”。如果是重复博弈,你不应当采取固定的策略。要让你的对手知道,你有可能采取你的任何一个备选策略。当然你的对手也知道,在你的备选的策略中,你更愿意选取哪一个策略,不愿意选取哪一个策略。
在表6-1中,甲在“上”、“下”之间随机选取策略,乙是无法预先知道甲的策略的。假定甲不是随机选取策略,而是固定地选取策略,比如策略“上”,并且假定乙知道甲的策略选取,那么,乙将选取“左”的策略,乙将得到最大的收益“2”,而甲的收益最小为“0”。这个博弈结果是乙所希望的,而是甲所不希望的。因此,甲在选取策略时,应当在“上”、“下”策略间玩混合策略。乙也一样。
采取混合策略的现实例子很多。小朋友之间进行的“锤子—剪刀—布”的游戏便是一个人人皆知的使用混合策略的例子。每个小朋友在游戏时在“锤子”、“剪刀”、“布”三者之中权衡而不固定采取一个策略,这便是混合策略。这个游戏的均衡的混合策略是,游戏者选择“锤子”、“剪刀”、“布”策略的概率或可能性相同均为1/3。如果甲、乙两人重复地玩这个游戏,如果一方,比如甲,选择某个策略的概率高于其他策略的概率,并且被对方,即乙,总结出来的话,那么,乙就会采取相应的应对策略,甲输的次数便增加了。如果你不信,你试试看。本人曾经与年幼的女儿玩这个游戏,尽管某一次我不一定能赢,但多次下来我能够赢她很多次。