上QQ阅读APP看书，第一时间看更新

第2章学习

在这一章，我们将展示学习过程使人表现最优的强大作用。我们会看到，学习的作用并不仅仅局限于我们知道什么正在被优化。学习的作用也不局限于我们的行为，我们的看法和偏好往往也会被其塑造。

为什么要谈论这些呢？因为这为我们使用博弈论奠定了基础，即使人们缺乏理性，即使我们试图去解释人们令人费解的偏好和看法。

强化学习

优兔1上仍然流传着20世纪50年代B.F.斯金纳的一段录像，画面中他打着黑色领带，穿着白色衬衫，袖子一直拉到手腕处，他站在一些绿色和白色的实验设备前面。斯金纳一边训练一只鸽子逆时针旋转，一边用电视观众喜欢的中大西洋口音对着麦克风娓娓道来。斯金纳的策略很简单，每当鸽子转向左边，斯金纳就打开一个食槽，奖励鸽子几粒谷物，但如果鸽子站着不动或者转向右边，斯金纳就不会打开食槽。

摄像机的镜头推向鸽子，一开始鸽子只是来回摆动。最终很偶然地，鸽子漫不经心地朝左边挪步。食槽咔嗒一声打开，鸽子很快吃到了谷物。食槽关上之后，鸽子开始四下寻找。它又摆动了一会儿，然后有点儿漫无目的地走来走去。

“现在我正等着它向逆时针的方向转。”斯金纳说，“之后我会强化这个动作。”很快，鸽子就朝左边挪去，咔嗒一声，斯金纳打开了食槽。

鸽子现在已经掌握了要领。食槽一关上，它就满怀期待地向左边挪步。

“你瞧，瞬间就有效果了。”斯金纳有些自豪地说。鸽子停了下来，斯金纳又补充道：“我在等一个比这更明显的动作，结果肯定不止这样。”鸽子又挪动了一下，食槽咔嗒打开。鸽子急忙回去吃它的战利品。

食槽关闭，鸽子立刻转向左边，然后几乎没有停顿地转了整整一圈。

斯金纳斩钉截铁地宣布：“成功了，转了一整圈。”整个训练过程耗时不到一分钟。

斯金纳的视频鲜明地展示了强化学习这一塑造动物和人类行为的关键过程。强化学习的核心本质很简单：当一种行为（比如逆时针转）会带来奖励（比如一点儿食物）时，它就会得到强化，并且更有可能重复出现。

强化学习无处不在。养宠物的人都会采用强化学习。狗狗学会了坐下和不动，是因为当按照我们的要求去做时，它们会得到奖励。当我们用水瓶朝着猫喷水的时候，它们就学会不再抓沙发了。如果你没有养宠物，不妨在优兔上搜索“如何训练一只猪”或者“教猪坐下”这样的视频，你也能看到强化学习的效果。话说回来，其实你已经亲眼见识过强化学习了，因为你和你周围的所有人都在通过强化来学习。孩子们为了获得小熊软糖学会了上厕所，为了获得金色的星星学会了加减法。小孩和大人都会通过听众由衷的笑声或者紧张的沉默来判断自己的笑话有没有意思。再比如，一套服装是该继续穿还是送去二手店，取决于它是否得到别人的称赞。

强化学习是很强大的。孩子们不管是学习简单的算术，还是长除法、代数、几何和微积分预备课程，都离不开强化学习。优兔上的猪已经通过强化学习，学会了完成障碍赛跑、进球，或者在需要出去上厕所的时候按铃。斯金纳因教他的鸽子打乒乓球而出名；到了20世纪90年代中期，一个日本的研究小组教会他们的鸽子准确区分毕加索和莫奈的作品，从而超越了斯金纳。

尽管强化学习可以让动物们出现在优兔上，但这显然不是它存在的目的。强化学习使得动物们学会了在不断变化的环境中对生存至关重要的功能行为。通过强化学习，动物们知道了去哪里寻找食物、庇护所和配偶，如何躲避天敌，以及怎样区分哪些食物是有毒的，哪些是有营养的。2

社会学习

亚萨瓦群岛是太平洋上一个美丽而偏远的火山群岛。虽然严格来说亚萨瓦群岛是斐济的一部分，但在20世纪的大部分时间里都处于自治状态，那里的国王不允许在岛上发展旅游业。当人类学家乔·亨里奇和他的博士生詹姆斯·布勒施在21世纪第一个十年中期造访亚萨瓦群岛时，他们有了下面的发现：3

在经济上，亚萨瓦人主要依靠园艺、捕鱼和沿海采集。捕鱼是最重要的蛋白质来源，而对那些有足够技能的人来说，用鱼叉捕鱼是最高产的捕鱼方法。人们也会用钓线和渔网捕鱼。山药和木薯是提供热量的主食，不过山药在正式场合一直是不可或缺的，也更受人们喜爱。男人们暗暗较劲，都想种出最大的山药。这里的政治单位由相互关联的氏族（被称为“Yavusa”）组成，由长老议事会和一位世袭的酋长来统治。社会生活是由亲属关系和义务关系构成的复杂网络。在研究期间，这些村庄里没有汽车、电视、市场和公共设施。

在亚萨瓦群岛，亨里奇和布勒施开始研究亚萨瓦人是如何学会捕鱼、种植山药和木薯，以及使用草药这些生存技能的。他们对当地人进行了调查，问了以下问题：如果你有关于鱼或者捕鱼的问题会去找谁咨询？你会向谁请教有关种植山药的问题？你会向谁询问将哪种植物作为药物的问题？他们还问了这些问题：谁最擅长用钓线捕鱼？谁最会种植山药？谁最了解药用植物？他们记下受访者提到的人名，然后搜集这些人的资料。他们多少岁？性别是什么？他们住在同一个村里吗？是一家人吗？他们得到的结果很简单。到目前为止，亚萨瓦人通常会向最擅长捕鱼、种植山药和使用草药的人请教。

亚萨瓦人就亨里奇和布勒施的问题给出的答案，说明了两点。第一，我们不仅会通过强化学习从自己的经验中学习，还会通过模仿（有时也会通过明确的指导）来向他人学习。如果你想学捕鱼、耕种或者使用草药，你不需要冒着挨饿和生病的危险，你可以向他人求教或者模仿那些看起来知道自己在做什么的人。如果你想知道自己该不该穿某套衣服，除了穿上它，让别人来夸自己，然后根据称赞的力度来调整你的衣橱，你还可以看看周围的人都穿什么。

第二，我们并不是随意地向他人学习。我们的学习过程在很多方面都偏重于让自己向那些懂行的人学习。我们会更多地模仿那些成功的、有声望的、年长的（如果我们学习的东西限于特定年龄，我们会选择同年龄段的）、理智的人等等。在亚萨瓦人的例子中，他们向那些最擅长捕鱼、耕种和用植物治病的人请教。而在衣橱的例子中，我们会尤其关注像米歇尔·奥巴马和乔治·克鲁尼这样的时尚偶像。

在一项实验中，当一个成年人之前表现得很好（把鞋穿在脚上），相较于他表现不佳（稀里糊涂地把鞋穿在手上）的时候，14个月大的婴儿更有可能模仿他用非传统的方法（用额头按下开关）去开灯。4在另一项研究中，学龄前儿童通过模仿来学习新单词，不过他们更倾向于模仿大人而不是模仿其他的孩子；然而学龄前儿童在学习新单词时并不只是考虑年龄，他们也会优先考虑可靠性问题。他们更有可能去模仿那些已经知道并能正确使用新单词的人。无论对方是孩子还是成年人，而不是模仿那些错误使用新单词的人，他们只在面对僵局时才会考虑年龄：如果一个孩子可靠，而一个成年人不可靠，他们会模仿孩子，但如果两个都不可靠，他们就会模仿那个成年人。5

孩子们还认识到，成年人了解的东西（比如哪些食物有营养）和小孩了解的东西（比如哪些玩具好玩）6是不一样的，在某些情况下，不去模仿别人（包括成年人）反而更合理。在之前那个教幼儿用前额开灯的实验中，研究人员加入了一项测试，他们把成年人的双手绑起来，使其行动不便，但是没有绑幼儿的手。孩子们不会费力去模仿那些双手被绑着的成年人，他们似乎知道成年人之所以用额头开灯，只是因为他们行动不便，所以当自己没有被绑住的时候，他们是没必要用额头去开灯的。7

本书的分析基于的前提之一是，无论是通过强化从自己的经验中学习，还是通过模仿和指导向他人学习，都会引导我们去做对自己有益的事情，至少在大多数时候是这样的。在这个前提下，学习既高级又精妙的事实让我们变得更加自信。8

接下来的两个例子就体现了这一点，同时也说明了另一个问题：我们常常完全不知道自己为什么要做某件事，也不清楚学习所发挥的作用。

冰屋是一项人类聪明才智的非凡成就。即便北极寒风肆虐，在就地取材（压实的雪，偶尔还有海豹皮；北极没有木材，没有砖，没有石头，也没有黏土）建造而成的冰屋里，一盏小小的油灯就能让屋内升温60华氏度[1]。

这绝非易事。事实上，单纯用雪建造一个不会倒塌的建筑物就已经够难的了，许多在童年时尝试过建造冰屋的读者一定深有体会。为了防止冰屋倒塌，并且使其足以抵御北极的强风，因纽特人将雪块组装成一个非常坚固的拱形结构，这种结构被称为“倒悬链线”（悬链线指的是一根绳或一条项链被人用两根手指拿起来时的形状）。倒悬链线自古代被发现以来，就一直被用于建造纪念碑、建筑物和桥梁。

几个关键因素使得冰屋具有很好的保温效果。有些违反常理的是，建造冰屋所用的压实的雪是一种极好的隔热材料，这多亏了被困在其中的数百万个气泡。冰的隔热效果不太好，所以用量很少，主要用来建造负责采光的窗户。冰屋的地面是阶梯式的：因纽特人住在最上面那层，在中间的平台上做饭和进行其他活动，从低于周围积雪面的最底层平台进入。这确保了灯、灶火和因纽特人自身散发的热量会通过入口向上升，然后留存在冰屋内部。入口与盛行风成90度，而且通常会被修建成一个直角，从而进一步帮助冰屋抵御寒风。所有这些以及其他更多的细节，都经过了几代人的不断完善。

令人震惊的是，因纽特人把这些问题都解决了，但关键是在这个过程中，他们并没有计算倒悬链线的承重能力、压实的雪的隔热值以及不同入口会产生的压力差。靠一个人通过反复试验最终还能活着完成这样的设计是不可能的。想必应该是有一年，一个因纽特人家庭挖出了一种入口。结果这个冰屋比他们家的上一个冰屋暖和，也比邻居的冰屋暖和。第二年，这家人便以同样的方式建造了他们的冰屋（强化学习），有几个邻居也挖了类似的入口（模仿与指导）。就这样，直到所有人都以这种方式建造冰屋入口。墙壁、窗户和通风口都是以同样的过程被不断完善的。经过几代人的努力，因纽特人学会了建造完美冰屋的方法，他们不需要知道自己正在学习，也不需要知道为什么要把冰屋建造成这样。9

让我们离开冰冷的北极，前往气候温暖的中南美洲。在那里，把玉米在碱性溶液里浸泡一下再吃的习俗可以追溯到玛雅和印加时代。传统上，人们通常会往煮玉米的水里扔一些烧过的贝壳或一点儿木灰，然后加以浸泡。玉米粒经过这样的处理，会变成淡黄色，口感柔软黏糯。它们可以被直接加到菜肴里，或者很轻松地被磨成粉。

这种用碱性溶液处理玉米的方法被称为碱化湿磨法，尽管这种做法乍一看有点儿奇怪，但它对释放玉米中的维生素B3（也叫烟酸）有着至关重要的作用，否则它很难被人体吸收；如果没有碱化湿磨法，以玉米作为主食的人最终会患上营养缺乏症，如糙皮病，从而导致痴呆、腹泻和皮炎。当然，碱化湿磨法已经有几百年的历史了——比发现维生素的时间要早得多。所以我们再一次看到，一种文化在没有现代科学帮助的情况下采取了一种有益的做法。有一天，一位厨师可能不小心把一些木灰弄到了锅里。吃了玉米的人一定感觉更舒服，气色也更好了。或者有可能他们只是发现玉米变得很好磨，后来又注意到这对他们的健康也有影响。或许他们根本就没有注意到对健康的影响，但生病的次数变少了，这意味着他们通常会更加成功，因此也就更有可能被他人模仿或请教。无论如何，强化学习、模仿和指导都有很多发挥魔力的机会，任何人都没必要去关注或了解它们发挥的作用。

没有人知道有作用并不意味着这种方法没有作用。这是欧洲人在第一次遇到玉米时受到的惨痛教训。欧洲人热情地把玉米作为主食，但由于他们在当地人为什么要碱化玉米的问题上没有得到一个满意的答案（“这就是我们一贯的做法”），所以他们跳过了看似没用的碱化湿磨法。毕竟，他们有强力磨粉机，可以在不软化的情况下把玉米磨成粉。后来在意大利北部、法国和美国南部，糙皮病大规模暴发。在20世纪上半叶，约有300万美国人患上糙皮病，有10万人因此丧命。

人类拥有独特的学习和模仿那些作用不明确的复杂行为的能力。我们用到的一种方式是过度模仿——模仿那些看起来完全没必要的行为（除非你是一个自负的、有民族优越感的欧洲殖民主义者）。关于过度模仿的经典研究大概是这个样子的：成年人向儿童和黑猩猩展示如何打开装有食物的盒子。成年人接到指示要添加一些额外的、不必要的步骤：可能是敲3次盒子顶部，或者摸鼻子。孩子们会模仿大人的每个动作，甚至是那些不必要的动作。而黑猩猩更聪明，它们会省去那些没用的步骤。也许它们的确更聪明，但也更容易犯和欧洲人面对碱化湿磨法时一样的错误。

继续我们的旅程，让我们回到斐济，在那里我们会看到一个例子，它很好地展现了学习是怎样既塑造行为又塑造看法的。

斐济的女性在怀孕和哺乳期，会严格遵守饮食禁忌，不会吃某些在其他时候经常吃的鱼，比如岩鳕、鲨鱼、梭鱼和海鳝。（斐济人通常从陆生哺乳动物、贝类、章鱼和刺鲀中获取蛋白质。）

斐济人不知道的是，他们避免食用的正是那些含有危险的雪卡毒素的食物。过多的雪卡毒素会让我们生病，导致手脚疼痛，或者非常严重的腹泻。这些症状有时会持续好几个月。雪卡毒素中毒在怀孕和哺乳期尤其危险，因为女性在这个时期更容易受到毒素的影响，毒素会伤害到胎儿和母乳喂养的婴儿。

雪卡毒素是藻类产生的一种化学物质。它会在以藻类为食的鱼的体内积聚，以这些鱼为食的鱼类体内的毒素浓度会更高，而以后者为食的鱼类体内的毒素浓度会进一步升高。岩鳕、鲨鱼、梭鱼和海鳝在食物链中都处于比较高的位置（据说海鳝甚至会攻击鲨鱼），所以它们导致雪卡毒素中毒的风险是最大的。章鱼和刺鲀在食物链中都比较靠下，贝类则更低一点儿，因此，吃它们导致雪卡毒素中毒的风险比较低。吃陆生哺乳动物和蔬菜几乎没有什么风险。因此，斐济的饮食禁忌有效地使人们远离高风险食物，选择低风险食物，从而使胎儿和婴儿更加健康。

斐济人通过学习，在不了解这些饮食禁忌重要作用的情况下掌握了它们，这又是一个不寻常的例子。当被问起是从哪里学到这些禁忌时，绝大多数人都会回答说他们是从自己的母亲、奶奶、婆婆、长辈、一位聪慧的女性或阿姨那里学来的；只有不到10%的人会说他们是从医生那里学来的，而且他们中没有人听说过雪卡毒素。

另一件不寻常的事情是：通过学习和模仿被塑造的不只是斐济人的行为，还有他们的看法。当被问起为什么要遵守饮食禁忌时，大多数女性会回答说，不这样做对宝宝的健康不利，宝宝会“皮肤粗糙”或“关节发臭”。这些看法是错误的也不要紧，它们仍然有效。（不要惊讶，你的一些看法也有同样的情况。）

我们之前提到过，本书的一个前提就是学习会导致功能性行为（或者通常有这种倾向）。斐济人错误但有效的看法揭示了第二个密切相关的前提：相应的看法往往会一起出现。学习使得我们以特定方式行事（比如避开某些食物）的一个好办法，就是塑造我们的看法——让我们认为这些食物会导致宝宝皮肤粗糙，从而促使我们有所行动。

可以通过学习或模仿被塑造的，除了看法，还有喜好。

位于曼哈顿下东区的多特斯餐厅是一家拥有百年历史的标志性犹太餐厅，一走进去，你马上就会发现四面堆满了闪闪发光的熏鲑鱼和白鲑，还有一桶桶风味奶油干酪的冷藏箱。墙上有装满百吉饼的篮子，高高的架子上堆满了裸麦粗面包和黑面包，还有五颜六色的进口鱼子酱罐头。对19世纪末和20世纪初从埃利斯岛来到下东区的几十万可怜的东欧犹太人来说，这里是他们钟爱的美食圣地，也是盐的圣地。你会发现盐是该餐厅主要的调味品。如果仔细看，你可能会在某些地方找到一点儿胡椒粉。当然，百吉饼上必须加的所有调味品都被放在篮子里了。还有一些莳萝，如果你把它也算作调味品。不时地还会有洋葱出现。不过通常该餐厅的美食都只用盐调味。

走几个街区来到位于东6街的曼哈顿“咖喱一条街”，情况就完全不同了。当你走在人行道上时，很多餐厅门口都有招揽顾客的人朝你冲过来，印度之珠就是其中的一家，在那里你会看到香喷喷的巴尔蒂咖喱和火辣辣的咖喱肉，它们都用到了十几种香料，而且用量极大。如果你问服务员他觉得百吉饼、熏鲑鱼、奶油干酪和鱼子酱怎么样，他会一边点头一边告诉你：“还可以。”你再问他一次，他会承认说：“味道太淡了。”

为什么印度人爱吃香料味很重的菜？为什么东欧的德系犹太人就不爱吃？1998年，詹妮弗·比林和保罗·谢尔曼提出，答案就在于香料能够抑制和杀死会导致食物变质的细菌。他们认为，这种能力在气候炎热的地区最有用，所以我们会发现这些地方的人很喜欢香料。10

为了检验他们的理论，比林和谢尔曼先通过文献证明了香料确实能够抑制和杀死细菌。在这个过程中，他们考虑了30种最常导致食物中毒的细菌，然后综合了几十项检测某种香料或其活性成分的存在是否减缓了其中一种细菌的生长或将其彻底杀死的研究。有些香料，比如多香果和牛至，以及大蒜和洋葱等根菜能抑制全部30种细菌的生长。大部分香料，比如月桂叶、薄荷、芫荽和肉豆蔻能抑制一半到3/4的细菌。有些香料，比如黑胡椒，以及柠檬和酸橙等柑橘类水果虽然靠自己的力量只能抑制一小部分细菌，却能加强其他香料的效果（黑胡椒可以增强其他香料中活性成分的生物利用度，从而提高它们被细菌吸收的速度；柠檬和酸橙可以分解细菌的细胞壁，使细菌对香料中的活性成分更加敏感）。

接着，比林和谢尔曼搜集了来自世界各地几十种文化的数百份食谱，然后按照香料的种类和用量编制索引。果不其然：“随着年平均温度……升高，含香料食谱的占比、每份食谱中的香料数量、香料的总用量和对抗菌力最强的香料的使用都增加了。”他们还接连排除了几种可能的理论。一个很自然的问题是，香料只在更热的地方被使用，是不是因为那里是它们的产地呢？但是，繁忙而古老的香料贸易表明，香料在除产地之外的地方也在被使用。多香果就是一个很好的例子：它的使用国数量是产地国数量的10倍。此外，他们还发现，香料通常并不是在越热的地方种植得越多。很多气候炎热的地方几乎不种香料，但很多人仍然在使用香料。等等，也许香料能使人通过出汗保持凉爽？的确，辣椒中的辣椒素有这样的效果，但是大多数香料，比如牛至、薄荷和肉桂都没有。或许香料中含有在更炎热的地方更有益的微量营养素？也没有。在本地可获得的蔬菜和肉类中，重要微量元素的含量要高得多。

所以，还是得回到他们各自的祖国，印度母亲逐步训练自己的宝宝忍受然后爱上辛辣的食物（把大人的食物和酸奶混合起来，然后慢慢减少酸奶的用量），而德系犹太人的母亲则坚持用盐。当他们的孩子来到美国时，他们的烹饪风格也被带过来了。

就像斐济人和因纽特人一样，这些印度和德系犹太人母亲没必要知道自己为什么会有这样的饮食习惯。大多数人根本不清楚，他们可能会回答“这就是我们一贯的做法”或者“这样做饭比较好吃”。他们也没有意识到在几代人身上发挥魔力，通过塑造喜好来影响他们行为的学习过程。

为什么学习要塑造的是看法和喜好，而不是直接塑造期望的行为呢？我们之前提出过一种可能性：这是一种能让我们行动起来的有效途径。如果喜欢辛辣的食物，你就会吃辛辣的食物。不过另一种可能性是，内化确保了人们在不了解功能性行为作用的时候也会采取这种行为，比如过度模仿。如果印度人喜欢在咖喱中加入黑胡椒，他们就不会想着省去黑胡椒，即使他们不知道它存在的意义在于增强了孜然、芫荽、姜黄和辣椒的效果。要是欧洲人有机会变得爱吃碱化玉米，他们就不会得糙皮病了。

滞后与溢出

还记得在印度之珠那个不好意思地承认百吉饼和熏鲑鱼味道有点儿淡的服务员吗？他并不孤单。比如，感恩节你去一个印度裔美国人家里做客，可能会发现火鸡在烤之前已经撒了一点儿咖喱粉或者在酸奶和唐杜里香料里腌制了一夜。蔓越莓果酱从远处看没什么特别的，但能看出有点儿辣，因为里面有青辣椒，可能还有烤过的、带着泥土芳香的孜然。肉汁或许泛着金黄色的光泽，散发出明显的藏红花粉的香气，黑胡椒可能也比平时多放了一点儿。也不是只有印度裔美国人这样。你去一个墨西哥裔美国人家里，可能会发现餐桌上除了火鸡，还有墨西哥浓汤和其他墨西哥的传统菜肴。一位墨西哥裔美国朋友说，她姨妈有一次负责做焗烤四季豆。姨妈看了看菜谱，觉得没道理，索性直接拿四季豆和辣椒配在一起。全家人吃得都很开心。

当然，不管是多特斯餐厅的熏鲑鱼，还是感恩节的火鸡和四季豆，变质的风险都不是很大。美国的食品供应得益于充足的冷藏设备，以及旨在减少工业化食品安全问题的措施和法规。更准确地说，从温暖的地方来的移民不吃熏鲑鱼或者用香料处理火鸡和配料，是因为他们喜欢香料。无论从字面意义还是从象征意义上来讲，他们都已经养成了这种喜好，尽管这起源于一种需要防范食源性疾病的文化，但即便现在生活在一种没有这种需要的文化中，他们也坚持了这样的喜好。

我们把这样的效应称为滞后。滞后就像退化特征，比如人类的尾巴或者鲸鱼的手。它们曾经是有用途的，但这种用途不再有价值了。之所以会出现滞后，是因为学习和进化一样，并不是瞬间完成的。正如一个人需要花些时间才能喜欢上辛辣的食物，一种文化的美食要经过一段时间才会变得辛辣一样，要抛弃这些东西也是需要时间的，或者就像动物行为学家所说的那样，灭绝也是需要时间的。11

有时候，我们还会碰到这样的情况，那就是一种看法或喜好虽然在某个环境中仍然有现实用途，但在脱离这个环境后还继续存在。我们把这样的效应称为溢出。你的狗骑跨在你的腿上，这就是一种溢出。毕竟，骑跨某些东西是有实际意义的，但要是一条腿呢？没有太大意义。之所以会出现溢出，是因为学习和进化一样，需要泛化——把我们在一个环境中学到的东西应用到其他类似的环境中，而且即使相当擅长泛化，我们也做不到十全十美。有时候我们会过度泛化，特别是在学习塑造我们内在的看法和喜好的时候。

溢出效应对解释心理学和经济学实验室实验（经过设计，在严格控制的实验情境中进行）的结果特别有帮助。实验室环境极其关键：要诱使我们的喜好和看法从日常生活溢出到实验情境中，我们才能看到众多有趣的现象。（如今，用“实验室”这个词实际上有点儿不准确。在很多研究中，“实验室”指的都是亚马逊的众包平台Amazon Mechanical Turk，世界各地的人坐在家里登录一下，在上面匿名回答几个问卷就能赚点儿外快。）

看看下面这个经典的实验。受试者两人一组玩最后通牒游戏。一位受试者获得了几美元——比如10美元，然后决定分给自己的搭档多少钱。之后他的搭档决定要不要接受这些钱。如果他接受，那么他们各自得到相应的钱。如果他拒绝，那么两个人都拿不到钱。最后，所有受试者分道扬镳，永不相见（就是字面意思，请记住，他们在互联网上都是陌生人，没法相互确认身份，也没法交流）。

在最后通牒游戏中，平分是很常见的结果。这很好理解。还有一种常见的结果是第一位受试者出价太低，比如1美元或2美元，他的搭档拒绝接受。这也很好理解。道理很简单：毕竟，我们的正义感就是用来防止别人欺负我们的，当他们这样做的时候，我们必须反击（见第14章）。这个实验非常奏效：我们的正义感准确地溢出到这个无用的小游戏中。

但是等一下。在实验者的精心设计下，这个实验是不公开名字的，甚至连他自己也无法确认受试者的身份。所有人，包括实验者在内，都不会发现是否有好说话的受试者接受了很低的出价。那么生气有什么用呢？如果受试者表现理智，他们应该咬紧牙关，接受很低的出价，反正总比什么都没有好。那么这是否意味着人们的正义感并不具有我们所宣称的防止别人侵犯自己的作用？我们认为不是的。这就像是在说，因为狗有时会骑跨在人的腿上，所以它们性冲动的产生不是为了繁殖一样。事实上，我们认为正确的解释是，人的正义感不能完美契合所有具体的情况——考虑到完全匿名的实验情境的独特性和学习过程的滞后和溢出效应，这并不奇怪。

接下来，我们将用一章的篇幅来讨论几个关键概念，它们会帮助我们更好地理解如何利用和解释博弈论。

[1]60华氏度≈15.6摄氏度。——编者注

本周热推：

集装箱改变世界（修订版）金融与繁荣战略管理：定位与路径经济学的意义如何预防下一次大流行

第2章 学习

第2章学习