上QQ阅读APP看书，第一时间看更新

第一部分
大脑中的惯性机器

第一章　学习、记忆和习惯

我们的思想和行为表现得十分流畅，以至于很难想象它们是由我们脑袋里像果冻一样的组织中嘈杂的电活动引起的，然而事实就是如此。大脑的复杂性远远超出我们的想象，一般人可能不知道，许多神经科学家对人类能否完全了解大脑的工作原理是感到绝望的。即便如此，从大脑细胞如何处理信息开始，我们对于大脑的基本要素还是有了很多的了解。

人类大脑是由数以亿计的神经细胞构成的，其中，神经元负责处理信息。此外还有许多支持细胞，称为神经胶质（glia）细胞。神经元将电信号从一端传送到另一端，然后释放出化学信号，影响邻近神经元的电活动。神经元胞体产生的信号通过一个叫作轴突（axon）的线状结构传递到另一端，在那里释放一种叫作神经递质的化学物质。正是这种电信号和化学信号的结合，以及确定神经元如何进行连接的大脑构造，决定了我们所做的一切。

举个例子，讲讲当我的猫Coco看到窗外的一只鸟时，它的大脑里发生了什么。鸟反射的光投到Coco的视网膜上，那里有专门的感光神经元；当光子击中位于细胞表面（细胞膜）的特殊受体分子时，细胞的电学特性发生了变化，光能量转化成了电信号。这个电信号称为动作电位，它沿着神经纤维传导。这些感光神经元与视网膜中的其他神经元接触，动作电位导致化学信号的释放，从而使传导链中的下一个神经元激活或失活。这些信号通过眼内的几层神经元传播，最终通过一条神经（由许多轴突组成的线缆）到达大脑。信号首先抵达大脑深处一个叫作丘脑的结构，你可以把它想象成大脑的总机——几乎所有进入大脑的信号都要经过丘脑传入。信号从丘脑传递到大脑的外表面，即大脑皮质，大脑中很多高级信息加工都是在这里进行的。大脑皮质的不同部位接收不同类型的信息；在Coco的例子里，视觉信息传递到大脑后部一个称为视觉皮质的区域，接着层层向前移动。在每个阶段，信息处理都会变得更加复杂一些。在接受丘脑传入信号的视觉皮质中，特定的神经元只对视觉世界的一小部分信号敏感，对相对简单的特征敏感，如轮廓或线条。这些区域将视觉信号向大脑前部传递，后者对信号中复杂的特征更加敏感，如形态或整个物体。在某一时刻，这些信号让Coco能够识别视觉刺激中的形态是一只鸟，并将信号发送到大脑中负责处理情绪的部分，从而释放神经化学物质，让它感到兴奋和激动。其中一些信号还会导致运动皮质的活动，使得它跑向门口，发出一些奇怪的声音。

在整本书中，我会更详细地探讨大脑功能如何导致我们的各种想法和行为，其中的很多细节对于我们理解习惯如何形成，以及为什么它们会持续影响我们是至关重要的。

习惯与有意记忆

无论是在执行习惯的过程中，还是在随后对它们进行回忆时，习惯与我们对过去事件的有意记忆都是完全分离的，这是习惯的一个显著特征。以我们离家时锁门的习惯为例：一旦我们学会了锁门，就不会再去想怎么锁门，或者试图去回忆曾经锁门的情景；我们只是不假思索地去做，就像所有习惯一样。如果我问你锁门的时候你是朝哪个方向拧钥匙的，你可以很形象地描述这个过程，告诉我是沿顺时针方向转动，然而，平时在锁门的时候，你从来不会去想“现在，我需要顺时针转动钥匙了”。反过来说，有多少次你离开了家，后来却想不起自己是否锁了门。通常情况下，习惯系统是值得信赖的，它会确保门被锁上，但它往往不会给我们留下什么经验的痕迹。

对于那些因大脑损伤而失去记忆的人来说，习惯和意识体验之间的区别尤其明显。有一个著名的例子来自法国神经学家艾德华·克拉帕雷德（Édouard Claparède）的研究。当他与一名记忆障碍患者见面并握手时，他用事先藏在手里的大头针扎了一下她的手。几分钟后，她已经不记得自己被大头针扎过了，但当克拉帕雷德再次和她握手时，她却没有把手伸出来。他问她为什么拒绝了握手，她说：“有时人们手里会藏着大头针。”克拉帕雷德的患者显然保留了一些被针扎的体验，尽管她并非有意识地记住具体的情节。基于这类奇闻逸事，始于20世纪60年代的大量神经科学研究已经确立了这样一个观点，即大脑里存在多重记忆系统。最主要的区别存在于这两个记忆系统中：一个允许我们有意识地记住过去的事件（比如，记住早上你把车停在了哪里），一个不涉及对过去事件的有意记忆（包括习惯和技能，比如如何开车）。

有意记忆系统

对过去事件的有意回忆尤其依赖于陈述性记忆系统，它涉及位于颞叶深处的一组大脑区域（称为内侧颞叶），包括海马体及其周边的大脑皮质部分（见图1.1）。这些区域的损伤会导致人丧失对过去事件的记忆以及无法形成新的记忆。事实上，海马体只要受到轻微损伤就会导致这种记忆障碍。研究者拉里·斯奎尔（Larry Squire）及其同事通过研究一位姓名缩写为R. B.的男子的大脑证明了这一点。R. B.经历过几次心脏事件，导致大脑暂时缺氧，从而出现了严重的记忆问题。他还活着的时候，斯奎尔和同事用多种方法测试了他的记忆，发现他的记忆有诸多方面的问题。R.B.智力完好——事实上，他的智商有111分，高于平均水平。然而他对新材料的记忆能力受到了严重的损伤。例如，当向他呈现一篇散文时，他可以在读完以后立即将故事中的细节复述出来，但20分钟后，他就几乎无法再记起任何细节了。R. B.能够清楚地意识到自己的记忆问题，就像斯奎尔及其同事所描述的那样，“他解释说，对于过去发生了什么事，他需要反复向他的妻子询问。如果某天他和孩子通过电话，第二天他就什么也想不起来了”。1

图1.1　这是我大脑的磁共振成像（MRI）扫描图，它呈现了陈述性记忆系统的解剖结构，图中标明了海马体（包括CA1区）、内侧颞叶和丘脑的相对位置。右上方的小图显示了这个切面在我脑部的大致位置，就在耳朵前面。

R. B.去世时捐出了自己的大脑用于科学研究，这样一来，斯奎尔和同事就能够更详细地观察他的大脑是如何受损的。R.B.的大脑整体上看来很健康，但是当研究者使用显微镜观察时，发现他的海马体中一个叫作CA1的特定区域受到了损伤。大脑的这一微小区域中包含大约1600万个神经元，听起来似乎很多，但它们在人脑中的近1000亿个神经元中只占了极小的一部分。尽管如此，这些神经元的损伤却足以让R. B.产生持久和严重的记忆问题，而他的其他认知功能却保持完好。

从20世纪60年代开始，人们逐渐清楚地认识到，虽然海马体损伤可能会导致个体想不起来过去发生的事，但不会影响他其他的学习能力。率先提出这一发现的是布伦达·米尔纳（Brenda Milner）和苏珊娜·科金（Suzanne Corkin），她们研究了一个名叫亨利·莫莱森（Henry Molaison）的人，更广为人知的是他姓名的缩写H. M.。H. M.曾患有严重的癫痫，当时没有任何药物可以治疗，只能进行手术，但在接受了癫痫手术后，他开始变得健忘。外科医生切除了他大脑两侧的大部分内侧颞叶组织，这极大地减轻了他的癫痫症状，却让他无法记住手术前几年间发生的事情，未来也不能形成新的记忆。与此同时，科金和她的同事通过与H. M.互动发现，他学习其他事物的能力保留得出奇地好。在《永远的现在时：失忆症患者H.M.留给后世的礼物》（Permanent Present Tense: The Unforgettable Life of the Amnesic Patient H.M.）一书中，科金探讨了H. M.是如何学习新的运动技能的，比如，他在1986年进行髋关节置换手术后学习使用助行器，而且经过练习，他能够学会并正确地使用它。虽然他不能确切地记住自己为什么需要助行器，但当他被问到为什么需要助行器时，他能简单地回答“这样我就不会摔倒了”。

在20世纪50年代及60年代进行的一系列研究中，米尔纳和科金广泛测查了H. M.的学习能力。她们发现，尽管他仍然不能有意识地回忆过去，但他能够很好地学习一些运动技能，并在很长一段时间内保持这些技能。这些针对H. M.的早期研究为后来几十年中的一系列研究奠定了基础，也促使科金随后对遗忘症患者的学习能力进行了更深入的探索。科金的一个主要研究发现是，遗忘症患者不仅可以学习新的运动技能，还可以学习新的感知和认知技能。我的博士生导师尼尔·科恩（Neal Cohen），早年与拉里·斯奎尔一同在加州大学圣地亚哥分校做研究，他们提供了一个非常引人注目的研究例证。在这项具有里程碑意义的研究中，他们考察了个体学习阅读镜像文字的能力，这是一种感知技能（见图1.2）。2加拿大心理学家保罗·科勒斯（Paul Kolers）在20世纪70年代开展的研究表明，通过练习，人们阅读镜像颠倒文字的速度会越来越快，准确率也会越来越高，而且他们一旦掌握了这种阅读技能，此能力会持续至少一年。在科恩和斯奎尔的研究中，他们将不常用的单词以3个一组的方式镜像呈现给受试者，并测试受试者大声朗读这些单词所花的时间。他们测试了3组因不同原因导致遗忘症的受试者，其中一组遗忘的成因堪称恐怖，斯奎尔等在后来的一篇论文中对此做了描述。3一个姓名缩写为N. A.的患者，他在美国空军服役期间的一次意外中被一把小型锉刀刺中了脑袋。斯奎尔及其同事对他进行了MRI成像检查，发现锉刀损伤了他的丘脑，而丘脑对记忆来说是很重要的脑区，因为它与海马体有着紧密的联系。另一组受试者患有柯萨科夫综合征，这是一种长期酗酒的人因缺乏硫胺素（维生素B₁）而引起的大脑失调病症，它也会导致丘脑损伤。第三组是一些因慢性抑郁而接受电休克治疗的人，这种治疗结束后，也会引起一段时间的遗忘症状。

图1.2　一个镜像文本的例子。试着在最短的时间内从右往左大声读出这几个单词。

科恩和斯奎尔首先需要确定这些人确实是有遗忘症状的。为此，他们向每个受试者呈现两两配对的10对单词，接着对他们进行测试，测试时只给他们呈现配对中的第一个单词，并让他们回忆另一个单词是什么。当完整地看完这10对单词3遍以后，健康的受试者平均能回忆起8～9个单词。相比之下，遗忘症患者只能回忆起两个，这说明相较于健康受试者，他们的有意记忆能力严重受损。为了测试他们学习镜像阅读技能的能力，科恩和斯奎尔让受试者在3天时间里练习阅读镜像颠倒的单词。大约3个月后，他们又对这些人进行了测试，看他们的技能保持得如何。结果显示：遗忘症患者在学习如何阅读镜像文本上不存在问题，他们的阅读反应和健康对照组差不多。在3个月后的测试中，遗忘症患者依然很好地保持了这项能力，没有表现出技能的丧失，事实上，他们还能够在任务中继续进步。这些结果有力地证明了，即使患者患有遗忘症，也没有影响学习能力。同时，研究结果也清楚地表明了，海马体及其相关的大脑系统并不是学习新技能所必需的。那么问题来了：如果不是海马体，大脑中对习惯和技能至关重要的系统是什么呢？

爬行动物大脑进化的残留

如果上网搜索“蜥蜴脑”（lizard brain），你会发现，它似乎是许多人类深层次问题的根源，搜索结果如：

·　你那2亿岁的蜥蜴脑是如何拖你后腿的

·　不要听信你的蜥蜴脑

·　如何打败你的蜥蜴脑

·　让蜥蜴脑安静下来

……

神经学家保罗·麦克林（Paul MacLean）认为，行为的惯性源自爬行动物大脑的进化残留，这一观点最近逐渐流行起来。麦克林在美国国立精神卫生研究院建立了准自然实验室，并花了几十年时间（从20世纪60年代到90年代）在那里研究蜥蜴的大脑和行为。麦克林对哺乳动物的大脑是如何从2亿多年前的爬行动物大脑进化而来的很感兴趣。由于哺乳动物的祖先——类似蜥蜴的生物（兽孔目动物）如今已不复存在，因此麦克林将目光投向了它们现存的近亲：蜥蜴。根据他的描述，我们会看到蓝刺蜥蜴在日常生活中拥有极其习惯化的行为，而我们人类又何尝不是如此：

每天清晨，当蓝刺蜥蜴从实验场中的藏身处冒出来时，它都会慢慢地、小心翼翼地向前挪动身体，那样子就像可能会随时被捕食者抓住似的。它继续往前，来到一个它偏爱的晒太阳的地点，在那里，它摆出一个能够让自己最大限度从人造阳光中吸收热量的姿势。一旦身体热起来，达到一个最适宜的温度后，它的下一个动作就是在晒太阳处附近的一个固定的地方排泄。换句话说，与其他哺乳动物一样，它有一个固定的排便点……排便后，它开始朝着最喜欢的休憩处前进，中途或许会停下来喝点儿水……到达休憩处后，它会做一下简短的特征展示，然后用一种悠闲的姿势，在这片区域内搜寻移动的猎物。它的样子看起来与钓鱼者等鱼上钩的样子颇有几分相似……在一段固定的等待猎物的阶段之后，它会进入一段不活动的午后时光……随着一天的结束，雌性蓝刺蜥蜴开始回到藏身处它最喜欢的地方，接着闭上眼睛，慢慢安静下来，把头埋进一个缝隙里过夜。雄性蓝刺蜥蜴最终也会这样做，但它们通常需要再晒一会儿太阳，占统治地位的那一只比其他蜥蜴吸收热量的时间更长。4

麦克林基于自己的研究，提出了“三重脑”的观点，把大脑分成了3个主要部分。“爬虫脑”由大脑深处的一些区域组成，这些区域存在于所有的脊椎动物中，包括脑干和基底神经节。麦克林强调了爬虫脑的日常行为和习惯，以及求偶时的鸣叫、展示支配或服从等活动中的作用。麦克林认为，“边缘系统”对哺乳动物而言是一套新结构，它与情感体验有关。“新哺乳类脑”指的是哺乳动物大脑皮质中最发达的部分，它的体积会随着哺乳动物的进化而增大。

当阐述“爬虫脑”在习惯或日常行为中的作用时，麦克林尤其关注基底神经节，为他带来启发的是那些对亨廷顿病患者的研究发现。亨廷顿病是一种遗传模式非常简单的遗传疾病：如果父母中有一方患有这种疾病，那么孩子有50%的概率遗传导致该病的基因突变。这种突变是非常强大的——任何有这种突变的人，在他们的一生中一定会发展成这种疾病，通常发病年龄在50岁左右。亨廷顿病最明显的症状是无法控制自己的动作，从而导致四肢抽搐、行走不协调，也会伴有精神症状，如精神异常、易怒、抑郁等。亨廷顿病的大脑紊乱是由于一种叫作亨廷顿蛋白的蛋白质在结构上发生了基因突变，这一病症就是因这种蛋白质而得名的。亨廷顿蛋白存在于全身的细胞中，但在大脑的某些部位尤其常见，特别是基底神经节内的神经元中。亨廷顿病的基因突变导致细胞产生亨廷顿蛋白的变异体，这种突变蛋白会使细胞功能异常或过早死亡。

这种疾病最终会攻击大脑的大部分区域，其最早的信号就出现在基底神经节中。事实上，在一项对携带亨廷顿病突变基因的年轻人进行的脑成像研究中，在这些预计10多年后才会出现亨廷顿病明显症状的人中，其基底神经节的变化迹象当时就已非常明显了。5

为了确立亨廷顿病与丧失习惯和日常行为之间的关系，麦克林用了埃里克·凯恩（Eric Caine）等于1978年发表的研究作为证据。6例如，一个患有此病的人抱怨说，虽然她知道准备一顿感恩节晚餐所需的所有步骤，但她无法像过去那样做出来；她对如何按顺序执行每个步骤感到困惑。虽然这篇论文的作者从“组织、计划和排序方面存在困难”的角度来看待患者的这些抱怨，但麦克林却将其解读为：丧失了从事惯性行为的能力。

这类例子虽然具有启发性，但并没有直接表明亨廷顿病患者在学习新习惯方面存在问题。受科恩和斯奎尔研究的启发，加州大学圣地亚哥分校的另一组研究人员首次通过实验，测试了亨廷顿病患者学习新技能的能力。由于技能与习惯之间存在紧密联系，因此被试者的这种能力是否受损是可以预测的。玛丽安娜·马尔托内（Maryanne Marton）等使用了与科恩和斯奎尔相同的镜像阅读任务，除了测试患有柯萨科夫综合征的人，他们还测试了亨廷顿病患者。7在镜像阅读任务中，他们发现这柯萨科夫综合征受试者和亨廷顿病受试者表现出了几乎相反的缺陷模式。柯萨科夫综合征受试者的表现与科恩和斯奎尔研究中的同类受试者表现相似，他们学习镜像阅读技能的能力相对正常，但很难记住任务中出现的单词。相反，亨廷顿病患者的单词记忆能力相对正常，虽然他们通过练习也能在镜像阅读任务中有点儿收获，但与柯萨科夫综合征受试者或控制组受试者相比，他们的技能学习能力要弱得多。这种情况就是我们所说的“双重分离”（double dissociation），即两组不同受试者在两项不同的任务中表现出相反的正常或受损模式。这种分离状态充分证明了不同任务（镜像阅读和记忆）依赖于不同的大脑系统，这项研究也首次揭示了基底神经节病变的人在技能学习方面存在缺陷。

有趣的是，尽管麦克林关于基底神经节在惯性行为中扮演了重要角色这一观点经受住了时间的考验，但他关于人类大脑有一部分具有“爬行动物”特点的观点，却在很大程度上遭到了神经科学家的反对。后续的研究比较了许多不同脊椎动物（从爬行动物类到鸟类再到哺乳类）的大脑解剖结构，发现它们的大脑构造总体上是非常相似的。8即使是现存最古老的脊椎动物七鳃鳗，也有与哺乳动物类似的大脑结构。

从整体结构上看，爬行动物与人类在大脑结构上并没有本质区别，人脑只是包含更多的组织，以更复杂的方式集合起来。不过，正是这种发展，尤其是前额叶皮质的发展，使人类能够超越其他物种。

大脑里的“中央交换机”

在人类大脑深处有一系列神经核群（成束的细胞集合），称为基底神经节。人类的基底神经节由几个独立的区域组成，包括尾状核、壳核、伏隔核（合称为纹状体），以及苍白球（包括内侧部和外侧部两部分）和丘脑底核，（见图1.3）。此外，黑质和腹侧被盖区也被认为是基底神经节的一部分，两者都含有能够释放多巴胺的神经元。虽然这些区域分布在大脑中部的不同位置，但它们之间能够通过特定的方式紧密相连。

图1.3　（左）基底神经节不同部位在大脑皮质侧面图中的相对位置。（右）纹状体不同部位的位置，包括尾状核（C）、壳核（P）和伏隔核（NA）。

大量连接从大脑皮质神经元通往基底神经节，与纹状体区域产生联系。重要的是，纹状体的各个部分接收来自大脑皮质不同区域的传入信号：壳核接收来自运动和感觉区的输入，尾状核接收来自前额叶皮质和涉及视觉的颞叶区的输入，伏隔核接收来自处理奖赏和情感的额叶区（以及其他皮质下的区域，如杏仁核）的输入。正是由于这些不同的连接决定了各个部分的功能——伏隔核在成瘾中起着核心作用，而壳核在日常行为中扮演了重要角色。

当来自皮质的传入信号到达纹状体时，它通常与一组特定的神经元相连，这组神经元在显微镜下呈多刺状，而被称为中型多棘神经元（medium spiny neurons）。从这里开始，信号通过基底神经节有两条通路：一条直接通路，一条间接通路。直接通路从纹状体开始，最终到达苍白球，更具体地说，是到达苍白球内部；间接通路是经过基底神经节的一个更迂回的线路，信号从这里传送到丘脑，然后传送回大脑皮质，通常会到达一个接近信号传入起始点的区域。因此，我们把这两种循环叫作皮质纹状体环路（corticostriatal loops）（见图1.4）。

图1.4　基底神经节环路图，显示了直接通路（左）和间接通路（右）。兴奋性连接用箭头和加号表示；抑制性连接用圆头和负号表示。直接途径有两个抑制步骤，最终导致大脑皮质兴奋；间接途径还多了一个抑制步骤，从苍白球外部到丘脑底核，最终导致苍白球内部的兴奋和大脑皮质的抑制。

让我们看看当信号经过直接通路时发生了什么。为了更清楚地理解这一点，我们需要知道，神经元的区别在于它们对相连的神经元所产生的影响：兴奋性神经元使目标神经元的活动增加，而抑制性神经元使目标神经元的活动减少。稍后我们还将讨论第三类神经元，它们对其他神经元的反应具有调节作用。

当大脑皮质中的一个神经元向纹状体发送一个传入信号时，它会导致接收这个传入信号的中型多棘神经元更加活跃，这是因为皮质中的神经元是兴奋性的。事实上，几乎所有从大脑的一个区域向另一个区域发送信号的神经元都是兴奋性的。纹状体中接收传入信号的中型多棘神经元是抑制性的，这意味着当它们放电时，会导致苍白球中的目标神经元活动减少。苍白球中的神经元也是抑制性的，当它们放电时，会抑制丘脑中目标神经元的活动。在动物休息时，苍白球中的神经元会以每秒60～80次的速度放电9，这种持续（或“紧张性”）抑制使丘脑中的神经元大部分时候都保持沉默，这样它们就不能使大脑皮质中位于环路末端的目标神经元兴奋。注意这里发生了什么：我们有两个连续的抑制性神经元，这意味着第一个神经元（纹状体中的中型多棘神经元）传入的信号将减少第二个神经元（位于苍白球中）的持续抑制，最终导致丘脑和大脑皮质兴奋。这就好比把两个负数相乘，得到一个正数。因此，直接通路的刺激作用是通过让环路末端的皮质产生兴奋活动从而引发一个行为或想法。

基底神经节间接通路的作用正好相反——通过抑制大脑皮质中位于环路末端的神经元，从而停止了行为和想法。间接通路的起始阶段与直接通路非常相似，有一个从纹状体到苍白球的连接，但连接点在苍白球的外部。接着，苍白球向外发送抑制信号到一个叫作丘脑底核（STN）的区域。丘脑底核向苍白球内部发送一个兴奋性输出，这与直接通路中第二个抑制阶段类似。当这个抑制阶段开启以后，丘脑底核活动所产生的作用就会是抑制丘脑和大脑皮质的整体活动。这样一来，通过在环路中增加一个步骤，间接通路中的活动就产生了抑制行为和思想的作用。

从大脑皮质传入纹状体的信号是如何知道该走哪条通路的呢？事实证明，纹状体中不同组的中型多棘神经元会将信号传递到直接通路或间接通路，而这两组神经元的主要区别之一与人人都喜爱的一种神经化学物质有关：多巴胺。

复杂的多巴胺

多巴胺似乎无处不在。科学记者贝瑟尼·布鲁克夏尔（Bethany Brookshire）在2013年的一篇博客文章中完美地捕捉到了这一点：

人们喜欢描述大脑中“充斥着化学物质”，但有一种化学物质——多巴胺，似乎总能脱颖而出。它是我们所有罪恶行为和秘密欲望背后的分子：多巴胺是爱，多巴胺是欲望，多巴胺是婚外情，多巴胺是动机，多巴胺是注意力，多巴胺是女性主义，多巴胺是上瘾。

天啊，多巴胺太忙了。

你一定在大众媒体中读到过“多巴胺”这个词，事实上，这是一种最受喜爱的神经递质，在媒体中它常常被描绘成一种“快乐激素”。多巴胺似乎与任何事物都有关系，从爱到成瘾，但这其实是很多人对多巴胺在大脑中扮演的许多复杂角色的误读。

首先，让我们来看看多巴胺从何而来，它的作用是什么。大脑中绝大多数的多巴胺都产生于大脑深处的两个小核团：黑质（更具体地说，产生于这个区域中一个叫作致密部的部分）和腹侧被盖区（见图1.5）。10这些神经元向大脑的大部分区域发送投射，但对基底神经节的投射尤其强烈。大脑中多巴胺能神经元的数量很少——人脑中大约只有60万个多巴胺能神经元11，但它们却影响着我们思想和行为的几乎所有方面。多巴胺是一种神经调节递质，它不会直接引起受其影响的神经元的兴奋或抑制。它的作用是调节信息传递的效率，增强或削弱神经递质的效应，就像吉他扩音器上的音量旋钮，其作用是调节吉他发出的声音对扬声器音量的影响。此外，大脑会因经验而发生变化（神经学家称之为可塑性），我们将会看到，多巴胺在这个过程中也起着关键作用。

图1.5　产生多巴胺的神经元位于大脑深处，位于黑质致密部（SNc）和腹侧被盖区（VTA）内。这些神经元将输出信号广泛传送到整个大脑，其中很大一部分传送到了纹状体。（图片由阿里亚斯-卡里翁等提供）

多巴胺的另一个复杂之处在于神经元上存在不同类型的多巴胺受体。其中一些受体会增强神经元的兴奋性（类似于调高音量），另一些受体会减弱神经元的兴奋性（类似于调低音量）。单个神经元倾向于表达（产生受体并将它们置于细胞表面）这两种多巴胺受体中的一种。对直接及间接通路中中型多棘神经元的研究表明，直接通路中的神经元主要是增强兴奋性多巴胺受体，而间接通路中的神经元主要减弱兴奋性多巴胺受体。多年来，这一区别一直备受争议，但一套新的神经科学技术——光遗传学（optogenetics），为这一区别提供了强有力的证据。

加州大学旧金山分校的亚历克塞·克拉维兹（Alexxai Kravitz）和阿纳托尔·克里泽（Anatol Kreitzer）进行了一项里程碑式的研究，他们测试了不同类型的多巴胺受体在基底神经节通路中的定位，方法就是用光遗传学技术来激活小鼠纹状体神经元，这些纹状体神经元表达了增强或抑制。他们还研究了这种激活对小鼠行为的影响。12表达增强受体的纹状体神经元位于直接通路中，因此，激活它们应该会使小鼠的活动增多。当克拉维兹和克里泽激活表达增强受体的神经元时，他们发现小鼠在笼子里走动的时间更多，而静止不动的时间更少，这与这些神经元驱动大脑皮质活动增强的观点是一致的。当他们激活表达抑制受体的神经元时，情况正好相反——小鼠待在原地的时间更长，而在笼子里走动的时间则更少。这样的结果进一步证实了不同类型的神经元具有不同的作用，有的会导致行为的发生，有的会阻止行为的发生。

有了这些背景知识，我们现在就可以理解为什么亨廷顿病会导致出现动作不受控的症状。由于一些原因，亨廷顿病对间接通路神经元的影响远早于对直接通路的损害。在健康的大脑中，动作会受到间接通路的抑制，而在亨廷顿病患者的大脑中，这一通路受到了破坏，平衡被打乱，而这对直接通路是有利的，因此会导致动作不受控制。再来看一下帕金森病的情况，这是一种比亨廷顿病更常见的神经系统疾病。帕金森病在某些方面表现出与亨廷顿病相反的症状：动作迟缓、姿势僵硬和震颤。帕金森病的主要致病原因是黑质多巴胺能神经元的变性死亡。这些神经元的死亡导致了大脑中多巴胺的缺乏，而多巴胺会抑制间接通路中表达抑制受体的神经元的活动，因此，多巴胺缺乏导致了间接通路的活动增加。相反，由于多巴胺会增加直接通路中增强受体神经元的活动，因此，多巴胺缺乏就导致了直接通路的活动减少。这就表明，为了实现健康的大脑功能，这两个通路的活动必须达到一个平衡状态。

可塑的大脑

多巴胺在大脑中还有许多不同的作用，其中之一是它在习惯形成过程中所起的核心作用——调节大脑中变化的基本机制，即突触可塑性（synaptic plasticity）。为了理解突触可塑性，让我们来看看当一个神经元与另一个神经元交流时会发生什么。

假设皮质中有一个神经元将信息投射到纹状体的一个中型多棘神经元上，皮质神经元会产生一个动作电位，导致兴奋性神经递质从位于轴突末端的小泡中释放出来，轴突末端与纹状体中的神经元相连。这些神经递质分子会被释放到一个位于轴突与纹状体中目标神经元之间的开放空间中，这个开放空间称为突触（synapse）。释放后，神经递质分子漂浮在突触的间隙中，其中一些分子与突触另一端神经元表面的受体接触。当这种情况发生时，它们会引起神经元的电变化，最终导致目标神经元产生自己的动作电位。重要的是，有许多不同的原因可以解释为什么一些特定的神经元在引发动作电位时会比其他神经元的影响更大：可能因为它们能释放更多的神经递质，也可能因为它们有更多的突触，或者它们有更大的突触等。此外，还有一种可能性是下游神经元的表面有更多的受体。突触可塑性是指经验使突触强度发生变化的过程，一些神经元在激活其他神经元时相应地变得更强或更弱。这种可塑性被认为是学习的关键。13

多巴胺并不直接导致突触可塑性，但它在调节可塑性方面起着关键作用，称为三因素规则（three-factor rule）（见图1.6）。可塑性最常见的一种形式是当一个神经元快速连续地引起另一个神经元放电，其突触传递效能就增强了。这种以神经科学家唐纳德·赫布（Donald Hebb）的名字命名的赫布可塑性（Hebbian plasticity），通常被描述为“一起放电的神经元连接在一起”。在大脑的某些区域，包括纹状体，这一概念有略微修改，以满足三因素规则：“在多巴胺的存在下，一起放电的神经元连接在一起；在没有多巴胺存在时，一起放电的神经元会断开连接。”这3个因素是：传入神经元的放电，随后目标神经元放电，以及多巴胺的存在。在这种方式下，多巴胺就像是一扇通向新行为（包括习惯）发展的大门。

图1.6　三因素可塑性规则示意图。在该图中，多巴胺调节纹状体中的突触可塑性。皮质神经元释放谷氨酸（G），导致纹状体神经元放电。突触的变化取决于多巴胺（D）是否存在；如果多巴胺存在（右图），那么突触得到强化，如果多巴胺缺失（左图），突触则会弱化。

塑造“奖励”的多巴胺

沃尔夫拉姆·舒尔茨（Wolfram Schultz）是一位德国神经科学家，他一直试图理解多巴胺，他的工作成为解开多巴胺释放之谜的关键。他的研究包括记录猴子大脑中释放多巴胺的神经元的活动，并尝试理解它们放电的机制。长期以来，多巴胺都与奖励联系在一起。早前的研究表明，如果在大鼠大脑中放置一个电极，刺激多巴胺释放，大鼠几乎会做任何事来获得这种刺激。舒尔茨早期对猴子进行的研究证实了，奖励事件确实会引起猴子大脑中多巴胺能神经元的活动。然而，他注意到一个现象，这可能会颠覆我们对于多巴胺角色的认知。当猴子被给予一个意料之外的奖励时，多巴胺能神经元就会放电。接着，舒尔茨测试了一种情境，即猴子在获得奖励之前首先接收到一个信号（一束闪光）。14在实验刚开始时，猴子还不知道光束是奖励之前会出现的东西，此时它的多巴胺能神经元不会放电，直到奖励出现才会放电。然而，猴子一旦知道了光束出现后会有奖励，多巴胺能神经元就会在光束出现后马上开始放电，而在奖励出现时则不放电。而且如果预期的奖励在光束之后没有出现，则多巴胺能神经元的活动就会下降到基线水平以下。这说明多巴胺能神经元并不是严格意义上的对奖励敏感，而似乎是对世界与我们预期不一致的情况敏感，这一概念称为奖励预测误差（reward prediction error）（见图1.7）。

图1.7　多巴胺能神经元奖励预测误差信号的演示。每张图显示了多巴胺能神经元在一段时间内的活动。上图显示了多巴胺能神经元对意外奖励的反应（R）。中图显示了多巴胺能神经元对预期奖励的“条件刺激”（CS）产生反应，而对预期奖励本身缺乏反应。下图显示了当预期的奖励没有出现时，由于消极的预测误差而导致的活动抑制。（改编自舒尔茨等）

这一发现至关重要，因为它有助于将多巴胺与计算机科学和心理学的一系列观点联系起来，促使我们用当今主流的计算框架来理解多巴胺的作用。在计算机科学领域，研究人员一直对如何构建经验学习的系统感兴趣。这一领域如今被称为机器学习（machine learning），它是我们自身的许多自动化系统的基础。机器学习中有一个领域叫作强化学习（reinforcement learning），大意是通过“尝试-错误”的过程来进行学习的。强化学习理论的一个基本观点是：学习应该基于我们的预期与我们的实际经历结果的匹配程度。也就是说，这个世界和我们预期不一样的地方，就是我们需要学习的地方。大多数强化学习理论认为，做决定者基于他所有可能采取的行动的预期价值来做出一个行为，随后通过观察结果（输或赢），利用这一信息去更新下一轮的预期。重要的是，我们并不是利用输或赢的绝对次数来更新预期，而是用预期和观察结果之间的差异来更新预期。在舒尔茨等的研究中，这种差异就是多巴胺所代表的预测误差信号。实验证明：多巴胺可以通过强化学习的计算机科学来进行理解，这项研究提供了一个在大脑决策中非常有用的计算框架。

爱因斯坦曾开玩笑说，科学理论应该尽可能简单，但不能过于简单。就此而言，尽管奖励预测误差理论成功地解释了多巴胺功能的许多方面，但它可能过于简单化。伊拉娜·威滕（Ilana Witten）是普林斯顿大学的一位神经科学家，通过研究小鼠，她希望理解多巴胺功能的各种复杂细节，并且她也找到了可用于研究小鼠大脑的强大技术。为了记录小鼠进行复杂行为过程中的多巴胺能神经元活动，威滕与另一位普林斯顿大学的教授大卫·汤克（David Tank）合作，开发了一种可用于小鼠的虚拟现实系统。在这个系统中，小鼠被置于一个小球上（有点儿像乒乓球），它的头部用一个小型金属头盔固定，头盔中不断向小鼠播放沉浸式视频，使它在小球上跑步。头盔能够很好地将头部固定在适当位置，通过一种叫作钙离子成像（calcium imaging）的技术，用一台小显微镜就能在小鼠做各种行为时记录下它的大脑神经元活动。这使得研究人员能够确定多巴胺能系统中的神经元活动是如何与动物行为的许多不同方面相联系的，而不仅限于奖励预测误差。

2019年，威滕发布的研究结果表明：多巴胺能神经元的活动方式比我们之前认为的要复杂得多。在一个十分简单的游戏中，小鼠从一个虚拟走廊上跑下来，接着向左或向右跑到走廊尽头。如果转到了正确方向，就会喝到一口水（这对口渴的小鼠来说是一个相当大的奖励），而如果转到了错误的方向，就会听到嗡嗡的蜂鸣声，然后不得不原地等待2秒钟。当小鼠在走廊上奔跑时，它会看到走廊两边有虚拟的“塔”，这给了它一个线索，暗示它走哪一边会获得奖励；哪一边的塔越多，奖励就越有可能出现在那一边。小鼠学会了这一点，通过练习，它们转向某一边的可能性与那一边塔的占比非常接近。参与实验的共有20只小鼠，威滕记录了这些小鼠玩游戏时大脑中300多个多巴胺能神经元的活动。

如果奖励预测误差理论是正确的，那么多巴胺能神经元应该只在意外奖励出现时以及可以预测奖励时才会放电。为了验证这一点，威滕与纳撒尼尔·丹（Nathaniel Daw）教授进行了合作研究。丹教授是研究多巴胺信号与学习的关系的世界顶级专家之一。研究团队建立了一个统计模型，用这个模型他们可以测试多巴胺能神经元如何对小鼠在游戏体验中的不同方面做出反应——从小鼠在走廊上的位置，到它能够跑多快，再到它在之前的尝试中是否获得了奖励。研究团队发现，多巴胺能神经元对游戏的不同方面都有反应。有充分的证据表明：许多多巴胺能神经元的反应与奖励预测误差理论的预期一致，但这并非导致它们做出反应的唯一因素。威滕的研究已经开始向我们展示出多巴胺到底有多复杂。

你想要什么，多巴胺比你更清楚

当谈到科学上流行的错误观点时，荣登榜首的或许就是多巴胺和快乐之间的关系。多巴胺与快乐有关这当然是有道理的，毕竟已有研究证明了，动物会自我刺激多巴胺能系统，直到筋疲力尽。它们一定是觉得快乐所以才这么做的吧。然而，有时候显而易见的答案恰恰是错误的。大脑的神经化学系统非常复杂，在过去的20年里，一个重要的发现就是多巴胺并非直接负责产生快乐的化学物质。多巴胺的作用似乎集中在动机上——或者就像神经科学家肯特·贝里奇（Kent Berridge）所说，是“想要”（wanting），而不是“喜欢”（liking）。

约翰·萨拉蒙（John Salamone）是康涅狄格大学的一名神经科学家，他致力于研究大鼠的动机——主要是通过操纵大鼠的大脑化学物质，试图把它们变成电视迷。为此，他使用了一种实验装置，让大鼠在不需要额外努力就能吃到少量食物和爬过障碍物后能吃到大量食物之间做出选择。

当面临选择时，大鼠通常都会爬过障碍物去获取更多的食物。然而，在一些实验中，萨拉蒙发现，干扰多巴胺会使大鼠更有可能选择少量的无须努力就能获得的食物。这并不是因为多巴胺被扰乱后大鼠就爬不过障碍物了，如果让它们在攀爬后给予食物和不攀爬也不给食物之间做选择，它们一定会选择前者。这样看来，多巴胺被扰乱后似乎只是降低了大鼠为食物而努力的意愿。

萨拉蒙的研究与神经科学家肯特·贝里奇和特里·罗宾逊（Terry Robinson）的一系列观点相吻合，他们的论述非常有说服力，他们认为多巴胺的作用是激励显著性（incentive salience）：多巴胺并不会决定机体对奖励的喜爱程度，而是提供一种信号，告诉你机体想要获得某种奖励的程度，以及你应该付出多大努力去得到奖励。

就多巴胺在动机中的复杂性而言，其中一个表现就是，它在大脑中广泛释放，在不同的接收脑区里，它的影响是不同的。例如，将纹状体运动部分的多巴胺阻断，会降低动物的整体身体活动水平。伏隔核（纹状体的一个部分，与大脑中涉及情绪的其他部分联系紧密）中的多巴胺受体似乎在激励动机中起着核心作用，但它的角色很复杂。阻断伏隔核中的多巴胺不会干扰基本的食欲，也不会干扰进食的快乐，但会干扰动物进食的意愿，即它们是否愿意做出获取食物的行为，或者是否愿意为了获得更多食物而进行额外的努力。

尽管多巴胺对动机很重要，但奖励的快乐信号似乎是由大脑中的其他神经递质系统发出的，包括阿片受体（阿片类药物如海洛因的作用靶点）和大麻素受体（大麻中活性成分的作用靶点）。最有名的证据来自肯特·贝里奇的研究，他研究了在阻断大脑中的多巴胺或阿片类神经递质后大鼠的“快乐反应”（比如，为了获得甜食而舔嘴唇或爪子，或面对苦味食物时摇头）。他发现，阻断多巴胺不会减少动物的快乐反应，而阻断阿片类神经递质则会。这些结果与许多关于纳曲酮作用的报道一致。纳曲酮是一种阻断阿片类物质作用的药物，通常用于治疗酒精成瘾。一些研究检测了纳曲酮对性、赌博、安非他命类药物的使用等方面的影响，这些研究普遍发现，纳曲酮减弱了个体从这些方面获得的愉快感。

行动的选择

在任何特定的时间点上，一个人可能做出的行动几乎是无限多的。即使是一个简单的动作都有很多种方式，比如，拿起一个咖啡杯：可以快速拿起、缓慢拿起、平稳拿起、摇摇晃晃地拿起、直接拿起、兜着圈拿起……要理解我们为什么做出某个行动，一个重要的问题是，当我们选择一种行动时，我们的目标是什么？一方面，我们希望从行动中获得最大的奖励，这种奖励可以是喝一口咖啡而不让咖啡洒出来，也可以是从游戏中赢得最多的筹码。另一方面，我们希望将行动的成本降至最低，无论是在体力、脑力还是在时间。我们可以拿起咖啡杯，把它举过头顶5次，然后放到嘴边，但是没有人会真的那样做，因为这可能会让咖啡洒出来，而且会增加体力和时间成本。基底神经节和多巴胺能系统似乎在计算中扮演着核心角色，帮助我们决定在特定的时间点做什么以及如何去做。

神经科学家彼得·雷德格雷夫（Peter Redgrave）曾在1999年提出，基底神经节是行动选择的“中央交换机”。15该理论认为，大脑皮质向基底神经节发送代表潜在行动的信号。这一理论的提出是基于我们之前提到过的苍白球内强烈的紧张性抑制。假设一个人需要在两种可能的行动中做出选择（比如，伸手拿一块蛋糕或一根胡萝卜）。每一个潜在的行动都会由一个信号来代表，这个信号从大脑皮质发送到基底神经节。在信号到达之前，基底神经节的紧张性抑制会抑制一切行动。当这两个信号到达纹状体时，它们通过直接和间接通路的活动相互竞争，最终其中一个行动被直接通路选中并得到执行。

多年来，这一模型在很大程度上仍然是一种推测，但近年来，神经科学方法的进步已经开始为这个模型提供直接证据。罗伊·科斯塔是哥伦比亚大学的一名神经科学家，他的研究为了解行动选择在基底神经节中如何进行提供了证据。他在研究中采用了光遗传学技术，使得研究人员能够识别纹状体中的任何单个神经元属于哪条通路，然后分别测量两条通路中这些神经元的活动。在实验中，他们教小鼠执行一系列按压杠杆的动作。经过练习，小鼠可以按得很快。科斯塔发现，直接和间接通路的神经元在系列行动的开始阶段都变得很活跃，这或许反映了不同的可能行动之间的竞争。然而，一旦系列行动开始，就只有直接通路的神经元仍然保持活跃。在系列行动的最后，间接通路的神经元再次变得活跃，这表明在结束一个复杂行动时，这些神经元也参与了。16

本章提到的这些研究向我们展示了，基底神经节是大脑里习惯学习的中心，而多巴胺在建立新习惯的过程中扮演着关键角色。我们可以从中看到这些机制是如何使一种习惯变得根深蒂固的。例如，给大鼠提供两个杠杆，它可以选择去按压，但只有一个杠杆会提供食物颗粒作为奖励。刚开始，按压两个杠杆的行动价值大致相等，因为大鼠并不知道哪一个会带来奖励（实验室动物在类似的环境中待久了，通常都会知道杠杆是用来按压的）。大脑皮质会向纹状体发送对应于按压每一个杠杆的指令，其中一个会在纹状体中获胜。比如大鼠可能在过去学过，右边的杠杆更有可能提供奖励，所以它可能就会选择右边的那一个。如果它得到了食物，那么这个意外的奖励就会导致多巴胺的释放，多巴胺会通过三因素规则强化大脑皮质和纹状体之间的连接，从而使大鼠去按压那个特定的杠杆。这种连接的增强将使皮质神经元更有可能在下一次引起纹状体神经元放电。如果大鼠没有得到食物，那么就会导致连接强度的下降。这种连接强度的变化使得下次大鼠在面对同样的选择时，得到了奖励的那种行动更有可能胜出，随着时间的推移，这种行动就逐渐固化成了一种习惯。

下一章我们会转向本书中最核心的问题之一：为什么习惯会如此顽固？

本周热推：

祖先的故事基因之河蚂蚁的世界生命密码2：人人都关心的基因科普生命是什么：40亿年生命史诗的开端

第一部分 大脑中的惯性机器

第一章 学习、记忆和习惯