第四节 跨疾病分类的“内表型”
由于精神疾病的病理生理特征跨越诊断边界,一个有前途的研究方向是搜索跨疾病分类的“内表型”。所谓内表型即是将风险基因型与精神疾病综合症状联系在一起的定量遗传性状(图1-4-1A)。尽管尚未显示内表型具有比精神病学诊断更简单的遗传学特征,然而由于内表型可以更精确地定义和测量,从而更容易在动物模型上检测,以揭示疾病背后的生物学机制。例如,冲动性(impulsivity)与强迫性(compulsivity)的行为内表型在一系列包括强迫症、药物依赖、注意缺陷多动障碍在内的许多精神疾病的诊断类别里都可以看到。冲动和强迫或许不是单一的构建,但是它可能是从一组心理过程派生出来的,能够由内表型来揭示(图1-4-1B)。
图1-4-1 横跨传统定义精神病类别的内表型研究
注:A.基因以及在研究精神分裂症的生物系统方法中涉及的内表型。遗传、环境和表观遗传因素之间动态发展的交互作用产生的累积效应导致精神分裂症的发病。作为精神分裂症鉴别的内表型,涉及感觉运动门控通道、眼球运动功能、工作记忆及神经胶质细胞的异常。更多的基因位点、基因及候选的内表型仍有待于进一步发现(由问号表示)。该图不是按比例绘制的。B.冲动和强迫背后的可能心理因素的机制。这些表征并不一定直接相关,说明冲动与强迫并非源于同一基因。这个领域的研究目前十分活跃。冲动和强迫都涉及运动/响应脱抑制,但发生在反应过程的不同阶段
如何准确和可靠地识别内表型是一个重大挑战。为了在这个研究中取得进展,我们要综合考虑患者的感受与其选择和行动。这就需要设计行为实验来测试专门的认知功能,以量化多种精神疾病是否共享同一特定功能的异常。这些精心设计的任务应该对人类和其他动物均适用,从而可以将动物实验的结果用于转化研究(translational research)。而且其理论推测可以应用到正常受试者和患者,这样才可以提供对大脑功能障碍的核心的洞察。
举个抉择障碍的例子。很多精神病人在社会、职业和娱乐领域重复地做出错误的、对自己不利的选择。越来越多的证据表明,抉择障碍是一种贯穿精神疾病诊断边界的认知内表型。有一些研究涉及“以奖赏为基础的抉择”(reward-based decision making)的评估过程,能让人通过经验来学习做出正确评估的是大脑本身的计算原则,而这种能力正是适应性选择行为(adaptive choice behavior)的基础。大脑的这个抉择过程包括:从2个或多个选择中取1个、评估其结果(得到奖赏还是惩罚)、用这种经验来指导下一个选择,以期实现抉择优化。强化学习(reinforcement learning)理论为这种适应性抉择过程和与精神疾病造成的损伤提供了研究框架。在这个行为科学与生物机制交叉的研究领域里,有一个重大发现,那就是腹侧被盖区(ventral tegmental area,VTA)多巴胺神经元间断式发放是“奖赏预测误差”的表征。该发现正好与强化学习理论所预言的“奖赏预测误差”相符合。
简单解释,我们在此将“奖赏预测误差”用数学描述为δt=rt-Vt,其中rt是在时间t的实际奖赏,Vt是大脑的预期奖赏。预期奖赏是主观的,需要通过“抉择-结果评估-抉择-结果评估”的过程反复来调整。这个反复学习过程可由如下数学公式描述:Vt+1=Vt+αδt。如果实际奖赏大于预期奖赏,δt是正值,Vt+1比Vt大;相反,如果实际奖赏小于预期奖赏,δt是负值,Vt+1比Vt小,这样Vt可能逐渐准确地预言实际奖赏。学习的速度由速率α来控制(α越大,Vt变化越快)。不少实验证据表明,帕金森病、精神分裂症、抽动秽语综合征、注意力缺陷障碍、药物成瘾和抑郁症都涉及强化学习的受损,这有力地证明了这些基于功能、跨诊断类别的方法在精神病学研究中的重要性。
例如,药物成瘾可以认为是强化学习系统出了问题。这种定量模型的优点是其足够精确可以通过新的实验来验证真伪,这是科学对定量模型的基本要求。Redish的模型预测,当药物被用作无条件强化物时,“阻断”行为不会发生。所谓“阻断”行为是基于如下的研究观察:当受试者首先学习到刺激A是与奖赏相关联的,如果随后将A与另一刺激B配对时,受试者不会认为B也与奖赏相关联。如果药物(例如刺激A和B)导致价值无限增加,这种“阻断”则不应该被观察到。然而,用可卡因作为无条件刺激的行为实验发现,“阻断”仍然发生了,与Redish的模型相违。对此结果的一种可能的解释是“阻断”并非由强化学习造成;另一种解释是强化学习涉及脑内多个互相竞争的系统,如何对这个结果做出正确的解释仍在研究中。
强化学习方法也被用于抑郁症的研究。Huys等试图检验的假设是抑郁症与对奖赏敏感性的改变有关。具体而言,在此模型中“奖赏预测误差”变成δt=ρrt-Vt,其中新加的参数ρ表示对奖赏的敏感性。用强化学习模型,对有50例严重抑郁症患者与50例健康受试者参与的实验结果进行拟合行为数据的分析,发现与健康对照组相比,抑郁症患者组的奖赏灵敏度(ρ值)显著减少,但学习效率α并没有变化,这与抑郁症患者缺乏愉快感和生活动力的表现是一致的。Strauss等2011年也曾报道过类似的结果,但没有将此现象定量化或做出理论解释。Huys等的这项工作表明计算建模可用来剖析行为障碍的不同方面(比如,是患者对奖赏的灵敏度,而不是学习效率出现了异常)。
目前人们认识到强化学习涉及到两个神经系统。其中一个称为“无模型(model-free)系统”,是由暗示自动引起的习惯性行为系统。第二个是基于大脑对环境因果关系的理解作行为选择的“基于模型(model-based)的系统”。“无模型系统”和“基于模型的系统”之间必须保持平衡。Daw等建立了一个双系统学习模式的计算模型并结合人脑成像的研究方法来检验这2个系统的不平衡是否会导致精神疾病的不适应选择行为。利用这个计算模型,研究者们发现,重复使用成瘾性药物后,受试者的行为选择重点从“基于模型的系统”转换为“无模型系统”。同样,双系统计算模型拟合数据发现,强迫症的患者也偏向于“无模型系统”的习惯行为。目前,关于中枢控制机制如何管理维持“基于模型的系统”和“无模型系统”之间平衡问题的研究方兴未艾。
“无模型系统”依赖于“奖赏预测误差”,而“基于模型的系统”可能依赖于侧额叶的更抽象的“状态预测误差”(state prediction error)。基于此理论,研究者们创立了“双系统强化学习”的计算模型。这个强化学习的计算模型方法已经推进了对诸如妄想症等精神疾病的转化医学研究,而这些研究在过去单靠实验精神病学的手段是无法完成的。妄想症是关于世界的错误信念,尽管这些信念与现实世界里大量的证据有矛盾,具有妄想障碍的人仍顽固地坚持己见。Corlett等用功能磁共振成像研究首发精神病患者,看到因果关系的冲突会激活右侧前额叶皮层,这种活动被认为可以作为对“预测误差信号”的检测。他们发现,患者该预测误差信号的异常与妄想症的严重程度密切相关。因此,预测能力的异常会产生错误的信念,并导致学习能力异常,从而引起妄想症。
运用强化学习计算模型方法的这些研究实例,很好地说明了当理论和计算模型与实验相结合后,有助于分解行为的不同分过程(例如对奖赏的敏感性、学习效率、“无模型系统”和“基于模型的系统”之间的平衡等),研究它们在不同精神疾病中不同形式的异常。因此,每种认知内表型(例如“冲动”)可用这些分过程不同损伤程度的特定组合来定义。因此,今后在这方面的进展,可能会产生一个有前途的新理论框架,以指导精神疾病转化医学的研究。