引言 人类思维与人工智能的未来
诺拉·乔伊斯(Nora Joyce)对她的丈夫詹姆斯说:“你为什么不写一部人人都能看懂的书呢?”
我希望此书有益于以下读者:想要探究人类思维如何运作的读者,想要了解如何更好思考的读者,想要制造智能机器的读者以及想要学习人工智能知识的读者。此外,心理学家、神经学家和计算机专家也会对本书产生极大的兴趣,因为本书对这些人士一直奋力研究的课题提出了许多新观点和新看法。
我们都钦佩科技、艺术和人类学研究中取得的许多重大成就,却很少认可自己在日常生活中取得的成功。我们认识眼中看到的事物,理解耳中听到的词语,记得过去经历过的事情,因此可以利用这些经验应对以后将遇到的其他困难和机遇。
我们可以完成其他动物无法完成的非凡壮举:一旦无法采用常规思维方式进行思考,我们就会反思;假如“反思”显示我们出现了错误,那么我们就能重新塑造一些全新且有效的思维方式。但是,我们对大脑到底是如何成功完成这些事情的却所知甚少:想象如何发挥作用?意识缘何形成?什么是情感、感觉和想法?人类如何思考?
与此相反,人类在解决物理难题方面却取得了诸多进步。固体、液体和气体是什么?颜色是什么?声音和温度是什么?力、压力和张力是什么?能量的本质是什么?当前,区区几条定律就足以解释几乎所有这些神秘的事情,比如由物理学家牛顿、麦克斯韦和爱因斯坦以及薛定谔等人发现的方程式。
因此,心理学家自然也会想到模仿物理学家,即通过寻找一系列定律来解释大脑中发生的事情。然而,根本就不存在如此简单的一套定律,因为大脑拥有数千个部件,每一个部件都负责不同的特定工作:一些部件识别环境,一些部件促使肌肉执行行动,一些部件制订目标和计划,还有一些部件存储和使用大量的知识。尽管对大脑的运行方式不甚了解,但我们知道,大脑是在信息的基础上构建的,而信息又包含数以万计的遗传基因,因此大脑中每一个部位的运行方式都受不同的定律约束。
人类大脑包含复杂的机器装置,一旦认识到这个事实,我们就需要采取与物理学家完全不同的做法,即寻找更为复杂的方式来解释我们最为熟悉的精神活动,而不仅仅满足于寻找简单的方式。诸如“感觉”“情感”或“意识”等词语的意思对我们来说如此自然、清楚和直白,我们根本不知道该如何对它们的含义进行深思。然而,本书认为,这些常用的心理学词汇并不描述任何单一、确定的过程,相反,它们都在试图描述大脑中复杂过程的影响和效果,例如第4章将讨论的“意识”就指代20多种不同的过程!
使简单的问题变得复杂,这种方式表面上看起来会使事情变得更糟。然而,从大的方面来说,增强复杂性有助于简化工作,因为一旦把未知的事物分割成细小的部分,我们就能用更小的问题来取代更大的问题;虽然这些更小的问题看起来可能仍然难于解决,但却不再是难解之谜。另外,第9章提出,把人类自身当成复杂机器的行为并没有伤害人类的自尊心,相反却能够增强人类的责任感。
在开始将大问题分割成小问题之前,本书认为,人类的大脑是由很多被我们称为“资源”的部分组成的(见图0-1)。
图0-1 大脑由不同“资源”组成
我们使用图0-1来说明一系列大脑资源是如何控制和影响人类思想的,从而来解释人类的一些精神活动(比如愤怒、爱或尴尬)。例如,被我们称作“愤怒”的状态能够激发一些资源,使其能够快速而有力地作出反应,同时压制一些让计划和行动都变得更为谨慎的资源。因此,愤怒用攻击代替了谨慎,用敌意代替了同情。与之相似,“恐惧”的状态会激发让你萌生退意的资源。
大众:有时我会觉得周围的一切是那么明亮和有趣,而有时(尽管周围没有发生任何变化)我又觉得周围的一切是那么黯淡和无聊,朋友们也觉得我有些“沮丧”和“压抑”。为什么会有如此的心态、情绪、情感或性情?为什么情感会引发这些奇怪的效果?
人们普遍认为“这些变化是大脑中某些化学物质、压力或消极的想法造成的”,但是这个答案却没有指出这些过程的实际运作方式,而选择“资源集”的想法却指出了思维变化的具体方式。例如,第1章伊始就是对以下常见现象的思考:
当一位朋友爱上了某人,他就像变了一个人似的成为一个有目标、有规划、懂得换位思考的人,就像一个刚刚被打开的开关或刚刚开始运行的程序。
大脑内部究竟发生了什么,会使其思维方式发生如此大的变化?以下是本书使用的研究方法:
每一种主要的“情感状态”(emotional states)都是因为激活了一些资源,同时关闭了另外一些资源——大脑的运行方式由此改变了。
但是,是什么激发了这样的资源集呢?我们将在以后的章节中提到,大脑也必须具有我们称之为“批评家”(Critics)的资源。每种“批评家”资源会专门识别某种情况,然后激活其他特定的资源集。一些“批评家”资源是与生俱来的,意在激发我们的一些本能反应,如愤怒、饥饿、恐惧和口渴,其发展、演化有利于人类祖先们的生存。因此,愤怒和恐惧是为了抵御和保护,而饥饿和口渴是为了给人类的进化提供所需要的营养物质(见图0-2)。
图0-2 不同“批评家”可以激发出不同的本能反应
然而,随着人的不断学习和成长,我们也不断发展出激活另一些资源集的方法,这种发展过程使得人们形成了一种情感状态,我们称之为“理性”而非“感性”。例如,在生活中遇到难题时,大脑能在不同的思维方式间进行转换和思考,从而选择不同的资源集来把问题细分为更小的部分,或通过类比法,或从回忆中寻找解决方法,或向他人寻求帮助。
这种方法将有助于我们发现独特的人类智能。
每一种主要的思维方式都是因为激活了一些资源,同时关闭了另外一些资源——大脑的运行方式由此改变了。
例如,本书的前几章试图从情感状态如何使用资源的角度出发,说明这种方法如何解释诸如爱、依恋、痛苦和沮丧等情感状态。之后的章节也会以同样的方法分析思维更加具有“智能”的层面。
大众:使用同一种方法来描述情感和常规性思维的做法看起来很奇怪,但是思维基本上是理性的、超然的、独立而有逻辑的,而情感则因为其非理性的感觉和偏见,从而活跃了思维方法。
传统上认为,情感为简单明了的思维增添了额外的特征,正如艺术家借用颜色为黑白的图画增添色彩一样。然而本书认为,我们的许多情感状态是由思维方式压制某些资源而形成的。例如,第1章提出的“依恋”是在压制一些资源的条件下形成的,被压制的资源则被用来识别其他资源所犯的错误。
大众:我依然认为你关于情感的观点忽略了太多内容。例如,当我们的胸部或内脏感到不适、心悸或是感到眩晕、颤抖或出汗时,诸如恐惧或恶心的情感状态就会影响我们的身体和大脑。
我承认这种观点可能太过极端,但有时候,为了探索新的想法,我们必须摈弃以往陈旧的思想,至少暂时需要如此。例如,当前人们普遍认为,人们的情感与身体状况紧密地联系在一起,然而本书第7章则将持相反的观点,认为身体部位是大脑用以改变(或保持)精神状态的资源,例如,我们可以通过持续保持某种面部表情来表示自己支持某个计划。
因此,尽管本书名为“情感机器”,但我们仍然认为情感状态与人们所认为的“思考”过程并无大异,相反,情感是人们用以增强智能的思维方式。这就是说,当我们的热情没有高涨到对自己有害的程度时,不同的思维方式就成为被人们称作“智能”(英文为intelligence或resourcefulness)的重要组成部分,这个过程不仅适用于情感状态,也适用于我们所有的精神活动。
如果你仅以一种方式“理解”某件事情,那么你可能根本无法理解它,一旦走进死胡同,你便无路可逃。但是,如果同时使用多种方式来表征某物时,一旦你遭受挫败,便可以转换到其他思维方式,直到找到一种适合自己的方法为止。
以此类推,当设计模拟人脑的机器即创建人工智能时,我们需要确保这种机器的多样性。
如果一个程序仅有一种运行方法,那么一旦这种方法不再适用于该程序,则该程序很快就会陷入停滞。相反,如果一个程序同时有几种运行方法,一旦其中一种方法出现问题,程序会很快转而使用其他方法或者寻找合适的替代方法。
以上就是本书的中心思想,它与认为每个人都有一个中心核、一种看不见的精神或自我,这种精神或自我又产生了多种多样精神活动的主流观点完全不同。这种主流观点看起来降低了人类的身份,即我们所有的美德都是间接获得的,我们所有的成就都是不值得称颂的,因为这些成就是其他途径附送的礼物。相反,我认为人类的尊严来自人类自身的构造:处理多种情况和困境的不计其数的方法。多样性正是人和动物以及与过去所制造的机器的主要区别所在。本书的每一章都会讨论人类特殊智能的来源途径:
●第1章 我们天生就拥有多种精神资源;
●第2章 我们能从人与人的关系中学习;
●第3章 情感是不同的思维方式;
●第4章 我们能反思我们自己最近的想法;
●第5章 我们试着学习多维度思考;
●第6章 我们能够积累大量的常识知识;
●第7章 我们可以在不同思维方式之间转换;
●第8章 我们发现了很多表征事物的方式;
●第9章 我们可以塑造多样的自我。
几百年来,心理学家一直在寻找能够解释人类大脑活动的方法,但是到目前为止,仍然有很多思想家认为思维的本质非常神秘。许多人认为大脑是由一种只存在于生命体内的物质成分组成,机器不能感觉或思考,不会担忧自身的变化,甚至不会感受到自己的存在,更不会产生促成伟大的画作或交响乐作品的思维。
本书有如下目标:解释人类大脑的运行方式,设计出能理解、会思考的机器,然后尝试将这种思维运用到理解人类自身和发展人工智能上。
引用和注释
本书所引用部分源自具体的人物,我们会将其写在注释里。
马赛尔·普鲁斯特(Marcel Proust,1927):每一位读者都只能读出自己已有的知识。一本书仅仅是一种光学仪器,作家在这个光学仪器里让读者发现自己,这种发现必须借助书本。
另一些引用则为假想读者的评论:
大众:如果日常的思维如此复杂,那为什么它在我们看起来却如此直白?
大多数引用符合标准的参考书目引用格式,例如:
Schank,1975:Roger C.Schank.Conceptual Information Processing.New York:American Elsevier, 1975.
一些内容参考了网上的资料,例如:
Lenat 1998: Douglas B. Lenat. The Dimensions of Context Space.Available at http://www.eye.com/doc/context-space.pdf.
另一些内容参考了网上的内容,例如:
McDermott 1992: Drew McDermott, In comp.ai.philosophy. February 7, 1992.
如果想获得上述文件(以及它们的撰写背景),可以在网上搜索comp. ai.philosophy McDermott 1992,我会在自己的网站上保留这些文件的复件;读者也可以通过www.emotionmachine.net提出问题、撰写评论。
我之前的一本书《心智社会》(The Society of Mind)中使用了术语“智能体”(agent),而本书则改成了术语“资源”(resource)。我这么做的原因是,很多读者认为“智能体”类似普通人(像旅行代理商),这些人能够独立运行或和其他人合作。与此相反,一些资源完成了某项工作,从而为其他资源奠定了基础,但并不能和其他的资源进行直接交流。如果想更详细地了解这两本书是如何联系在一起的,请参考普什·辛格(Push Singh, 2003)的文章,他为本书提供了很多想法。