1.2 人工智能的三大主流学派
通过机器模仿实现人的行为,让机器具有人类的智能,是人类长期以来追求的目标。如果从1956年正式提出人工智能学科算起,人工智能的研究发展已有60多年的历史。这期间,不同学科或学科背景的学者对人工智能做出了各自的解释,提出了不同观点,由此产生了不同的学术流派。期间对人工智能研究影响较大的有符号主义、联结主义和行为主义三大学派。
1.符号主义:基于逻辑推理的智能模拟方法
符号主义(Symbolicism),又称为逻辑主义(Logicism)、心理学派(Psychlogism)或计算机学派(Computerism),其原理主要为物理符号假设和有限合理性原理。主张从功能方面模拟、延伸、扩展人的智能。核心是符号推理与机器推理,用符号表达的方式来研究智能、研究推理。奠基人是西蒙(CMU)。
发展途径:启发程序→专家系统。
案例1-24:动物识别专家系统
专家系统一般由两部分组成:知识库与推理引擎。人类专家提供知识,再将这种显式的知识存储到知识库中用来推理。它一方面需要人类专家整理和录入庞大的知识库(专家规则),另一方面需要计算机科学家编写程序,设定如何根据提问进行推理找到答案,也就是推理引擎。
设计一个简单的动物识别的专家系统,简单判断蛇、蜥蜴、鸡、猫4种动物。知识库的规则如下:
冷血and没有腿→蛇
冷血and有腿→蜥蜴
非冷血and有羽毛and不会飞→鸡
非冷血and没有羽毛→猫
你可以录入上述规则到知识库。推理过程如图1-1所示。
例如:当你问这个专家系统,如果一个非冷血、有羽毛、不会飞的动物是什么时,它会经过推理告诉你结论。
图1-1 动物识别的推理过程
然后设计一个算法,即推理引擎,其实就是一个if-else结构的多分支推理引擎。
代表性成果:1956年问世的第一个启发程序LT逻辑理论机,它证明了38条数学定理,表明了可以应用计算机研究人的思维过程,模拟人类智能活动;1968年发表的第一个专家系统DENTRAL化学分析专家系统。
符号主义曾长期一枝独秀,为人工智能的发展做出重要贡献,为人工智能走向工程应用具有特别重要的意义。在人工智能的其他学派出现之后,符号主义仍然是人工智能的主流派别。
2.联结主义:受脑科学的启发
联结主义(Connectionism),又称为仿生学派(Bionicsism)或生理学派(Physiologism),联结主义主张从结构方面模拟、延伸、扩展人的智能,要用电脑模拟人脑的神经系统联合机制,其原理主要为神经网络及神经网络之间的联结机制与学习算法。联结主义核心是神经元网络与深度学习,目前人工智能的热潮实际上是联结主义的胜利。奠基人是明斯基(MIT)。
代表性成果:它的代表性成果是1943年由生理学家麦卡洛克和数理逻辑学家皮茨创立的脑模型,即MP模型,开创了用电子装置模仿人脑结构和功能的新途径。它从神经元开始进而研究神经网络模型和脑模型,开辟了人工智能的又一发展道路。1960年研制的感知机;1982年和1984年,美国物理学家霍普菲尔提出了离散的神经网络模拟和连续的神经网络模拟,开拓了神经网络用于计算机的新途径;1986年,鲁梅尔哈特等人提出了多层网络中的反向传播(BP)算法,使多层感知机的理论模型有所突破。
发展途径:人工神经细胞→人工神经网络。
案例1-25:感知器的例子
(1)神经元的结构
神经元(Neuron)是神经系统的基本结构和机能单位。一般包含胞体、树突、轴突三部分。
树突是胞体发出的短突起,树突形状似分叉众多的树枝,上面散布许多枝状突起,因此,有可能接受来自许多其他细胞的输入。
胞体内有细胞核,而且绝大多数维持细胞生命的细胞器都在其中。
轴突是胞体发出的长突起,称为神经纤维。轴突为细胞的输出端,从胞体延伸出来,一般很长。许多轴突由髓鞘包裹,其作用是与其他细胞的信息流绝缘。沿鞘壁有许多豁口,称为郎飞氏结。轴突到突触接端为止。
神经元受到刺激后,产生神经冲动,并且沿轴突传送出去(见图1-2)。
图1-2 神经元的组成
既然思考的基础是神经元,如果能够“人造神经元”(Artificial Neuron),就能组成人工神经网络,模拟思考。20世纪60年代,提出了最早的“人造神经元”模型,称为“感知器”(Perceptron),直到今天还在用(见图1-3)。
图1-3 感知器
上图的圆圈就代表一个感知器。它接收多个输入(x1, x2, x3…),产生一个输出(output),好比神经末梢感受各种外部环境的变化,最后产生电信号。
为了简化模型,我们约定每种输入只有两种可能:1或0。如果所有输入都是1,表示各种条件都成立,输出就是1;如果所有输入都是0,表示条件都不成立,输出就是0。
(2)感知器模型
下面通过一个例子来解释什么是感知器模型。城里正在举办一年一度的游戏动漫展览,小明拿不定主意,周末要不要去参观。
他决定考虑三个因素。
天气:周末是否晴天?
同伴:能否找到人一起去?
价格:门票是否可承受?
这就构成一个感知器。上面三个因素就是外部输入,最后的决定就是感知器的输出。如果三个因素都是Yes(使用1表示),输出就是1(去参观);如果都是No(使用0表示),输出就是0(不去参观)。
如果某些因素成立,另一些因素不成立,输出是什么?比如,周末是好天气,门票也不贵,但是小明找不到同伴,他还要不要去参观呢?
现实中,各种因素很少具有同等重要性:某些因素是决定性因素,另一些因素是次要因素。因此,可以给这些因素指定权重(weight),代表它们不同的重要性。
天气:权重w1为8
同伴:权重w2为4
价格:权重w3为4
上面的权重表示,天气是决定性因素,同伴和价格都是次要因素。
如果三个因素都为1,它们乘以权重的总和就是8+4+4=16。如果天气和价格因素为1,同伴因素为0,总和就变为8+0+4=12。
这时,还需要指定一个阈值(threshold)。如果总和大于阈值,感知器输出1,否则输出0。假定阈值b为8,那么12>8,小明决定去参观。阈值的高低代表了意愿的强烈,阈值越低就表示越想去,越高就越不想去。
上面的决策过程,使用数学表达如下。
为了方便后面的讨论,需要对上面的模型进行一些数学处理。
外部因素x1、x2、x3写成矢量<x1, x2, x3>,简写为x;
权重w1、w2、w3也写成矢量(w1, w2, w3),简写为w;
定义运算w·x=∑wx,即w和x的点运算,等于因素与权重的乘积之和;
定义b等于负的阈值b=-threshold。
感知器模型就变成了下面这样。
(3)感知器的训练
现在,你可能困惑前面的权重项和偏置项的值是如何获得的呢?这就要用到感知器训练算法:将权重项和偏置项初始化为0,然后,利用下面的感知器规则迭代的修改wi和b,直到训练完成。
这种方法就是试错法。其他参数都不变,w(或b)的微小变动,记作Δw(或Δb),然后观察输出有什么变化。不断重复这个过程,直至得到对应最精确输出的那组w和b,就是我们要的值。这个过程称为模型的训练。经过多轮迭代后(即全部的训练数据被反复处理多轮),就可以训练出感知器的权重,使之实现目标函数。
20世纪60~70年代,联结主义,尤其是对以感知器为代表的脑模型的研究出现过热潮,由于受到当时的理论模型、生物原型和技术条件的限制,脑模型研究在20世纪70年代后期至80年代初期落入低潮。直到20世纪80年代提出用硬件模拟神经网络以后,联结主义才又重新抬头。我们现在所说的深度的神经网络,就是一类典型的联结主义的算法,或者说是工具。
3.行为主义:基于“感知—行动”
行为主义(Actionism),又称进化主义(Evolutionism)或控制论学派(Cyberneticsism),主张从行为方面模拟、延伸、扩展人的智能,认为智能可以不需要知识。其原理为控制论及感知—动作型控制系统,是一种基于“感知—行动”的行为智能模拟方法。行为主义推崇控制、自适应与进化计算,奠基人是维纳(MIT)。
行为主义学派认为人工智能源于控制论。早期的研究工作重点是模拟人在控制过程中的智能行为和作用,并进行“控制论动物”的研制。到20世纪60~70年代,播下智能控制和智能机器人的种子,并在20世纪80年代诞生了智能控制和智能机器人系统。行为主义是20世纪末才以人工智能新学派的面孔出现的,引起了许多人的兴趣。这一学派的代表作首推布鲁克斯的六足行走机器人,它被看作是新一代的“控制论动物”,是一个基于感知—动作模式模拟昆虫行为的控制系统。
代表性成果:1952年研制成功的第一个“控制论动物”——香农老鼠。1991年布鲁克斯演示的新型智能机器人。
发展途径:控制论动物→智能机器人。
代表性成果有MIT的Brooks研制的智能机器人。举个例子,比如条件反射,给狗一个条件,让它最后能流口水强化学习,便是行为主义非常经典的例子。强化学习,终身学习,从人的行为学习、受启发而总结出来的学习机制,均属于这一派。
4.三大学派研究方法的比较
首先,符号学派的思想和观点直接继承于图灵,他们是直接从功能的角度来理解智能的。他们把智能理解为一个黑箱,只关心这个黑箱的输入和输出,而不关心黑箱的内部构造。因此,符号学派利用知识表示和搜索来替代真实人脑的神经网络结构。符号学派假设知识是先验地存储于黑箱之中的,因此,它很擅长解决利用现有的知识做比较复杂的推理、规划、逻辑运算和判断等问题。
联结学派则显然要把智能系统的黑箱打开,从结构的角度来模拟智能系统的运作,而不单单重现功能。这样,联结学派看待智能会比符号学派更加底层。这样做的好处是可以很好地解决机器学习的问题,并自动获取知识;但是弱点是对于知识的表述是隐含而晦涩的,因为所有学习到的知识都变成了联结权重的数值。我们若要读出神经网络中存储的知识,就必须要让这个网络运作起来,而无法直接从模型中读出。联结学派擅长解决模式识别、聚类、联想等非结构化的问题,但却很难解决高层次的智能问题(如机器定理证明)。
行为学派则研究更低级的智能行为,它更擅长模拟身体的运作机制,而不是大脑。同时,行为学派非常强调进化的作用,他们认为,人类的智慧也理应是从漫长的进化过程中逐渐演变而来的。行为学派擅长解决适应性、学习、快速行为反应等问题,也可以解决一定的识别、聚类、联想等问题,但在高级智能行为(如问题求解、逻辑演算)上则相形见绌。
人工智能的三个学派、三个途径,在学术观点与科学方法上,有严重的分歧和差异,联结主义学派反对符号主义学派关于物理符号系统的假设,认为人脑神经网络的联结机制与计算机的符号运算模式有原则性差别;行为主义学派批评符号主义学派、联结主义学派对真实世界做了虚假的、过分简化的抽象,认为存在“不需要知识”“不需要推理”的智能。
联结学派和行为学派似乎更加接近,因为他们都相信智能是自下而上涌现出来的,而非自上而下的设计。但麻烦在于,怎么涌现?涌现的机制是什么?这些深层次问题无法在两大学派内部解决,而必须求助于复杂系统科学。
5.未来达到强人工智能,需要三大学派互相融合
三大学派、三条途径各有所长,各有所短,应相互结合、取长补短,综合集成。
人工智能三大学派在不同阶段独立发展,分别交替占据主流。每一个学派都有自己的优势。以联结主义为例,联结主义对于感知非常有效,如用作视觉语音识别和分类等效果显著,但做推理效果则不尽人意,符号主义则特别适合做推理。
三大学派是相对独立的,现在人工智能的发展有融合的趋势。无论是国内还是国外人工智能的研究发展,都需要把这三个学派统一起来,而要做到需要对这个领域非常了解,才能把它融合起来。因为未来要达到强人工智能,每个方面的感知、认知、推理、技艺的功能都需要。