1.2.7 当今智能世界
21世纪以来,随着大数据、云计算、物联网技术的发展,人工智能技术不再局限于算法的研究,而是已经融合到复杂系统之中,进行更加广泛的商业化应用。同时,算法的研究也更加智能和深入,产生了具有自学习能力的深度学习算法。因此,本文将对复杂系统的前世今生做简要的介绍,并对人工智能热点之一的深度学习中主要的算法和成果进行总结。
1.复杂系统
亚里士多德曾经说过:“整体大于部分之和”。世界本身就是纷繁复杂的,从古至今,人们一直试图理解复杂系统,从而解开世界的奥秘。科学探索就是发现隐藏在复杂、混乱状况后面的规则与模式,把纷繁复杂的“复杂事物”变成相对简单、容易理解的“简单事物”。著名物理学家霍金说过:“我认为下一个世纪会是复杂性世纪。”他预言,21世纪科学家们将花费大量的时间和精力去研究复杂性理论,从而解决现实生活中的复杂系统问题。
20世纪复杂性研究思潮主要包括整体论阶段、信息论—控制论与系统论阶段和全新的阶段。
1)整体论阶段:20世纪30—40年代
整体论强调,复杂事物是由多个部分组成的整体,而整体大于部分之和。或者说,整体具有组成部分所没有的东西,把各组成部分机械堆积在一起并不是整体,不能产生该事物,也不能解释该事物的性质和行为。
整体论与还原论不同,还原论强调事物的整体行为,可以归结为组成部分(元素)行为的综合,而“强”整体论则认为,在系统的组成元素里没有系统的整体新性质,“弱”整体论认为复杂系统的整体特性是在它各部分的相互作用中产生的。
2)信息论—控制论与系统阶段:20世纪50—60年代
维纳以反馈控制、信息论、计算机及神经科学等多学科融合的方法,综合研究各类系统(人、动物与机器)的控制,信息交换和反馈调节,看重研究过程中的数学关系,并由此提出了控制论,这个复杂性研究带来了全新的视野。香农的信息论,用无序性(熵)的减少来解释系统组织化的复杂性。控制论,指明系统是怎样感知外部世界信号、识别目标、探测现状与目标之间的差异,以减少和消除差异的。
信息论—控制论—计算机,从机理的角度对复杂系统的性质提供了还原论的解释,研究了复杂系统向目标演变的内部成员的行为。系统论、人工智能和机器人研究获得了新的动力。
系统论的创立者是美籍奥地利生物学家贝塔朗菲(Ludwig von Bertalanffy, 1901—1972)。1945年,他在《关于一般系统论》书中指出,系统论是关于综合系统及其子系统的一般模式、原则和规律的理论体系,它强调整体性、统筹全局的最优性、整体与部分统一的综合性。
1950年,冯·诺依曼提出了具有自我复制能力的细胞自动机,它是研究具有繁衍(复制)能力的复杂系统行为的最初理论框架。
3)全新的阶段:复杂巨系统
20世纪70年代以来,科学迅猛发展,人们更执着于研究事物的复杂性。伴随着人工免疫系统(1986年)、人工生命(1987年)的研究,到1996年,西蒙把层级理论作为复杂系统理论的基础,复杂性与复杂系统的研究进入了一个新的阶段。
1990年,我国著名科学家、工程控制论开创者钱学森大力倡导“开放的复杂巨系统”研究;1992年提出了“综合集成研讨厅”的理论框架,采用“从定性到定量的综合集成技术”,把人的思维和思维成果、人的知识和智慧以及各种信息集合起来,构成“大成智慧工程”。复杂巨系统包括人脑系统、人体系统、我们生存的环境与生态系统、社会系统以及国际互联网系统(见图1-34)[24]。
钱学森院士高瞻远瞩,早在1990年就提出把互联网系统纳入复杂系统研究。互联网系统是具有网络智能的、世界最复杂系统,它能把数以千亿的用户和复杂的社会系统结合在一起。
1994年,戴汝为院士的研究团队积极投入到复杂巨系统研究。戴汝为院士认为,复杂巨系统具有以下主要特性。
开放性:系统与外部以及子系统之间,都存在着能量、信息和物质的交换。复杂性不仅表现在系统本身,还突出体现在与动态环境的交互作用及不确定性。
图1-34 复杂巨系统
多层次性:整个系统的层次很多,子系统或组件的组成模式也多种多样。
涌现性:组成系统的组件通常是分布式或时空交叠的,其功能各不相同。相互作用方式以及随时间的变化的不确定性,导致在整体上时而涌现出独特的、新的性质和作用模式。
巨大性:系统的子系统或基本单元的数目极其巨大,可能成千上万甚至数以亿计。
人-机结合:巨系统中,人表现为特殊的高级智能组件,能处理目前机器智能尚不能完成的功能。人机结合使得有可能把某个领域专家,甚至多个学科领域专家的知识、经验结合起来,融入巨系统。
2.深度学习
21世纪以来,深度学习技术更加受到人工智能研究人员的青睐。深度学习是机器学习的一种,它的核心与神经网络相关。如同机器学习一样,深度学习主要依赖于大量数据和数据标注。它是能够使计算机系统从经验和数据中得到提高的技术,具有强大的能力和灵活性,从而将大千世界表示为嵌套的层次概念体系。
图1-35 杰弗里·辛顿
在神经网络复兴和机器学习发展的基础上,深度学习技术[34]发展得到了极大的推进。20世纪80年代到21世纪初,计算机硬件和分布式技术快速发展,杰弗里·辛顿(见图1-35)在2006年提出了深度学习概念,开发了深度信念网络(deep belief net,DBN)算法,并得以广泛地应用于并行处理器上。
该算法具有的快速学习训练方法取得了惊人的成果,打破了长期以来深度网络难以训练的僵局。从此,媒体开始追踪报道深度学习领域取得的各种成果。不过,深度信念网络仍存在一定的局限性,它需要在一个固定的维度进行。然而,不论是语音还是图像,并不是在一个固定的维度出现。
在处理图像方面,卷积神经网络技术起到了极大的作用。1984年,日本学者福岛邦彦创立了卷积网络理论,并构建了原型神经感知机。1998年,杨立昆成功建立了深度学习常用模型之一的卷积神经网络(convoluted neural network, CNN)。21世纪以来,研究者们将该方法应用于图像处理。2012年,NIPS会议上辛顿研究组发表了论文《深度卷积神经网络下ImageNet分类》(ImageNet Classification with Deep Convolutional Neural Networks),将图像中对象分类的错误率降低到了18%,并且在处理2000亿张图片的能力上远超于传统的计算机视觉技术。该论文的发布堪称深度学习神经网络领域的里程碑事件。此后,该技术受到了各大公司的关注。2013年,辛顿加入了谷歌公司,杨立昆也去了Facebook公司。
2011年开始,深度学习成为了科研机构、科技公司、工业界高度关注和发展的方向。图像识别、语音识别、机器翻译、情感分析、人机对抗等领域全面发展,其中最让世人关注的便是2017年深度学习网络程序AlphaGo毫无悬念地击败了围棋世界冠军柯洁。谷歌的DeepMind公司研发的AlphaGo采用了改进后的蒙特卡罗算法,并通过自我对弈增强自身学习效果(即“强化学习”,详见1.3.6节),它对15万场比赛进行学习。AlphaGo具有两个不同神经网络的“大脑”,它们相互合作进行下棋,它们都采用了多层神经网络,去过滤处理围棋棋盘的定位,通过13个完全连接的神经网络层进行分类和逻辑推理,最终产生对棋盘的局面判断。AlphaGo的成功象征着计算机技术已进入了人工智能的新信息技术时代,计算机的智能正在接近人类智能。此后,谷歌DeepMind首席执行官戴密斯·哈萨比斯宣布“要将阿尔法围棋(AlphaGo)和医疗、机器人等进行结合”,而不仅作为一个游戏工具,它所具备的自主学习的能力,能够将它所需的数据进行学习和移植。
我们可以看到人工智能技术的演进经历了漫长的发展时间,多次起起伏伏,最终仍能够一步步地呈螺旋状上升发展(见图1-36),如今人工智能技术的发展正处于稳定爬升期。人工智能技术在各领域的应用成果也层出不穷,下节将围绕人工智能技术在当今最新应用的几个方面进行介绍。
图1-36 人工智能技术螺旋式上升发展的演进事件