1.4 人工智能的研究领域
在大多数学科中存在着几个不同的研究领域,每个领域都有其特有的感兴趣的研究课题、研究技术和术语。在人工智能中,这样的领域包括自然语言处理、自动定理证明、自动程序设计、智能检索、智能调度、机器学习、机器人学、专家系统、智能控制、模式识别、视觉系统、神经网络、Agent、计算智能、问题求解、人工生命、人工智能方法和程序设计语言等。在过去50多年中,已经建立了一些具有人工智能的计算机系统。例如,能够求解微分方程的,下棋的,设计分析集成电路的,合成人类自然语言的,检索情报的,诊断疾病的以及控制太空飞行器、地面移动机器人和水下机器人的具有不同程度人工智能的计算机系统。下面简要介绍人工智能的一些研究领域。
1.问题求解与博弈
人工智能的第一个大成就是发展了能够求解难题的下棋(如国际象棋)程序。在下棋程序中应用的某些技术,如向前看几步,并把困难的问题分成一些比较容易的子问题,发展成为搜索和问题消解(归约)这样的人工智能基本技术。今天的计算机程序能够下锦标赛水平的各种方盘棋、十五子棋、中国象棋和国际象棋,并取得前面提到的计算机棋手战胜国际和国家象棋冠军的成果。还有一种问题求解程序把各种数学公式符号汇编在一起,其性能达到很高的水平,并正在为许多科学家和工程师所应用。有些程序甚至还能够用经验来改善其性能。
如前所述,这个领域中未解决的问题包括人类棋手具有的但尚不能明确表达的能力,如国际象棋大师洞察棋局的能力。另一个未解决的问题涉及问题的原概念,在人工智能中叫做问题表示的选择。人们常常能够找到某种思考问题的方法从而使求解容易而解决该问题。到目前为止,人工智能程序已经知道如何考虑它们要解决的问题,即搜索解答空间,寻找较优的解答。
2.逻辑推理与定理证明
早期的逻辑演绎研究工作与问题的求解相当密切。已经开发出的程序能够借助于对事实数据库的操作来“证明”断定;其中每个事实由分立的数据结构表示,就像数理逻辑中由分立公式表示一样。与人工智能的其他技术的不同之处是,这些方法能够完整和一致地加以表示。也就是说,只要本原事实是正确的,那么程序就能够证明这些从事实得出的定理,而且也仅仅是证明这些定理。
逻辑推理是人工智能研究中最持久的子领域之一。特别重要的是要找到一些方法,只把注意力集中在一个大型数据库中的有关事实上,留意可信的证明,并在出现新信息时适时修正这些证明。
对数学中臆测的定理寻找一个证明或反证,确实称得上是一项智能任务。为此不仅需要有根据假设进行演绎的能力,而且需要某些直觉技巧。1976年7月,美国的阿佩尔(K.Appel)等人合作解决了长达124年之久的难题——四色定理。他们用三台大型计算机,花去1200小时CPU时间,并对中间结果进行人为反复修改500多处。四色定理的成功证明曾轰动计算机界。我国人工智能大师吴文俊院士提出并实现了几何定理机械证明的方法,被国际上称为“吴氏方法”,是定理证明的又一标志性成果。
3.计算智能
计算智能(Computational Intelligence)涉及神经计算、模糊计算、进化计算、粒群计算、自然计算、免疫计算和人工生命等研究领域。
进化计算(Evolutionary Computation)是指一类以达尔文进化论为依据来设计、控制和优化人工系统的技术和方法的总称,它包括遗传算法(Genetic Algorithm)、进化策略(Evolu-tionary Strategy)和进化规划(Evolutionary Programming)。自然选择的原则是适者生存,即物竞天择,优胜劣汰。
自然进化的这些特征早在20世纪60年代就引起了美国霍兰(Holland)的极大兴趣。受达尔文进化论思想的影响,他逐渐认识到在机器学习中,为获得一个好的学习算法,仅靠单个策略的建立和改进是不够的,还要依赖于一个包含许多候选策略的群体的繁殖。他还认识到,生物的自然遗传现象与人工自适应系统行为的相似性,因此他提出在研究和设计人工系统时可以模仿生物自然遗传的基本方法。20世纪70年代初,霍兰提出了“模式理论”,并于1975年出版了《自然系统与人工系统的自适应》专著,系统地阐述了遗传算法的基本原理,奠定了遗传算法研究的理论基础。
遗传算法、进化规划、进化策略具有共同的理论基础,即生物进化论,因此,把这三种方法统称为进化计算,而把相应的算法称为进化算法。
人工生命是1987年提出的,旨在用计算机和精密机械等人工媒介生成或构造出能够表现自然生命系统行为特征的仿真系统或模型系统。自然生命系统行为具有自织织、自复制、自修复等特征。
人工生命的理论和方法有别于传统人工智能和神经网络的理论和方法。人工生命把生命现象所体现的自适应机理通过计算机进行仿真,对相关非线性对象进行更真实的动态描述和动态特征研究。
人工生命学科的研究内容包括生命现象的仿生系统、人工建模与仿真、进化动力学、人工生命的计算理论、进化与学习综合系统及人工生命的应用等。
4.分布式人工智能与Agent
分布式人工智能(Distributed AI,DAI)是分布式计算与人工智能结合的结果。DAI系统以鲁棒性作为控制系统质量的标准,并具有互操作性,即不同的异构系统在快速变化的环境中具有交换信息和协同工作的能力。
分布式人工智能的研究目标是要创建一种能够描述自然系统和社会系统的精确概念模型。DAI中的智能并非独立存在的概念,它只能在团体协作中实现,因而其主要研究问题是各Agent间的合作与对话,包括分布式问题求解和多Agent系统(Multi-Agent System,MAS)两领域。MAS更能体现人类的社会智能,具有更大的灵活性和适应性,更适合开放和动态的世界环境,因而备受重视,已成为人工智能乃至计算机科学和控制科学与工程的研究热点。
5.自动程序设计
自动程序设计能够以各种不同的目的描述来编写计算机程序。对自动程序设计的研究不仅可以促进半自动软件开发系统的发展,而且也使通过修正自身数码进行学习的人工智能系统得到发展。程序理论方面的有关研究工作对人工智能的所有研究工作都是很重要的。
自动编制一份程序来获得某种指定结果的任务与证明一份给定程序将获得某种指定结果的任务是紧密相关的,后者叫做程序验证。
自动程序设计研究的重大贡献之一是作为问题求解策略的调整概念。已经发现,对程序设计或机器人控制问题,先产生一个不费事的有错误的解,然后再修改它,这种做法要比坚持要求第一个解答就完全没有缺陷的做法有效得多。
6.专家系统
一般地,专家系统是一个智能计算机程序系统,其内部具有大量专家水平的某个领域知识与经验,能够利用人类专家的知识和解决问题的方法来解决该领域的问题。
发展专家系统的关键是表达和运用专家知识,即来自人类专家的并已被证明对解决有关领域内的典型问题是有用的事实和过程。专家系统和传统的计算机程序的本质区别在于专家系统所要解决的问题一般没有算法解,并且经常要在不完全、不精确或不确定的信息基础上得出结论。
随着人工智能整体水平的提高,专家系统也获得了发展。正在开发的新一代专家系统有分布式专家系统和协同式专家系统等。在新一代专家系统中,不但采用基于规则的方法,而且采用基于框架的技术和基于模型的原理。
7.机器学习
学习是人类智能的主要标志和获得知识的基本手段。机器学习(自动获取新的事实及新的推理算法)是使计算机具有智能的根本途径。此外,机器学习还有助于发现人类学习的机理并揭示人脑的奥秘。
传统的机器学习倾向于使用符号表示而不是数值表示,使用启发式方法而不是算法。传统机器学习的另一倾向是使用归纳(Induction)而不是演绎(Deduction)。前一倾向使它有别于人工智能的模式识别等分支;后一倾向使它有别于定理证明等分支。
按系统对导师的依赖程度可将学习方法分类为:机械式学习、讲授式学习、类比学习、归纳学习、观察发现式学习等。
近十多年来又发展了下列各种学习方法:基于解释的学习、基于事例的学习、基于概念的学习、基于神经网络的学习、遗传学习、增强学习以及数据挖掘和知识发现等。
数据挖掘和知识发现是20世纪90年代初期新崛起的一个活跃的研究领域。在数据库基础上实现的知识发现系统,通过综合运用统计学、粗糙集、模糊数学、机器学习和专家系统等多种学习手段和方法,从大量的数据中提炼出抽象的知识,从而揭示出蕴涵在这些数据背后的客观世界的内在联系和本质规律,实现知识的自动获取。
大规模数据库和互联网的迅速发展,使人们对数据库的应用提出新的要求。数据库中包含的大量知识无法得到充分的发掘与利用,会造成信息的浪费,并产生大量的数据垃圾。另一方面,知识获取仍是专家系统研究的瓶颈问题。从领域专家获取知识是非常复杂的个人到个人之间的交互过程,具有很强的个性和随机性,没有统一的办法。因此,人们开始考虑以数据库作为新的知识源。数据挖掘和知识发现能自动处理数据库中大量的原始数据,抽取出具有必然性的、富有意义的模式,成为有助于人们实现其目标的知识,找出人们对所需问题的解答。
8.自然语言理解
语言处理也是人工智能的早期研究领域之一,并引起进一步的重视。已经编写出能够从内部数据库回答问题的程序,这些程序通过阅读文本材料和建立内部数据库,能够把句子从一种语言翻译为另一种语言,执行给出的指令和获取知识等。有些程序甚至能够在一定程度上翻译从话筒输入的口头指令。
当人们用语言互通信息时,他们几乎不费力地进行极其复杂却又只需要一点点理解的过程。语言已经发展成为智能动物之间的一种通信媒介,它在某些环境条件下把一点“思维结构”从一个头脑传输到另一个头脑,而每个头脑都拥有庞大的、高度相似的周围思维结构作为公共的文本。这些相似的、前后有关的思维结构中的一部分允许每个参与者知道对方也拥有这种共同结构,并能够在通信“动作”中用它来执行某些处理。语言的生成和理解是一个极为复杂的编码和解码问题。
9.机器人学
人工智能研究中日益受到重视的另一个分支是机器人学。一些并不复杂的动作控制问题,如移动式机器人的机械动作控制问题,表面上看并不需要很多智能。然而人类几乎下意识就能完成的这些任务,要是由机器人来实现就要求机器人具备在求解需要较多智能的问题时所用到的能力。
机器人和机器人学的研究促进了许多人工智能思想的发展。它所导致的一些技术可用来模拟世界的状态,用来描述从一种世界状态转变为另一种世界状态的过程。
智能机器人的研究和应用体现出广泛的学科交叉,涉及众多的课题,如机器人体系结构、机构、控制、智能、视觉、触觉、力觉、听觉、机器人装配、恶劣环境下的机器人及机器人语言等。机器人已在工业、农业、商业、旅游业、空中和海洋及国防等领域获得越来越普遍的应用。
10.模式识别
随着计算机硬件的迅速发展,计算机应用领域的不断开拓,急切要求计算机能更有效地感知诸如声音、文字、图像、温度、振动等人类赖以发展自身、改造环境所运用的信息资料。着眼于拓宽计算机的应用领域,提高其感知外部信息能力的学科——模式识别便得到迅速发展。
人工智能所研究的模式识别是指用计算机代替人类或帮助人类感知模式,是对人类感知外界功能的模拟,研究的是计算机模式识别系统,也就是使一个计算机系统具有模拟人类通过感官接受外界信息、识别和理解周围环境的感知能力。
实验表明,人类接受外界信息的80%以上来自视觉,10%左右来自听觉。所以,早期的模式识别研究工作集中在对视觉图像和语音的识别上。
模式识别是一个不断发展的新学科,它的理论基础和研究范围也在不断发展。随着生物医学对人类大脑的初步认识,模拟人脑构造的计算机实验即人工神经网络方法已经成功地用于手写字符的识别、汽车牌照的识别、指纹识别、语音识别等方面。
11.机器视觉
机器视觉或计算机视觉已从模式识别的一个研究领域发展为一门独立的学科。在视觉方面,已经给计算机系统装上电视输入装置以便能够“看见”周围的东西。在人工智能中研究的感知过程通常包含一组操作。
整个感知问题的要点是形成一个精练的表示以取代难以处理的、极其庞大的未经加工的输入数据。最终表示的性质和质量取决于感知系统的目标。不同系统有不同的目标,但所有系统都必须把来自输入的、多得惊人的感知数据简化为一种易于处理的和有意义的描述。
计算机视觉通常可分为低层视觉与高层视觉两类。低层视觉主要执行预处理功能,如边缘检测、动目标检测、纹理分析、通过阴影获得形状、立体造型、曲面色彩等。高层视觉则主要是理解所观察的形象。
机器视觉的前沿研究领域包括实时并行处理、主动式定性视觉、动态和时变视觉、三维景物的建模与识别、实时图像压缩传输和复原、多光谱和彩色图像的处理与解释等。
12.神经网络
研究结果已经证明,用神经网络处理直觉和形象思维信息具有比传统处理方式好得多的效果。神经网络的发展有着非常广阔的科学背景,是众多学科研究的综合成果。神经生理学家、心理学家与计算机科学家的共同研究得出的结论是:人脑是一个功能特别强大、结构异常复杂的信息处理系统,其基础是神经元及其互联关系。因此,对人脑神经元和人工神经网络的研究,可能创造出新一代人工智能机——神经计算机。
对神经网络的研究始于20世纪40年代初期,经历了一条十分曲折的道路,几起几落,80年代初以来,对神经网络的研究再次出现高潮。
对神经网络模型、算法、理论分析和硬件实现的大量研究,为神经计算机走向应用提供了物质基础。人们期望神经计算机将重建人脑的形象,极大地提高信息处理能力,在更多方面取代传统的计算机。
13.智能控制
人工智能的发展促进自动控制向智能控制发展。智能控制是一类无需(或需要尽可能少的)人的干预就能够独立地驱动智能机器实现其目标的自动控制。或者说,智能控制是驱动智能机器自主地实现其目标的过程。许多复杂的系统,难以建立有效的数学模型和用常规控制理论进行定量计算与分析,而必须采用定量数学解析法与基于知识的定性方法的混合控制方式。随着人工智能和计算机技术的发展,已可能把自动控制和人工智能以及系统科学的某些分支结合起来,建立一种适用于复杂系统的控制理论和技术。智能控制正是在这种条件下产生的。它是自动控制的最新发展阶段,也是用计算机模拟人类智能的一个重要研究领域。
智能控制是同时具有以知识表示的非数学广义世界模型和数学公式模型表示的混合控制过程,也往往是含有复杂性、不完全性、模糊性或不确定性以及不存在已知算法的非数学过程,并以知识进行推理,以启发来引导求解过程。智能控制的核心在高层控制,即组织级控制。其任务在于对实际环境或过程进行组织,即决策和规划,以实现广义问题求解。
14.智能调度与指挥
确定最佳调度或组合的问题是人们感兴趣的又一类问题。一个古典的问题就是推销员旅行问题(TSP)。许多问题具有这类相同的特性。
在这些问题中有几个(包括推销员旅行问题)是属于理论计算机科学家称为NP完全性一类的问题。他们根据理论上的最佳方法计算出所耗时间(或所走步数)的最坏情况来排列不同问题的难度。该时间或步数是随着问题大小的某种量度增长的。
人工智能学家们曾经研究过若干组合问题的求解方法。有关问题域的知识再次成为比较有效的求解方法的关键。智能组合调度与指挥方法已被应用于汽车运输调度、列车的编组与指挥、空中交通管制以及军事指挥等系统。它已引起有关部门的重视。
15.智能检索
随着科学技术的迅速发展,出现了“知识爆炸”的情况。对国内外种类繁多和数量巨大的科技文献之检索远非人力和传统检索系统所能胜任。研究智能检索系统已成为科技持续快速发展的重要保证。
数据库系统是储存某学科大量事实的计算机软件系统,它们可以回答用户提出的有关该学科的各种问题。数据库系统的设计也是计算机科学的一个活跃的分支。为了有效地表示、存储和检索大量事实,已经发展了许多技术。
智能信息检索系统的设计者们将面临以下几个问题。首先,建立一个能够理解以自然语言陈述的询问系统本身就存在不少问题。其次,即使能够通过规定某些机器能够理解的形式化询问语句来回避语言理解问题,仍然存在一个如何根据存储的事实演绎出答案的问题。最后,理解询问和演绎答案所需要的知识都可能超出该学科领域数据库所表示的知识。