2.3 智能形成的三大来源
机器如何获得智能是长期以来众多人工智能研究者持续探究和思考的问题,也将是人工智能未来长期的研究课题。从人工智能几十年的发展历程来看,不同的技术学派使机器拥有智能的理念各不相同。
当前新一代人工智能取得的成功,主要归功于2006年提出的深度学习神经网络、2009年高性能并行计算芯片应用于智能计算,以及2010年后大数据计算体系和数据基础进一步成熟。如果说从神经网络到深度学习只是同一技术路线上的量变过程,这种能够支持海量数据建模的深度算法与强大算力和海量数据这三力汇聚所激发的化学反应才是质变过程,新一代人工智能得以蝶变为足以引发经济、社会深度变革的新的“能”。
当前人工智能的智能生成机理已不同于之前阶段,大数据、高算力和大模型等三种不同领域的技术在新世纪初集中成熟、历史性交汇,实现了智能涌现的突破,有人将它称为智能算法中的“暴力美学”,在这一路线上已经催生出了AlphaGo、GPT-3等具备令人惊叹的智能水平的人工智能系统。现阶段机器智能的实现逻辑大致包括以下三个方面。
1.数据蕴含的智能
预测、决策、优化等大量智能都需要基于知识,而知识正在从大数据获得。
在20世纪70年代之前的人工智能研究中,人们主要采用符号演算来衍生智能。科学家们致力于以推理驱动的模式实现机器智能,解决应用题解答、几何题证明等问题。此后,以专家系统为代表的基于规则驱动的智能范式渐渐占领了人工智能主流地位,但是通过人类知识迁移的方式实现机器智能,还实现不了机器自主的智能增长和涌现。而基于数据驱动的机器学习方法则不再依赖人去梳理逻辑或梳理一些知识,嵌入机器使之具备智能,而是试图让机器自己基于原始数据去抽取知识和形成智能,数据蕴含的丰富信息成为智能生成的重要来源。
随着互联网的快速发展,网络大数据开始快速积累。每个用户通过网络进行的购买行为积累了大量信息:页面停留时间、用户是否查看评论、每个搜索的关键词、浏览的商品,等等。这些用户数据能够真实还原其消费行为、习惯、偏好等信息,而基于这些信息开发的智能化服务对于促成商业服务具有重要价值。
数据也是各类认知系统的智能来源。IBM为了“喂饱”沃森(Watson),曾收购多家医疗健康领域的公司,比如可以查看5000万份美国患者病例的分析公司Explorys,拥有超过300亿份医学图像的医疗影像与临床系统提供商Merge Healthcare。大量账单记录、病历、X射线和MRI(磁共振成像)图像等医疗数据的输入,为沃森系统提供了持续的智能提升来源。
人类的经验和知识正以大数据为载体向智能系统转移。比如说医疗影像识别,现在是智能医疗领域最活跃、相对成熟度较高的人工智能技术落地场景。可疑病灶的识别、定位与标定,需要依靠大量专业医生的经验和知识,高水平的医生通过数据标注将人的知识嵌入医疗影像标注数据中,用深度学习方法实现知识的模型化,建立起医疗诊断系统,可以大规模地复用和并行化使用,就能够为很多边远地区不具备高水平医疗条件的医院提升诊断能力。其中,标注数据集的质量和水平,很大程度上决定了医疗影像诊断系统的智能水平和产品竞争力。
为了获取汽车行驶过程的环境、路况等经验数据,Waymo无人车已经跑了超过2000万英里,这也是目前自动驾驶决策模型增长知识和衍生智能的重要来源。
2.计算力蕴含的智能
天下武功,唯快不破。在程序设计中,大家经常会有这样的体会:即使用一个看起来挺笨的基础算法操作,结合反复的循环迭代,当计算足够快之后机器仍然可以表现出非常高的智能反应。随着计算机“暴力计算”能力的不断提高,就可以使用相对“简单”的计算统计方法解决相对“复杂”的问题(3)。遍历搜索等计算型智能就曾推动棋类博弈程序发展。1997年,重达1.4吨的IBM超级计算机“深蓝”(Deep Blue)在国际象棋比赛中,以6局比赛2胜1负3平的成绩战胜了世界冠军卡斯帕罗夫,主要还是以暴力穷举为基础。在强大计算力支撑下,人工智能研发者可以利用低于人类的智能算法,制造超越人类能力的智能机器。
计算能力不足曾是人工智能发展的制约因素之一,很多智能算法因受制于计算速度而难以应用于实践。缺少计算力这一关键要素,数字化时代终究不能成为智能化时代。
20世纪80年代,一台微型计算机的内存尚无法支撑读入一张高清图像,一直到20世纪90年代中期,人工智能学者还不具备研究机器视觉问题的足够硬件条件,图像识别研究也只能处在方法阶段,更无法形成机器视觉的实际应用。更不用说采用现在深度学习的计算模式,支撑对海量图片进行深度挖掘和知识抽取。
集成电路技术在持续推动着算力增长。1965年,英特尔(Intel)公司联合创始人戈登·摩尔提出的摩尔定律成为最成功的技术预测之一,集成电路芯片上所集成的晶体管数量,按每隔18个月翻一番的速度飞速增长。最早的计算机“ENIAC”能够进行每秒5000次加法或400次乘法,而现在苹果iPhone8手机的A11处理器在1平方厘米集成了43亿晶体管,已经达到每秒1万亿次的计算速度。
卡斯帕罗夫1995年还在批评计算机下棋缺乏“悟性”,但1996年他就开始认为“深蓝”貌似有悟性了,而实际上这期间“深蓝”只是在计算能力上提高了一倍而已,并没有方法上的根本改变,一些人类感觉到的高阶智能,只是因为超出了人脑的解释能力。
近年来大规模并行计算技术的应用使得人工智能再次向前迈进了一大步。云计算技术为深度学习的高效计算提供了平台;早期用于满足可视游戏中高密度视觉处理需求的图形处理单元(GPU)开始用于深度学习的矩阵运算,使得深度神经网络节点数量和运行效率大幅提高。近年来快速发展起来的NPU、TPU,以及FPGA人工智能专用芯片都在训练端、模型端实现了并行计算加速,成长为新阶段人工智能产业的新生力量。
得益于算力的飞速增强,很多原来受计算复杂度限制而不可计算的问题,开始变得可实现了。计算力的不断提升,正在为人工智能进一步加速发展提供强大推动力。甚至有专家表示,单位算力成本正在以指数级变得便宜,未来任何不能有效利用算力的新算法都将前途有限。
3.算法蕴含的智能
计算机发明以来,早期的计算效能进步主要来自于硬件的贡献。尤其是随着20世纪60年代集成电路技术加速发展以来,单位尺寸芯片上的晶体管数量按摩尔定律呈指数级增长,推动现代计算机沿着体积更小、速度更快的方向快速进化。然而目前摩尔定律也正在面临失效的挑战,尤其是当2019年以来最先进的制程工艺开始走向7纳米甚至5纳米之后,晶体管尺寸会越来越受制于硅原子直径而难以进一步压缩。
实际上,在计算机发展的几十年里,算法对于计算机整体计算效能提升的贡献已经大大超过处理器。柏林康拉德信息技术中心格罗斯彻教授发现,在1988年,通过当时的计算机和线性程序实现规划模型解决标准化生产要花82年。而在15年之后的2003年,同样的问题在大概一分钟之内就能解决,效率几乎提升了4300万倍。在这个过程中,效率提高1000倍主要归功于处理器的速度提升,而43000倍的贡献则来源于算法的进步。
为此,我们可探讨一下智能算法与可计算问题。
算法的计算复杂度是指随着问题规模的增加,求解算法的工作量增长的速度。由此可将待计算问题分为P问题、NP问题、非NP问题等。P问题指的是能够在规模n的多项式函数时间里得到解决的问题,这些都是计算机容易解决的问题;NP问题指的是能够在多项式的时间里验证一个解是否正确的问题,NP问题中有相当一部分也是能够在多项式的时间里求解的,也能通过计算机进行计算,NP问题包含了P问题。而非NP问题,如NP-hard问题,就是不能找到一个多项式复杂度的算法验证一个解是否正确,更不能在多项式的时间里求得问题的解。
目前看NlogN大致是计算机可计算的边界。也就是说,当前算力条件下,对于一个问题只有能够找到计算复杂度为NlogN类型算法时,这类问题可以理解为是计算机可计算的,包括P问题和部分NP问题。以现有硬件计算能力计算机仍难以玩儿转大量的非NP问题,而这类问题却是人们现实生产和生活中大量面临的问题。
计算能力限制了可探索问题的范围,这就导致计算机能解决的问题一直存在局限,由此分为易解的问题和难解的问题。智能算法的一个重要价值在于经常能够将难解问题的计算复杂度降低,变成计算机能够完成的计算任务。
智能算法通过实现知识的抽取和建模,使人工智能具备了更强的学习和泛化能力,能够完成分类、预测等决策型任务,替代了传统程序中各种大量IF嵌套的遍历判断过程,大大降低了计算复杂度。通过实现计算复杂度可接受的智能算法,就能够将难解问题转变为易解问题。
围棋是一个回合制的棋类项目,对于这样一个问题最简单最直接的方法就是完全的树搜索,对整个棋盘穷尽一个搜索。以围棋一盘棋平均要下150步计,每一步有250种可选的下法,列举所有情况的方式,需要计算250150种情况,大致是10360。对这样一个穷尽式搜索导致的搜索爆炸,所蕴含的可能性的数量比整个宇宙的原子数量还多,目前集全世界所有算力都没有办法完成。
因此,尽管人工智能在20年前就已经通过遍历搜索的超强算力轰炸打败人类国际象棋冠军,但围棋却一向被认为是一个典型的计算机难解问题。然而人类的职业棋手,却可以凭借大局观、直觉、棋感等能力把握局势、判断落子。因此,围棋始终被认为是人类大脑的专利,甚至有人称其“是地球人的最后一个堡垒”。
基于人类积累的棋谱和经验,在人工智能算法中巧妙设计启发式规则、概率模型,就能够对搜索树进行剪枝,使树的宽度、高(深)度得到大幅度压缩。尤其是深度学习可以充分利用历史数据和统计规律以及概率分布形成的估值网络,在博弈过程的每一步针对给定当前的棋盘、棋面评估不同走法可能的胜算概率,相当于利用统计手段排除了明显无效低效的招法,精简了运算量。
人在处理这些NP问题时并没有采用遍历搜索,人脑也不具备足够的计算力,而AlphaGo解决问题的方式与人脑的棋感、直觉等非常相似。这样,智能算法就把一个现有算力不可计算的“组合爆炸”问题,通过算力可接受的智能算法,在可接受时间内给出近似最优解。比如商品推荐系统给出的个性化推荐,用户可能喜欢多一点,也可能喜欢少一点,并不存在严格的对错判定。
可见,人类日常进行思维决策活动,其中很大一部分都涉及不确定性或概率推断。现实世界还有大量不确定性、动态变化问题,都是无法建立确定性模型的,暴力计算式遍历也是不可实现的。解决这类复杂问题,就需要放弃严格逻辑而改用概率逻辑,人工智能技术在这类领域具有非常广阔的空间。
由于“维度灾难”导致的问题复杂度指数级增长,在军事、社会、经济、环境、气象等领域仍存在大量NP问题尚未解决,气候变化、可持续性发展、疾病和医疗问题等社会面临的严峻挑战,人类目前进展都不够快。还有各类离散组合优化和涉及大量要素的博弈决策问题,很多都是不可遍历的问题,比如港口、机场航班优化调试、EDA芯片设计软件中布线最优化、图像内容理解中的图匹配、物流运输中大量存在的路径优化问题等大都是NP问题。当这些问题规模大到一定程度,如果没有智能算法,解决起来将会极其复杂,只能找到一个低质量方案,甚至不可解决。
智能算法开拓了机器能够求解问题的新疆域,人们开始发现,有太多问题可能用智能算法得以解决。很多类似创造性、悟性之类的智能感受,可能通过在人类所无法遍历的高维状态空间中求解就能够实现。由于智能机器在高维空间中的超强寻优能力,AlphaGo往往会给出匪夷所思的走法,而这种创新能力也可广泛应用于设计、药物研发、参数优化、工艺配方等现实业务中。比如,利用构建的生物信息知识图谱和高性能计算等技术,可以实现复杂生物信息的深度认知,提升自然生物机理探究能力。在智能交通领域,通过巨量数据进行优化计算和预测分析,以整体最优为目标调控全市车流和规划每辆车的行车路线,可以解决大城市交通优化问题。
不完全信息博弈是典型的巨复杂问题,战略型游戏的状态空间接近无穷维,复杂、快速、多变现代化战争使得指挥与控制面临信息不完备性、环境高度复杂性、边界不确定性、博弈强对抗性、响应超实时性等关键挑战,以指挥决策为核心的智能军事有很大创新空间。“深绿”(DeepGreen, DG)是美国国防高级研究计划局(DARPA)研发的下一代作战指挥和决策支持系统,通过模拟仿真预测预演采用不同作战方案的可能效果,帮助指挥官做出正确的决策,缩短作战响应时间,在瞬息万变的对垒博弈中领先对手一步。
数据、算力、算法自身都具备使机器产生智能的能力,三者的汇聚成为过去十年助推人工智能再度崛起的关键要素。蔡自兴教授认为,数据是人工智能之基,算力是人工智能之力,算法是人工智能之魂(4)。未来,数据、算力、算法也将共同驱动新一轮人工智能产业化发展,为智能化产品和服务带来强大创新力。