从零构建知识图谱:技术、方法与案例
上QQ阅读APP看书,第一时间看更新

1.4 为什么需要知识图谱

上文中我们介绍了知识图谱的基础知识,尤其可以看到知识图谱在搜索方面的重要作用。可能有读者会问,和传统数据库相比,知识图谱有哪些独特优势?要回答这个问题,我们先来聊一聊人工智能目前的发展情况。

随着硬软件的发展,自2012年以来,深度学习在各领域,尤其是感知层面,都掀起了技术革命。

在计算机视觉领域,微软在2015年提出的深度学习算法[9],已经在ImageNet2012[1]分类数据集中将错误率降低到4.94%,首次低于人眼识别的错误率(约5.1%)。在语音合成技术领域,DeepMind公司在2017年6月发布了最新的WaveNet语音合成系统[2],是当时世界上文本到语音环节最好的生成模型。在语音识别领域,通过引入深度学习,大大提到了语音识别的准确性。2017年8月,微软语音识别系统错误率由之前的5.9%进一步降低到5.1%,大幅刷新原先记录,可与专业速记员比肩[8]

而在预训练语言模型方面,OpenAI的语言模型GPT-2[3]在多项任务上均超越了BERT,成为当时新的标杆。2020年,GPT-3[4]横空出世,其参数比GPT-2多100倍。该模型经过了将近0.5万亿个单词的预训练,可以在不进行微调的情况下,在多个NLP基准上达到最优质的性能。

在应用领域,有很多人们所熟知的具有代表性的案例。2011年,IBM Waston在综艺节目《危险边缘》(Jeopardy!)中击败了人类最优秀的选手。在2016年,Google的AlphaGo打败了人类最顶尖的围棋选手李世石。在星际争霸2中,Google的AlphaStar打败了人类的专业选手,而在Dota2比赛与人类的对战中,OpenAI也取得了不俗的战绩。同时,IBM的Project Debater,在与人类的辩论赛中也开始崭露头角。甚至在人类最后的堡垒艺术方面,人工智能也取得了令人瞩目的突破。2018年10月,一幅名为《爱德蒙·贝拉米的肖像》的画作(如图1-11所示)拍出了43.25万美金的高价,远超7000到1万美元的预期。而这幅画作,是用了1.5万张图片,结合生成对抗模型得到的结果。

000

图1-11 人工智能画作《爱德蒙·贝拉米的肖像》

人工智能在感知层面的应用突飞猛进,伴随着深度学习的发展,在各个领域都取得了超越人类的成绩。但迄今为止,这些突破都是基于海量的训练数据,通过强大的计算能力得到的。例如,基于Transformer的GPT-2,拥有15亿参数和40GB网络数据的测试集,在算法发布时的训练价格是每小时2048美元,使用了256块Google TPU v3。GPT3的参数量更是达到了惊人的1750亿,并使用了45GB的数据进行训练。

众所周知,人工智能一共有三个代表性学派,如图1-12所示。其中,符号学派强调模拟人的心智,连接学派强调模拟脑的结构,行为学派强调模拟人的行为。

000

图1-12 人工智能代表性的三个学派

以深度学习为代表的连接学派,主要解决了感知问题,也引领了这一轮人工智能的发展热潮。但是在更高层次的认知领域,例如自然语言理解、推理和联想等方面,还需要符号学派的帮助。知识图谱是符号学派的代表,可以帮助我们构建更有学识的人工智能,从而提升机器人推理、理解、联想等功能。而这一点,仅通过大数据和深度学习是无法做到的。多伦多大学的Geoffrey Hinton教授也提出,人工智能未来的发展方向之一就是深度神经网络与符号人工智能的深入结合。

近两年,市场上出现了大量聊天机器人产品,提供各种各样的功能,比如情感陪伴、个人助理、儿童教育、生活购物等。但从实际的效果来看,绝大部分产品只能完成简单的问答和对话,远未达到媒体上宣传的效果,更不要说进行真正的思考和推理,就好像是绿野仙踪里的铁皮人,缺少了具有“生命感”的那颗心。同时,在对常识的理解上,人工智能系统的理解能力还非常稚嫩,对于人类而言非常容易的问题,如“鸡蛋放到篮子里,是鸡蛋大还是篮子大”以及“啤酒杯掉到地毯上会不会碎”等问题,则很难判断。究其原因,大数据并不等于知识,人类在长期生活实践中所积累的经验和知识,也无法快速传递给人工智能系统。

综上所述,知识图谱是实现通用人工智能(Artificial General Intelligence,AGI)的重要基石。在从感知到认知的跨越过程中,构建大规模高质量知识图谱是一个重要环节。当人工智能可以通过更结构化的表示理解人类知识,并进行互联时,才有可能让机器真正实现推理、联想等认知功能。不过,对于AI拥有了全部人类知识后是否能够形成独立思考的能力,则需要专家学者进一步研究。


[1] http://image-net.org/challenges/LSVRC/2012/。

[2] https://deepmind.com/blog/article/wavenet-generative-model-raw-audio。

[3] https://github.com/openai/gpt-2。

[4] https://github.com/openai/gpt-3。