Python深度学习从零开始学
上QQ阅读APP看书,第一时间看更新

1.1 什么是人工智能

首先,我们来界定一下接下来所要讨论的人工智能(AI)的定义和范畴。

AI是Artificial Intelligence的缩写,中文是大家广知的“人工智能”。它可以理解为使机器具备类似人类的智能,从而代替人类去完成某些工作和任务。

读者对AI的认知可能来自于《西部世界》《超能陆战队》《机器人总动员》等影视作品,这些作品中的AI都可以定义为“强人工智能”,因为它们能够像人类一样去思考和推理,且具备知觉和自我意识。这就是所谓的强人工智能,即指具有完全人类思考能力和情感的人工智能。“弱人工智能”则是指不具备完全智慧但能完成某一特定任务的人工智能。这样的弱人工智能系统,能够在特定的任务上、在已有的数据集上进行学习,同时能够在今后没见过的场景预测上获得比较好的结果。这种“弱人工智能”就在我们身边,早已服务在大家生活的方方面面了,已经开始为社会创造价值。比如语音助手,它集成在智能手机、智能音箱、轿车里,甚至是我们的智能手表中。最常见的一种应用场景是,我们说“Hi Siri,帮我查查明天上海的天气”,语音助手立即响应我们的要求,告知我们天气情况。这里面涉及了机器如何听懂、理解人类的意图,然后在互联网上找到合适的数据,再回复给我们。

还有一个常见的应用场景是,机器人电话客服,相信大家平时都接到过一些推销电话(甚至是骚扰电话),电话那端和人类的声音是完全一样的,甚至能够对答如流,但是我们有没有想过,和我们进行交流的其实只是一台机器呢?

这个其实是最接近大家普遍认知的人工智能,无奈要让机器完全理解人类的自然语言还是“路漫漫其修远兮”,特别是人类隐藏在语言里面的情感、隐喻,机器要理解起来依然是困难重重。所以,自然语言处理(NLP)一直被视为是人类征服人工智能的一座高峰。在网上可以搜索到很多关于自然语言处理的相关内容,有兴趣的读者可以进一步去查阅和了解。

相比于理解自然语言,计算机视觉的发展就顺利得多,它教计算机能“看懂”一些人类交给它们的事物。比如在停车场出入口处汽车牌照的识别,以前得雇一个专职人员天天守在出入口处登记车牌号、计算停车费、缴费后放行等,现在几乎是一个摄像头即可搞定所有的事情。

在购物的应用场景中,如Amazon的无人超市,能够通过人脸识别知道顾客是不是来过、以前有没有在这家超市购物过,从而给顾客推荐他们心仪的商品,使顾客获得更好的购物体验。

除了身边这些“有形”的能看能听的人工智能产品或服务,那些帮助人类做决策、做预测的人工智能系统也是人工智能技术的强项。

比如刷抖音的时候,后端服务器会学习用户的喜好,推荐越来越符合用户胃口的视频。

再比如说专业性更高的医疗行业,你有没有想过,自己学医八年,从20到28岁,呕心沥血孜孜以求,到头来仍然有可能被新技术所取代。笔者的一个朋友的儿子是医疗影像专业的,在一家医院工作,有一次一起交流的时候发现他对自己的前景充满了担忧:他说一个影像科的医生,从学习到出师,需要花费十余年的时间;这些X光片或者CT、核磁共振的片子及其诊断结果,如果让人工智能诊疗系统来进行判断,可能只需要几秒钟就能完成,而且机器诊断的准确率还会明显地高于人类医生,同时成本也更低。

对于家庭生活场景中的应用,在每年的CES(国际消费类电子产品展览会)中我们都会看到全球智能家居厂商发布的硬核产品。2019年科沃斯发布了第一款基于视觉识别技术的扫地机器人DG70,它可以识别家里的鞋子、袜子、垃圾桶、充电线,当然除了用到视觉识别系统之外,还需要机身上各种各样的传感器信息的融合处理,才能在清扫复杂家居环境时实现合理避障。