2 对话式交互的登场
2.1 交互演进简史
回顾技术发展的历史,最大的几次浪潮出现基本都伴随着一个规律:新的核心技术(无论是软件还是硬件方面)的出现和整合带来全新的人机交互方式,大量的商业应用应运而生。人机交互的历史变化如图2-1所示。
图2-1
人机交互形态从1990年之前以鼠标键盘为主的本地软件,逐渐过渡到2010年以手指触摸为主的移动App。如今,人机交互形态逐渐变为以自然语言对话为主,比如智能音箱、手机助手等。随着底层硬件、操作系统和人工智能技术的发展,交互的方式变得越来越便捷。
从历史的角度来看,1973年,第一个可视化操作的Alto计算机在施乐帕洛阿尔托研究中心(Xerox PARC)完成。Alto是第一个把计算机所有元素结合到一起的图形界面操作系统。它结合了3键鼠标、位运算显示器、图形窗口及以太网络连接,是第一款运用图形式交互技术的计算机。受软硬件限制,过去用上计算设备的人很少。一方面,当时的人机交互方式是让人学习机器的语言,且操作需要一些专业技术,学习成本高;另一方面,计算设备十分昂贵,远超大众经济承受能力,因此无法成为个人设备;再者,日常应用和普通生产力应用寥寥无几,所以即使学会了交互操作,也并不实用。
1983年,苹果公司推出Apple Lisa个人计算机,它是全球第一款搭载对话式交互的个人计算机,“完美借鉴”了Xerox的图形式交互技术,真正将图形式交互的商业应用价值发扬光大。PC时代由此拉开序幕。
2007年年末,移动互联网开始普及,核心驱动的硬件技术是触摸技术、各种传感器的成熟及整体计算能力的提升和小型化;软件方面,iOS系统与Android系统的出现,通过软硬件结合的方式创造出完全颠覆过去的触摸操作的体验,并使其成为真正可用的人机交互方式——让图形式交互的输入工具从鼠标键盘时代跨越到更直观的触摸方式。这样的智能系统,能完美地与开放的生态系统结合,让更多的人从使用计算设备中获利,许多不会使用键盘鼠标的人也可以通过触摸手机屏来操作。
举个例子,在智能设备普及之前,大众点评只是一个小众产品,因为网页并不是最合适这个商业模式的产品形态:通常,人们想要找餐厅的时候,很难快速从互联网获取相关的建议信息,毕竟让大家随身携带一台计算机是不太现实的;相比之下,智能手机的便携性很好地解决了这个问题,人们可以随时取出手机,点开大众点评App查阅相关信息,继而使大众点评的商业模式有了更合适的产品形态。
如今,随着人工智能和自然语言处理(Natural Language Process,NLP)技术的再次兴起,我们跨入了第三次交互浪潮——对话式交互。对话式交互是一种全新的交互方式。随着技术的平民化,人机交互正不可逆转地向人更习惯的方式靠近。
正如苹果公司前资深交互设计师Bred Victor所说:
“在未来的25年,没有人会再点击下拉菜单,但是人们仍然会指着地图互相纠正对方说的话,这是最基本的。好的信息软件在处理信息时会更接近人的使用方式,而不是计算机的方式。”
如图2-2所示,一方面,人机交互形态正在变化。在过去,网站和App强制用户像机器人一样思考问题,而对话系统则强制机器和计算机像人一样思考问题,让机器去适应人,而不是人去适应机器。另一方面,对使用者来说,使用机器的门槛变得越来越低:过去只有专家才能用的巨型人机交互系统,如今,正逐渐变成3岁儿童都可以使用的玩具。
图2-2
可以预见的是,接下来是人工智能的时代,过去的成百上千个App会逐渐演化成未来的成百上千个Chatbot。过去,我们依赖操作系统完成玩游戏、听音乐、看视频、买东西等操作;未来,这些操作中的一大部分都会交给Chatbot去完成。这是未来交互趋势的变化——从没有人工智能到有人工智能,机器从不懂人类到懂人类,从有界面到无界面,从图形式交互界面到对话式交互界面。
如图2-3所示,Chatbot逐渐为各种行业赋能,就像Android和iOS系统为手机赋能一样:手机到智能手机的最大变化是搭载了Android 和iOS这样的操作系统。类似地,从家居到智能家居、硬件到智能硬件、客服到智能客服,也是因为这些产品有了对话的功能,也就是说有了Chatbot。这样类比下来,Chatbot将会逐渐成为新的操作系统。未来,Chatbot将是人工智能时代不可或缺的基础组成部分,任何产品都要依赖对话系统为之赋能。
图2-3
如果一款Chatbot产品能够完美地运作,无须依赖特定硬件,与用户使用习惯天然契合,没有使用成本障碍,并且无须下载新的应用程序,直接在用户熟悉的即时通信软件中实现过去需要应用程序来承载的服务,甚至还能开拓新的形态,则将为Chatbot带来巨大的创新空间和前景。
App怎样颠覆Web,下一代人机交互就会怎样颠覆App。很多商业模式和形态都可以被重新考虑,越来越多的人都能更自然地通过计算设备获得价值。可以肯定,Chatbot会成为下一个具有超级增长点的交互方式,会打开新的维度,释放更多的商业价值。以图形化交互界面为基础的人机交互模式将会逐渐消失,取而代之的是对话式人机交互界面,而对话式人机交互界面的底层操作系统以AGI为代表。
当然,未来的交互方式并不会是单一的对话式交互,就像移动触摸的交互没有完全取代鼠标键盘的交互一样。未来的交互形态会变成多感官的综合交互,包括对话、视觉、触觉等,本书的主要内容就是围绕对话式交互展开的。