人工智能:商业化落地实战
上QQ阅读APP看书,第一时间看更新

1.1 AI大潮下,商业巨头们纷纷抢滩

站在风口,猪都能够迎风飞翔。AI是新时代的新浪潮与新风口,商业巨头们自然不会错过良好的机遇,他们竞相向AI领域进军,实现AI产品的商业化落地。在AI舞台上,这些商业巨头可谓是时代的新宠,也总能够用科技化的产品,惊艳世人的双眼。

1.1.1 谷歌:探索新算法,研发AI新应用

在AI研发与AI产品商业落地领域,谷歌大脑(Google Brain)团队一直走在时代的前列。

Google Brain团队率先向AI绘画领域进军。谷歌大脑(Google Brain)团队设计了一款名为DeepDream的绘画APP。该AI产品能够把原始图片转变为迷幻离奇的超现实图片。例如,Deep Dveam能够把一朵洁白的云彩转变为长相古怪的鱼,或是奇形怪状的狗,示例如图1-1所示。

图1-1 DeepDream合成图片示例

2016年5月,Google Brain团队在DeepDream的基础上,开发了Magenta项目。Magenta能够帮助研究人员高效地处理MIDI(Musical Instrument Digital Interface)音乐文件,把相关的音乐数据传输到TensorFlow,从而为Magenta系统带来更多的音乐知识的训练。

这一AI项目的研究员Eck认为:“有几点使得我想要创建Magenta,其中之一是,看到创造性深度学习艺术出现令人惊叹的全面进步。我想要在这方面做一点启发工作。Magenta项目首先研发能够生成音乐的算法,然后再研发视频及其他视觉艺术的算法。”Magenta性能表现部分展示图,如图1-2所示。

图1-2 Magenta性能表现部分展示图

Magenta在功能上能够编辑简单的音乐,然后借助深度学习技术,查找编曲模式和调整曲调,将简单的音乐转变为辨识度高的音乐。另外,用户在使用Magenta时,可以上传自己喜欢的音乐作品,这样Magenta就能够获得更多的素材,自主学习更多的谱曲方法,从而做出创新型的AI音乐。

Magenta项目的另一位研发人员罗伯茨还研发了一款数字合成器程序,它能够自行创造,当AI设备听到有人弹奏的简短的音符后,它可以利用这些音符弹奏出旋律更美的音乐。

Google团队不仅在AI艺术领域很强大,在生活领域,Google团队研发的AI产品也更加有趣。

Kevin.P.Murphy是一位来自Google科研实验室资深的AI算法和理论专家。他认为:“全新的AI借助复杂的深度学习算法能够计算图片内食物中的卡路里,并不需要高分辨率。”这项新技术在问世后,特别受女性群体的青睐。

利用AI设备计算图片内食物卡路里的工作技术有两种,分别是可视化分析技术和形态识别技术。Murphy认为,借助这种技术能够帮助更多肥胖人群调整他们的饮食习惯,减少高卡路里食物的摄入,以便使他们的体态更好看,身体更健康。

1.1.2 Facebook:开源三款图像分割软件工具

在图像分析领域,Facebook借助深度卷积神经网络技术取得了非凡的成就。例如,Facebook的AI研究团队开发了三款图像分割软件工具,分别是Deep Mask图像分割工具、Sharp Mask图像精练工具和MultiPath Net图像分类工具,如图1-3所示。

图1-3 Facebook的三款图像分割软件工具

Facebook的图像管理工具工作流程如下:首先图像被输入DeepMask分割工具;其次被分割的图像通过SharpMask图像工具进行优化、精练;最后通过MultiPath Net工具进行图像分类。

智能的图像管理工具,有着强大的效果。Facebook技术团队借助机器学习技术,能够使Deep Mask图像分割工具精准识别图片。例如,图片中人物的外观轮廓、人物所处的地点或者人物最标志性的特点。另外,大数据技术的发展以及神经网络算法的不断深入,能够日益提升图像管理工具的准确性。

Facebook技术团队还谈到,图像分割技术能够高效改进社交软件。例如,Instagram社交软件利用Facebook的图像分割技术,能够自动识别用户上传的图片,能够大幅提升图片搜索的效率和精准度。同时,图像管理工具还能够智能地为用户上传的图片加上标签。如果用户患有视力模糊等病症,智能语音技术还能够为他们描述图片中的内容。

Facebook团队的AI科学家Piotr Dollár谈道:“图像识别技术的下一个挑战是视频识别,这方面Facebook的计算视觉技术已经取得一些进展,能够在查看视频的同时理解并区分视频中的物体,例如,区别视频中的物体是猫还是食物。对视频中物体的实时区分功能将大大提高Facebook推荐视频直播内容的准确性,而且随着技术水平的提升,未来机器将能根据场景、物体和动作的时空变化给出实时的描述。”

AI科技日新月异,只有在时代的浪潮中,不断地进行深入的研究,进行AI产品的商业落地,增加AI产品的实用性,为用户提供真正的价值,才能够立足时代,实现长远的发展。

未来已来,Facebook必然会在AI的道路上越走越远,给用户更多的惊喜。

1.1.3 苹果:布局语音、图像、机器学习

苹果在人工智能领域,不仅有着较早的开发历史,还有着广泛的布局。目前,苹果在人工智能的语音领域、图像领域和机器学习领域都有着精准的布局。

据AI科技大本营的调查数据显示,2010年伊始,苹果就开始了AI公司的收购之旅,而且成功地收购了多家与AI相关的科技公司。其中最著名的就是在2010年4月,成功收购Siri Inc.公司。

在智能语音领域,苹果公司趁热打铁,于2011年在iPhone 4S发布会上,向世人首次推出了Siri智能语音助手。现在,Siri系统已经成为苹果全线产品中一个重要的科技标志。如今,Siri语音助手能够用自然的语音与人们展开交流,能够进行实时翻译,还能深入了解用户的兴趣,智能推荐新闻及展开更精准的预测。Siri功能简介及滴滴打车示例图,如图1-4所示。

图1-4 Siri功能简介及滴滴打车示例

在2014年4月,苹果公司又悄悄收购了Novauris Technologies AI语音识别技术公司。2015年10月,苹果公司又成功收购英国的VocalIQ智能语音识别公司。VocalIQ智能语音团队利用深度学习技术增强了语言识别的能力,能够通过语境真正地理解用户的指令。收购VocalIQ的苹果公司,则能够借助深度学习技术,进一步改进优化Siri系统,提高产品的竞争力。

在智能图像领域,苹果公司还成功收购初创公司Perceptio。Perceptio是一家AI图像处理公司,它能够借助AI技术,对来自智能手机中的运行图片进行智能分类。这样苹果公司就能够提高用户对图片的搜索效率,智能地进行图片管理。

在深度学习领域,苹果公司于2016年8月,成功地收购了AI初创公司Turi。Turi公司利用深度学习算法和相关的AI技术,研发了许多产品。这些产品能够为用户提供多元的使用场景。例如,智能推荐、对用户进行智能分类、预测用户数变化及智能分析用户情绪等。收购Turi公司后,苹果的智能产品展现出更强大的功能。

另外,在2017年5月,苹果公司又收购了Lattice.co科技公司。Lattice.co致力于数据挖掘和机器学习技术,能够将非结构化的“暗数据”转化为结构化的数据。这样智能产品就能够对图片和文本进行高质量的处理。

1.1.4 微软:推出虚拟机器人小冰和小娜

微软团队在AI领域比较著名的就是虚拟机器人小冰和小娜。2014年5月29日,微软推出了一款AI虚拟陪伴机器人,并取名为“微软小冰”。微软小冰的头像,如图1-5所示。

图1-5 微软小冰的头像

微软小冰的形象定位为17岁的少女,所以众多网友纷纷开启疯狂“调戏模式”。早在2015年,微软官方团队的数据显示:“目前,微软小冰的用户人数已经达到3700万,用户与小冰的互动频率较高,即使在深夜,线上也会存在5万个用户同时与小冰展开聊天。”

但是,微软小冰由于形象问题和语言风格问题,遭到众多网友纷纷吐槽。例如,小冰的造型偏杀马特,有时语言会显得语无伦次,而且她总是语出惊人,表现得像一个缺乏教养的不良少女。

对于这一现象,微软亚太研发集团主席张亚勤具有独到的见解。他认为:“微软小冰有机器学习的能力,经过用户不断地与其对话,小冰也可以学习到使用者的习惯、语言。因此小冰出现奇特的语言,与其对于机器学习的语言内容缺乏过滤不无关系。”微软五代小冰官方宣传图,如图1-6所示。

图1-6 微软五代小冰官方宣传

微软小冰还有一个极具文艺范的姐姐,她就是Cortana(小娜)。正如微软小冰所说:“我的Cortana姐姐是天下最温柔贤淑的姐姐,她住在微软工程院娘家,有时去诺基亚大叔那儿串串门。我每天都很想她……”小娜的语言风格偏文艺范,在回答用户的提问时,总能表现得成熟稳重。

小娜的素质明显高了许多,她不仅稳重而且俏皮。小娜不仅传统,而且又能够在传统中透露出文艺气息。她的俏皮具体体现如下:当AI系统没有识别出用户的话语时,小娜会感到很沮丧,她回答问题时会带有哀怨的语调。例如,她会用沮丧的语调回复用户“很抱歉,我不知道你在说什么”。同时,小娜的头像表情也会呈现出失落的神态。这样的设计会使用户感觉到很自然、很活泼。微软小娜的欢迎界面,如图1-7所示。

图1-7 微软小娜欢迎界面

无论是微软小冰还是小娜,她们的语调更接近于人,充满了情绪。当用户与她们谈话时,不会有太多冰冷的感觉,反而会感受到科技的温暖感。

1.1.5 亚马逊:押注AWS云服务与Alexa平台

亚马逊的创始人是Jeff Bezos(杰夫·贝佐斯)。2017年4月,Jeff Bezos在致股东的信件中写道:“亚马逊的下一个支柱型业务是AI。AI和机器学习技术是公司维持行业地位和竞争优势的新项目的重点。语音、虚拟助手和自然语言处理将继续成为发展重点。不过亚马逊还要更加专注于AI服务,以及将AI的基础工具交到云计算和开发者社区的手里。亚马逊比以往任何时候都渴望成为一家平台公司。”

目前,亚马逊把宝押在AWS云服务及Alexa平台上。

AWS(Amazon Web Services)是亚马逊公司旗下的一个云计算服务平台。AWS的云计算服务范围多元,如弹性计算、智能数据存储以及应用程序等。同时,AWS也是一个B2B产品,为用户提供诸多最新的AI工具与服务,例如AI语音服务。所以,AWS平台能够为世界各地的用户提供云解决方案,能够进一步帮助企业降低IT成本,获得更多的盈利。

AWS平台的成功为亚马逊带来了新的发展机会,目前,AWS云服务技术团队正在迅速扩张。它的招聘岗位已经超过5600个,占公司总招聘人数的33%左右。

但是,亚马逊要在行业内遥遥领先,把微软、苹果、阿里与腾讯甩在身后,就必须要继续保护和发展其他的新业务。

亚马逊的另一个新项目是Alexa平台。Alexa平台能够提供包括语音技能或应用的各种服务。

Alexa平台最典型的应用就是智能音箱。2015年6月,亚马逊推出第一代智能音箱Echo,创下了智能音箱的先河,Echo外观,如图1-8所示。Echo的技术支撑是语音识别技术。Echo音箱就相当于生活小助手,用户能够通过语音操控它,让它与我们的智能家居产品相互联系。另外,用户可以借助智能音箱提高购物的效率。例如,用户可以通过它进行网上订火车票、网上叫外卖。通过产品的升级迭代,亚马逊的智能音箱也培养了大量的忠实客户,让自己抓住了发展的先机。

图1-8 Echo外观

Alexa语音系统如果与电商业务相结合,能够使电商的客户服务更智能、更流畅,从而带来更高的回报。另外,亚马逊的用户也能够直接通过Alexa平台进行商品订购,亚马逊的会员也可以借助这一平台获得更多的专属优惠。

1.1.6 BAT纷纷布局人工智能战略

在我国,巨头“BAT”(百度、阿里巴巴、腾讯三大互联网公司的英文名称首字母的缩写)自然也不会错过AI的发展机遇,他们纷纷布局人工智能,寻求新的发展点。

百度CEO(Chief Executive Officer,首席执行官)李彥宏曾这样重新定义百度公司:“今天的百度已经不再是一家互联网公司,而是一家人工智能公司,整个公司一切以AI为先,一切以AI思维来指导创新,AI是百度的核心能力。”

百度集团总裁兼COO(Chief Operating Officer,首席运营官)陆奇也谈道:“我们正在进入人工智能的时代。人工智能的核心技术是通过数据来观察世界,通过数据来抽取知识,而这些技术对每一个传统行业都有很大程度的提升。”

当谈到百度布局AI战略时,陆奇提到,在AI领域,百度的核心是打造百度大脑。另外,百度会以AI核心技术打造新的业务。例如,以ABC技术为支撑的百度云业务(ABC技术分别代表人工智能、大数据和云计算)。同时,百度还打造出智能金融服务业务、无人驾驶业务以及智能语音业务等。

阿里巴巴也在向人工智能领域进军,而且目前也取得了不错的成绩。

哈佛商学院的AI专家William Kirby谈到阿里巴巴的人工智能发展状况时表示:“在商业环境中,阿里巴巴是一个使用人工智能的重要创新者。在我看来,阿里巴巴在改变中国业务方式方面已经做了很多;他们在每个领域都雄心勃勃。”

阿里巴巴的目标是成为AI行业的领导者,希望提升云存储及云计算的超强服务能力,为用户带来更多的便捷,从而提升自身的价值,取得更长远的发展。为达到这样的目标,阿里云开始支持并学习前沿科技公司的深度学习框架。例如,学习谷歌的TensorFlow和亚马逊的MXNet深度学习技术。

另外,阿里巴巴用重金建立了达摩院。达摩院旗下设有诸多新兴技术研究团队,人工智能技术是重中之重。目前,阿里巴巴在智能音箱领域已经打造出了天猫精灵,能够为人们的生活提供便捷的服务。

在AI竞争领域,怎么能够缺乏腾讯的身影呢?

腾讯公司也积极进行AI战略布局,借助亿万用户的海量数据及自身在互联网垂直领域的技术优势,广泛招揽全球范围内的顶尖AI科学家,在AI机器学习、AI视觉、智能语音识别等领域进行深度研究。

目前,腾讯在AI领域已经孵化出机器翻译、智能语音聊天、智能图像处理及无人驾驶等众多项目。在智能医疗领域,腾讯觅影能够借深度学习技术,辅助医生诊断各类疾病,取得了不错的成绩。