引言 超越现实,AR(1)正在重塑未来
想象一下:12月的一个清晨,天很阴沉,你戴着新的增强现实眼镜,沿着纽约的拉斐特街漫步。这款眼镜很新潮,配有微型数据投影仪和光学组合器,可以做到虚实融合——虚拟世界和现实世界几乎无法被区分开来。你只要动一动头部,全息数字层就会混合并叠加到现实世界,这种新颖的观察世界的方式是量身定制的。你旁边的行人看到的则是不同的影像,但也同样是经过精心设计的。
首先,你会注意到眼前的世界正变得更加丰富多彩,同时也充斥着海量的信息。在抬头向上看时,天际线处,你会看到还没建造起来的建筑,它们是半透明的,其中一些建筑还处于设计草图阶段,以便下次开分区会议时能得到你的反馈;另一些建筑则配有详细的信息,并标明了预计完工日期。还有,你最好不要盯着那些高层住宅看太久,否则你会立马收到那些关于房产的广告,而且这些广告会被全景投射到你所居住公寓的窗户上。
再往下看,街道上叠加了拓宽的人行道和自行车道图像,这些改造工程会在未来几个月开展。同时呈现的还有一张图表,显示自行车事故发生率有所下降。根据你的系统偏好,颇受好评的餐馆会浮现在你的眼前,并在你走路时为你推荐菜肴——右边是意大利饺子,左边是寿司船,而在正前方,是一碗热气腾腾的拉面,这足以让你驻足停留。
其次,棘手的问题则是,这些增强技术并非没有情感。投射出的经过优化的影像旨在刺激你大脑的特定部位,同时这些影像会展现更积极的一面,这或许也是配置偏好。你的专属人工智能(AI)——“现实编辑器”会推断出,你今天不想看到它早上在街道上发现的垃圾桶,所以它会用虚拟灌木丛和树木代替垃圾桶,而虚拟灌木丛和树木影像则来自你童年时候的家庭前院。纽约市看起来无比美好!要是气味能有查找和替换功能就更好了。由于眼镜通过脑电图和太阳穴上的皮电反射来感知你的情绪,并跟踪你的瞳孔扫视活动(当专注于某场景时你的眼睛是如何下意识地飞速转动的),所以你看到的东西会迅速随之做出反应。如果你早上闷闷不乐,那么你的眼镜就会扭曲现实,以便振奋你的精神:它们会照亮阴云密布的天空,加入夏日的阳光,逐渐增强与你的脚步相匹配的音乐节奏,此刻蔚蓝的天空上会出现励志的话语,云彩汇成了你的口头禅:“你能行的!”
再次,你会意识到这种看世界的方式比社交网站的社交性更强。广告牌上不再是街头小广告,而是播放着的视频,视频里你的朋友和最喜欢的明星在与你讲话,他们的话语还可以被翻译成西班牙语,以帮助你提升词汇量,为即将到来的假期旅行做好准备。人行道上也像好莱坞的星光大道上一样镶嵌着名字和头像,包括你的亲戚和你最亲近的教授和导师。多么好的回忆往事的方式呀!
你最近在寻找一件时髦的夹克,所以你的增强现实眼镜会呈现其他人时下正在穿的流行款式。如果你在看到某个款式时立刻不经意做出“扬眉”的动作,眼镜就会帮你将其标记在书签上。多亏了Tinder AR智能眼镜应用程序,你可以自动“删除”最近碰巧遇上的不太顺利的约会,比如上周给你留下阴影的那次约会。就像在英国电视剧《黑镜》(Black Mirror)中一样,这些约会对象总会时不时地像幽灵一样出现在你的脑海里。如果你说再也不想见到他们了,智能眼镜立即就能帮你达成心愿。
稍后,你再次出门,这次是跑步。导航很容易,因为你只需沿着一条黄色砖路跑步,这条路是专为你设计的。昨天的10公里,最先和你一起跑的是电影《烈火战车》(Chariots of Fire)中的苏格兰人(2),然后是洛奇(3),最后是牙买加短跑名将尤塞恩·博尔特(Usain Bolt),他和你一起进行了最后的冲刺。这很有趣,但是带来的动力没有预期的那么强劲。今天,你的眼镜又在你看到的景象中叠加了一群僵尸来追你。如果你的配速比昨天快,他们就抓不住你。也因此,你最后超过了昨天的配速!这些智能眼镜不仅可以扭曲现实、编辑现实,还可以预测未来。当你跑步经过商店橱窗时,橱窗里会映射出你年老时的形象:两鬓斑白,但是穿着2032年奥运会的T恤衫,你看起来精瘦、敏捷、健康。
我将这种新型的视觉现实称为“超视”(SuperSight)。
眼睛的进化
人眼是一种神奇的器官,拥有超过1.2亿个感光细胞,可以识别1 000万种颜色,同时也拥有全身最活跃的肌肉,这些肌肉使我们的平均眨眼时间仅为100毫秒。人眼包含200多万个可活动部分,复杂程度仅次于大脑。尽管人眼如此之奇妙,但几千年来它的进化并不显著。虽然我们发明了眼镜来矫正视力,发明了显微镜和望远镜来完成特殊的观测任务,但我们的祖先和我们感知世界的能力相差无几。未来10年,由于一系列技术呈现出指数级发展,这种情况将发生根本性变化。人类的视野将经历一场史诗般的进化,我希望能为你呈现出这一画面,让你能够身临其境。
可能你已经熟悉了虚拟现实(virtual reality,VR)的概念,熟悉了像Oculus Quest公司的或是HTC公司的VIVE系列这种虚拟现实沉浸式头显,这类头显能够将佩戴者带入奇幻的游戏世界。《AR改变世界》这本书并不是关于虚拟现实的,那些可穿戴的虚拟现实设备让我们远离现实,其中的景象都是不透明的,这会让你的体验脱离周遭世界。超视则将信息放置于现实场景之上,在现实的世界之上叠加了一个新的维度。正如美国参数技术公司(PTC)的首席执行官吉姆·赫佩尔曼(Jim Heppelmann)所言:“用信息装饰我们周围的现实世界要有用得多。”吉姆在空间计算(spatial computing)(4)软件创新方面颇有建树。这种通过信息叠加结合到现实世界中的装饰,通常被称为增强现实(5)。
最初,AR的探索性研究得到发展是出于军事用途的考虑。20世纪90年代初,在美国空军研究实验室,工程师们想要简化远程操作员控制机械手臂的方式。他们使用光学组合器将使用者的实际手臂图像叠加于机器人手臂图像之上,并混合计算机生成的图像与房间的视图,以模拟物理障碍。数字信息和现实世界实现混搭,增强现实由此诞生。后来,研究人机工程学的航空航天工程师发现了AR的另一大优势:它可以将飞机仪表盘信息转移到离飞行员视线更近的窗口显示器上,从而减轻飞行员的认知负荷。工程师们在平视显示器(head-up display,HUD)的基础上又研发了空军飞行员头盔,使用HUD进行目标定位和着陆引导。
2016年,微软推出了首款可广泛使用的AR耳机HoloLens。它使用了最初为Kinect游戏的3D传感器开发的跟踪技术,用于深度感知和身体跟踪。此技术已经在关于展示界面的学术研究中使用了一段时间。大约在同一时间,业内人士开始使用“混合现实”(mixed reality,MR)这个术语来描述这些增强效果,因为它们变得越来越丰富,反应也越来越灵敏。这一转变得益于两项技术:
· 测距深度相机,可以读取佩戴者面前世界的各个维度。
· 实时图形绘制技术的改进,可以根据环境的变化定位动态的、交互式的数字覆盖。
这意味着虚拟物体可以被放置于特定的位置,如放置于桌子上、半隐藏于门后面,或者飞跃于窗户之上。在第一代谷歌眼镜中,虚拟物体只能盘旋在半空中。
新兴行业经常会碰上命名的问题。2018年的一段短暂时间里,我们尝试将包括VR、AR和MR的所有沉浸式技术归类为同一个名字——“扩展现实”(extended reality,XR)。这种命名令人感到困惑,即使是对这个新兴行业的一小部分研发者、投资者和记者来说也是如此。今时今日,我们开始使用一个更为确切的术语——空间计算,来描述这个新范式。同时也有人使用“环境计算”(ambient computing)这一术语。两者都描述了沉浸式计算的未来方向:将现实世界与数字增强融合在一起。这与智能手机“随时随地”的承诺大相径庭。空间计算将重心放在了地点和环境上,信息围绕着我们所理解和接触到的世界的物理性质进行组织。
社交平台Snap和Instagram的粉丝已经体验到了空间计算将数字内容添加到现实世界之上的能力。每次你在自己脸上添加可爱的考拉鼻子、兔子耳朵、彩虹,或者通过伸舌头来制作3D苹果Animoji独角兽玩偶动画时,你都在使用计算机视觉和缩放数字投影技术。很多品牌也毫不犹豫地加入了进来,用真正的产品来“装饰”你的脸,比如沃比帕克(Warby Parker)眼镜公司和丝芙兰化妆品公司。不久,美发沙龙会为路过的顾客提供新发型预览服务,施华洛世奇会展示与你的服装很搭配的耳环和项链。齿形矫正公司SmileDirectClub在扫描了你牙齿的当前排列状况后,已经能够为你提供“微笑之旅”的动画预览。同理,社交媒体上主打“快速无痛”的整容手术广告很快就会通过手机屏幕上的镜子放大你的缺陷。相比鼓励人们永久地改变自己的身体,面部滤镜可能会平息人们对需要整容手术的焦虑。当你可以无休止地体验虚拟世界时,还有必要改变现实世界吗?
大多数Snap的滤镜都是在自拍模式下使用的,但你手机的另一个摄像头,即后置摄像头同样也具有增强功能,不仅仅在手机游戏《宝可梦GO》(Pokémon Go)中是这样。一些商品,比如乐高,当你用手机扫描它们的包装盒时,手机就会弹出“构建者体验”的延时动画。很快,更多的产品公司将使用超视来优化它们的包装,以显得“更加用心”。它们会将场景制作成动画,激发顾客的想象力,讲好产品线的故事,交叉销售(6),并最终赢得顾客的青睐。
在今天的研究和创新实验室中,各个智能手机制造商、社交媒体巨头、游戏工作室和无线运营商都在竞相创新、演示、获取专利,旨在“掌握”这一未来平台,或者至少是掌握软件或硬件堆栈(7)的关键部分。在新一轮超视浪潮中,各家公司争相创新,研发抓人眼球的软件应用程序、可穿戴设备及商业模式,形成一片新的气象。各家科技公司则像一个巨大的多层蛋糕,依托彼此的软件平台和工具,发现各种新的应用及其局限性,并寻求新的途径和解决方案。例如,具身多模态交互设计就是通过研究徒手手势(如捏、伸展和滑动)(8)、头部姿势、语音命令和凝视等动作的组合来告诉系统你想要做什么,这些研究将结合我们所看到的情况,决定我们与这些数字层互动时所使用的词汇。
这一波即将到来的计算技术的市场是巨大的。即使是保守的金融分析师也会给出下列预测:2019—2024年,AR市场的复合年均增长率为46.6%,到2024年行业收入将增长至727亿美元,到2028年将超过3 000亿美元。而市场最重要的驱动力则来自几乎所有科技巨头不断增加的投资,包括美国的亚马逊、谷歌、苹果、IBM、微软、英特尔、康卡斯特、高通和Facebook,中国的百度、阿里巴巴和腾讯,韩国的三星、LG,日本的索尼、佳能和松下。抢先诸多科技巨头一步进入该市场的是嗅觉灵敏的初创企业,如nReal公司。该公司的AR眼镜视野清晰、质量较轻,售价500美元,而且能够绑定手机,利用手机的计算能力和网络连接。有些公司甚至更为雄心勃勃,正在试验具备超视功能的隐形眼镜,其中Mojo Vision公司推出的样品已经可以投入使用。图0-1展示的是一种增强现实眼镜的大致情况。
图0-1 一种增强现实眼镜的大致情况
注:各大型平台都在开发超视,谷歌、苹果和三星等公司越来越多的相关专利就是极有力的证明。
每10年就会出现一项新的技术,集诸多创新于一体,使我们的生活和工作方式实现跨越式发展。10年前,只有最具先见之明的未来学家才会预见智能手机(多点触摸屏+摄像头+电话)、无人机(传感器+飞行控制算法+远程无线电发射和接收系统)、基于语音的数字助手(自然语言处理+语音识别+云服务)、门铃摄像头及联网恒温器等技术未来发展的无限可能性。
超视就是这一个10年的融合新技术。它继承了过去30多年的使能技术(enabling technology)(9),如机器学习、计算机视觉、可穿戴设备、边缘计算、5G、深度定制化、情感计算,以及手势和语音等新的交互范式等,所有这些技术都融合于我们所熟悉的日常佩戴的眼镜中(如图0-2所示的North公司的眼镜)。这些组件技术日趋成熟、实现微型化,并能很好地融于智能眼镜中,它们带来的影响将涉及生活的各个领域,并将改变我们与信息及彼此之间的互动方式。智能眼镜将像今天的智能手机一样变得常态化且无处不在。
图0-2 North公司的眼镜
注:眼镜制造商North公司的眼镜能够提供导航、个人提词器和优步网约车预计到达时间等服务,该公司已被谷歌收购。
增强世界,不可阻挡。在本书的每一章中,我都会梳理增强世界中的一个领域:包括我们的联系方式、饮食方式、购物方式及合作方式,甚至是学习的未来及想象力的未来。如果成功的话,我希望能帮助你预见这种转变,甚至是激发你的想象力,帮助你研发出一个新产品或是开创一家新公司。
诚然,很难预测超视眼镜的采纳曲线(10)的斜率。它们会以多快的速度扩展到工作环境之外?我预计最初它们会遵循Apple Watch的轨迹,因为它们的售价很贵(500~1 200美元),具有自由支配性,且需要一定的护理和输入,比如每晚充电。按照这个剧本发展的话,它们将首先作为时尚和自我品牌的展示而被纳入时代文化精神,其次被纳入的才是其功能性。像21世纪第一个10年的移动设备、语音接口和智能手表所经历的那样,超视也将深深融入时代文化之中。智能眼镜改变的不仅仅是我们所看到的内容,其增强现实的能力将改变人类看世界的方式。原因在于它们最好被看作我们全天候必须借助的辅助工具,而不仅仅是可有可无的备选工具。从心理上而言,可穿戴物品与身体融为一体,就像手表、鞋子、头盔或头灯一样,代表着我们能力的进化程度——它们是我们的一部分。
智能眼镜为佩戴者提供了绝佳的信息优势,就像借助谷歌玩拼字游戏一样。它们赋予使用者更强的记忆力、可视化能力及分析能力,使用者可以更深刻、更迅速地看到世界的复杂性和相互联系;它们使我们具备了一些动物的能力,我们的感知力也将从局限的电磁波谱扩展到更短的红外光谱和更长的紫外光谱,像蝙蝠一样可以透过雾和黑暗“看”得更远,像配备了X射线一样,我们可以看到发动机、建筑物和水体的内部。此外,它们的空间投影能力使我们的视觉在时间维度上更具弹性、在物理维度上范围更广,远超出我们现今的想象力。如果超视赋予的这些超能力为真,我们的感知系统将由此继续进化。
超视系统也在迅速实现小型化。现在,整套光学系统,包括微控制器、电池和天线,均可装入普通眼镜、衬衫纽扣,也可以装入吞咽的药丸中来代替内窥镜检测结肠息肉。图0-3展示了Snap眼镜这一小型化系统。整个系列的超视装备,值得期待!
图0-3 包含了小型化超视系统的Snap眼镜
注:Snap眼镜主要通过摄像功能将你的所见直接上传到你的订阅中。值得一提的是,这确实很炫酷。
在医疗保健一章中,你将了解到在许多诊断方面计算机视觉算法的表现是怎么优于人类医生的。同时你也会了解到这对未来工作的意义,不仅仅局限于医疗领域从业人员,同样也包括任何有可能被视觉人工智能赋能或带来威胁的领域。毕竟,超视的创新性具有颠覆意义,而且,即使是最有益的技术也存在着不足之处。
进化的权衡与损失
进化的推进不可避免地会伴随着权衡与损失。纵观整个动物王国的视觉系统,生物学在这方面给我们上了生动的一课。
人眼80%的感受细胞是视杆细胞,主要用于感知亮度的变化;其余为视锥细胞,主要感知颜色。然而,猫的眼睛中,96%的细胞是视杆细胞,所以猫并不是不懂得欣赏你新买的枕头花色,而只是因为它们的眼睛感知颜色的能力较弱。眼睛中,视杆细胞和视锥细胞的比例有着明确的模式:肉食动物对颜色的感知力较差,为了跟踪猎物,它们的视觉系统在进化中更为注重速度、光线和景深。相比之下,白天觅食的人类与食草动物的视觉进化得能够区分美味的紫色浆果和邻近有毒的粉红色浆果。在进化中,猫头鹰的视觉在孔径上得到优化,但转动眼睛的能力消失了——猫头鹰可以在漆黑的夜晚看到很远的地方,但要看向侧面,就必须转动整个头部。水下生物的视觉也有类似的权衡现象:自然选择牺牲鱼类的双目视力来换取非常广阔的视野。相比拥有三维的视野,能够看到从后面悄悄游过来的猎物似乎更为重要,这种现象在动物王国中很常见。
技术中也同样存在着为了优化而出现的权衡——工具越强大,权衡就越不可避免。现在很多国家政府利用超视为城市公共汽车配备人工智能摄像头,交警能够及时发现危险驾驶行为,从而使道路交通更加安全。配备人工智能的无人机可能帮助我们监控建筑工地安全、防止偷猎者杀害犀牛等。
《AR改变世界》中提到的几乎每一个计算机视觉应用在给我们带来惊喜的同时,也不可避免地带来了一些隐忧。预测这些技术带来的影响与后果既颇具意义,也极其复杂;但是,不能仅仅因为技术影响这个问题非常困难和棘手,就认为技术会带来反乌托邦的未来。就像活字印刷术、电报、电灯、青霉素、汽车或CRISPR基因编辑技术一样,超视对社会来说也是一项具有里程碑意义的发明,既带来希望,也带来危险。对于增强技术的未来,我们的想象越透彻生动,我们对空间计算技术的使用就能在伦理上越合规,也就越能控制其不利的一面、发挥其有利的一面。我希望能加深你的理解,并让你对这个重要的话题产生兴趣。
接下来的章节中,我们会分析超视带来的后果,这里重点列出6种截然不同的危害,并提供建议措施帮助缓和或消除这些危害。每一种危害都代表了一组或多组紧张的利益关系:盈利的商业模式与人类的心理健康,或是零摩擦的个性化定制与强有力的隐私保护措施。以下是这6种危害。
· 危害1:社交绝缘,人与人之间的交流将变得难上加难
当我们每天都徜徉于自己独立的、个性化的现实中时,人与人之间的联系和社区意识可能会受到影响。我们可以选择将任何想要的图形和皮肤添加到周围的世界中,人与人之间的目光交流将变得难上加难。计算机视觉可能会让我们沉浸在个人与世界的对话中,减弱了我们理解他人和与他人感同身受的能力。
· 危害2:监视状态,它将变得更加无处不在
现在,摄像头已被安装在从学校走廊到家庭门铃的任何事物上,而将来通过嵌入我们的眼镜框,它将变得更加无处不在。这些摄像头的功能会变得更强大,协调性更高,感知力更强。这些数据会被组合在一起,以提供个性化定制等有价值的服务,它还将为公司提供前所未有的侵犯我们隐私的机会,了解我们喜欢什么、购买什么、去哪里、在做什么,以及和谁一起做这些事情。
· 危害3:认知拐杖,我们可能会变得过度依赖它们
诸如全球定位系统(GPS)之类的辅助技术经常导致我们失去某些技能,比如不再去练习阅读地图、书写或测向等技能。空间计算技术使我们可以把整个世界变成一间教室,我们打网球时、修理房子时及第一次约会时,都有私人助手辅导,我们可能会变得过度依赖它们。
· 危害4:说服无处不在,不断影响我们的行为和消费习惯
我们已经习惯用个人数据换取免费的数字服务(比如在谷歌和Facebook上)。在计算机视觉时代,公司和品牌不仅能够看到我们的搜索历史和活动日程表,还能够看到我们看到的事物。这就意味着他们可能会以前所未有的方式影响我们的行为和消费。
· 危害5:训练偏差,我们必须将自己的生命托付给这些自动系统
依靠计算机视觉的判断,无论是关于医学诊断还是关于是否选择在通过黄灯时加速,我们必须将自己的生命托付给这些自动系统,但对它们的准确性及训练方法通常不太清楚。超视学习的数据集已经存在巨大的偏差,尤其是涉及种族和性别方面的内容。
· 危害6:服务部分人的超视
在任何技术的发展历程中,社会不平等在早期都会根深蒂固。随着超视的发展,我们会创造更多的数字种姓制度吗?
对技术的隐忧
是不是突然对计算机视觉、人脸识别、AI及万物互联产生了矛盾的心情?很多人都有同感。尽管我已经帮助开发了此类技术创新性最强的应用程序,但对于这些技术带来的不可避免且令人不安的后果,我常常会感到纠结。
作为企业家和未来学家,我痴迷于使用新材料和新技术进行重新设计和重新发明。我在本科时学习物理和美术,两个学科都在试图理解和捕捉光线,而且我从十几岁时就疯狂地爱上了摄影。11岁时,我在父母家的地下室里建造了一间暗室,从那以后,我就一直在同自己的黑白胶片打交道,与此同时我也会点燃、躲避和不小心吸入定影剂。
大学时期,我在校园里举办过摄影展。能够展示自己的作品并收到别人的反馈总是令我激动。除了美国著名的文理学院——圣奥拉夫学院的师生和我的父母,没有其他人能看到我拍的照片。这就是为什么在20世纪90年代,互联网的到来让我变得如此兴奋。我喜欢在网上分享我拍的照片,让不仅是在我所在的大学图书馆学习的人,而是世界各地的任何人都可以看到它们。然而在那时,互联网主要是为文本和静态图像服务的。我在麻省理工学院的研究生同学尼尔·梅尔(Neil Mayle)和我一起申请了通过网络浏览器上传照片的专利,发明了首个在线照片共享服务,然后我们筹集到了资金,在1996年成立了一家公司,提供在线相册服务。但我们没有赶上数码摄影的流行,彼时只有专业人士才能买得起数码相机,家用调制解调器是56K波特(11),把36张照片数字化到光盘上要花30美元。我们从未想过,简单且连续的照片滚动会成为Facebook和Instagram的标准结构,我们也从未想过20年后,我们会使用不限量手机套餐,口袋里会揣着数百万像素的相机四处走动,随时分享自拍及猫咪的视频。可惜了,我们应该留着那家公司的。
我们没有在照片共享领域继续投入,而是将精力投向了互动工厂(Interactive Factory),这是一家蓬勃发展的产品设计公司。互动工厂帮助制作了乐高机器人(LEGO Mindstorms)和音乐学习体验游戏《吉他英雄》(Guitar Hero)等。我们发明了模拟技术来教授物理学和计算机科学,还发明了语言学习软件。我们创办的互动科学博物馆也在全美各地进行展览。此外,我们发明的居家划船设备可以让使用者具有虚拟比赛体验(见图0-4)。
图0-4 让使用者具有虚拟比赛体验的居家划船设备
2000年,我在Viant公司管理一个多学科创新小组。当时公司刚刚上市,因此我说服首席执行官成为麻省理工学院(MIT)媒体实验室的学术赞助商,我曾在该实验室就读。为了其中一个合作项目的子项目,我开始痴迷于研究微妙、简单明了的外围信息显示的可能,所以我创办了一家名为Ambient Devices的公司,得到了媒体实验室的创始人和我在那里的其中一位导师石井宏(Hiroshi Ishii)的支持。在那家公司,“着魔”(enchantment)是我的口号——我们可以将世界重新想象成一个万物互联、更智能、更有活力的地方。我的第一本书《魔物》(Enchanted Objects)从一个发明家的视角探索了即将到来的万物互联世界。现在,得益于下一波沉浸式技术和计算机视觉技术,我们不再需要在镜子、桌子、厨房电器、乐高和灯具中嵌入传感器和无线网芯片来实现个性化定制并为这些事物添加服务。相反,我们将使用超视将数字和现实结合起来,这样我们就能以全新的方式观看周围的空间、物体和人。超视让我们能够从外部进行有趣的探索。
2015年,人工智能可以通过社交媒体照片实现社交购物体验,受此启发,我与尼尔·梅尔和另一位媒体实验室的同事乔舒亚·瓦克曼(Joshua Wachman)共同商定,创建了Ditto公司。公司创办之初,社交媒体上每天都会发布3亿张照片。这些图片中包含着能够引人思考及让人感兴趣的内容,但对于互联网的超链接而言,它们却是隐形的,或者可以说它们是“非结构化数据”。我们训练出一个基于云的算法大脑,可以识别数千种品牌、事物、织物图案和使用环境,然后将这些物体或体验与其来源链接起来:电子商务网站、旅行社、餐馆、体育门票销售商、食谱、eBay及本地的流浪狗收容所。当你浏览朋友发布在Facebook上的照片时,你会想,这么酷的背包、鞋子、站立式冲浪板、灯、蓝莓派还有哈巴狗,在哪里可以找到类似的东西?通过Ditto软件你就可以找到。
出售了Ditto公司之后,我供职于沃比帕克眼镜公司。作为主管视觉技术部门的副总裁,我利用自己在物理、计算机视觉和数字产品开发等方面的背景创建了在线视力测试软件。使用者站在距离屏幕视力表精确距离的位置,在家就能通过手机上的计算机视觉进行精准的眼科检查,这整个过程获得了专利。我们发明的在线测试程序,现在对数十亿需要矫正镜片的人来说是可以方便访问的。然后,我们将该测试与虚拟试戴工具搭配,该工具使用AR测量使用者的瞳孔距离和面部轮廓,推荐最佳镜框并能让使用者实现可视化评估。在这家公司期间,我们还研究并制作出了新一代眼镜的雏形。这种新型眼镜嵌入了多项技术,包括助听器、可变焦透镜、增强视觉信息及通过读取脑波推断情绪和关注点的传感器等。
在产品设计公司IDEO及创新技术咨询公司EPAM Continuum时,我的团队都主攻思辨-未来(speculative-future)项目(12)。在这本书中你会读到很多相关内容:婴幼儿玩具品牌费雪(Fisher-Price)玩具的未来,餐厅外卖的简化体验,家庭自动清洁机器人,等等。整个过程始于深入的客户研究,从而发现客户有哪些未满足的需求、愿望和思维模型(人类用以思考事物的隐喻)。然后,整合这些洞察,将其转化成商业机会,制作出产品雏形,观察客户的反应。这些塑造未来的项目游走于人类洞察力、技术颠覆和商业模式创新的交汇处。学习和思考时,我们会感到兴奋;使用稚嫩的新技术时,我们小心谨慎,往往也会感到沮丧;等待客户对心爱的产品雏形进行反馈时,我们也常常毕恭毕敬。
一路走来,我一直在MIT媒体实验室教授环境计算,给其他研究实验室做讲座,在行业会议上发表主旨演讲,并在初创公司制定产品路线图时为其提供咨询服务。超视一直是我所有这些工作的重心。
即将到来的超视时代
我有幸目睹了技术拐点引发的产品和商业模式的深刻变革。作为MIT的教授、初创企业投资者,以及时尚、医疗保健、城市设计和建筑等领域公司的顾问,我已经习惯了解读跨行业模式并预测即将到来的数字浪潮的影响。我的目标是帮助本书读者掌握同样的洞察力和前瞻力。
在接下来的9章里,我们将剖析使超视成为可能的技术,并探讨下一阶段视觉变革的意义。在前几章里,我们从超视改变个人体验和互动方式开始,然后逐渐延伸到社会层面的问题,如食物、教育、工作和健康等,最后转向产生最深远影响的领域:改变我们集体想象力和促进变革的能力。
在每一章中,你都会看到开拓超视技术和服务的企业家和科学家:为高端零售业发明魔镜的萨尔瓦多·尼西·维尔科夫斯基(Salvador Nissi Vilcovsky);为微型花园匹配名厨的珍妮·布廷(Jenny Boutin),以及帮助消防队员用X光视觉导航的烟雾潜水头盔的发明者。我还会介绍一些硬件公司和软件公司,它们正在谋求同“互联网五巨头”(谷歌、亚马逊、Facebook、微软和苹果)匹敌的方法。这些巨头公司均投入了数十亿美元,想要抢先占有整合现实和体验现实的下一个平台。
接下来,我将解释支持超视的技术和关键算法,并介绍相关框架以帮助大家了解即将到来的世界。更重要的是,我将关注超视带来的主要影响和次级效应,帮助你想象未来的产品和服务。
我们所处的时代需要新的视角。我们必须更明确地表达出主要问题:气候变化带来的影响、普遍存在的不平等现象、教育和医疗保健问题。视觉的进化能给我们带来哪些方面的进步?我们需要的是猫头鹰的夜视能力吗?是猎鹰的远距离视觉的敏锐度吗?是鱼类的周边视觉能力吗?还是我们需要具备完整地看到其他事物的能力?我认为,在无数其他实用型应用中,我们最迫切需要超视能力去预见未来,不仅是为了我们自己的健康,同样也是为了对地球的保护。
我的祖父是一位建筑师,每当想快速表达一个视觉想法时,他都会本能地抓起一卷描图纸。他会将描图纸置于现有建筑或景观的照片上进行素描,然后在描图纸上再铺上另一张描图纸,调整一些线条,画出一份新的草图。超视将是我们未来的描图纸:以最快的方式来为个人、系统及城市大小的变化建立雏形,实现视觉化。
未来在等待我们,让我们通过超视来想象最好的未来吧!