第3章 前言 AI与空间计算融合的前沿
这场讨论的核心是一个关键时刻,它将重塑我们对世界的认知。融合的核心是两股强大力量的结合——AI与空间计算,后者以AR(增强现实)和VR(虚拟现实)为代表。这种融合象征着创新和创造力之间错综复杂的交织,为我们带来了全新的视角,使得数字世界与现实物理世界之间的互动得以实现。如果没有AI,空间计算就不可能实现,而随着生成式AI的涌现,空间计算将得到进一步增强。
这种融合不仅仅是技术的汇集,更代表着我们开启了一扇全新时代的大门,迈过一个通往未知可能性的门槛。它将AI卓越的数据处理能力与AR和VR的沉浸式实力结合,创造出一种动态的协同效应。这种伙伴关系预示着一个变革性的未来,我们将会更加直观和无缝地与数字信息及周围的世界互动,超越传统的界限,实现物理领域和数字领域之间的联结。
有趣的是,这种融合的影响范围远远超出了技术领域。它涉及我们日常生活的方方面面,涵盖了我们如何接受教育、参与娱乐、获得医疗健康服务,以及做出购物决定等诸多领域。这种变革性转变不仅改变了我们与技术互动的方式,还重新定义了商业格局。
从商业角度来看,其影响是深远的。利用这项技术的企业将通过向客户提供引人入胜的沉浸式体验来获得竞争优势。想象一下医疗领域,AR可以通过向外科医生提供实时数据来彻底改变手术的方式;再想象一下零售行业,VR可以为顾客提供虚拟试衣服务。此外,AI的分析能力将帮助人们做出更明智的决策,这是当今风云变幻的商业格局中令人垂涎的资产。
本书的前言部分为我们后续探索AI和空间计算奠定了坚实的基础。在整个讨论过程中,我们将探究其关键组成部分、实际应用场景以及其对各个领域产生的深远影响。接下来本书将深入研究有望重塑数字世界与物理世界之间界限的技术融合,让我们见证迅猛发展的现在,以及充满机遇、创新和希望的未来。
搭建舞台
要真正理解这种融合的意义,我们首先需要将其与过去的变革性发明进行比较。历史上不乏技术创新改写人类体验的标志性时刻。回顾第一张照片的突破性发明,它让时间的瞬间变得永恒,并彻底改变了视觉叙事的方式。随后,第一部电影的问世将叙事搬上银幕,开启了娱乐和艺术表达的新时代。
这些历史上的里程碑彻底改变了我们看待世界的方式。如今我们再次发现自己正站在AI与空间计算的交汇点上,这些技术即将深刻地重塑我们的生活,就像过去的革命性发明重塑我们的生活一样。就像第一张照片改变了我们记录和珍惜记忆的方式一样,AI和空间计算正在改变我们对现实的感知。与电影改变娱乐行业的格局类似,AR和VR正在引入全新的沉浸式体验。
此外,如同第一台电视的问世永远改变了我们与世界的互动方式,AI和空间计算正在打破物理领域与数字领域之间的壁垒。这些技术使我们能够以之前无法想象的方式与信息和环境进行互动。
这种融合不仅仅是技术的演进,更意味着我们与世界互动方式的深刻变革。它有能力重新定义我们的现实,模糊虚拟世界与物理世界之间的界限。它为我们的日常生活走向与AI和空间计算无缝交织的未来铺平了道路,开启了超出我们目前理解的可能性。当开始探索这些技术的变革潜力时,我们将会揭示它们如何重塑行业、重新定义体验,并推动我们进入一个充满无限创新和想象力的时代。
与众不同的AI时刻
在这个历史时刻,我们发现自己正处于两股独特的技术力量的融合之中,每股技术力量都处于其发展的关键阶段。一方面,AI这项技术已经经历了一段相当长时间的非凡进化之旅。AI的根源可以追溯到计算机科学和数学的诞生。多年来,它已经从抽象概念转化为实际应用,并演进为我们日常生活中不可缺少的一部分。
在本书中,我们将探讨AI的核心组成、实际应用及其对各个领域产生的深远影响。值得注意的是,计算机视觉是空间计算背后的驱动力。空间计算无缝融合了计算机视觉,通过理解物理世界并与之交互来创造沉浸式体验。这些技术超越了单纯的视觉范围,还包含在环境绘制和解释方面发挥重要作用的扫描技术。
此外,在空间计算的背景下,生成式AI的影响力怎么强调都不为过。这项技术带来了全新的三维创意,能够生成沉浸式和交互式的三维内容,让空间计算的世界变得更丰满。在本书中,我们将进一步探索这些技术之间深刻的相互作用及其变革潜力。
AI的故事以重要的里程碑为标志,从早期的专家系统(一种由AI驱动的软件,模仿特定领域人类专家的决策专业知识)到当前的机器学习、深度神经网络和通用AI。一路走来,它推动了自然语言处理、图像识别和预测分析等方面的创新,彻底改变了我们的生活和工作方式。为AI提供支撑的算法和模型变得越来越复杂,为各行各业的复杂决策、自动化和个性化提供了有力的支撑。
在一条平行的道路上,我们遇到了以AR和VR为代表的空间计算,其正处于从进化阶段向革命阶段过渡的边缘。虽然AR和VR已经发展了一段时间,但它们现在已经准备好超越其小众起点,并获得更广泛的主流应用。这一关键时刻标志着其从早期小众爱好者到更广泛、更多样化用户群体的转变,具有重要意义。
这种融合的独特之处在于AI对空间计算的深度参与。这不仅仅是技术的共存,它们协同的力量将会重塑我们的世界。这种融合是无与伦比的,甚至超越了历史上的一些革命性事件,比如电力或工业革命对历史的影响。虽然这些过去的里程碑重塑了行业并加速了进步,但当前的融合超越了行业和基础设施的范畴,重新定义了人类生存的本质。
除了应用于计算机视觉之外,AI凭借其复杂的数据分析、预测和决策能力,已经融入了我们的生活。它微妙地影响着我们的选择,从我们关注的内容到我们选择的产品,它通常在幕后运行以提升我们的体验。AI已成为我们日常决策中的一个无声无息但无时不在的伙伴,不断帮助我们提高效率、个性化程度和便利性。
与此同时,空间计算凭借其无缝融合数字世界和物理世界的能力,增强了我们与技术的互动。这不仅为我们的物理现实提供了数字覆盖,更让我们能够生活在一个有情境感知的沉浸式数字环境中。在这个空间维度中,数字与物理之间的界限消失了,一种互动和参与的新途径开启了。
这一时刻标志着从被动消费技术到主动参与数字世界的转变,从仅仅观察数字领域到亲身居住其中的转变。AI与空间计算的融合不仅将重新定义我们的日常体验,还将重新定义工作、教育、医疗服务和娱乐的本质。
本质上,这种融合代表了AI(一种正在不断发展的技术)与空间计算的变革潜力的融合。它为未来铺平了道路,未来不仅技术发达,而且将更加深刻地实现以人为本。这是一个有望实现前所未有的创新和变革的时刻,与历史上其他任何时刻都不同,在这个时刻,数字世界和物理世界的结合创造了一个人类潜力无限的现实。这是一个超越时间和空间的时刻,它定义了一个创新和想象力相结合的时代,重新定义了人类互动和体验的真正本质。
难忘的过去:第一张照片、第一部电影、第一台电视
在历史的长河中,让我们回到那个捕捉瞬间的概念本身就是一场革命的时代。第一张照片的创作无疑是视觉表现方式的巨大转变。它赋予了人类捕捉瞬间并使之永存的强大能力,否则这一瞬间可能会消失在历史的迷雾中。通过照片,我们发现了一种捕捉生命短暂之美的方法,以有形的形式为子孙后代留下珍贵的记忆。
在这个里程碑之后,第一部电影的诞生标志着我们传达和保存故事的能力取得了更大的飞跃。这项技术奇迹是叙事的“催化剂”,使我们能够以曾经仅限于梦境的方式体验故事。电影成了娱乐的中心,成为一种通过讲故事的通用语言弥合差距以及将人们联系起来的媒介。它将灯光昏暗的剧院变成了通往新世界的大门,使观众能够坐在舒适的座位上前往遥远的地方和过去的时代。
然后,随着第一台电视被打开,人类历史上的另一个里程碑——电视开始闪烁。这是一个将世界直接引入我们的客厅的起始,有效地创造了一扇通往外部世界的窗户。获取信息和娱乐仅靠阅读书籍和听收音机的日子已经一去不复返了。电视打破了交流的障碍,让世界各地的事件以视觉的方式展现在我们眼前。新闻、艺术、文化和娱乐等内容不再遥远。现在,这些节目内容让更多的观众可以看到,从而丰富了人们的生活,并拉近了世界各地人与人之间的距离。
过去的这些历史时刻深刻地展示了技术变革的力量。它们阐明了创新如何不断重塑我们的世界,重新定义我们如何捕捉、体验和传达自身存在的本质。如今,以VR和AR为代表的AI和空间计算的融合也预示着一场深刻的变革,它将会重塑我们对数字世界和物理现实的感知以及我们与之互动的方式。这种融合不仅仅是一种技术演进,更代表了一种范式的转变,开启了通向未来的一扇大门,让现实世界与虚拟世界之间的界限变得更加模糊。它带领我们进入一个创新与想象力无限的时代,而且我们的存在几乎神奇地与AI和空间计算的世界无缝交织在一起。
VR和AR的黎明
如今,我们正处于一场技术革命的前沿,这令人不禁想起之前更早出现的范式转变。在这种情况下,VR和AR的出现激发了我们集体的想象力。这些变革性技术正在重新定义我们与世界互动和感知世界的方式。
VR作为一项开创性的创新,赋予了个人进入完全数字化环境的独特能力。人们戴上VR头戴显示设备时,便融入了一个虚拟的世界,模糊了物理世界与数字世界之间的边界。这种沉浸感使用户能够探索各种合成的逼真的环境,从梦境般的场景到栩栩如生的训练场景。VR的影响远远超出了单纯的娱乐范畴,已经渗透到游戏、职业培训甚至医疗服务等领域,它可以复制实现世界的真实场景以达到教育和技能拓展的目的。
相比之下,AR采用了不同的方式。AR不是将用户淹没在完全数字化的场景中,而是将数字元素叠加到我们的现实环境中。通过数字信息的增强,AR提升了我们对物理环境的感知和理解。AR为现实世界提供了个性化的数字覆盖,提供了增强我们体验的背景信息和见解。无论是通过实时方向来协助人们进行城市导航,还是在手术过程中为医疗专业人员提供重要的患者数据,AR都将重新定义我们与周围环境互动的方式。
VR和AR都超越了娱乐的范畴,在教育、医疗服务、工程和设计等各个领域取得了重大进展。在教育领域,VR为学生提供了进入历史事件场景或人体内部运行场景的机会,将学习转变为沉浸式的难忘体验;在医疗服务领域,AR可以让外科医生在手术过程中随时访问重要的患者数据,从而提高手术精度和保障患者安全;在建筑和设计领域,VR和AR都有助于实时建模和可视化,帮助专业人员做出明智的决策并且使其更加有效地协作。
VR和AR的出现不仅代表着技术的进步,更预示着我们学习、工作和娱乐的方式将发生根本性转变。这些技术开创了一个全新的时代,改善了体验式学习,提高了医疗实践水平,并对设计和工程等领域做出了革命性的贡献。随着人类对VR和AR潜力的探索,我们将了解它们如何塑造未来,如何创造数字世界和物理世界无缝共存的现实,如何以多种方式改善我们的生活。
空间计算的前景
在技术的最前沿,我们发现空间计算的非凡发展无缝融合了AR和VR,这种融合有望重新定义我们对人机交互的理解。
空间计算的潜力远远超出了单纯的技术进步,它预示了我们在数字世界和物理世界的感知和交互方面的深刻革命。在这个沉浸式的领域里,数字元素和物理元素无缝融合,从根本上改变了我们处理数据、信息和面对周围世界的方式。
想象一下未来,数字信息与你所处的物理环境错综复杂地融合在一起。在这个空间维度里,数字元素摆脱了屏幕的限制,成为你周围环境中不可或缺的组成部分。无论你是在三维空间中进行复杂的数据集可视化、像操控有形物体一样操控虚拟物品,还是接收叠加在物理环境上的相关信息,空间计算都不仅可以增强工作、学习和休闲体验,还为我们提供了一个感知现实的全新视角。
AR和VR的空间计算应用简直令人惊叹,它们有可能给很多职业带来革命性的转变。建筑师可以从草图无缝过渡到沉浸式三维模型,能够实时设计和让结构可视化;医疗从业者可以利用AR在手术过程中获取关键信息,从而提高精确度和安全性;在教育领域,AR和VR开启了体验式学习的新时代,让学生能够在空间背景下近距离探究历史事件、科学现象或进行艺术创作,这使教育变得更加引人入胜和令人难忘。
此外,AR和VR有能力重新定义协作和沟通。在空间领域,距离变得无关紧要。团队可以在共享的虚拟空间中轻松协作,无论现实的距离有多远,虚拟空间都可以帮助人们培养团队意识。这种协作潜力延伸到各个领域,包括设计领域,专业人员可以实时合作开展项目,而无须考虑他们的物理位置;在医疗健康领域,AR和VR使远程医疗达到了新的高度,因为医疗专家可以通过AR叠加来指导手术过程,这突破了地理界限。
AR和VR的前景远远超出了技术的范畴,它们重新定义了我们的现实并释放出无限的潜力。当跨过这个变革时代的门槛时,我们进入了一个数字与物理之间的界限消失的世界,这为众多的机会铺平了道路。在这个世界里,创新是无止境的,AR和VR增强了我们生活的方方面面。这预示着未来现实和虚拟的无缝融合会创造更丰富、更沉浸的存在。
领导者的当务之急
在瞬息万变的技术领域,既有的企业领导者和那些渴望掌舵的人面临的不仅仅是选择,而是必须非常严肃地沉浸在本书提供的深刻见解之中。在这个技术融合飞速发展的时代,在这个不断变革的领域,技能熟练、信息灵通和拥有竞争力不仅仅是非常重要的事,而且是最重要的必要条件。
这一当务之急的核心是一个与技术世界中清晰可见的事实产生共鸣的基本真理:“AI不会取代你的工作,但使用AI的人会取代你的工作。”这句简洁的陈述概括了我们当前现实的症结所在。它认识到人类专业知识不可替代的作用,同时强调人类智力与AI能力之间的共生关系。这不是人类与机器的问题,而是人类与AI合作来释放前所未有的潜力的问题。
在接下来的章节中,我们将开始广泛探索AI和空间计算的多方面前景。这次旅程将带我们全面了解它们的重要性、在各个领域的深远应用,以及如何熟练驾驭这一不断变化的领域所需的多方面技能。
AI与空间计算这些前沿领域的融合不仅仅是技术的融合,还代表着可能性和机遇的爆发。这些不是短暂的趋势,而是变革的力量,它们将会重塑行业、重新定义商业模式,并彻底改变我们与技术和整个世界互动的方式。
在这个不断变化的环境中,领导者肩负着重大责任。他们不仅有责任理解AI和空间计算的复杂性,而且有责任率先有效地利用它们的能力。拥抱这些前沿领域是保持创新先锋地位的关键,旨在引导企业走向一个未来,其中的适应性、创新性和技术流畅性是成功的基石。
作为领导者,你不仅仅要掌舵,还要具备在未知水域扬帆的远见和勇气,要充满信心地指导你的团队,要知道AI和空间计算的融合是这样一段不仅有望带来技术进步,还会带来以人为本的深刻变革的旅程。你还需要塑造一种组织文化,不仅为未来做好准备,还要准备在未来实现蓬勃发展。
未来充满了诱人的前景和令人兴奋的可能性。在这个时代,领导者不仅仅要管理变革,还要拥抱变革,以好奇心和勇气引领并抓住这些融合前沿的变革力量。未来的领导者懂得创新是无限的,通过拥抱变革,并利用AI和空间计算的能力,我们可以创造一个不仅技术先进而且以人为本的未来。让我们以坚定的决心和远见,踏上这段探索和转型之旅。未来正在向我们招手,我们必须做好迎接它的准备。
在下一节中,我们将揭示商业环境中空间计算的本质,并从探索其基本定义和所需的核心技术开始。
什么是空间计算
空间计算是很多商界人士在苹果公司于2023年6月发布Vision Pro设备时第一次听到的术语。但是,这并不是一个新术语。有人可能会说,我们的手机就是原始的空间设备。事实上,AR、VR、XR(扩展现实)和AI领域的很多专业人士多年来一直致力于空间计算。
为了理解空间计算的商业价值,我们首先必须为商业世界创建一个工作定义,并解释它将带来的市场机遇。
一旦这样做了,我们就可以了解商业和计算将如何变化,以便为这一转型做好准备。
很多人追溯到西蒙·格林沃尔德(Simon Greenworld)2003年在麻省理工学院发表的硕士论文,在其中,空间计算首次被定义为学术术语。当时他还是麻省理工学院媒体实验室美学和计算小组的研究员。在论文中,他探讨了计算结构的空间环境,并这样定义空间计算:“空间计算是人类与机器的交互,其中机器保留并操纵真实物体和真实空间的参照物。它是让机器在我们的工作和娱乐中成为更好伙伴的重要组成部分。”
他进一步定义:“在人类与机器的交互中,机器保留并操纵真实物体和真实空间的参照物。在理想情况下,这些真实的物体和空间对用户具有优先意义。空间计算更关注体验的质量。在大多数情况下,这意味着设计的系统要突破屏幕和键盘的传统界限,而不会被束缚住,陷入一种界面或温和的模拟。为了让机器在我们的工作和娱乐中成为更全面的伙伴,它们需要加入我们的物理世界。它们将不得不操作我们操作的物体,而我们需要使用我们的物理直觉来操作它们。”
格林沃尔德的定义并非独一无二。很早的时候,曾是风险投资界和科技界宠儿的Magic Leap(美国增强现实公司)的技术人员将他们正在打造的设备描述为空间计算设备。他们将空间计算定义为一种新的计算形式,利用AI和计算机视觉将虚拟内容无缝融入我们周围的物理世界。
他们通过一款名为Magic Leap One的设备做到了这一点。在2018年由前CEO(首席执行官)罗尼·阿博维茨(Rony Abovitz)和其他几名重要的Magic Leap员工撰写的一篇题为《空间计算:给我们技术朋友的概述》的文章中,他们解释了该公司如何将空间计算定义为一种新的计算形式,让数字内容超越当今的二维屏幕和计算机的限制,并深入研究了其中的一些技术构件。[1]从那以后,Magic Leap就不再使用空间计算这个术语,而是使用AR一词,这一变化可以在其最近的媒体采访中和网站上看到。
在苹果公司2023年6月召开全球开发者大会(WWDC)期间,该公司公开表示,空间计算“将数字内容与物理世界无缝融合,同时让用户可以身处其中并与他人保持联系”。这一信息进一步反映在其网站和针对开发者的visionOS(苹果的空间计算操作系统)资料中。
在2023年的Meta Connect开发者大会召开期间,Meta公司宣布推出Meta Quest 3(一款头戴显示设备),该产品采用新的芯片,使设备能够更好地穿过混合现实,通过先进的空间映射更好地扫描物理世界,以及实现虚拟物品的空间锚定,让佩戴者每次使用设备时都可以返回起点。Meta公司的高管还谈到通过智能眼镜的发展迎来下一代计算平台,并表示该公司的新款眼镜将成为“未来很长一段时间内市场上最有价值的空间计算眼镜”。该公司还宣布了新的雷朋Meta智能眼镜,该眼镜将在2024年实现多模态,能够利用AI了解佩戴者周围的环境。
微软则将空间计算定义为设备感知周围环境并以数字方式表现这种感知的能力,以及在人机交互中提供新功能的能力。
AWS(亚马逊云计算服务)将空间计算定义为虚拟世界与物理世界的结合,通过将物理世界虚拟化,并将虚拟信息叠加到物理世界上,用户可以通过自然和直观的方式与数字内容进行交互。对AWS来说,这种结合增强了我们在物理或虚拟场景上进行数据可视化、数据模拟以及与数据交互的方式。亚马逊技术副总裁比尔·瓦斯(Bill Vass)在他的博文《预测未来的最佳方式是模拟未来》中表示,“空间计算是协作体验的动力”[2]。
英伟达公司通过Omniverse产品为其开发人员引入了空间框架,而Niantic(一家游戏公司)通过其视觉定位系统(VPS)专注于空间映射,该系统使用户能够将虚拟物品放置在特定的现实世界位置,并让该物品持续存在,因此一个人可以留下一个物品供其他人寻找,从而使现实世界的全球桌上游戏变得栩栩如生。
为当今的商业世界定义空间计算
空间计算需要一个有效的定义,这样我们才能与这项新技术保持同步。一个可靠的定义将有助于我们理解空间计算在整个商业世界中的意义,以及它将如何影响商业、工作、教育、购物、休闲等领域的未来。
空间计算是人类与技术互动方式的下一次转变。它涉及AI、XR、物联网(IoT)、传感器等一系列技术,以赋能和创造一种新的人机交互形式,比以往任何时候都更具沉浸感和影响力。空间计算将重塑目前固有的空间人机交互。换句话说,它将允许在三维空间进行人机交互,这有助于实现更真实的表现和互动。
空间计算使用与环境相关的信息,以实现对使用者来说最直观的操作方式。企业利用空间计算进行数字化转型,这将使它们在竞争中脱颖而出,并为它们在虚拟世界和物理世界日益融合的环境里成长起来的下一代中取得成功奠定基础。
空间计算将带来实用且有影响力的用例。它使得工作人员可以轻松地“随身携带”工作站,即一块无限的画布(一种屏幕替代形式)。通过AI,空间计算将开创一种与计算机和其他机器交流的新方式,这些机器能够解释我们的世界,并实现人机交互的新范式。
现在,我们在手机上体验的初级AR正在为明天的空间计算播下种子。我们已经看到了空间计算用户界面的早期迹象。空间计算将消除障碍、缩短距离,并实现人类从未经历过的大规模协作。它将通过空间计算机在我们的物理空间中实现互联网及其数据的实体化。通过使用各种技术,空间计算机将了解佩戴者及其所处的物理空间,这反过来又可以实现实时更新和交互。它是“活的”。它让我们可以与计算机进行更直观、更自然的交互,让设备能够更好地理解、映射和驾驭我们的物理环境。这些设备能“看到”我们所看到的世界,并了解我们的世界。在某些方面,空间计算使我们能够像与物理世界互动一样轻松地与虚拟世界互动。
人类天生是空间生物,能够以立体的方式理解世界并与之互动,因此空间计算有望让我们回归空间思维。随着年龄的增长,当我们被迫将创造力平面化时,我们的空间思维往往会丧失。空间计算有望提升我们的生产力、效率和创造力,并促进我们与他人的交流。无论在商业领域还是在生活的其他方面,空间计算最终都可以帮助我们做出更好的决策。这是一种革命性的技术变革,我们的设备从必须挂在墙上、放在桌子上或拿在手中的静态设备,转变为开始淡入背景并让我们重新关注周围物理空间(尽管是增强的)的设备。
我们现在正在经历AI革命,与此同时,我们正处于一种新的计算范式的风口浪尖,物理和虚拟的东西无缝融合,为创造力、创新、人类连通性和新的工作方式创造了无限的可能性。这对人与技术的互动以及人与人之间的互动都会产生深远的影响。它消除了障碍,拉近了距离,并实现了共存。空间计算将迫使我们探索物理世界与虚拟世界之间的融合。换句话说,它将让我们使用的设备以及使用这些设备的方式融入我们日常生活的自然流程和模式。
空间计算将数字信息和体验带入物理环境。它会考虑佩戴者的位置、方向和背景以及周围的物体和表面。它使用一种新的先进的计算类型来理解与虚拟环境和佩戴者相关的物理世界。它通过使用新兴的接口设备来实现这一点,比如内置了摄像头、扫描仪、麦克风和其他传感器的可穿戴设备。新界面以手势和手指运动、视线追踪和语音的形式出现。GPS(全球定位系统)、蓝牙和其他传感器使创建包含物理环境的数字内容成为可能。
从购物到工作、从规划到娱乐,我们周围的世界将通过空间计算以新的方式与我们互动。这是计算、通信和三维空间融合的地方。空间计算可以实现高级手势识别(比如识别我们的手部动作并将其作为指令),并且用户的每只眼睛都可以看到分辨率高于4K的图像。
那么,这与VR和AR有何不同呢?空间计算似乎与VR或AR没有什么不同。AR是将数字内容叠加到物理空间中,VR是一个完全沉浸式的虚拟环境。XR频谱是空间计算的一部分,但它不是其唯一的支撑技术。每个人都在考虑AI、XR、传感器、物联网和新水平的连接。AI是将空间计算带给大众的最重要的基础技术之一。
换句话说,空间计算是硬件和软件的结合,它使机器能够在我们不告知的情况下理解我们的物理环境。反过来,它使我们能够创建在物理环境和虚拟环境中都有用途的内容、产品和服务。空间计算是一种变革性的新技术,通过采用一系列技术将物理世界和虚拟世界无缝融合,使我们能够与机器人、无人机、汽车、虚拟助手等一起探索世界。
在关键技术进步的推动下,未来空间计算有望实现大幅增长。这些技术进步包括光学方面的巨大进展、传感器和芯片的小型化、真实描绘三维图像的能力以及空间计算硬件和软件的不断发展。在AI重大突破的支持下,这些创新将使空间计算在未来几年对大规模企业越来越具有吸引力。
以下是我们为商业专业人士提供的空间计算的工作定义。这个定义是本书第一作者凯西·哈克尔在2023年11月为《哈佛商业评论》撰写的一篇文章中首次使用的定义的改进版本,本书两位作者共同完善了该定义。
空间计算是一种不断发展的以三维世界为中心的计算形式,其核心是使用AI、计算机视觉和XR将虚拟体验融入物理世界,从而使人摆脱屏幕的束缚,并使所有表面都成为空间界面。它让人、装置、计算机、机器人和虚拟生物在三维空间中通过计算来辨识方向。它开创了人与人交互以及人机交互的新范式,增强了我们在物理环境或虚拟环境中对数据进行可视化、模拟和与之交互的方式,并将计算的范围从屏幕扩展到你所能看到、体验和了解的一切事物。
空间计算使我们能够与机器人、无人机、汽车、虚拟助手等一起探索世界,但它不仅限于一种技术或一种设备。它是软件、硬件和信息的混合体,使人类和技术能够以新的方式联结起来,它开创了一种新的计算形式,其对社会的影响可能比个人计算和移动计算对社会的影响更大。
为了厘清概念,我们还必须讨论空间计算不是什么。它不仅仅是XR,也不仅仅是一款设备或一家公司。它是人类与技术互动方式的一次翻天覆地的变化。
当我们被问及空间计算与元宇宙(两位作者都写过相关文章,并对元宇宙进行过深入研究)等概念之间的区别时,耐克元宇宙工程总监安德鲁·施瓦茨(Andrew Schwartz)的一条推文指出了为什么空间计算可以带来变革,以及它与元宇宙有何不同。他写道:“如果互联网的组织原则是信息希望被共享,而元宇宙的组织原则是信息希望被体验,那么空间计算就是将创造这些体验所必需的工具融合在一起。”
空间计算是新技术变革的推动者,但它自身也由一系列技术所推动,我们将在下一节以及整本书中深入探讨这些技术。
空间计算涉及哪些技术
空间计算世界依赖于一系列基础技术来驱动其沉浸式体验。这些技术包括AI和内容创作工具,以及连接解决方案和云计算。在本节中,我们将探索这些技术及其在空间计算中的关键作用。在空间计算领域,数字世界和物理世界融合在一起,创造出非凡的体验。
AI基础
AI是空间计算的基石,包含多个子领域。
机器学习(Machine Learning,ML):空间计算的支柱,使系统能够从数据中学习并适应,而无须进行明确的编程。它让机器可以识别模式、做出决策,并随着时间的推移提高其性能。在空间计算中,机器学习为AR导航中的路线规划等应用提供了支持,这些应用通过分析实时传感器数据为用户提供最高效和用户友好的路线。通过不断完善其对环境的理解,机器学习在增强用户体验方面发挥着关键作用。
深度学习(Deep Learning,DL):机器学习的一个子集,专注于使用多层神经网络来对复杂模型进行建模。在空间计算中,深度学习能够创建处理大量数据的复杂模型,这对于AR和VR应用中的图像识别和对象检测至关重要。该技术增强了空间设备识别用户周围环境中的物体和空间并与之交互的能力。
强化学习(Reinforcement Learning,RL):机器学习的一种形式,其中智能体通过采取行动和接收反馈或奖励来学习如何做出决策。在空间计算中,强化学习用于开发游戏和娱乐应用中的动态角色行为。它让角色能够根据用户的输入调整自己的动作,从而创造更具沉浸感和互动性的体验。此外,强化学习有助于空间设备中使用的实时决策过程,以改善用户交互。
程序化生成(Procedural Generation):一种用于通过算法生成内容的技术,可以创建大量不同的风景、物体和场景。在空间计算中,程序化生成为沉浸式环境带来了动态且不断变化的维度。这项技术通常用于生成三维世界,使每个用户的体验都是独一无二的。它对于游戏、虚拟模拟和AR等应用至关重要,这些应用需要即时生成内容以保持新鲜度和多样性。
神经网络(Neural Networks):受人脑结构启发的计算模型。它们是各种AI任务的基础,包括模式识别和数据分析。在空间计算中,神经网络有助于处理复杂的任务。例如,它们在计算机视觉中发挥着关键作用,能够识别现实世界中的物体和形状。这种功能对于在AR应用中增强物理环境非常重要,可以提供实时信息并增强用户理解。
计算机视觉(Computer Vision,CV):一种让机器能够理解和解释来自物理世界的视觉信息的技术。在空间计算中,计算机视觉处于最前沿,它帮助空间设备识别用户周围的物体和空间,并与之交互。它在AR导航等应用中发挥着重要作用,可以将数字信息叠加到现实世界中,为用户提供实时方向和指引。
传感器技术(sensor technology):传感器技术是空间计算的感觉神经系统,为设备提供感知物理世界的能力。空间设备配备了各种传感器,包括摄像头、陀螺仪、加速度计、GPS、光探测和测距(激光雷达)等。这些传感器采集与用户周围环境相关的数据,如运动、位置、光照水平甚至深度信息。在空间计算中,传感器在理解用户的环境和移动、促进精确跟踪、手势识别和物理空间映射方面发挥着关键作用。这些传感器是空间设备的眼睛和耳朵,使它们能够为用户提供实时的、环境感知的体验。无论是用于沉浸式游戏、AR导航,还是用于工业环境的精确地图绘制,传感器技术对于创建动态体验和交互式空间体验都十分关键。
空间音频(spatial audio):空间音频是空间计算领域沉浸式体验的无名英雄。它改变了我们感知声音的方式,让我们沉浸在与环境视觉协调一致的三维听觉情境之中。无论你是在探索虚拟世界、参加虚拟音乐会,还是在听AR讲故事,空间音频都可以为体验的听觉部分增加深度、维度和真实感。它可以让声音从空间中的特定位置发出,从而使用户产生方向感和距离感,甚至可以模拟不同环境的声学效果。空间音频不仅丰富了我们的娱乐体验和游戏体验,而且在训练模拟、虚拟会议和建筑设计中得到应用。这项技术彻底改变了我们与声音互动的方式,使音频成为沉浸式体验中不可或缺的一部分。
眼动追踪(eye tracking):眼动追踪技术已经成为空间计算领域的游戏规则改变者,为了解用户的意图和兴趣提供了直接的窗口。通过精确监测眼球运动和注视方向,它可以实现用户与空间设备更自然、更直观的交互。从VR和AR到游戏和医疗健康应用,眼动追踪都可以增强用户体验。它让设备可以根据用户的视线进行调整,从而提供有针对性的信息,增强沉浸感,甚至提供个性化的内容。除了娱乐之外,眼动追踪在帮助行动障碍患者和协助诊断程序等医疗健康方面也具有很好的前景。借助这项技术,观看行为成为一种强大的工具,以之前我们难以想象的方式驾驭和塑造数字世界和物理世界。
语音识别(voice recognition):在AI能力的推动下,语音识别技术已经成为让用户在空间计算中轻松交流的基石。借助语音的力量,用户可以自然地与空间设备进行交互,仅用声音就可以发出指令、提出问题并接收响应。AI算法是语音识别的基础,其使这些系统能够理解人类语言、口音和语境的细微差别。这项技术不仅为日常工作带来了便利,还为无障碍交流打开了大门,让具备各种能力的个人都能参与空间环境。无论是在AR界面导航、控制智能家居设备方面,还是在触手可及的实时语言翻译方面,AI增强的语音识别都已经成为连接人类意图与数字行动的桥梁。在快速发展的空间计算领域,语音识别就像一部交响乐,使我们的言语与我们想要的行动和体验协调起来。
异常检测(Anomaly Detection):异常检测涉及识别数据中的异常模式或行为。在空间计算中,这项技术对于确保安全至关重要。通过分析传感器数据并识别异常情况,空间设备可以提醒用户潜在的问题。异常检测在与预测性维护相关的应用中尤为重要,它有助于预测设备故障并减少停机时间。
基于物理的模拟(Physics-Based Simulation):基于物理的模拟对在空间计算中创建逼真、动态的虚拟环境来说十分重要。空间应用程序可以模仿现实世界的物理交互,增强用户的存在感和互动感。医疗培训模拟、建筑设计和游戏等应用程序利用这项技术来提供逼真的场景和用户体验。
优化算法(Optimization Algorithms):优化算法是空间计算中简化流程和决策的基础。它们确保系统高效、有效地运行。在零售商店布局优化等应用中,这些算法会分析客户的移动数据,并帮助零售商通过优化商店布局和产品摆放来增强顾客的购物体验。
自然语言处理(Natural Language Processing,NLP):自然语言处理使机器能够理解人类语言并与之交互。在空间计算中,自然语言处理促进了用户和空间设备之间的无缝交流。这对于涉及实时语言翻译的应用尤为关键,AR眼镜可以将口语即时翻译成字幕或音频,让讲不同语言的人可以轻松交流。
语言识别(speech recognition):一种将口头语言转换为文本或可操作数据的技术。在空间计算中,这项技术有助于用户交互。它使用户能够发出语音指令并接收来自空间设备的响应,使语音控制界面成为AR和VR应用程序不可或缺的一部分。
生成式AI(Generative AI,GenAI):一项为空间计算带来一个新的创造力维度的技术。它使应用程序能够创建三维内容和模拟,从而扩展了沉浸式体验的可能性。例如,在时尚设计和奢侈品领域,生成式AI可用于处理体积数据、分析供应链信息以及生成产品及设计的虚拟三维模型。
这些技术共同构成了空间计算的AI框架,为其注入了在现实世界中交互、适应和创新的能力。
与空间计算相关的其他关键技术
在空间计算的多层面世界中,沉浸式体验的实现还有赖于多项关键技术的共同支撑。这些技术包括内容创建和设计工具、渲染和图形技术、云和边缘计算、高速连接以及物联网集成。所有这些构件都在塑造空间计算的格局中发挥着独特而重要的作用,增强了视觉效果、计算能力,带来了更广泛的连通性等。我们要深入研究这些技术的重要性以及它们如何为空间计算生态系统赋能。
内容创建和设计工具:内容创建和设计工具是空间计算的沉浸式体验背后的工匠。它们使创作者能够构建交互式的、引人入胜的空间内容,包括虚拟世界、AR应用程序、三维模型等。这些工具有助于空间环境、物体和角色的设计,从而将数字元素无缝整合到物理世界中。内容创建和设计工具是空间艺术家的画笔和画布,能够将富有想象力的概念转化为有形的、可体验的现实。
渲染和图形技术:渲染和图形技术是使空间计算的真实视觉体验得以实现的画布。无论你是在探索虚拟情境,还是在与AR叠加的内容进行交互,视觉体验的质量都取决于渲染和图形技术的实力。这些系统可以通过复杂的处理过程将数字信息转化为视觉上令人惊叹的表现形式,包括从光照和阴影到纹理和颜色的所有方面,确保你在空间领域中看到的内容不仅令人信服,而且令人惊叹。
云和边缘计算:云和边缘计算是一对动态组合,能满足空间计算的计算和存储需求。云提供了复杂的空间体验所需的大量数据和处理能力,支持多个设备之间的无缝数据同步和获取。边缘计算使实时处理更接近空间设备,减少延迟并确保交互即时实现。它们共同创建了空间计算的支柱,提供计算能力和存储容量来实现其全部潜力。
5G和6G连接:5G(第五代移动通信技术)和新兴的6G(第六代移动通信技术)连接是空间计算的超级高速公路,确保设备和云之间快速可靠的数据传输。这些技术能够支持信息的实时、无缝交换,从而实现高质量、低延迟的空间体验。无论是流式传输AR内容、虚拟项目协作,还是在共享虚拟空间中进行游戏,5G和6G连接都是确保流畅和不间断连接的重要基础设施。
物联网集成:物联网集成是将空间设备与更广泛的互联设备及系统联系起来的纽带。空间计算不仅仅涉及设备之间的交互,还涉及这些设备如何融入更大的互联技术生态系统。物联网集成让空间设备可以与智能家电、城市基础设施、医疗健康系统等进行通信。它通过创建一个协同工作的设备网络来改善我们的日常生活和体验,从而扩展了空间计算可以触达的可能性。
真实使用案例
下面介绍一系列引人注目的AI驱动的空间计算应用案例,从重新想象的导航到预测性维护,这些现实世界的案例充分展示了AI在塑造空间计算领域变革性体验方面所发挥的强有力的作用。
AR导航:AR导航应用中的AI算法彻底改变了我们在周围环境中导航的方式。这些应用程序提供实时方向和基于位置的信息,将直观的视觉提示(如箭头和街道名称)叠加到用户的视野中。无论是在繁华的城市中寻找最快捷的路线,还是在陌生的地方发现隐藏的宝石,AI增强的导航都可以简化行程。
虚拟室内设计:空间计算与AI相结合,改变了我们想象室内设计的方式。AI驱动的应用程序使用户能够将家中的家具和装饰可视化。通过使用计算机视觉来确定房间布局和设计偏好,这些应用程序可以提供量身定制的设计建议。对房主和室内设计师来说,这是一个游戏规则改变者,可以在进行任何实际更改之前提供不同设计的预览。
工业环境中的预测性维护:工业环境中AI与空间计算的结合产生了预测性维护解决方案。AI算法可以分析来自机器和设备的传感器数据,在潜在故障发生之前进行预测。通过减少停机时间和提高运营效率,该应用为企业节省了时间和资源,最终提高了生产力。
医疗培训模拟:医疗健康专业人员正在VR环境中采用AI驱动的模拟操作。这些模拟操作为医疗从业者提供了一个无风险的环境来进行手术和程序练习。通过提供真实的反馈来增强这些场景,AI使医疗健康服务的提供者能够改进他们的手术技能,最终提高患者的安全性、缩短恢复时间和改善术后护理水平。
零售店布局优化:AI在零售业有一个深度的应用,即优化商店布局和产品摆放。通过使用空间计算分析客户的移动模式,零售商可以创造既有吸引力又有利可图的购物体验。AI帮助零售企业提升购物者流量,并使产品摆放与客户行为保持一致。
时尚设计和奢侈品行业:时尚设计和奢侈品行业利用AI优化供应链、跟踪不断变化的时尚趋势并对设计进行革命。时尚界的AI融合了计算机视觉来处理体积数据,以实现准确的匹配和精确性。机器学习有助于分析供应链数据和改进流程,而生成式AI引入了三维虚拟模型,从而改变了时尚设计领域的格局。
智慧城市规划:AI是城市规划信息化背后的驱动力,它分析来自整个城市的传感器和摄像头采集的数据。空间计算有助于这些数据的可视化,帮助城市规划者在交通管理、基础设施发展和公共安全等方面做出明智的决策。AI可以确保城市的管理得到优化,以实现高效和可持续的发展。
实时语言翻译:AI和空间计算的协同作用促进了实时语言翻译的发展。由AI驱动的AR眼镜可以将口语转换为字幕或音频,从而实现讲不同语言的人之间的无缝交流。这项技术超越了语言障碍,促进了全球化世界中的协作和理解。
安全审核和检查:AI驱动的AR眼镜彻底改变了工业环境中的安全审核和检查。这些智能眼镜可以实时识别潜在的危险和合规问题。它们通过为安全审核员提供有价值的信息来预防事故并确保遵守法规,从而提高工作场所的安全性。
建筑设计和可视化:建筑师正在采用AI和空间计算来创建建筑物和城市环境的三维虚拟模型。这些模型使建筑师能够更有效地将设计可视化并迭代设计,从而提高建筑领域的精度和创造力。
游戏和娱乐:AI驱动的算法增强了VR和AR中的游戏体验和娱乐体验。强化学习应用于角色行为,提供动态和自适应的游戏玩法。程序化生成技术可以生成逼真的三维环境,而神经网络则有助于完善角色行为和生成环境,从而使游戏体验和娱乐体验更具沉浸感和互动性。
在本节中,我们揭示了推动空间计算沉浸式体验的关键技术,从AI及其子领域到其他关键技术构件。这些技术共同塑造了物理世界和数字世界融合的情境,从而创造出非凡的体验。现在,我们将注意力转向那些利用这些技术力量的受益者身上。
谁是空间计算的受益者
空间计算带来了一拨变革性的好处,惠及各个领域和各行各业的广泛受益者,这些受益者有可能成为空间计算领域的资助者。这项技术从根本上改变了我们与数字世界和物理世界交互的方式,带来了诸多益处。让我们探讨一下,这些受益者是谁,以及他们如何利用空间计算的潜力来满足各自特定的需求和目标。
主要受益者
消费者和最终用户:空间计算最重要的受益者是消费者和最终用户。他们体验了从AR游戏到VR模拟的沉浸式娱乐,获得了全新的享受和参与度。此外,在教育和培训方面,最终用户受益于真实的交互式学习体验,从而塑造了知识传递的未来。
医疗健康:空间计算在医疗健康领域发挥着举足轻重的作用。一方面,医疗专业人员利用这项技术进行手术规划和培训,它为外科医生提供一个无风险的环境来练习复杂的手术。另一方面,患者从先进的可视化和远程医疗应用中受益,获得改进的诊断和治疗机会。
制造业和工业:制造商在空间计算领域找到了有价值的盟友。空间计算有助于产品设计、原型制作和质量控制,缩短了产品面市时间并提高了产品质量。维护和维修技术人员也从中受益,他们可以通过获取AR指令来提高效率和减少错误。
零售:零售商已经利用空间计算来提升购物体验了。AR购物让顾客可以在做出购买决定之前在自己的空间中实现产品可视化,从而减少网上购物的不确定性。此外,库存管理和物流也受益于改进的空间理解和自动化。
时尚和奢侈品:时尚和奢侈品行业正在通过空间计算进行转型。空间计算加快了成衣和定制服装的设计速度,提高了合身性和个性化程度。空间计算设备本身成为时尚宣言,而游戏和娱乐与时尚相融合,开辟了新的收入来源。
游戏和娱乐:游戏行业处于空间计算的最前沿,通过VR和AR为游戏玩家提供沉浸式、交互式的体验。与此同时,娱乐行业精心打造了引人入胜的VR和AR体验,通过AR叠加提升表演和活动的效果。
教育和培训:教育机构利用空间计算提供互动式的、引人入胜的课程,使复杂的科目变得更容易理解。航空和军事等各个领域的培训则受益于提升了学习效果的逼真的模拟。
房地产和建筑:房地产专业人士利用空间计算来提供虚拟参观和AR可视化房产展示,从而简化了买卖流程。建筑师和城市规划者受益于三维建模,以进行精确的设计和客户演示。
交通和汽车:空间计算推动了自动驾驶汽车的发展,改进了导航和安全系统。公共交通受益于改进的路线规划和乘客信息,从而增强了旅行体验。
航空航天和国防:航空航天工业依赖空间计算进行飞机设计、维护和飞行员培训。国防应用则包括为军事人员提供的先进的模拟和训练场景。
艺术和创意:艺术家和设计师采用空间计算工具进行数字艺术创作和三维建模。空间计算引入了全新形式的互动和沉浸式艺术装置,重新定义了创意的边界。建造:在建造行业,空间计算帮助工人将建筑计划可视化,并在施工开始前检测错误。
旅游和文化遗产:游客可以从博物馆和历史遗址的AR导览和互动文化体验中受益。文化遗产保护可以依靠三维扫描和数字归档来保护和颂扬我们的过去。
环境科学:空间计算在环境科学中得到应用,帮助研究人员进行环境监测和数据可视化,为环境保护工作和可持续的未来做出贡献。
便捷性:空间计算通过自适应界面和辅助技术促进便捷性,确保残障人士也能够接触数字内容和环境。
企业和生产力:企业利用空间计算的强大功能来加强协作、远程工作和数据可视化。空间计算优化了决策过程和数据分析过程,在现代商业环境中为企业提供了竞争优势。
这些受益者代表了一个多样化且充满活力的市场环境,依靠空间计算的能力和创新而蓬勃发展,正在塑造各行各业,改善生活,并突破可能的边界。
为什么空间计算对商业有好处
正如我们所了解的,空间计算和AI正在深刻改变商业世界。它们已经通过大量实例为商业创造了价值。在展示技术所能带来的价值方面,AI处于领先的地位,而空间计算更像是一个沉睡的巨人,有待在未来10年被唤醒。
空间计算和AI的商业价值是什么?以下是一份简短的、不全面的列表,列出了我们已经确定的一些益处,我们将在接下来的章节对其进行更深入的分析和补充。
空间计算和AI对商业有益,因为它们能够:
优化和改进流程。
以创新的方式促进沟通和协作。
解决沟通问题。
提供更佳的零售体验,从而减少退货和浪费。
创造更多能让客户乐在其中的沉浸式娱乐。
借助空间视频和记忆捕捉技术,创造全新的留存记忆和记录历史的方法。(我们相信这将是消费者购买空间计算机的主要原因之一。)
通过更好的建模和工具应对气候变化,并做出更好的决策。
具有有效的对外交往的潜力和更好的决策能力,以及将战略远见可视化的能力。
还有更多!
我们坚信,空间计算和AI的融合将深刻改变我们所熟知的商业,并将对我们的生活产生显著的影响。我们撰写本书的目的是帮助读者掌握这一新现实,协助当今和未来的领导者更好地准备在这样的现实中成为领导者并战略性地应用这些技术,不是将其视为一种短暂的潮流,而是将其作为未来商业的重要组成部分。
这就是读者阅读本书时应该期待的内容。在前言中,我们阐述了为什么AI和空间计算对于现代商业领导者至关重要。
在接下来的三章(第1~3章)中,我们将重点探讨AI驱动的空间计算与商业的相关性。在第4~6章中,我们将介绍领导者在这个新时代需要了解的空间计算与AI融合的知识,以及如何在这个技术快速变革的时代成功领导他们的企业。
在本书的最后三章(第7~9章)中,我们将重点关注取得成功的策略,以及如何实施空间计算和AI。然后,我们将探讨AI驱动的商业革命在未来可能会带来什么!
因此,在接下来的章节中,我们将深入探讨AI和空间计算如何改变商业,已产生影响的领导者是谁,以及为什么在这一时刻了解空间计算和AI对于引领当今的商业走向未来至关重要。因此,请准备好将思维超越AI,并着眼于更广阔的前景。未来是AI与空间计算融合的时代!
注释
[1]Takahashi,Dean.(2019 December 10).Magic Leap formally launches Magic Leap 1 and reveals enterprise partners.VentureBeat.
[2]Vass,B.The best way to predict the future is to simulate it.(2022 Sep-tember 12).AWS Spatial Computing Blog.