第5章 渴望新理论:广义相对论与量子力学
在过去的100年里,我们对物理宇宙的认识已经非常深入了。量子力学和广义相对论的理论工具使我们懂得了很多事情,我们能够很好地预言发生在原子、亚原子领域乃至星系和星系团尺度的物理现象,甚至我们还能认识整个宇宙本身的结构。这是了不起的成就。真的,一种普普通通的生命,困在一颗小小的行星上,在一个普普通通的星系的边缘,绕着一颗普普通通的恒星旋转,却能凭他们的头脑和实验,去发现和理解物理宇宙中某些最神秘的特征。不过,物理学家天生是难得满足的,他们还要去把最幽深和基本的东西揭示出来,这就是霍金讲的,认识“上帝的大脑”的第一步。
很多证据说明,量子力学和广义相对论没能达到最深层的认识。它们通常的适用范围是不同的。大多数情形,要么用量子力学,要么用广义相对论,不会同时需要它们。然而,在某些极端条件下,事物质量大而且尺度小——例如在黑洞的中心、在大爆炸时刻的宇宙——为了得到正确的认识,我们既需要量子力学,也需要广义相对论。可是,量子力学与广义相对论,一个像火药,一个像火,它们遇到一起便带来巨大的灾难。当这两个理论的方程混合起来时,好好的物理问题却得不出有意义的答案。那些无意义的答案主要是一些无限大的东西,如关于某过程的量子力学概率的预言,不是一个百分数,而是无限大。大于1的概率已经够荒谬了,无限大的概率是什么呢?我们被迫承认,一定出了什么严重的问题。通过认真考察广义相对论和量子力学的基本性质,我们可以找出毛病在哪儿。
量子力学的核心
海森伯发现不确定性原理时,物理学在那儿拐了一个大弯,但并没有停歇下来。概率、波函数、干涉和量子,都带着认识实在性的崭新思路。不过,顽固的“经典”物理学家们还抱着一丝希望,盼着当一切都弄清楚以后,这些“离经叛道”的东西将树立一个离过去思路不远的理论框架。然而,不确定性原理把所有的“复辟”幻想都扫荡干净了。
不确定性原理告诉我们,当我们考察的距离越小、时间越短,宇宙会变得越疯狂。上一章讲过,当我们想确定基本粒子(如电子)的位置和速度时,会遇到这种情况:用更高频率的光照电子,我们能以更高精度测量它的位置,但那代价是我们的观测更多地干扰了电子的运动。高频率的光子具有更多的能量,所以像针一样“扎”在电子上,从而极大地改变了它的速度。在一间满是小孩儿的屋子里,我们会遇着同样的狂乱场面。你可以精确知道每个孩子的瞬间位置,但你却几乎管不了他们的活动——向哪个方向跑,跑多快——不可能同时知道基本粒子的位置和速度,意味着微观世界在本质上是混沌的。
尽管这个例子在不确定性与疯狂性之间建立了基本联系,它也只说明了问题的一部分。你大概会认为,不确定性只有在我们这些笨拙的自然观测者闯进了它们的场景才会出现。这是不对的。电子在小盒子里飞速地撞来撞去,这个例子可能会让你更明白那是怎么回事。即使实验者没有“直接”拿光子去“打击”电子,电子速度还是会剧烈地不可捉摸地从一点变到另一点。但是,这个例子也没能完全说明海森伯的发现所隐藏的微观世界那迷人的特征。即使在我们所能想象的最宁静的场合,例如空空如也的空间区域,不确定性原理告诉我们,从微观的角度看,那里也有大量的活动。距离和时间的尺度越小,那活动就越狂乱。
明白这一点的关键是量子的会计方法。我们在前一章看到,粒子(例如电子)可以暂时“借”能量来克服难以逾越的物理障碍——就像人们常常可以借钱渡过难关。这是对的。但量子力学迫使我们将这类比向前推得更远。我们想象一个不得不靠借钱生活的人,他去求一个个朋友,每个朋友只能借他几天,他只得找更多的朋友,这家借,那家还,还了借,借了还——他费好大力气借来钱,不过是为了尽快把它还掉。像华尔街狂涨狂跌的股票价格一样,这位可怜的借钱者手里的钱也在瞬间经历着巨大的涨落。不过,当一切平息过后,他的账目说明他还跟当初一样,一点儿也没富起来。
海森伯的不确定性原理说,在微观的距离和时间间隔里,能量和动量也发生着类似的疯狂的涨落。即使在虚空的空间——例如一只空盒子——不确定性原理也会说能量和动量是不确定的:当我们从更小的时间尺度来看更小的盒子时,它们的涨落就更大。仿佛盒子里的空间也不得不“借”能量和动量,不断从宇宙把它们“借来”,接着又很快还回去。那么,在平静的空虚的空间区域里,哪些东西参与了这样的“交易”呢?什么东西都可能有,这真是难以想象的;不过,最终“流通”的还是能量(也包括动量)。E=mc2告诉我们,能量可以转化为物质,而物质也能转化为能量。这样,如果能量涨落足够大,即使在虚空的空间里,它也可以在瞬间生成正反粒子对,例如电子与它的正电子伙伴。因为这些能量必须马上归还,所以粒子对会在瞬间湮灭,归还生成它们的能量。其他形式的能量和动量也发生着相同的事情——如其他粒子的生成与湮灭、电磁场疯狂的振荡、强弱相互作用场的涨落……量子力学的不确定性原理告诉我们,宇宙在微观尺度上是一个闹哄哄的、混沌的、疯狂的世界。费恩曼曾笑话过,“生了灭、灭了生——浪费了多少时间。”由于能量的借与还在平均意义上相互抵消了,所以只要不是微观地去看,空虚的空间仍然显得宁静而太平。但是,不确定性原理说明,宏观的平均的眼光模糊了众多微观的行为。注5我们很快会看到,融合广义相对论和量子力学的那个障碍就是这里讲的那些疯狂的东西。
注5:你可能还在疑惑:虚空间的区域里还能发生什么事情吗?重要的是应该知道,不确定性原理为空间能有“多空”做了限制,与我们平常讲的虚空是不同的。例如,关于场的波扰动(如在电磁场中传播的电磁波),不确定性原理指出,波的振幅和振幅改变的速度也服从一个类似于位置和速度的反比关系:振幅确定得越精确,它改变的速度就越不精确。现在,我们说一个空间区域是空的,意思是没有波经过这个区域,所有的场都是零。说得啰唆一点(但却是有用的),我们可以讲,通过这个区域的所有波的振幅都为零。但是,如果我们对振幅知道得那么精确,则不确定性原理告诉我们,振幅的改变是完全不确定的,我们可以说它有任意的数值。但如果振幅改变了,就说明它们在下一时刻不再是零,即使空间区域还是“空的”。不过,平均说来,场还是零,因为它在某些地方为正,而在其他地方为负,区域的总能量是不会改变的。当然,这只是在平均意义上说的。量子不确定性说明场的能量即使在空虚的空间区域里也是涨落的,我们关心的空间区域距离和时间尺度越小,看到的涨落就越大。因为瞬间涨落得到的能量将通过E=mc2转化为瞬时的粒子和反粒子对,然后它们很快湮灭。结果,能量在平均意义上仍然没有改变。
量子场论
20世纪三四十年代,理论物理学家们在不懈地寻找一种数学形式来描写微观世界的混沌行为,我们可以提几个杰出的名字,如狄拉克、泡利(Wolfgang Pauli)、施温格(Julian Schwinger)、戴森、朝永振一郎(Sin-Itiro Tomonaga)和费恩曼。他们发现,薛定谔的波动方程(第4章讲过)实际上只是微观物理学的一种近似描写——当我们不太深入微观的混沌时(不论实验的还是理论的),这近似是非常好的;但当我们想走得更近时,它就失败了。
薛定谔在他的量子力学方程里遗忘了一个重要的东西,那就是狭义相对论。实际上,他当初确实试过把狭义相对论包括进来,但后来发现那方程做出的预言不符合氢原子的实验观测。于是薛定谔继承了物理学的老传统,将问题分开来解决:不急着跨一大步把所有新发现的物理学东西都塞进一个新的理论;通常更好的办法是小步、小步地走,一步步地把研究前沿的最新发现囊括进来。薛定谔发现并建立的数学方程包含了实验发现的波粒二象性,但在那个初步认识的年代,他没有包括狭义相对论。
但物理学家很快发现,狭义相对论对一个正确的量子力学框架来说是很重要的。这是因为,微观的混沌行为让我们看到了能量可以有多样表现形式——这个观点来自狭义相对论的E=mc2的结果。薛定谔的方法忽略了狭义相对论,也就忽略了物质、能量和运动的重要性。
为了把狭义相对论与量子概念结合起来,物理学家们首先把力量集中在电磁力与物质的相互作用上。经过一系列激动人心的进步,他们创立了量子电动力学。这是后来相对论量子场论(或简称量子场论)的一个例子。说它是量子的,因为概率和不确定性的观点从一开始就融合在理论中了;说它是场论,因为它把量子原理融入了以前的经典力场的概念——在这里,那是麦克斯韦的电磁场。最后,我们说它是相对论的,因为狭义相对论也是从一开始就走进来了。(如果你想对量子场有一个直观的认识,你可以很好地借助经典场的想象——例如,数不清的看不见的力线穿过空间——不过,那图像应该有两个特点:第一,量子场应该由粒子构成,就像电磁场由光子组成一样;第二,能量应该以粒子质量和运动的形式出现,它不停地在量子场之间往来波动,在空间和时间里不停地振荡。)
量子电动力学可以说是有史以来关于自然现象的最精确理论。我们可以从木下东一郎(Toichino Kinoshita)的例子来说明这种精确。木下是康奈尔大学的粒子物理学家,在过去的30年里,他一直在艰辛地用量子电动力学计算电子的某些具体性质。他的计算写满了几千页,最后还是世界上最大的计算机来完成的。他的努力是值得的:计算的结果在小数点后面十二位都得到了实验的证实。这绝对是抽象的理论计算与现实世界之间惊人的契合。通过量子电动力学,物理学家能在完备、实用、可靠的数学框架下巩固光子作为“最小的一束光”的角色,揭示它们与带电粒子(如电子)的相互作用。
量子电动力学的成功激励其他的物理学家在20世纪六七十年代去发展一门类似的新的量子力学方法,以认识弱、强和引力的作用。结果证明,对弱力和强力来说,这是一条硕果累累的道路。通过与量子电动力学类比,物理学家构造了强力与弱力的量子场论,叫量子色动力学和量子弱电理论。“量子色动力学”这个色彩绚丽的名字,在逻辑上该叫“量子强动力学”,但那不过是一个名字而已,没有别的更深的意思。注6另一方面,“弱电”这个名字确实概括了我们在认识自然力的长路上所树立的一座里程碑。
注6:普朗克常量为1.05×10-27克·厘米2/秒或1.05×10-34焦耳·秒。
格拉肖(Sheldon Glashow)、萨拉姆(Abdus Salam)和温伯格(Steven Weinberg)证明了弱力与电磁力可以自然地用他们的量子场理论统一起来——尽管两种力在我们周围世界的表现好像是迥然不同的,凭借这项研究,他们共同获得了1979年诺贝尔物理学奖。毕竟,除了在亚原子的尺度内,弱力场几乎消失了,没有一点儿作用;而电磁场——可见光、无线电波、电视信号、X射线……却是我们离不开的宏观实在物。不过,格拉肖、萨拉姆和温伯格从根本上证明,在足够高的能量和温度下——如在大爆炸的几分之一秒内——电磁场和弱力场熔化在一起,表现出不可分辨的特征,应该更准确地叫弱电场。当温度下降,电磁力与弱力便结晶似地分离开来(分离的过程实际从大爆炸时就开始了),具有与高温下不同的形式——这样一个过程就是有名的“对称破缺”,我们会在以后慢慢讲——从而在我们今天冰冷的宇宙中表现得迥然不同。
好了,现在我们知道,到20世纪70年代,物理学家已经对四种力中的三种(强、弱、电磁)做了合理而成功的量子力学描述,还证明了其中的两种(弱和电磁)实际上有着共同的起源(弱电力)。在过去的20年,物理学家做了大量实验,通过那三种力的自我表现和它们在第1章介绍的物质粒子中的作用,来检验量子力学的处理方法。理论安然面对了所有的实验挑战。实验家们测量了19个特别的参数(表1.1中的粒子质量和第1章注释1中补充的力荷、表1.2中的三个力的强度,以及几个别的我们不需要讨论的参数),理论家将这些数引进物质粒子和三种力的量子场理论,结果,这个微观宇宙的理论做出的预言与实验符合得好极了。在我们今天的技术条件下——所达到的能量可以将物质粉碎到一百亿亿分之一米的大小——理论都是正确的。因为这一点,物理学家把这个关于引力外的三种力和三族物质粒子的理论叫作标准理论,或者,更多的时候称它是粒子物理学的标准模型。
信使粒子
根据标准模型,强力和弱力的场也有最小的组成粒子,就像电磁场以光子为最小组成一样。我们在第1章曾简单讲过,最小的强力单元是胶子,而最小的弱力单元是弱规范玻色子(或者,更准确地说是W和Z玻色子)。标准模型要求我们把这些力的粒子看成没有内部结构的——在这样的框架下,这些粒子全都是基本的,跟那三族物质粒子一样。
光子、胶子和弱规范玻色子提供了它们所组成的力的微观传递机制。例如,当一个带电粒子排斥另一个带同性电荷的粒子时,我们大体上可以想象每个粒子都裹着一个电场——一团“电的云雾”——每个粒子感觉的力就源自那“两团云”的排斥。不过,更准确的量子图景却多少有些不同。一个电磁场由一群光子组成,两个带电粒子间的相互作用实际上是光子在两个粒子间往来“出没”的结果。两个带电粒子通过交换小小的光子而相互影响,这个过程有点儿像两个溜冰的人连续不断地相互传球,通过传球,两个人的运动状态都将受到影响。
然而溜冰者的比喻却有一个大毛病,那就是传球总是“排斥性的”——它使两个人越离越远。不同的是,带相反电荷的粒子也通过交换光子发生相互作用,而那电磁力却是“吸引的”。看来,光子似乎并不是力本身的传递者,它只不过是传递“消息”,告诉粒子该如何响应那个力。对同性电荷的粒子,光子带来的消息是“离开”;而对异性电荷的粒子,那消息是“走近”。因为这一点,我们有时说光子是电磁力的信使粒子。同样,胶子和弱规范玻色子分别是强力和弱力的信使粒子。把夸克锁在质子和中子里的强力起源于一个个夸克交换胶子。可以说,胶子真就像把这些亚原子粒子紧紧黏在一起的“胶”。弱力决定着粒子的某种放射性衰变的嬗变过程,它的中介是弱规范玻色子。
规范对称性
你大概已经看到了,我们关于自然力的量子理论的讨论还遗漏了一个奇异的角色,那就是引力。物理学家靠那个方法成功地处理了其他三种力,你可能会建议他们去寻找一个引力的量子场理论——在那个理论中,引力场的最小单元引力子应该是它的信使粒子。乍看起来,这该是一个特别合时宜的建议,因为另外三种力的量子场论告诉我们,它们与我们在第3章遇到的引力的某个方面之间存在着诱人的相似。
回想一下,引力让我们能够把所有的观察者——不论他们的运动状态如何——看作绝对平等的。即使通常认为在加速运动的人,也能说自己是静止的,因为他可以把感觉到的力归结为他处在一个引力场中。在这个意义上,引力强调对称:它保证所有可能的观察者的观点以及所有可能的参照系都是同样有效的。同样,强力、弱力和电磁力也都通过对称性相联系,虽然那些对称比同引力相关的对称要抽象得多。
为了粗略体会这些难以捉摸的对称性原理的意思,我们考虑一个重要的例子。我们记得,在第1章后面的注释里,每个夸克都带着三种“颜色”(我们想象那是红、绿、蓝,当然这不过是一些标签,与通常看到的色彩没有一点儿关系),这些颜色决定着夸克该如何“响应”强力,就像电荷决定着对电磁力的响应一样。在得到的所有数据的基础上,我们建立了夸克间的一种对称性,那就是,同色夸克(红与红、绿与绿或蓝与蓝)间的相互作用都是相同的,不同色夸克(红与绿、绿与蓝或蓝与红)间的相互作用也是相同的。实际上,我们还从数据发现了更令人惊奇的事情。假如夸克携带的三种颜色(三个不同的强荷)都“转移”了(用假想的色彩来说,大概意思是,红、绿、蓝转移成黄、青、紫),甚至它们每时每刻从一个地方到另一个地方都在不停地转移,夸克之间的相互作用却一点儿也不会改变。因为这一点,我们说宇宙体现着一种强力对称性:物理学不因力荷的转移而改变——或者说,物理学一点儿也不知道力荷转移了。这很像我们说球体现着旋转对称性,因为不论我们在手里怎么转,不论转多大的角度,球看起来都是一样的。由于历史的原因,物理学家也说强力对称是规范对称的一个例子。
我们来看关键的一点。在广义相对论中,为使所有可能的观察立场都处于对称地位,必须要求存在引力。类似地,从外尔(Hermann Weyl)20世纪20年代以及杨振宁和米尔斯(Robert Mills)20世纪50年代的工作发展起来的规范对称性也要求存在另外一些力。根据杨振宁和米尔斯的观点,那些力场能完全补偿力荷的转移,从而完全地保证粒子间的物理相互作用不会改变。这很像一个灵敏的环境控制系统,通过彻底补偿任何外来的影响而使一个区域内的温度、气压、湿度保持为常数。对与夸克的色荷转移相关的规范对称来说,需要的力不是别的,正是强力。就是说,如果没有强力,物理学在上面说的色荷转移下会发生改变。这一发现表明,虽然引力和强力有许多不同的性质(回想一下,引力比强力弱得多,而作用范围却远得多),它们确实还有某种相同的特征:它们的存在是为了让宇宙享有特别的对称性。而且,相同的论证也适用于弱力和电磁力,它们的存在关联着另外的规范对称性——所谓的弱与电磁的规范对称。因此,四种力都直接联系着对称性原理。
四种力的这个共同特征预示着我们在这节开头的建议是很有希望的。那就是,为了把量子力学融入广义相对论,我们应该寻找一种引力的规范场理论,就像物理学家已经发现了的其他三种力的成功量子场理论一样。近些年来,这个思想激励了一大批有名的物理学家满怀热情地踏上寻找之路,但一路上困难重重,还没有谁走到尽头。我们来看那是为什么。
广义相对论与量子力学
广义相对论适用于巨大的天文学尺度。在那样的距离,爱因斯坦的理论说明,没有物质意味着空间是平直的,像图3.3画的那样。为了把广义相对论与量子力学融合起来,我们现在必须转移关注的焦点,去考察空间的微观性质。在图5.1中,我们说明了如何一点点去暴露越来越小的空间结构。开始的时候,看不出什么来;看图中底下的三层,空间结构几乎是一样的形态。从纯经典的立场看,我们以为这样平直稳定的空间图景会一直保持到任意的距离尺度。但量子力学完全改变了这种想法。万物都摆脱不了不确定性原理所规定的量子涨落——引力场也不例外。虽然经典理论认为虚空间没有引力场,但量子力学证明,引力场尽管在平均意义上等于零,实际上却因量子涨落而波荡起伏。另外,不确定性原理还告诉我们,关注的空间越小,看到的引力场起伏越大。量子力学展现了一个没有绝望的世界,越是狭小的地方,越是浪花飞溅。
图5.1 逐级放大空间区域,显露它的超微观特性。为了融合广义相对论与量子力学,我们将在最高的地方面对汹涌的量子泡沫
引力场通过空间的弯曲表现出来,而量子涨落通过周围空间越来越强烈的扭曲表现自己。在图5.1中我们看到那种扭曲隐约出现在第四层。向更小的距离尺度逼近,我们会在第五层遇到随机的量子力学波动,那里的引力场表现出极强烈的空间弯曲,一点儿也不像我们在第3章画过的弯曲的橡皮膜。实际上,它像图顶那样,到处是混沌的卷曲。惠勒发明了一个名词量子泡沫来描绘这种超微的空间(和时间)里表现出的混沌状态——它描绘了一幅陌生的图画,传统的一些概念,如左和右、前和后、上和下(甚至过去和未来),都失去了意义。还是在这样的小尺度上,我们才发现广义相对论与量子力学原来是不相容的。广义相对论的核心原理——光滑的空间几何的概念——被小距离尺度的量子世界的剧烈涨落破坏了。在超微尺度上,量子力学核心的不确定性原理与广义相对论核心的空间(以及时空)的光滑几何模型是针锋相对的。
实际上,那矛盾是很具体地表现出来的。把广义相对论和量子力学融合起来的所有计算,都得到一个相同的答案:无限大。这是一个当然的信号,告诉我们做错了事情,该让老师打手掌心了。广义相对论的方程平息不了量子泡沫的喧嚣。
不过,应该看到,当我们回到寻常尺度(在图5.1中从上往下看),小距离尺度上剧烈的随机涨落会平息下来——像那位被迫借钱的人把钱还了,银行的账户没留下借钱的痕迹——这时,宇宙结构的光滑几何学又变得精确了。我们有过这样的经历:从远处看到的一幅色彩均匀光亮柔和的图画,走近一看,却跟光滑的画面大不相同,原来它不过是一点点色斑,每一点都是分离的。但是你得注意,只有在离图很近,一点点地看,你才会发现它原来是离散的;而从远处看时,它是光滑的。同样,除了在超微观的尺度下,时空结构都表现得很平坦,这也是为什么广义相对论在足够大的距离(和时间)尺度——与许多典型的天文学问题相关的尺度——能做得很好,而在小距离(和时间)尺度上却产生那么多矛盾。广义相对论核心的光滑和轻微弯曲的几何图像,在大尺度上证实了;但在推向小尺度时,却被量子涨落破坏了。
广义相对论和量子力学的基本原理使我们能够在某个很小的尺度上进行计算,不过,低于那个尺度时,图5.1里的可怕现象会表现得很明显,计算不能再往前走了。因为标志量子作用强度的普朗克常量太小,描写引力本来强度的引力常数也太小,它们构成一个更小的几乎难以想象的普朗克长度:十亿亿亿亿分之一(10-33,小数点后面32个零)厘米。注7图5.1最高层描绘的就是在普朗克长度下的超微观的宇宙景观。为了对那尺度有一个具体的认识,我们想象,把一个原子放大到我们的宇宙尺度,那么普朗克长度也不过是一棵普通的树的高度。
注7:我们可以通过简单的论证,即通过物理学家所说的量纲分析,来认识普朗克长度。思路是这样的:如果一个理论是由一组方程建起来的,为将理论与实在相联系,抽象的符号必然与自然的物理特性相结合。特别是,我们必须引进一个单位系统,就是说,假如一个符号代表着长度,我们应该能有一个标准来说明它的数值。例如,一个方程中的长是5,我们当然需要明白它是5厘米、5千米还是5光年。在涉及广义相对论和量子力学的理论中,单位的选择是以下面的方式自然出现的。广义相对论依赖于两个自然常数:光速c和牛顿引力常数G。量子力学依赖于一个自然常数。看看这几个数的单位(例如,c是速度,应该表达为距离除以时间,等等),我们可以发现,组合具有长度的单位,实际上,它等于1.616×10-33厘米。这就是普朗克长度。它既包含了引力和时空的量(G和c),也与量子力学有关,所以,在任何联合广义相对论与量子力学的理论中,它都确定了一个测量标准——一个自然的长度单位。我们在文中用“普朗克长度”通常是一个大概的意思,指长度在10-33厘米的几个数量级范围内。
于是我们看到,广义相对论与量子力学间的冲突只是发生在宇宙相当隐蔽的地方;因为这一点,你当然可以问,那些问题值得去忧虑吗?有些物理学家也很明白那个问题,但他们还是在研究需要的时候,在典型尺度远远超过普朗克长度的问题上,快乐地运用广义相对论和量子力学。而另外一些物理学家则深信,我们那两块物理学基石根本就搭配不起,并不因为超微观的尺度才暴露了问题。他们认为,这个矛盾指出了我们对物理宇宙认识的根本缺陷。这种看法源于一个不能证明然而深入人心的世界观:如果在最深最基本的水平上认识宇宙,宇宙应该能以一个各部分和谐统一、逻辑上连贯一致的理论来描述。不论那矛盾对各人的研究是不是根本性的,有一点是肯定的,那就是,大多数物理学家很难相信,我们对宇宙最深层的认识的理论基础是由两个虽然有力然而搭配不起的数学框架拼接起来的。
为了能让两个理论协调起来,物理学家做过大量的尝试,他们以这样那样的方法,要么修正广义相对论,要么修正量子力学;虽然一次次的努力通常都胆识惊人,但结果却是一个失败跟着一个失败。
终于,超弦理论来了。