第一推动丛书·物理系列(套装共9册)
上QQ阅读APP看书,第一时间看更新

第5章 时间之箭:热力学

对物理现实的图像,尤其是对时间的属性,我们来一次大变革的时候到了。这变革也许超过今日的相对论和量子论。

——彭罗斯

《皇帝新脑》

当我们从量子力学的微观世界转移到日常生活的宏观世界来,时间之箭就变得比较清楚了。这就是热力学的领域,它是一个威力巨大的理论,其中时间的流逝方式与萦绕在诗人和小说家脑际的想象是一样的。格雷夫斯(Robert Grayes)有一次生动地描写道,时间就是“计数脉搏,计数缓慢的心脏跳动,在缓慢的心脏跳动中流血,从而走向时间的死亡”。热力学所做的与此相同。它揭示了同样不可逆的过程中瞬息即逝的现实,从我们的青春逝去到眼泪风干。这些不可逆过程使人类的存在既富于深刻哲理又富于情趣。当然,并不是它的所有应用都是这么富有象征性。热力学还解释蒸汽机如何工作以及为什么茶会变凉这一类问题。

热力学把时间与有序性和无序性(随机性)这样的概念联系起来。时间的流动变得显而易见,这是因为在任何孤立系统中都有一种毫不留情的倾向,使得有序程度降低而无序程度增加。如果往红茶里面加一点牛奶,奶分子就会与茶分子混合在一起并且扩散。最后,奶和茶的分布会完全一样,茶显出特有的浓褐色;当混合过程完成以后,不会再有进一步的变化发生。在茶所达到的最后状态中,分子的无序性——或者用热力学术语准确地说,熵——达到了一个极大值。这是一种平衡状态,奶分子和茶分子在混合物中所有各处都是均匀的,不再具有任何进一步混合的能力。我们从来没有见过相反的过程,即均匀的褐色液体自发地分开成为白色的奶和红色的茶。因为要使这样的过程发生,我们就必须让时间开倒车。

时间之箭在所谓的“热力学第二定律”中明显地表现出来。这个定律说,所有的物理过程都是不可逆的,因为一部分能量总是要作为热而散失掉。作家斯诺(C.P.Snow)认为,对于任何受到过良好教育的人,热力学第二定律都应该成为他所应具备知识的一部分。他描写过一些受过高等教育的人,“他们津津乐道地形容科学家们对文学的无知。有一两次我被激怒了就问他们,你们中有多少人可以讲一讲热力学第二定律。反应是漠然的,而且答案也是否定的。然而我的问题实际上等价于问一个科学家:你读过一篇莎士比亚的作品吗?”

不幸的是,正像文学批评家们为莎士比亚的戏剧争论不休一样,科学家们也为第二定律的意义发生激烈的争执。热力学的基本命题相当含糊,从而导致了多种多样的观点。这种情况也反映了通常对科学家的印象之荒唐:一般人总认为科学家是一伙穿着白外套、冷面孔、思想一致的人。事实上,科学家之间观点上的差别之大,常常可以表现为个人之间的冷嘲热讽和激烈的争吵。美国哲学家赫尔(David Hull)最近指出,物理学家们可以轻而易举地罗列出20种或者更多的第二定律的不同表述形式。赫尔写道,给局外人强烈印象的是,每一个科学家都坚持说他自己的观点是正确的。同时,像热力学本身一样,使人伤脑筋的时间问题,经常产生的更多的是争论的热度,而不是希望之光。

当我们讨论热力学的不同处理方法时,一些观点的相互冲突会变得很明显。我们会看到一种根据热力学平衡的描述,它是一种特殊情形,此时作为热力学理论核心的一切变化和流动都被抑制,而这种情形又是大多数科学家在热力学课题中唯一了解的部分。我们将要表明,平衡态热力学是一条死胡同。某些人错误地认为,热力学排除了有序结构的自然出现,而且意味着宇宙的整个进程是直接走向无序的混沌。我们会看到这也是不正确的,实际上热力学理论正把握着有序生命产生的关键。但是对我们眼前的目的来说,最基本的问题还是,如何使热力学和分子力学的微观理论相和谐,因为上面我们已看到,这种微观理论是时间对称的。科学思想的这两个至关重要部分之间表面上的抵触,一些人称为不可逆性佯谬(另一些人称为可逆性佯谬)。它已经使得一些科学家认为时间的热力学箭头在我们的精神之外,不具有现实性,是一种纯主观的概念。

热力学的诞生

热力学理论是随着19世纪早期,英国工业革命中蒸汽动力的出现而形成的。第一台实用的蒸汽发动机是在1782年由瓦特(James Watt)建造的,他以前在格拉斯哥大学从事科学仪器制造工作。蒸汽机烧煤把水加热,因而产生蒸汽压力推动活塞或转动涡轮桨叶。但是为了计算一台发动机的最大效率,就必须了解这台机械幕后的全部理论。这一学科就是热力学,它来源于希腊语,意思是热的运动。

当蒸汽机运转时,能量转化为所有组成部分的分子运动,这一过程是极端复杂的。但是热力学并不涉及原子和分子(我们回忆一下,当时原子的概念还没有得到普遍认可),它把注意力直接集中在一些与感觉有关的“宏观”量上面,像体积、温度和压力。在早期热力学家中一个杰出的人物是法国工程师卡诺(Sadi Carnot)。他是法兰西第一共和国一位领导人的长子,后来在一场流行性霍乱中去世,终年只有36岁。然而在去世前10年,他就已经对理想热机如何工作给出了一个透彻的热力学分析。他的这种理想热机是完全可逆的,没有不可逆的热损失。他说明了热机的效率如何决定于热量从热物体流到冷物体这一事实。在一台蒸汽机里,这就是说,热量从蒸汽形成的热气室,流到蒸汽凝结的冷气室。卡诺说,冷热物体之间的温度差异,就决定了热机工作的好坏。有重要意义的是,即使这样一种完美的热机,它的效率也绝不可能达到百分之百。

用实际用语来说,蒸汽机的工作就是把热转化为功,这里功的意义就是一种更有用、更有组织的能量。热和功的等价,是曼彻斯特一个酿酒世家的儿子焦耳证明的。他把一台蒸汽机的工作倒过来观察,也就是用功来产生热(用桨来搅动水,或者把空气压缩进一个容器里)。结果表明一定数量的不论什么形式的功,都产生出相同的热量。这一发现得到了公认,现在能量的最基本单位就是以焦耳的名字命名的[1焦耳大约等于在地球表面附近,把一只苹果垂直举起1码(0.9144米)所需要的功]。

能量的不同形式热和功之间的等价是热力学第一定律的基础。这一定律说,在一个物理过程中,能量总是守恒的,尽管它可以从一种形式转化为另外一种形式。换句话说,如果你对任何一个物理事件拟出一份能量清单,则事件前后的总能量是相等的。唯一的区别是,开始时的能量的一部分或全部,必定会在事件后作为热量出现。这是因为总有某些能量在某种物理过程中被“烧掉”了——例如,克服摩擦和空气阻力。这些“烧掉”的能量不会真的从清单上消失,只是由于表现为废热的能量耗散,使得能量换了一种形式。

在每一个能量转化的过程中,都有因为产生热而出现的能量耗散。例如一位运动员在跑100米赛跑时消耗的化学能,一只白炽灯泡发光(电磁能)时消耗的电能,等等。对耗散问题更进一层的认识,主要是由德国物理学家克劳修斯(Rudolf Clausius)完成的。他生于1822年,父亲是一位牧师兼教员。克劳修斯了解到,虽然热和功在焦耳所表明的意义上是等价的,但是耗散使得它们之间产生了一个十分重要的不对称性。原则上,任何形式的功都可以被完全转化为热。但是耗散意味着相反的说法不能成立,在热转化为功时,总有一部分热白白浪费掉了。例如,并不是蒸汽机中所有的热都可以用来推动活塞。一部分热量浪费到加热机器、周围大气以及操作者的手。一部分热量在机器关掉之后仍然保留在小水滴中。克劳修斯认识到(虽然最初这一认识还是朦胧的),这意味着热量损失是不可逆的,一旦发生热量损失,这种废能绝不可以再次变成功。他的这个突破性发现在1850年得到完全证实,克劳修斯也因此被称为“时间之箭”之父。但是在那个阶段他的学说还是有毛病的。出生在北爱尔兰贝尔法斯特的数学家汤姆逊(即后来的开尔文勋爵),把克劳修斯这种笨拙的处理方式改成一种普适的表述,即热力学第二定律。按照这个定律,总是存在着机械功退化成热的无情倾向,而相反的倾向却不存在。

第二定律的含义是,所有的能量转化都是不可逆的。当发动机的曲轴正好转过一个循环时,这台机器回到这样的状态,也许连最能干的机械工也看不出它与原来的初始状态有何不同。但是由于热而产生的能量损耗,却已经使得一些无法再被消除的变化发生了。曲轴规律性的机械运动(功)受到了摩擦力。一部分机械能变成了热,这热我们可以想象为轴上分子无规则的随机运动。这种无规则运动的能量又有一部分会被空气分子带走。最后的结果是作为热而出现的不可逆的能量耗散。

这里我们要记住的一个关键因素是卡诺提出的一个观点,即热只能由较热的地方流向较冷的地方。这就使我们得到了第二定律的另一种表述形式,即不可能通过把热量从较冷的地方转移到较热的地方而做功。为了更幽默地描写一下这个在实际行为中不可避免的原则,我们想引用喜剧大师弗兰德斯(Michael Flanders)和斯旺(Donaid Swann)在他们的歌“第一和第二定律”中的一段歌词:

你不能让热从冷处传到热处,

你想试一试吗?结果只会一无所获。

“不见得吧,让冷的再变冷,

会让热的再变热——这合乎规矩,

就像热量从热的东西传出,

一定会使冷的东西变热。”

不,你不能让热从冷处传到热处,

你如果要试试,你就会像是一个蠢货。

冷的东西变热,这才合乎道理——

因为这是一条物理法则!

克劳修斯在1865年引入“熵”的概念,从而把可逆过程与不可逆过程加以区别。这就使得第二定律更加具有锋芒。熵是这样一个量,它在有耗散的情况下不停地增长,当所有进一步做功的潜力都已耗尽,它就达到了极大值。按照克劳修斯对第二定律的说法,在可逆过程中熵的改变是零,而在不可逆过程中熵总是增加的。熵这个名称是克劳修斯根据两个希腊字发明出来的,意义是“转移的量”或者“发生变化的能力”。它无疑是热力学中最重要的概念,并且给出了一个明显的时间箭头:熵的增加正好与时间的前进一致。熵的概念给了爱丁顿极深刻的印象,他写道:“我希望能把熵这个概念在科学研究中令人惊奇的威力,原原本本地告诉你。”他把熵比作美和旋律,因为这三者都是与排列和有序联系在一起的。

为了更深入地理解熵的意义,把一些杂乱的容易引起混淆的因素去掉是非常有帮助的。科学家们为此常用一种理想化的情况,即把所感兴趣的过程定义为系统,过程以外的世界构成系统的外界。例如,热力学家常喜欢考虑“孤立系统”这样的特殊情况,这种系统与外界完全无关[图13(a)],像一只有刚性绝缘壁的盒子,物质或者能量无论从哪个方向都不能通过。一只理想的咖啡暖瓶可以作为这样的例子,它不会散失水蒸气或者热能。虽然在实际上没有一个系统是完全孤立的(宇宙本身可能除外),但是这还是一种非常有帮助的理想化假设。另外还有两种普遍形式的系统在热力学中常被应用:“封闭系统”[图13(b)],它可以与外界交换能量以及“开放系统”,它与外界既可以交换能量也可以交换质量[图13(c)]。利用这样的专门术语,像人这样的有生命的物体就是一种开放系统,因为人要和外界发生能量和物质的交换,例如喝酒、吃肉以及呼出热气和产生排泄物。

图13 热力学中的三种系统:(a)孤立系统,(b)封闭系统,(c)开放系统,图(d)表示熵的增加,图(e)表示自由能的减少。[录自柯文尼,法文杂志《研究》第20卷,第190页(1989)]

按照第二定律,在一个孤立系统中自然发生的任何过程,都一定伴随着系统的熵增加。因而熵给所有孤立系统提供了一个时间箭头。当熵达到它的极大值时,孤立系统的时间演化就停止了,该系统就处于它最无序的状态。这时系统已耗尽了它所有发生变化的能力——它已经达到了热力学平衡。

克劳修斯认识到宇宙本身是一个完全孤立的系统(否则在它外边是什么呢?),并且在1865年把热力学的前两条定律写成宇宙学的形式。第一条定律说,宇宙的总能量是守恒的;第二条定律说,如我们已看到的,宇宙的总熵是在无情地朝着它的极大值增长。德国物理学家霍姆霍兹(Hermann von Helmholtz)第一个从第二定律推断说,整个宇宙的演化就是逐渐地退化,最后停止于热力学平衡,此时不会再有任何变化发生。一个处于平衡的宇宙,熵和无序性都达到最大,所有的生命也就随之而死亡。宇宙的这种“热死”或“热寂”,又引出了弗兰德斯和斯旺的妙句:

热就是工作(功),而工作是该死的东西。

宇宙中所有的热,

因为不能再增加,

都在逐渐冷下去。

此后,不会再有任何工作了,

将是天下太平、永远的休息。

真的吗?

真的!老兄,这就是熵,

所有这些都是因为

热力学第二定律!

这是一个科学理论从一团蒸汽得到的一幅非常可怕的图像。然而,正如马克·吐温(Mark Twain)所说:“先抓住事实,然后你才可以大做文章。”实际上,热寂的说法是有问题的,因为它忽视了引力(和黑洞)的作用:如果包括引力,宇宙必定越来越远地偏离热寂所想象的物质均匀分布。即使不考虑这一点,宇宙这样一幅惨淡的远景也和它的中短期行为没有多大关系。我们从天文事实中(第3、第4章)知道,宇宙作为一个整体是在膨胀着的,所以在任何地方它都不会接近热平衡。热力学的知识也告诉我们,当一个体系远离平衡时,会由于像天空上星星那样的局部热点,而发生一些非常有兴趣的事情,例如生命的出现。

这里我们看到,热力学和达尔文生物进化论之间有一种明显的冲突。达尔文在他的自然选择理论中,表明了大自然何以能够优先选择一些罕见的事件(变种),因而逐渐演化出越来越复杂的生命形式。在他的理论中,变化的推动力是一些随机发生的事件。然而,玻尔兹曼(他是我们这一章的主角)却表明,在充满分子的气体中,正像克劳修斯的第二定律所说的那样,高度有序的结构将随着时间随机地消失。有些人说,“克劳修斯和达尔文不可能都是对的。”我们将在第6章和第7章再谈到,达尔文的学说如何与热力学取得一致,这里我们只想指出,玻尔兹曼对于达尔文,这个比他年长的同时代人,是十分尊重的。在19世纪将近结束的时候,玻尔兹曼写道:“如果你问我内心深处的信仰,关于是否有一天本世纪会被称为铁的世纪,抑或蒸汽的世纪或是电的世纪,我会毫无疑问地回答说,它将被称为自然机械观的世纪,达尔文的世纪。”1886年在奥地利科学院的一次会议期间,他在关于第二定律的讲演中谈到了同样的观点。

如果科学家们认定达尔文和热力学之间确有无法沟通的分歧,则大多数物理学家一定会说是达尔文错了,因为第二定律已经被证明是普遍适用的。用爱丁顿的话来说,“我认为,熵增原则——即热力学第二定律——是自然界所有定律中至高无上的。如果有人指出你所钟爱的宇宙理论与麦克斯韦方程不符——那么麦克斯韦方程就算倒霉。如果发现它与观测相矛盾——那一定是观测的人把事情搞糟了。但是如果发现你的理论违背了热力学第二定律,我就敢说你没有指望了,你的理论只有丢尽脸、垮台。”

平衡态热力学

如果你对蒸汽机感兴趣,第二定律所预言的、耗散引起的热损失就显然是一件讨厌的事。因此,早期热力学家们致力于寻求避免不可逆性的途径。在“思维实验”的理想情况下,这看起来是一件容易的事:可以简单地让蒸汽机无限缓慢地工作,这样在每一个瞬时,系统和外界之间就会处于热平衡。在这种“准静态”情况下,系统的整体性质不会随着时间而改变。熵会在任何时候都处于它的极大值,并且没有不可逆的热量损失发生。这样的系统相应于一个完全可逆的热机。即使如此,如我们已看到的,热转换为功的效率也不可能达到百分之百——第二定律是不可能违反的。同时,这样的理想情况还是有美中不足,因为在上述条件可以实现的情况下,这台机器要用无穷长的时间才能完成这一最简单的操作。

这些问题也许说明,平衡态的处理是颇有缺陷的。它相当于抑制时间在过程中的基本作用。因为所有的过程都发生在一段有限的时间内,因而在这一过程中不可能包含有无限多个平衡态进程。然而,许多科学家仍然试图按这种有点自相矛盾的方式思考热力学过程。这其中的一个原因是,只讲平衡态过程,可以避免描述不可逆过程的不便和困难,尽管在使一个系统达到平衡之前是要经过不可逆过程的。但事实上,克劳修斯关于熵的定义是仅仅对平衡态而言的,而且,熵是否可以在平衡态之外的一般情况下定义,这个问题现在仍然没有解决。

美国物理学家吉布斯(Josiah Willard Gibbs),无可非议地被认为是现代平衡态热力学的奠基人之一。在把热力学从局限于研究热和功之间的关系,拓展到研究所有形式的能量之间的转化方面,吉布斯做出了主要的贡献。他的3篇关键性的论文发表于1873年到1878年之间,当时他还只有三十多岁。这些论文是由康涅狄格州科学院发表的,后来它的出版委员会承认说,当时他们之中没有一个人懂得吉布斯说的是些什么。有一个人这样说:“我们认识吉布斯,信任他投来的稿件。”吉布斯和他的许多后继者,都谨慎地避免提及非平衡态现象。虽然他们的研究对于已经达到平衡态的系统有至关重要的意义,然而还是有点像把医学限制为给死人看病。

大家都说,吉布斯是一个为人死板、极不活跃的人。即使是一些高级学者,也常常把他和当时美国杰出的化学家沃尔考特·吉布斯(Wolcott Gibbs)相混淆。很长时间以后他的学说才在学术界得到广泛认可。今天,他的学说使我们感兴趣的主要是,能帮助我们洞察究竟是什么使得系统停止随时间的演化。当一个孤立系统[图13(a)],例如盛在一个充分绝热容器中的气体,处在它最无序的状态时,它就已经达到了热力学平衡。此时,为了描述平衡的宏观状态以及演化的终点,所需要的只有唯一的一个量,即熵可能达到的最大值。但是对于封闭系统和开放系统[图13(b)和图13(c)]来说,它们与外界的交流越来越重要,因而熵最大的状态也必须同时把外界的熵计算在内。这样,对于厨房里一杯正在凉下来的咖啡,我们必须考虑咖啡和厨房之间的能量交换对厨房产生的微小加热。如果我们想单独研究咖啡的平衡性质,这就麻烦了。因而为了简单起见,我们总是希望避免把厨房的行为明显地带到讨论中来。

为了排除厨房的影响,我们可以引入一个叫做自由能的新的量,它在平衡态时具有最小值。一个系统的自由能代表能从该系统得到的最大有用功。虽然自由能只是总熵换了一种形式,但是它的好处在于,它可以被看做是咖啡的某种内禀性质,而无须涉及厨房里其他地方发生了什么情况。在整个物理学和化学对系统平衡性质的描述中,自由能都起着中心作用,不管该系统是磁性物质、电冰箱还是化学反应的混合物。

熵和自由能是所谓热力学势的例子。这指的是,它们各自的极值——熵的极大值和自由能的极小值——显示着热力学平衡的状态。可以用钟摆的摆动作为一个比拟。在每一次摆动开始的时候,摆锤在引力的作用下具有一个势能,当它沿着弧线往下摆动时,势能就转化为运动的动能。空气的阻力使每次摆动开始时的势能逐渐消耗掉,因而摆动的弧线越来越小,最终使摆锤停止在垂直的位置上。这就是它势能最小时的位置。在一个密闭的容器中发生的化学反应,情况也与此十分相似。它最终会达到自由能最小的状态,此后不会再发生进一步的变化。

一个更时髦的描述热力学势极值的方式,是说它们是系统在时间上演化的“吸引子”。当一个球向山谷滚下去的时候,无论滚动开始的位置如何,球最后停下来的地方总是不变(图14)。与此相同,一个化学反应的平衡态决定于熵最大或自由能最小的点,与反应开始的条件无关。

图14 热力学势(熵和自由能)的力学类比。一个力学系统在势能最小时达到平衡。位置A和位置C相应于局部势能极小值。球在B点是不稳定的——哪怕是最小的扰动也会使它滑到A或者C,这个过程中就会有能量的耗散

平衡吸引子标记着一个重要的停止点,就像一块路标那样,“一切变化终止于此!”也像死亡对我们大家一视同仁,不管生前富贵荣华还是穷困潦倒,死亡都会把每一个人同样带到坟墓,这些吸引子也把它们的系统无情地拖向平衡。吸引子有各种各样,我们以后会常遇到。一个化学反应的平衡吸引子可以比作一个漏斗形物的底部:无论一个球开始时的位置如何,球将总是滚到最底部的一点。但是并不是所有的系统都有像这样的一个简单的吸引子——打个比方说,其他的(非平衡态)吸引子可以使这个球沿着一个一维的环滚动,像沿着宽边帽的帽檐滚动一样;或者使这个球在更高维的空间中更大的范围内滚动,像沿着一个油炸面圈的环形表面滚动一样。我们以后会看到,还可能有更稀奇古怪的吸引子。

砸碎平衡

平衡态热力学对于研究宏观系统不随时间而变的性质非常有用——例如像对一个所有化学反应已经停止了的试管,灰烬,或一杯已经凉了的茶。吸引子的概念同样可以给我们提供一个“时间之箭”的“箭靶”。然而,在非常实际的意义上,平衡态同样是一条死胡同。因为它涉及的只是热力学演化的终态,因而也就是时间的终点,它不可以用来描述能使时间明显表现的过程。如兰兹堡(Peter Landsberg)所说:“……热力学中既然不出现时间坐标,因此就不会有任何事情发生。”真实的世界中很少有这种令人窒息的平衡态。文学家贝凯特(Samuel Beckett)写道:“我们在呼吸,我们在变老!头发脱落,齿牙动摇!青春一去不回,往事云散烟消!”对于有生命的物体,热力学平衡只是随着死亡而出现,那时腐烂的尸体最终化成腐土。生命是由许多过程所组成的,从细胞分裂、心脏跳动到消化和思维,所有这些过程的发生都是因为它们不是平衡态。一个更有意思的说法是,平衡态热力学所做的预言,就像一个算命先生对你说你将来会死,但是他根本不知道你马上要和你的情人约会。对于一个基于第二定律及其对变化的解释的理论,这样一个结论看来是非常令人失望的。为了使我们对时间的研究有进一步的进展,我们必须再调查,对于不是平衡态的不可逆过程,热力学可以告诉我们些什么。

非平衡态热力学自然分成两个分支:“线性”分支描述接近平衡的系统的行为,“非线性”分支处理系统远离平衡时的情况。“线性”是一个数学词汇,它说的是在任何一种现象中,只要两个量之间有正比关系,这种关系就可以在图上用一条直线来表示。一个线性系统的作用,是组成该系统的各个部分的作用之叠加;但是一个非线性系统的作用,就不是简单地把各个部分的作用加在一起了。这之间的差别,可以用通常的家用电炉和切尔诺贝利核电站四号反应堆来比较,这后者是迄今世界上最严重的核事故的发源地。如果某人有2台电炉,则他会得到双倍的热量;如果他有3台,则热量会是3倍;依此类推。这种情形表示,在产生的热量和电炉数目之间有一种线性关系。但是在切尔诺贝利核电站的情况下,反应堆芯的过热增加了链式核反应,这反过来又产生了更多的热。结果形成的汹涌澎湃的热流,完全与最初的温度升高失去比例,这就叫做非线性正反馈。草率的操作规程加之苏联式设计中的致命弱点,最终导致了能量爆炸性的释放。1986年4月26日核电站变成废墟,并产生了全球性的严重后果。

混沌中现出有序

宏观系统的自然倾向是循着时间箭头走向平衡态。但是,如果系统的这一过程在它到达目的地之前就停止了,情况又会是怎么样呢?

图15所示的盛有氢气和硫化氢气体混合物的容器,可以用来说明,只要使一个系统保持在非平衡的状态,就可以推翻“熵就是无序”这样一个肤浅的教条。本来我们会以为,当混合物被加热时,它会变得更加无序:热量加得越多,气体分子就会越起劲地在容器里到处乱跑。但是现在让我们来防止它达到平衡态,这只要使容器的两端保持一个很小的温度差就行了。实验显示,在容器中的两种气体将逐渐发生分离:容器中较热的一端聚集较轻的氢气,而较冷的一端高度集中着质量较大的硫化氢。这个效应称为热扩散,这同一效应也使得储油罐中的油物质出现类似的浓度分布轮廓。

图15 热扩散装置。如果两个容器之间保持温度差,在其中一个容器中会发现更多的某种分子,而另一种分子则较少。浓度梯度正比于温度差(T1-T2)。[根据普里高津等所著《在时间与无穷无尽之间》第50页]

初看上去这个现象是与直觉相反的——加热容器使得熵增加,然而却使分子分布的随机性减小了,显现出一个所谓的气体浓度梯度。尽管热力学第二定律的通俗解释,是熵直接联系“无序”,而热扩散却表明,有序的组织可以自发地从无序状态中形成。在上面这个简单的例子中,这种有序组织就是沿着温度梯度方向,氢气浓度的逐渐增大,硫化氢浓度的随之减小。诚然,在气体分子的激烈运动中还是存在有随机性,但是总的说来这显然不是处于热平衡。热扩散给出了第一个例证,说明在不可逆的、非平衡态过程中,可以产生出有序性。这样,时间箭头就和可能出现的结构联系了起来。

平衡势使我们能够预测一个热力学系统的最终状态。它表明系统就像一个在路上滚动的球,无论它从凸起的什么地方开始滚动,最后总是停止在低洼之处。当一个系统由于其周围环境的限制而不能达到平衡时,是否对非平衡态行为也有一个类似的说法?总的说来答案是肯定的,只要系统不是偏离热力学平衡太远:还是用球来作比喻,球总是会滚到低洼处的。但是它也许会滚到另外什么地方——例如,如果它跑得离低洼处太远的话,它会落到另一个坑穴里面,这就使得预测变得困难得多。为了对热扩散确定一个热力学势,容器两端的温度差,也就是温度梯度,必须充分小。

温度梯度给了该系统一个“推动”,因而可以被描述为如同一种热力学力。这样的力造成了热量流和质量流,就像踢球使球运动一样。在接近平衡的时候,热流和质量流表现得很简单——如果力增加一倍,则流也增加一倍。热流和质量流与造成它们的力直接成正比,因而我们把这种情况下的热力学叫做线性热力学。

线性热力学主要是由耶鲁大学的昂萨格(Lars Onsager)的努力,才在20世纪30年代打下了坚实的基础,昂萨格为此获得了1963年的诺贝尔化学奖。他的“倒易关系”表明,在线性系统中有一种美学上很漂亮的对称关系:力产生流,流也产生力。在热扩散的情况下,物质的流动是由一个力引起的(用热梯度来表示)。昂萨格倒易关系接着说,物质的浓度梯度将产生热流,这个效应已经在实验上得到了证实。

1945年,一个新的角色登上热力学舞台——这就是普里高津。他在1917年即俄国十月革命那年出生于莫斯科,十年以后,小普里高津随同家人迁往西欧,在布鲁塞尔定居下来。在由比利时物理化学家顿德尔(Thophile de Donder)创立的布鲁塞尔热力学派里,他以一个小学徒的身份开始,一步步成长起来。他的大部分大学生涯是在布鲁塞尔自由大学度过的,这所学府当初是由互济会建立的,为的是对抗天主教会对纯世俗事务的横加干涉。至今这仍然是这所大学的宗旨。

28岁的普里高津发现,在线性表现良好的区域,热力学耗散降到它可能的最低点。这样,系统熵的变化率,也就是内禀的熵产生将会减小:一般而言,系统将会演化到一个稳定的或不变的状态,此时耗散处于一个极小值。在热扩散的情况下,总的熵可能是增加的,但是当气体最终的浓度梯度已经建立以后,内禀熵的产生率就处在它的最低值。

普里高津的博士论文在1947年发表,题目是“不可逆现象的热力学研究”。它包括有最小熵产生定理,并且也为他今后一生的研究打下了基础。普里高津像一颗新星那样升起,最后成为布鲁塞尔学派的领导人物。他和他的老同事格兰斯多夫(Paul Glansdorff)一起探索把热力学分析扩展到新的领域。

普里高津的最小耗散的图像,比起最大熵的平衡态概念来对我们更为有用,因为它与实际世界的关系更为密切——在实际世界中,没有东西是真正处于平衡态的。进一步演化的趋向总是有的:液体会混合,建筑物会风化,物体会冷却。但只要有一个很小的外部影响,使得系统保持在偏离热平衡的状态(例如在发生扩散的容器中的温度梯度),则将持续出现的是一种“稳恒态”,而不是坍缩到完全无序的状态。大多数房主是熟悉这种稳恒态的。风吹雨打和风化作用早晚会使得房屋变成一堆瓦砾,这就是它的平衡态。但是房屋通常可以在许多年里保持在稳恒态,因为维修的速率等于损坏的速率。只有当房屋停止维修时,房屋才开始风化瓦解(虽然最后的坍塌是很多年以后的事,但无论如何早晚一定会发生)。

在平衡态热力学的情况下,时间之箭的“箭靶”可以用一个具有像最小自由能或最大熵这样一些量的固定点吸引子来描述,它把系统拉向平衡态。对于偏离平衡,但是由于外部影响相对很小,而使得系统能够保持接近平衡态的情况,我们可以看到,许多平衡态情况下发生的事情仍然成立。最终的状态——例如浓度梯度——仍然不随时间而变,仍然是恒定的。普里高津把分析推广到略微偏离平衡的情况,他发现系统通常会演化到熵产生为极小值的点。此时他希望大胆地跨进一步,把这样的分析用于更复杂的情况——特别是远离平衡态的非线性系统——以完成一幅更大范围的系统随时间演化的图像。然而,与平衡态行为的类似性此时不复存在。这个新的领域也许很难懂,但是却非常令人兴奋,因为它和我们所看到的周围世界有非常密切的联系,并且提供了关于时间和变化的一幅更深奥微妙的图景。

极度远离平衡态

普里高津的最小熵产生定理是一个重要的结果。然而,它的证明决定于昂萨格所描述的流和力之间的良好线性关系(以及别的一些因素)。普里高津和他的布鲁塞尔同事一起,决心探究远离平衡态、线性规律已遭破坏的系统,目的是发现是否可能把他的定理推广为一个演化判据,对流和力之间的简单关系不再成立的非线性系统也能适用。这一努力导致了一些非常具有魅力的结果,也引起了不少激烈的争论。

我们前面已经提到过,科学家像其他人一样,他们之间会发生激烈的争吵甚至敌对。围绕着布鲁塞尔学派的争论一直没有平息,不幸的是,这个小组向外界报告他们的发现时,偶尔也做过一些夸张的言论,这使得争论如同火上浇油。其实根本的问题主要是介绍的方式,但却导致了非常令人不快的结局:差不多像政界的观点两极分化。可悲的是,这种宗派之争逐渐破坏了对布鲁塞尔学派做的贡献的理性辩论的基础。

经过长达20多年的煞费苦心的研究,布鲁塞尔学派精心研究出一种被称作“广义热力学”的理论,它的目的是把热力学原理运用于远离平衡态的情况。本质上,格兰斯多夫和普里高津用的是一种近似,它使得一个远离平衡态的系统,在局部上表现为平衡态。整个系统好像由许许多多这样的局部拼缀而成。从概念上讲,它颇为类似广义相对论中,把弯曲时空想象为许多局部平直时空拼缀在一起。

格兰斯多夫和普里高津用这种“局部平衡”近似,来研究平衡态热力学远不能够处理的情况。他们系统地阐述了所谓的“普适演化判据”,而且认为这一判据会对事物随时间演化的方式,给出一个更加精深奥妙的见解。这一研究在他们于1971年出版的一本书里登峰造极,这本书名叫《结构的热力学理论,稳定性和涨落》。不幸的是,他们用以表达这个判据的措辞——特别是他们选择的“普适”这个词——又成为后来争论的中心。作者们的原意是,他们得到的是一个纯热力学的演化判据,但是由于他们所声称的看上去比实际成立的要多,因而使得他们自己成为一场辱骂性论战攻击的目标,对手是那些仅仅是急于对布鲁塞尔学派发难的人。

格兰斯多夫——普里高津判据处理的是我们可能遇到的最普遍的情形——远离平衡的开放系统,其中能量和质量都可以流动,系统的行为由非常复杂的非线性关系所支配。对于远离平衡的稳恒态的稳定性,他们的判据给出了一个总的说明。这判据说,当平衡偏离得太远时,这种稳恒状态就变得不稳定了。此时可能会出现一个“转折点”,或者称作“分叉点”,系统在此处会偏离稳恒态,而演化到某种其他状态(图16)。

一个重要的新的可能性是,在第一个转折点之后,系统在时间和空间上的行为会具有高度的组织性。例如,在某些远离平衡的化学反应中,我们可以看到出现规则的颜色变化或者漂亮的彩色涡漩。这是系统随时间演化过程中达到的稳定状态,但是已经不再和最小内禀熵产生有任何关系了。

为了更清楚地说明熵和有序行为之间的关系,也许我们可以用一位打算省钱的先生(当然一位女士会做得同样好)可取的选择作比方。如果他是一文不名,那么他在消费上的改变——相当于平衡态时熵的变化——是零。然而,真实的世界不是处于平衡态。所以,我们这位希望省钱的先生,至少有少量的钱,而且必须花费一些在饮食上。在这种情况下,他能够期望做到的是,把他的开销降低到能使他活下来的最低水平。与此相似,许多处在少许偏离平衡但还是稳定状态的热力学系统,将把熵产生降到最低点。现在让我们来看远离平衡时会发生什么情况。这相当于这位先生是一个已经有钱而想要更多钱的人。在这种情况下,把他的日常开销降到最低是远远不够了。现在对他来说有许多其他的选择,而不仅仅是选择最便宜的食品和住宿。他可以把钱投资到利息高的银行里。他也可以斥巨资去进行利润丰厚的投机冒险事业。所有这些短期花费都完全可以使他达到他的目的。此时对省钱来说(而不是对花钱来说)不再有一个普适的判据,而如果他是一个过着粗茶淡饭日子的穷汉,就会有这样一个判据。这就是说,对远离平衡的情况,呈现出许许多多有序行为的可能性。

值得注意的事实是,当系统远离平衡时,整体熵产生以极快的速率增长,这是与第二定律一致的,然而我们却同时观察到极其有序的行为的出现。这样,我们必须修改前人留给我们的信条,即时间箭头总是联系着向无序状态的退化。确实,当时间走到“终点”,再不会发生任何变化的时候,可能出现的就是无序状态。但是在较短的时间尺度上,我们可以看到短暂的结构的出现,只要物质和能量的流动可以继续,这种结构就可以维持存在。下面这一点确很重要,这就是只有当系统对外界是开放的,它才可以保持在偏离平衡的状态:因为这才使得系统所产生的熵可以输送到外界,从而系统可以维持在有序状态,同时容许系统和外界所构成的整体熵增加。

格兰斯多夫和普里高津所给出的是一个“弱”判据,因为它只是说了热力学转折点的可能性,而没有给出它的必然性。它没有像热力学第二定律那样,对宇宙万物随时间的演化方式给出一个铁的法则。它依赖于第二定律以及其他一些附加假设。远离平衡的时候一般地不再有热力学势——不再有作为时间之箭箭靶的单一吸引子。这个判据缺乏普遍性这一点,是美国加州大学戴维斯分校的凯瑟(Joel Keizer)和亚特兰大乔治技术研究所的福克斯(Ronald Fox)指出的。

生机在远离平衡态时萌动

像《银光先生历险记》中那只不叫的狗,给福尔摩斯提供了破案的极其重要的证据一样,格兰斯多夫和普里高津判据的短处,可以转化为值得重视的长处。这个判据之所以不能成为一个普适法则,是因为对远离平衡态的情况,有多种多样的可能性可供选择。这种彻底的复杂性,使得直接因果联系的描述变为不可能,同时可以帮助理解,为什么在许多可能性中采取一种,就赋予系统在时间上演化的实际途径一个特殊的地位。这可以借助于所谓分叉图来说明,它是一种简单的形象化表示,描述了可供选择的多种多样的可能性(分叉的意思是在转折点有叉状分支)。对于我们这位节俭的先生所处的情况,图16表明在接近平衡的时候只有一种可能性,这相当于他处在捉襟见肘的贫困线上(相应于热力学主支)。远离平衡的时候,会出现多得多的可能性或“分支”。图16(a)中,分叉表示当系统达到它的热力学转折点时,该系统面临的难题。

让我们把这种处理用于化学反应,这是不可逆过程的一个极好的例子。随着时间的演化,化学物质相结合,并且从而转变成化学性质上截然不同的产物。例如,氧和氢结合在一起生成水,而铁和大气中的氧相作用形成铁锈(铁的氧化物)。分叉图上显示了,当一个特别的化学反应远远偏离平衡时,可能出现的情况。图16中的纵轴代表反应混合物中某种化学成分A的浓度。横轴代表与化学反应停止时热力学平衡态的“距离”(用希腊字母λ来表示)。点Aeq(A的平衡态浓度,此时λ等于零)是系统中A在平衡时的浓度。当一个系统由于某种限制而不能达到平衡时(例如一个开放系统,其中生成物的排出可以不断地由外界物质的输入加以补充),A的浓度将与Aeq不同。在这种情况下,反应剂A的补充速度与被反应消耗的速度相同,因而使得A的浓度保持不变。这时的浓度与Aeq的差别,就可以作为系统保持偏离平衡时,与热力学平衡态的“距离”的量度。

图16 远离平衡时化学反应的分叉图。(a)最初的分叉。λ表示当最小熵产生的热力学分支变为不稳定时,到平衡态的距离。分支点或转折点决定了λ处的浓度。(b)整个分叉图。当非线性反应远离平衡态时,可能的稳定态的数目急剧增加

分叉图给了我们一些什么启示呢?在平衡态以及平衡态附近,λ处于线性良好的区域(即在热力学主支上),并且系统遵循普里高津的最小熵产生定理,反应混合物也处于稳定的稳恒态。但是当与平衡态的距离超过一个临界的阈值时,就会出现选择,也就是在热力学转折点,即分叉点λc,突然出现两条线。图16中的虚线表示热力学主支,现在它变成为不稳定的了。

这种转折点具有特殊意义,因为越过它以后(它的位置决定于所研究的化学反应的细节),我们在有些情况下可以看到有序行为的出现。这个区域的另一个特点是,此时化学反应可以具有选择。在这种特例中,化学反应有两个新的稳定状态可供选择,过了线性区域后,A的浓度在这两种状态下的值是根本不同的。转折点实际上把一种演化历史感引入到反应混合物中来。这是因为,在许多选择中间必须做出一个选择,使得系统能够沿着分叉图上的一定路线演化到目前状态,因而事实上,系统对于它所做出的选择是有“记忆”的。在另外一个容器里生成的混合物可能是不同选择的结果。化学反应在任一时刻只能存在于一种稳定的状态:两条新分支中实际遵循了哪一支,即系统会处在哪一个新状态,完全像抛硬币决定正反面一样,各有百分之五十的机会。我们将在第6章和第7章看到,当系统面临如此众多的选择,也就是相毗邻的稳定态的数目非常巨大的时候,会出现什么样的情形——这时会发生完全不可预测的动力学行为,也就是所谓的决定性混沌。这种行为可以从图16(b)所示的更广延的分叉图上看出,在这个图上,第一个转折点后面跟着一大批新的转折点。

对于在第一个转折点之后会发生什么情况,格兰斯多夫和普里高津的非平衡态热力学只给出了一幅模糊的图像。它暗示某种重要的情况会发生,但对于实际会发生什么,它一点也没有讲。对于一个化学家,这些选择可能意味着一只周期性改变颜色的化学钟,或者试管里显现出的彩色图案。对于一个生态学家,这些可能性也许意味着动物种群中新的稳恒态或交替变化。对于一个医生,它也许意味着一次心脏病发作。为了恰当地处理这些情况,我们必须基于对(例如描述某个化学反应的)不可逆动力学方程的详尽数学研究。这样的动力学方程引人注目的性质以及它们所描述的复杂纷纭、千变万化的作用,是我们将在第6章要讨论的主题。

远离平衡时出现的新的状态,可以具有一种令人惊异的有序程度,此时无数个分子在时间和空间中的行为达到协调一致。普里高津把这称作“耗散结构”。因为它们发生在系统和外界之间有物质交换和能量交换的情况下,同时伴有系统的熵产生(耗散)。这些导致耗散结构生成的复杂而相互依赖的过程,共同的名称叫做“自组织”。

现在我们可以看到,热力学并不禁止有序结构的自发产生,而第二定律却被普遍错误地认为是朝着无序状态单调地退化的一个代名词。这就是格兰斯多夫和普里高津研究结果的真正意义。1977年,普里高津获得了诺贝尔化学奖,颁奖书中赞扬了他对于非平衡态热力学的贡献,特别提到了耗散结构理论。

如何使耗散结构与“热寂”的概念相符合呢?如果我们的宇宙观草率地应用了平衡态热力学,并忽视了引力的作用,它就会意味着宇宙的演化同义于无情的无序性增长,最终一切变化停止而达到热平衡。但是对于非平衡过程的研究已经表明,一个远离平衡态演化的宇宙,是不能够用如此简单的方式来描述的。在这样的宇宙中,不可逆的非平衡态热力学允许产生自发的自组织结构,使得行星、星系直到细胞、生物得以出现。

不可逆性佯谬

许多科学家认为,他们只能理解那些显示出与原子和分子活动有关的现象。这叫做“归并化”,按照这种说法,其他一切都可以归结到这个被认为是更基本的层次。但是用这种方法处理热力学和它的深奥微妙的时间箭头时,问题就出现了。因为如我们已经看到过的,不论是用牛顿力学来描述,还是用相对论或是量子力学来描述,在微观世界里看来不存在时间箭头。这样的一个结果就是,不存在微观平衡状态:时间对称的规律,不会挑选出一个一切变化潜力都已耗尽的终态,因为所有的时间瞬时都是彼此等价的。原子和分子领域中,运动的明显时间可逆性,是直接与热力学过程的不可逆性相抵触的,这就是罗史密茨(Josef Loschmidt)与其他一些人于1876年提出的一个著名的不可逆性佯谬。它认为,热力学和力学这两座大厦充其量也是不完备的。这个问题明显地需要答案,不应束之高阁。我们的科学探索,也许有一天会使我们理解瞬息万变的意义,但是我们不能就此止步,而必须继续努力,直到我们的理解与前面几章所讨论的理论相一致——因为正像开尔文勋爵有一次指出的,一个无视时间箭头的微观世界,具有可以把宏观世界整个颠倒过来的力量。“如果宇宙中的每一个物质粒子,其运动在任何时刻都是完全可以逆转的,则自然界的进程将永远是简单地可逆的。瀑布脚下飞溅的泡沫会重新聚在一起而流回水中;热运动会把瀑布水滴的能量重新会聚,使水升高从而在瀑布旁边形成另一个向上喷的水柱……活着的动物越来越年轻,它们只知道将来而不记得过去,最后会回到未出生的时刻。”

跨越鸿沟

要跨越现实世界的这两个层次(宏观和微观)之间的鸿沟,就要用到“统计力学”这门学科,它的任务是把量子力学或经典力学中所需要的庞大数目的信息,缩减到少数几个热力学参量。例如,它告诉我们,如何把对一升气体中的单个分子的描述,代之以气体的压力和温度这类更一般的术语。

在微观层次上,这一升气体由巨大数目运动着的分子组成——这个数目的数量级是10后面接着23个零。因此可以想象,要把所有这些分子的行为总括起来得到一个完整的描述,需要多大的信息量。我们需要知道在某个给定的初始时刻,所有分子的速度和位置。但是在宏观层次上,我们知道只需要很少的信息就可以描述气体的总体性质。例如,在平衡态的情况下,只需要知道三个量——气体的压力,它占据的体积以及它的温度。显然,这使得信息量大大地缩减。统计力学的任务,就是表明如何才能实现这样的缩减。

这其中的关键步骤,是把概率论补充进力学定律中。概率论使我们可以把计算建立在平均值的基础上。这种处理方法的根据有二。其一是,即使对牛顿模型也必须用概率描述,因为我们无法掌握所有分子速度和位置的准确信息(对这一不确定性的深入讨论见第8章)。这样,我们所有的论述就变成统计性的,就像在量子力学中那样,虽然这其中的理由与量子力学完全不同。而且,现在我们也只能谈及系统的平均性质,例如,分子的平均能量。

第二个根据是,宏观系统比起构成它们的原子和分子来要大得多。假如我们想要验证一下,抛硬币时正面(或反面)出现的机会是不是50%。这个概率并不意味着,如果把硬币抛两次,必须出现一正一反。只有当我们同时抛掷大量的同样硬币,或者把同一枚硬币反复抛掷多次,平均的行为才会出现——抛掷的次数越多或者硬币的数目越多,才越接近于50%的概率。回到用平均值来描述一个日常物体的分子的行为来,我们算是很幸运,因为这样的物体所包含的分子数目,可以达到亿亿亿个。因而统计力学中计算出来的平均值,一般能够给出一个极好的描述——与此相同,如果我们把一枚硬币抛掷一亿亿亿次,那么平均值与百分之五十的概率的偏离就是微不足道的了。

统计力学的一大问题是,它对于一切变化都停止了的平衡态现象的描述很简单,而对于仍然在随时间演化的非平衡态现象来说,就要远远复杂得多。我们先从平衡态统计力学开始,它给出分子与热力学性质之间的一个明确关系,例如气体分子的平均速度和气体温度之间的关系。平衡态统计力学的关键是一种叫做“配分函数”的复杂数学工具,它能够计算一个系统处于平衡态时的所有宏观性质——例如它的熵和压力,不论这系统是固体、液体还是气体。配分函数在原则上可以准确地从该系统可占的能级计算出来。这些能量可以通过解第4章中谈到过的薛定谔方程而得到。但是从实际的观点来看,这又是一件极其棘手而令人头疼的工作,只有借助于某些奇招,例如巧妙的数学近似,或者是构造一个理想化的模型,才能克服这些困难。然而,一旦我们得到了配分函数,我们就可以用它来给出有关物质所有平衡态性质的答案。例如,可以计算一升气体在平衡态时的熵或自由能,并且确定它在给定温度下的压力,而不需要做任何实验。

当我们用这同样的方法来处理非平衡态过程时,例如描述当容器打开、气体逸出时的行为,就会遇到很大的麻烦。这时候配分函数一下子变得毫不相干,因为只有对于热平衡态它才具有严格的意义。这种简洁巧妙的处理熵和其他热力学量的办法,原来是一条死胡同。

不幸的是,基本原理似乎告诉我们,除此之外,没有其他捷径。让我们来仔细研究一下统计力学的基础之一——采用平均值,而不是采用气体中每一个分子的准确位置和速度。取平均值的方式,决定于我们选用经典力学还是量子力学来描述微观层次。事实上我们是没有选择余地的,因为只有量子力学才能给出对微观世界的最好描述。然而,尽管这两者之间存在差别,但它们所给出的宏观描述,其基本要点却很少有实质性的不同,除掉某些不寻常的现象,例如超导,即在低温下金属完全失去对电流的阻抗。(这种相似性的出现,是由于经典统计力学和量子统计力学在数学形式上非常相似。实质上,由于所考虑的系统中粒子数目是如此巨大,这就使得行为怪异的量子效应变得不明显了。)

求解牛顿方程式,需要先确定一个大的系统中每一个分子的位置和速度。为了避免这样一个毫无希望的尝试,我们采用一种叫做“概率分布函数”的统计学方法。像在选举日那天对投完票的选民进行的民意调查,可以告诉我们选举的结果将会如何一样,概率分布函数亦可以告诉我们系统处于一个特殊状态的概率,在这种状态下所有的分子严格地具有所给定的位置和速度,而这位置和速度是按照牛顿方程随着时间演化的。

如果我们更喜欢用量子力学,则可以用波函数,它“等价”于经典力学中的轨道。当然,像牛顿模型一样,量子描述同样有在原子和分子层次上信息量过大的问题。对于一个系统观测到的宏观表现,可以有难以计数的微观状态与之相容(每一种状态由一个单独的波函数来描述),所以我们不可能希望得知系统实际上是处在哪个状态。对于通常含有万亿个分子的气体,量子态的数目之多是无法想象的。因此我们必须转而采用类似于民意调查,或经典概率分布函数那样的量子力学方法。这种方法叫做(概率)密度矩阵,它告诉我们发现系统处在任何一个量子态的概率,而不同的量子态由不同的波函数来描写。

至此为止,看来一切顺利。我们已经设法找到了一条途径,用量子力学或是经典力学来描写大量分子的统计行为。现在我们必须要做的,是描述一个系统偏离平衡态时的不可逆的演化。我们所需要的是描写经典的概率分布函数和量子密度矩阵如何随时间演化的方程。正好这两者的演化方程是一样的,它们称作刘维—纽曼方程。可惜,刘维—纽曼方程背离了我们的目的。它们是直接建立在经典力学和量子力学的基础之上的,而我们知道,这两者都并不区分时间的方向。因此,这些方程同样是时间对称的:它们可以用来计算平衡态时的熵,就像利用配分函数所做的那样;但是它们不可以独自解释系统偏离平衡而演化时熵的增加,而正是这种熵的增加给我们提供了时间箭头。这就是非平衡态统计力学的基本问题之所在。

玻尔兹曼的时间箭头

我们在序言中就已经谈到过玻尔兹曼,对这位大师是值得特别大书一笔的,因为他曾试图解决前面提到的令人困惑的佯谬。他是维也纳一个税务官的儿子,出生于1844年2月20日,即4月斋开始之前的星期二的夜里,那时狂欢舞会已近结束。他后来常常开玩笑说,这就是为什么他的性格如此容易激动、悲喜无常的原因。玻尔兹曼第一个对基本的物理定律——热力学第二定律——给出了一个统计性的解释,但是他的想法遭到其他物理学家和数学家的激烈反对。在他的学说被广泛承认之前,他自杀了。然而他也有强有力的同盟者。1900年,即玻尔兹曼自杀前仅仅6年,21岁的爱因斯坦写给他的女友米勒娃说,玻尔兹曼“是一位高明的大师。我坚信他的理论原则是对的,也就是说,在气体的情况下,我们确实是在处理具有确定的有限大小的分立质点,这些质点遵照一定的条件在运动”。

作为一个虔诚的天主教徒,玻尔兹曼在奥地利的萨尔兹堡和林兹接受教育,那时正是奥匈帝国时代。当他在维也纳大学攻读数学物理学博士学位时,他就显露出罕见的数学天才。他的导师是物理学家斯忒藩(Joseph Stefan)以及脾气古怪的数学家佩兹瓦尔(Josef Petzval),他是斯忒藩的博士生导师,是他把麦克斯韦的气体动力学理论引进欧洲大陆。玻尔兹曼把麦克斯韦的工作做了进一步的推广,他用的是斯忒藩的另一个学生、前面提到过的罗史密茨最早提出来的统计力学方法。早在量子力学出现之前许多年即1872年,玻尔兹曼就报告了把刘维方程用于气体中大量分子集合的结果,并分析了处理热力学平衡的途径。他的研究终于使时间似乎在微观层次上有了方向。他得到了一个时间不对称的演化方程,现在叫做玻尔兹曼方程,此方程对所谓的单粒子分布函数成立,这种分布函数是对气体中单个分子运动的一种统计描述。从这一方程他构造出一个新的数学函数,即所谓的H函数,它随着时间而减小。这个函数为熵的箭头提供了一个互补箭头,熵在系统向平衡态演化过程中是随时间增加的(H函数在数值上与熵相等,但符号相反)。因此玻尔兹曼声称,他在分子层次上解决了不可逆性佯谬。

这对于玻尔兹曼来说是一个极其重要的成就,因为他一直持有这样的观念:“力学是整个理论物理学大厦的基础,是其他一切科学分支的根基。”但是,为了得出他的不可逆方程,玻尔兹曼做了一个关键近似——“分子混沌”假设。换句话说,他认为分子在快要碰撞之前是彼此不相关的,但是在碰撞之后它们就变得彼此相关了(因为它们的轨道由于碰撞而发生了改变)。因为这个分子混沌假设是时间不对称的,这就解释了为什么玻尔兹曼方程描述了不可逆的时间演化。

因而,非常自然地,分子混沌破坏了牛顿的时间对称的定律。正因为如此以及其他一些原因,玻尔兹曼受到普朗克年轻的助手策梅罗(Ernst Zermelo)以及他自己的朋友罗史密茨的尖锐批评。用更直截了当的话来说,他们认为,不可能希望在无视任何时间方向的方程中,建立起一个唯一的时间箭头。罗史密茨1876年的批评,所根据的是力学的时间对称本性。20年后,策梅罗对玻尔兹曼的批评,则是根据庞加莱的回归论,我们可以回忆一下,它讲的是每一个孤立系统迟早会回到它的初始状态。

这些非难使玻尔兹曼如此震惊,他想从通过力学找到时间箭头的最初打算后退。以致他最后认定,第二定律根据的是概率理论而不仅仅是力学,因而必须摈弃力学归并论,而采用原子论的形式,并且原子也必须用统计方法处理。他后来甚至于赞同这样的观点,即宇宙早就已经处于热寂的状态,或者说是总体热力学平衡的状态,但是我们恰巧位于一个有涨落的区域,涨落使我们离开平衡态,现在它又使我们朝着平衡态回返,同时伴随着熵的增加。这样,玻尔兹曼的主张就是,在宇宙尺度上是没有时间箭头的,有许许多多和我们时间箭头相同的区域,也有同样多的区域,在那里时间箭头和我们的相反。

这是一个有独创性的想法。不幸的是,它是站不住脚的,因为我们从来没有观测到过其他的宇宙部分,在那里时间是颠倒过来的,例如一头公牛越长越小,并且可以把它糟蹋了的瓷器店还原一新。确实,正如我们在第3章中提到过的,现代天文学和宇宙学表明宇宙是在膨胀着的,所以它不可能处在热力学平衡状态。这里必须有一个宇宙学的时间箭头,因为在较早时期,宇宙中的星系是聚在一起的。所有已知的现象都与一个单一方向的时间一致,此时热力学平衡态是在将来而不是在过去。玻尔兹曼最初想使热力学的不可逆性与量子力学和经典力学的可逆性相一致,他的目的是对的。他走在了他的时代的前面,但是缺乏能够战胜他论敌的知识。我们将在第8章再回到这个问题。

在生命的最后几年里,玻尔兹曼仍然热衷于论证热力学行为是原子和分子现象的表现形式。如我们以前提到过的(第1章),这引起了他和他的对手马赫以及奥斯特瓦尔德之间的激烈论战,并且无疑地,由于玻尔兹曼说话啰唆,加之偶尔不加说明地改变自己的观点,这使得论战常常火上浇油。玻尔兹曼的对手是有相当权威的人,又加上玻尔兹曼在说话时声音不够洪亮,这使得他在论战中常处于下风,使他感到沮丧,所以在莱比锡时他就有了自杀的念头。当然也不是说他的对手总是占尽上风。德国数学物理学家索末菲,这样描写过1885年在卢比克科学会议上的一次争论:“玻尔兹曼和奥斯特瓦尔德之间的论战,像是一头公牛和一位灵巧敏捷的击剑手之间的争斗。但是这一次不论这位剑手的技艺多么高超,公牛还是赢了。我们年轻的数学家们都是站在玻尔兹曼这一边的……”然而大多数情况下,玻尔兹曼进行的是孤独而艰难的战斗。在新的一轮反对浪潮的冲击下,玻尔兹曼在他的经典著作《气体理论讲义》的前言中写道:“我意识到自己是在孤零零地奋斗,对时代潮流做软弱无力的反抗。”

玻尔兹曼在1902年从莱比锡返回到维也纳。此时他是创立动力学理论的三巨头中唯一的幸存者——克劳修斯和麦克斯韦都已去世。玻尔兹曼一方面在学术上孤立,另一方面健康日益恶化——他的视力越来越差,常常哮喘、心绞痛和头疼。1903年他的妻子汉丽蒂(她把他叫做“可爱的胖大令”)写给他们的女儿埃达说:“你父亲的身体每况愈下,我已经对他的将来失去信心。我曾幻想过在维也纳的生活会更好。”

在1904年庆祝他的六十大寿的生日宴会之后,玻尔兹曼变得更加郁郁不乐。在1905年到1906年之间的冬季,他讲完最后一节理论物理课后,一位学生这样描述过玻尔兹曼的痛苦:“一种神经质的病(头疼)使他不能继续教学。我和另外一位学生一起,在他的别墅里通过了口试。考试结束后离开时,我们在前厅听到了他令人心碎的呻吟。”一种害怕失去创造性的先天性恐惧以及心绞痛的恶化,加上攻击性的论战,终于使玻尔兹曼在1906年9月5日自杀了。仅仅几年之后,他的原子论学说开始流行起来,这在相当大的程度上是由于爱因斯坦关于布朗运动和分子计数的研究以及佩林(Jean Perrin)很快在苏黎世对此所做的实验证实。在约翰斯顿(William Johnston)的一本内容丰富的名为《奥地利精神》的书里,他谈到了玻尔兹曼所处时代的奥地利知识界,自杀几乎成了一种时髦的风尚,以此来逃避动荡年代的坎坷人生。玻尔兹曼确实有一次说过,“支配我全部心思和行动的,是发展理论”,“为此我可以牺牲一切:因为理论是我整个生命的内容”。

一切都在脑际:“粗粒化”

玻尔兹曼方程现在仍然生机勃勃、充满活力。它被广泛用于描述不可逆的“运输过程”,例如稀薄流体混合物中的扩散和黏滞性,此时玻尔兹曼的假设实际上是一个很好的近似。也有一些人尝试过改进H定理。当初最有希望的是所谓粗粒化方法。不幸的是,它的结果却导致与玻尔兹曼的看法完全不相容的结论。这结论认为时间箭头是纯主观的,只是通过我们所用的近似才存在于微观世界之外。

粗粒化是一种技巧,用于描述我们不能直接观察到的较小尺度上的事件。它可以用来计算一个系统(例如某种气体样品)任意限定的空间亚单元中分子的平均运动。运用这种处理方法,我们可以有效地挽救玻尔兹曼的H定理(它等价于熵的增加)以及与此有关的系统演化的“不可逆性”。这样,在微观的可逆方程与时间箭头之间就建立起联系。

但是,没有什么东西可以告诉我们,粗粒化的程度到底应该如何。用这种方法计算出来的熵,决定于所选取的粗粒大小,这直接与热力学发生矛盾,因为热力学中,熵的改变完全是客观的。除此之外,如果用事后决定的方式进行粗粒化,则不能保证熵会随时间增加——也许它会随时间减少。即使粗粒化的方法可行,也不过是因为我们在某一尺度上引入了近似,而忽略了在更小的尺度之下发生些什么。这使得我们处于一种奇特的情况,即可以任意找一个截止点,用来结束可逆的微观世界,开始不可逆的宏观世界。换句话说,只有在这一个主观决定的界线之上,时间才具有方向的意义:粗粒化方法把整个不可逆性和时间箭头的问题,降格为一种幻术。

如此一来,时间箭头再次变成一种主观的概念。我们为了遵循一个热力学系统的行为而做出的近似,被说成是因为我们不可能遵循构成系统的亿万个分子的运动。如物理学家杰恩斯(Ed Jaynes)所说:“不是因为物理过程本身不可逆,而是因为我们遵循物理过程的能力有限。”这就是说,如果我们的感觉足够灵敏,我们就可以看到分子的单独运动(忽略这在量子力学中引起的问题),从而可以去证实,所有的过程在这种微观层次上真正是可逆的。这马上会使熵的概念,变成我们对一个过程精确细节忽略程度的量度。这个想法在一个叫做信息论的学科里得到了成功的发展。

信息论处理的是译码和发送信息的问题。任何一个信息交换系统——从高保真度收录机到电脑或电话——都无法摆脱随机性的干扰即噪音的影响。信息论的目的就是:从伴随着噪音而接收下来的一切信号中,提取真正有用的信息。这一理论的基础是香农(Claude Shannon)和魏沃(Warren Weaver)在1949年奠定的。就他们所考虑的来说,信息可以由一串毫无意义、杂乱无章的信号组成。信息在技术上唯一的重要性,就是它可以被编码、传送、选择和解读。香农提出了一个信息的纯数学定义,它可以用于一个系统中任何概率分布的情况。利用这个定义,可以计算出在被干扰得一塌糊涂的情况下,发现信息的概率。

香农的数学公式看上去很像统计力学中熵的公式。许多人认为,这表明这两个概念之间有一种直接的联系,于是这就产生了一个结果,即所谓的“最大熵”技术。这一技术极其具有威力,它可以使我们从一大堆乱七八糟的干扰噪音中,把一丁点儿有用的信息找出来。噪音的本质是随机、无序的,这与信息的有序性形成对照。可以说,信号中的信息量越大,它的熵就越小。按照杰恩斯和他的助手的主观性解释,信息“熵”是一种量度,它表示忽视观测尺度之下过程细节的程度——这相当于可逆过程与不可逆过程之间的截止点。信息本身定义为香农的熵的负值,所以有时也称为“负熵”。

信息论中包含了丰富多彩的内容,它在计算机理论和通讯系统工程问题的分析中,有着极其广泛的应用。然而,熵和信息之间的极为相似,并不意味着它们必须都是主观性的概念。事实上,作为信息论的开山鼻祖,香农是在数学家纽曼的劝说之下才把“熵”这个字眼引进他的讨论中的,据说纽曼曾对香农讲:“这样做会使你在辩论中大占优势,因为没有人真正了解熵到底是什么东西!”

不应当认为信息论是为粗粒化打抱不平,而且是向主观主义倒退。事实上,在最大熵技术中并没有用到粗粒化——它并不是做某种任意性的分割,而是把整个系统作为一个“黑盒子”,其中细节我们是不知道的。不论我们从其他什么地方发现一星半点对它的支持,粗粒化已是无可补救。如普里高津和斯坦格斯所写到的:“不可逆性或者对所有的层次都对,或者对所有的层次都不对:它不可能再从一个层次过渡到另外一个层次中间,无缘无故地突然冒出来。”我们在这一章中已经谈到远离平衡态时发生的不可逆过程,在下一章中我们将更详细地讨论这个问题。特别是,在生命本身的存在和维持所必需的、许多关键性的生物过程中,不可逆过程起着基本的作用。如果粗粒化或者主观信息论的说法是正确的,我们则不得不接受这样的观念,即所有这一切皆为虚幻。确实,它会给出一个佯谬结果,也就是说,像我们大脑的功能一样明显是不可逆的宏观过程,都仅仅是由于我们所用的近似所致。

宇宙学的时间箭头

我们已经看到,第二定律如何意味着宇宙的热寂,也就是宇宙最后演化到一种彻底无序的状态。这种看法和宇宙学家们的看法是否一致呢?

在前面几章里,我们已经简略地谈到过时间和宇宙的起源。我们知道宇宙是在膨胀的,而且我们可以预言它的两种可能的极端命运:继续膨胀直到热寂(虽然也有人推测,如我们将在第8章看到的,即使在这样的条件下,也会出现一个恢复了活力的宇宙);或者是大坍缩,此时无处不在的引力最终使膨胀停止,并且使所有的物质不可抗拒地回聚到一起,从而形成一个最终的奇点。即使两者之一中有一个是对的,我们现在也无从得知究竟是哪一个对,因为这实际上决定于宇宙中现有物质的数量,这一点我们在第3章中已经提及。

假设宇宙是闭合的而且在坍缩。给定熵的增长和时间箭头之间的关系,是否大坍缩就意味着,一旦坍缩开始,时间就会逆转?有些人认为是这样的。河水将会倒流。布里斯托尔大学的贝里(Mike Berry)对此讥讽道:“光线会从眼睛里发射出去然后被星辰所吸收。”在这些离奇的想象背后,是这样一个观点:在膨胀过程中,时间箭头是从高度有序的大爆炸奇点,指向某种无序性最大的中间态;然后当宇宙开始向看上去和大爆炸同样高度有序的大坍缩收缩时,时间箭头便反转过来。彭罗斯据理驳斥了这种观点,他认为,即使在大坍缩的过程中,熵也还是增加的,第二定律仍然有效,时间箭头也保持不变(虽然他仍然把第二定律看做是自然界的“二级”定律而不是“一级”定律)。这是由于,大爆炸和大坍缩这两个奇点的结构是不等价的。许多宇宙学家赞同一种对称模型,即大爆炸和大坍缩是不可区分的,因为两者都是物质无限压缩的火球。然而,彭罗斯认为,所有的原初时空奇点都具有一个限制条件,它并不适用于黑洞或者最终的奇点:大爆炸奇点相对于大坍缩来说,有序程度要高得多,熵也要低得多。这个令人惊奇的结果是由于时空在奇点附近的几何结构,它对于大爆炸和大坍缩是不同的(图17)。观测证据表明大爆炸奇点是各向同性的——像一块牛奶冻,不管从什么地方把它切去一半,它显不出有任何结构——并具有高度的有序性和低的熵。但是在走向大坍缩的过程中,会产生像黑洞那样的时空缺陷。它们在大坍缩中凝聚成质量巨大的乱糟糟的一团,具有像果仁蛋糕那样的无序结构和相应的高熵。如果原初奇点没有这样的限制,就不会有第二定律,而且我们也就会期待像发现黑洞那样发现白洞。

图17(a)一个闭合宇宙的历史,它开始于受到高度约束的低熵大爆炸,而终止于混乱的高熵大坍缩。(b)如果没有特殊的初始限制,大爆炸就同样是高熵的。在彭罗斯的图像下,只有(a)才能在宇宙学尺度上满足热力学第二定律。[录自彭罗斯所著《皇帝新脑》]

如果彭罗斯的猜想是正确的,则我们需要知道,为什么在这些奇点中有这样的时间不对称性,使得产生低熵的大爆炸和高熵的大坍缩。许多物理学家也许简单地满足于这样的看法,即特殊的低熵大爆炸状态仅仅是一个“初始条件”(出自上帝之手?)的结果,如此而已。然而彭罗斯却认为,在时间“开始”和“结束”时奇点的独特性质,显然表明量子引力的整个理论必须是时间不对称的。按照他的看法,一个完全令人满意的理论,应当同时对时间演化和初始条件做出解释。到目前为止,看来我们离这个目标还很遥远。

尽管如此,彭罗斯的想法看来已经给出了时间箭头的正确条件。还有一个问题没有解决:如何安排时间的流逝,使其由低熵态——大爆炸,流向高熵态——大坍缩。用现有的与时间方向无关的物理规律,在这两个极端状态之间画上一个箭头,殊非易事:为什么不从大坍缩开始向大爆炸走呢?彭罗斯的说法根据的是用粗粒化来计算熵,这里面就包含了主观主义的各种问题。他承认不同的粗粒化会给出不同的结果,但他认为这在实际上不会造成很大差别,因为在开始和结束时刻所涉及的这两个熵值是有“天壤之别”的。

彭罗斯的推测还有另外一个有趣的推论。他认为一个完备的、具有时间箭头的量子引力理论,可能会解决第4章中讨论过的现代量子论中的一个中心问题——如何理解测量过程。一个包括时间箭头的量子引力理论,也许能够描述不可逆的波函数坍缩,只要存在足够大的时空曲率。事实上,引力相互作用会使波函数砰然爆裂,这样就提供了一种解释,为什么坍缩只能在宏观尺度上发生(由于在这样的条件下有大量的粒子存在,因而就会有可观的引力作用)。彭罗斯承认说:“到目前为止,对于我认为大有需要的新理论来讲,这只能说是刚刚有了一个萌芽。我相信,任何完全令人满意的新理论,必须含有关于时空几何本质的某种根本性的新思想。”

最后,我们注意到,高度有序的大爆炸这个观点使得人存原理(见第3章)看来有些靠不住了。人类在宇宙中出现的机会可能是非常小,但是人存原理认为,我们能够在此提出这个问题,本身就表明命运对人类的创生十分垂青。然而彭罗斯低熵大爆炸的初始条件,比起人类的创生来,其实现的机会真正可以说是小到分子是一,而分母是个天文数字。无疑地,极端形式的人存原理——宇宙是为了有利于人类而创生的——已经站不住脚了,因为人类存在概率之小远不及宇宙存在概率之小。

虽然我们现在对于熵的意义有了一个相当深刻的概念,但是我们仍然没有解决微观世界和宏观世界之间的矛盾。热力学和力学之间的冲突要到第8章才可以解决。在此之前我们想表明,为什么热力学的内涵是如此重要和广泛,不能草率地把它当做附加在力学之上的一种主观主义的旁门左道。为此,我们将在物理学和整个生物学中,浏览一下不可逆性问题。