热力学第二定律——是个什么样的定律呢?在物理行为中,它扮演着什么样的角色?它怎么就向我们呈现了真正深层的秘密?在本书的后面,我们将努力去理解这个秘密令人疑惑的本性,看它为什么可能将我们驱向求解的崎岖长路。我们将走近宇宙学的未知领地,面临一些空前的难题,我想只有从全新的观点来看我们宇宙的历史,才有可能解决它们。不过,这些都是以后的事情。现在我们还是用心来看看这个无所不在的定律蕴藏着什么东西。
我们平常说起“物理学定律”,是指两种不同事物之间的等式。例如,牛顿的第二运动定律是将一个粒子的动量的变化率(动量等于质量乘以速度)与作用在它上面的外力的总和等同起来。再看能量守恒定律,它说的是一个孤立系统在某一时刻的总能量等于它在其他任何时刻的总能量。类似地,电荷守恒定律、动量守恒定律和角动量守恒定律,也是关于总电荷、总动量和总角动量的对应等式。爱因斯坦的著名定律E=mc 2 说的是,一个系统的能量总是等于它的质量乘以光速的平方。再看一个例子,牛顿第三定律指出,在任意时刻,物体A作用于物体B的力,总是等于B反作用于A的力。众多其他物理定律也是如此。
所有这些定律都是等式——所谓热力学第一定律也是,其实它就是能量守恒定律,不过是在热力学环境下说的。我们强调热力学,是因为我们现在考虑热运动的能量,即组成系统的单个粒子的运动。这个能量是系统的热能,我们定义系统的温度等于每个自由度(我们接着要讨论)的能量。例如,当空气的摩擦阻力减缓粒子的运动时,尽管动能因运动轨迹的摩擦而损耗了,但并不违反总的能量守恒定律(即热力学第一定律)——摩擦产生的热,使空气和轨迹中的其他分子在随机运动中变得更有活力了。
然而,热力学第二定律却不是等式,而是不等式,它只是断言,一个孤立系统的某个特定的量(我们称为熵)——它是系统无序性(即“随机性”)的度量——在后来时刻的数值,将大于(或至少不小于)它在以前时刻的数值。由于陈述显而易见的薄弱,我们会发现,对一般系统而言,熵的定义也存在一定的模糊和随意。而且,在大多数表述形式下,我们会发现一些偶然或例外的情形,必须认为熵随时间(尽管是暂时的)而减小,虽然就总的趋势来说,熵还是增大的。
不过,第二定律(以后我都这样简称它)除了这一点内在的看似模糊的地方以外,它有着极大的普适性,远远超越我们所能考虑的任何特殊的动力学法则的系统。例如,它不仅适用于牛顿理论,也同样适用于相对论;它不仅适用于只包含离散粒子的理论,也同样适用于连续场的麦克斯韦电磁理论(我将在2.6,3.1和3.2节做简短介绍)。它甚至还适用于假想的动力学理论,尽管我们没有多大的理由相信它们与我们生存的宇宙有任何关联;当然,它最有用的地方还是现实的动力学纲领,诸如牛顿力学等。那些理论都具有确定性的演化,而且是时间可逆的,从而对任何可能的向未来的演化,如果颠倒时间方向,它们都会给出同样可能的演化图景。
换一种我们熟悉的方式。假设我们放一段影片,表现某个符合动力学定律——如牛顿定律——的时间可逆的行为,那么倒放影片所表现的过程,同样符合那些动力学定律。关于这一点,读者也许感到疑惑。假如影片表现一个鸡蛋从桌面滚下,落到地面砸碎,这是允许的动力学过程;可倒放的影片——地板上的破碎蛋壳神奇地重新组合,蛋清和蛋黄也各自聚集,钻进蛋壳里,然后跳回桌面——却是我们不可能看到的物理学过程(图1.1)。尽管如此,单个粒子的牛顿力学,包括粒子对作用在它的所有力的加速反应(遵从牛顿第二定律)和粒子之间的碰撞的弹性反应,都完全是时间可逆的。根据现代物理学的标准程序,相对论和量子力学的粒子的更精细的行为,也是时间可逆的——当然,广义相对论的黑洞物理学(也涉及量子力学)出现了某些微妙的特征,但我现在还不想纠结于它们。其中有些微妙的东西对我们以后的讨论是至关重要的,我们将在3.4节细说。不过眼下,我们满可以完全用牛顿图景来描述事物。
图1.1 一个鸡蛋从桌子滚下,落到地上碎了,遵从时间可逆的动力学法则
我们必须让自己习惯这样的事实:正反两个方向播放的影片所表现的情景,都满足牛顿动力学,但自我复合的鸡蛋却不符合第二定律,而且是极其不可能的事情,我们完全可以认为它不可能在现实发生。大致说来,第二定律说的是,事物总是变得越来越“随机”。所以,假如我们设定一个特殊的情景,让动力学驱动它向未来演化,那么系统将随时间向越来越随机的状态演进。不过严格说来,考虑到我们上面的情形,我们不能说它准会演进到越来越随机的状态,而应该说,它(大概)会以压倒性的可能向更随机的状态演进。在现实中,我们必须根据第二定律相信事物确实会随时间变得越来越随机,但那只是代表一种压倒性的可能,而不是绝对的确定。
尽管如此,我们还是可以相当有把握地断言,我们要面对的是一个熵增过程——也就是随机性增大的过程。这样说来,第二定律也许有点儿令人失望,因为它告诉我们事物只会随时间变得越来越没有组织。然而,这听起来不像什么神秘的东西,没有本节标题该有的意味。这不过是事物自然活动的一个明显的特征。第二定律似乎只是表述了寻常事物的一种不可避免、也多少令人泄气的特征。实际上,从这样的观点看,热力学第二定律是我们所能想象的最自然的事情,当然它也反映了我们最普通的经验。
也许有人疑惑,地球上出现生命,看起来是那么精妙,似乎与第二定律所要求的无序增加相矛盾。我以后会解释(见2.2节),这不是什么矛盾。就我们所知,生物学总的说来满足第二定律所要求的总的熵增。本节标题所指的神秘,是完全不同的尺度秩序的物理学的神秘。尽管它与生物学不断呈现给我们的神秘而奇异的组织有着一定的关联,但我们还是有很好的理由相信那与第二定律没有任何矛盾。
不过,有一点需要说清楚,它与第二定律在物理学中的地位有关:第二定律代表一种独立的原理,必须与动力学定律(例如牛顿定律)相结合,而不能认为是那些定律演绎的结果。然而,一个系统在任意时刻的熵的定义,对时间方向来说是对称的(所以,不管影片正放还是倒放,那个落地的鸡蛋在任意时刻的熵都有相同的定义);如果动力学定律也是时间对称的(牛顿动力学正是如此),而系统的熵不是常数(如那个打碎的鸡蛋),则第二定律不可能从动力学定律推导出来。因为,假如熵在某个特殊情形是增大的(如鸡蛋碎了)——这符合第二定律——那么,在相反的情形(如鸡蛋神奇地复合了),熵一定是减小的,这就完全违背第二定律了。由于正反两个过程都符合(牛顿)动力学,于是我们看到,第二定律不可能简单归结为动力学定律的结果。
那么,物理学家在第二定律里所说的“熵”,究竟要怎么量化“随机性”,我们才不会看到一只打碎的鸡蛋自己复合,从而排除这种严峻的可能呢?为了更具体地说明熵的概念到底是什么,也为了更好地描述第二定律究竟讲了什么,我们来考虑一个比碎鸡蛋更简单的例子。假如我们在瓶子里倒几滴红墨水,然后倒几滴蓝墨水,好好搅拌,过一会儿,红蓝墨水将失去本色,最终完全融合,瓶子里看到的就是紫色的墨水了。在这以后,不管怎么搅拌,紫墨水都不会分离成原来的红蓝墨水,尽管搅拌背后的微观物理过程是时间可逆的。实际上,即使不去搅拌,紫色最终也会自发形成,如果我们给墨水加点儿热,就更容易了。不过在搅拌下,紫色状态可以更快达到。用熵来说,原先的红蓝颜色分离的状态有着较低的熵,而最终的紫墨水的熵要大得多。实际上,整个搅拌过程不仅为我们呈现了一个满足第二定律的情景,它还开始让我们明白第二定律到底在说什么。
让我们更准确地来看看熵的概念,从而更明白发生了什么。一个系统的熵到底是什么呢?大略说来,熵是相当基本的概念,尽管它牵扯些微妙的见识——主要来自奥地利物理学家玻尔兹曼(Ludwig Boltzmann),它只不过是计数不同的可能性。为简化问题,我们把墨水的例子理想化,考虑每个墨水分子的位置只有有限个(尽管数量很大)可能。我们将分子看作蓝色或红色的小球,它们只能占据离散的位置,聚集在N 3 个小格子里。墨水瓶就是那些小格子组成的一个巨大的N×N×N立方体箱子(图1.2)。在图中,我假定每个格子恰好有着一个蓝球或红球。
为确定瓶中某个位置的墨水颜色,我们对那个位置附近的红球与蓝球的相对密度做某种平均。我们用一个立方体盒子将那位置围起来,盒子比整个箱子小得多,但比刚才说的小格子大得多。假定这个盒子包含大量刚才考虑的小格子,构成整个箱子的一种立方填充,不过不如原先格子填充那么密实(图1.3)。假定每个盒子的边长是原来格子的n倍,则每个盒子有n×n×n个格子。这儿的n虽然很大,但远远小于N。
图1.2 N×N×N立方体箱子,每个格子包含一个蓝球或红球
图1.3 大小为n×n×n的格子组合成k 3 个盒子
N》n》1
为计算简洁,我假定N恰好是n的倍数,即
N=kn
这儿k是整数,是箱子的每个边排列的盒子数。于是,箱子里共有k×k×k=k 3 个内嵌的盒子。
我们的想法是用这些中间盒子来度量盒子里某个位置的“颜色”。在这样的盒子里,我们可以认为每个球都太小而不可能单个地看到。结果是一种平均的颜色,通过对盒子里的蓝球和红球的颜色的“平均”,可以为每个盒子赋予一定的色调。假如盒子里红球的数目为r,蓝球的数目为b(于是r+b=n 3 ),那个位置的色调可以定义为r与b之比。因此,如果r/b大于1,我们就认为它更红;如果r/b小于1,我们就说它更蓝。
我们假定,如果n×n×n个格子的每一个的比值r/b都在0.999和1.001之间(即r和b在千分之一的精度上是相同的),则混合颜色就显现为均匀的紫色。乍看起来这也许是相当严格的要求(它得满足每个n×n×n格子)。但我们发现,在数目变得很大时,多数的球填充方式也的确满足这个条件!我们还应该记住,考虑墨水瓶里的分子时,它们的数量在常规看来会大得惊人。例如,一瓶普通的墨水大约有10 24 个分子,所以,取N=10 8 没有任何问题。另外我们看到,数码相片在10 -2 厘米的像素上能完美表现色彩,所以在这个模型里,取k=10 3 也是蛮有道理的。根据这些数字(N=10 8 ,k=10 3 ,从而n=10 5 ),我们发现1/2 N 3 个蓝球和1/2 N 3 个红球的集合,有10 23570000000000000000000000 种不同组合方式显现均匀的紫色。而生成原先的蓝球全在顶部而红球全在底部的组合,只有10 46500000000000 种不同方式。于是,对完全随机分布的球来说,几乎可以肯定会出现均匀的紫色,而所有蓝球都在上面的概率只是10 -23570000000000000000000000 (即使我们不是要求“所有”而只是99.9%的蓝球在上面,这个概率也不会有大的改变)。
我们将把“熵”看作那些概率的某种度量,或者生成同样“整体表现”的那些不同组合方式的数目。具体说来,直接用数目将得到一个极难驾驭的度量,因为它们的大小太悬殊了。不过幸运的是,我们有很好的理论上的根据,可以取那些数字的自然对数来作为更恰当的“熵”度量。对不大熟悉对数(特别是“自然”对数)的读者,我们用以10为底的对数来表示——记作“lg”(而自然对数为“ln”)。为理解lg,我们需要记住
lg 1=0,lg 10=1,lg 100=2,lg 1000=3,lg 10000=4,
等等。就是说,对10的幂次的对数,我们只要数它有多少个0。对不是10的幂次的正整数的对数,我们可以推广这个法则,其整数部分(即小数点前的数字)等于原来的位数减1,例如(整数部分为黑体字)
lg 2=0. 3……
lg 53=1. 7……
lg 9140=3. 9……
等等。在每个情形下,黑体字都比原数的位数少1。对数(lg或ln)最重要的性质是将乘法转化为加法;即
lg(ab)=lg a+lg b
(在a和b都是10的幂次的情形,这是显而易见的,因为a=10 A 乘以b=10 B 得到ab=10 A+B 。)
上面列出的关系,对我们在熵概念中运用对数有着巨大意义。如果一个系统由两个分离而且完全独立的单元组成,那么系统的熵就简单地等于将各部分的熵加起来。在这个意义上,我们说熵是可加的。具体说,假如第一个单元能以P种不同方式产生,第二个单元为Q种,则由两个单元组成的整个系统将以PQ种不同的方式生成(因为对第一个单元的P种生成方式的每一种,第二个单元都有Q种生产方式)。于是,如果我们定义任意系统的状态的熵正比于生成那个状态的不同方式数的对数,就能确保独立的系统都满足可加性。
然而,“生成系统状态的方式数”是什么意思,我还没说清楚。首先,我们模拟(墨水瓶里)分子的位置时,通常不考虑现实的分子会占有离散的格子,因为在牛顿理论中,每个分子都有无限而不是有限个不同可能的位置。另外,每个分子都可能有不那么对称的形状,因而在空间有不同的定向方式;它还可能有其他的内在自由度(如变形),这些都应该考虑进来。每个定向或变形都应该算作系统的不同构形。我们将通过系统的构形空间(下面接着讲)来处理这些问题。
具有d个自由度的系统,构形空间将是一个d维空间。举例来说,如果系统由q个点粒子p 1 ,p 2 ,……,p q 组成(每个粒子都没有任何内在自由度),那么构形空间有3q维。这是因为,每个粒子只需要3个坐标来决定它的位置,所以共有3q个坐标,从而构形空间的一个点P确定了所有p 1 ,p 2 ,……,p q 的位置(见图1.4)。在更复杂的具有内在自由度的情形,每个粒子将有更多的自由度,但一般思想还是一样的。当然,我并不指望读者能“构想”在那么高维的空间里发生的事情。这是不必要的。我们只需要想象2维空间(如画在纸上的一个区域)或通常3维空间里发生的事情,就能得到足够的认识。不过要牢记,那种图像难免存在一定的局限,我们马上就会遇到一些。当然,我们还应该记住,那样的空间是抽象的纯数学空间,不能与我们经历的3维物理空间或4维物理时空混为一谈。
图1.4 q个点粒子p 1 ,p 2 ,……,p q 的构形空间是一个3q维空间
我们定义熵时,还有一点需要说明,那也是我们正要考虑的问题。在我们的有限模型里,蓝球与红球的组合数目是有限的。可是现在,我们有无限多的组合方式(因为粒子的位置需要连续参数),这就需要我们考虑构形空间里的高维体积,才能得到关于大小的恰当度量,而不是细数一个个的事物。
为理解高维空间的“体积”,我们先来看低维情形。对2维曲面的一个区域来说,“体积度量”其实就是那个区域的曲面面积。在1维空间的情形,我们只考虑沿着曲线的某个部分的长度。在n维构形空间,我们要用普通3维区域的体积的某种n维类比来思考。
那么,在熵的定义里,我们该度量构形空间的哪个区域的体积呢?基本说来,我们要关心的是构形空间里某个特殊区域的体积,它对应于与我们考虑的某个特殊状态“看起来一样”的所有状态的集合。当然,“看起来一样”是很模糊的说法。它的真正意思是,我们有某个理论上可以穷尽的宏观参数的集合,能度量系统的诸如密度分布、颜色和化学组成等特征,但我们不去理会组成系统的每个原子的精确位置等细节。在这个意思下将构形空间 分解为“看起来一样”的区域,叫空间 的“粗粒化”。于是,每个“粗粒化区域”的点所代表的状态,可以通过宏观观测与其他区域的状态区分开来。见图1.5。
图1.5
的粗粒化
当然,“宏观”观测的意思还是很模糊的,不过我们这儿是在寻求某种“色调”的类比,就像我们在简化的墨水瓶的有限模型里用过的一样。我们承认,这个“粗粒化”的思想确实有某些模糊的地方,但在熵的定义中,我们关心的是构形空间里的那个区域的体积——或那个粗粒化区域的体积的对数。是的,这还是有点儿模糊,然而,不同寻常的是熵的概念表现得那么强健,主要就因为粗粒化的区域具有无比巨大的体积比。
不过,我们还没完成熵的定义,到这会儿,我们只谈了问题的一半。看一个略微不同的例子,就会发现前面的描述有不足的地方。我们不说红蓝墨水,而考虑装着一半水和一半橄榄油的瓶子。我们可以随意混合,也可以用力摇晃。但过一会儿,油和水会分开。我们看到油浮在上面,而水在下面。尽管如此,熵在分离的过程中仍然在增大。其中的关键一点是,橄榄油分子之间存在强烈的相互吸引,使油分子聚集而将水分子排斥。仅靠构形空间的概念不足以解释这种情形的熵增,我们需要考虑单个粒子/分子的运动,而不仅是它们的位置。不管怎么说,它们的运动是必要的,这样我们才能根据牛顿定律(假定它们在这儿也起着作用)决定未来的状态演化。对橄榄油分子而言,强吸引使分子速度增大,越来越靠近(它们做着严格的相互环绕的轨道运动),正是那关联空间的“运动”部分,为橄榄油分子的聚集提供了必需的额外体积(从而产生额外的熵)。
图1.6 相空间 维数是构形空间的两倍
我们需要的这个空间,不是前面说的构形空间 ,而是所谓的相空间。相空间 的维数是构形空间的两倍!在相空间里,每个组成粒子(或分子)的位置坐标,除了原来那个位置的坐标外,一定还有对应的“运动”坐标(见图1.6)。我们也许会想象,那种坐标的一个恰当选择是速度(或角速度,对应于描述空间方向的角坐标)的恰当度量。然而,后来发现,我们应该用动量(或角动量,对应于角坐标)来描述速度(这是因为它与哈米尔顿理论的形式有着深刻的联系 [1.1] )。在我们熟悉的多数情形,只需要知道“动量”就是质量乘以速度(如1.1节讲的)。这样,构成我们系统的所有粒子的瞬时运动连同它们的位置,就都蕴含在相空间 的单个点p的位置里了。所以我们说,相空间 内的点p的位置描述了系统的状态。
我们考虑的主宰系统行为的动力学定律,也可以看作牛顿运动定律。但我们还可以处理更一般的情形(如麦克斯韦电动力学的连续场,见2.6,3.1,3.2节和附录A1.),它们也来自哈米尔顿方程的宏大框架。这些定律是决定性的,因为我们系统在任何时刻的状态完全决定了它在其他任何时刻(不论更早还是更晚)的状态。换句话说,根据这些定律,我们可以将系统描述为相空间 内沿曲线(叫演化曲线)运动的一个点p。这条演化曲线代表了整个系统在动力学定律下从某个初始态(我们用相空间 中的一个p 0 点来代表)开始的唯一演化(见图1.7)。实际上,整个相空间将充满那样的演化曲线(犹如一捆稻草),其中每一点都处于某条特殊的演化曲线上。我们必须把这些曲线看作定向的——意思是我们必须为曲线赋予一个方向,为此我们可以给它加一个箭头。我们的系统在动力学定律下的演化,就由运动的一个点p来描述——在眼下的情形,它沿着从p 0 点出发的演化曲线,向着箭头指定的方向运动。这为我们呈现了p点所代表的系统的一个特殊状态的未来演化。如果从p 0 出发沿着箭头的反方向,演化曲线呈现的是演化的时间反演过程,它告诉我们p 0 代表的状态是如何从过去的状态生成的。这个演化在动力学定律下也是唯一的。
图1.7 点p沿着相空间中的一条演化曲线运动
相空间有一个重要特征:自量子力学诞生以来,我们发现它有一个自然的度量,可以从本质上将相空间的体积视为一个无量纲数。这一点很重要,因为玻尔兹曼的熵(马上就要讨论它)是以相空间体积的形式定义的,需要我们能够比较不同的高维体积的度量,它们的维数可以悬殊。从寻常的经典(非量子)物理的观点看,这似乎有点儿奇怪,因为在普通名词中,我们总是认为曲线的长度(1维“体积”)不如曲面的面积(2维“体积”)那么大,而曲面面积又小于3维体积,等等。但量子力学要我们用的相空间体积,以满足 的质量和距离单位来度量,只是纯粹的数。量 即狄拉克的普朗克常数(有时也叫约化普朗克常数 [1.2] ),其中h是寻常的普朗克常数。在标准单位里,的值极其微小:
于是,我们平常遇到的相空间度量将具有极其巨大的数值。
如果只考虑整数,相空间就仿佛“一粒粒的”了,这为量子力学的“量子”提供了离散性。但在大多数普通情形下,这些数都很大,所以颗粒性和离散性都不显著。一个例外是我们将在2.2节讨论的普朗克黑体辐射谱(图2.6和注释1.2),这是普朗克1900年的理论分析所解释的观测现象,启动了量子力学的研究。在这儿我们必须考虑同时包含不同数量光子的平衡状态,也就要考虑不同维数的相空间。恰当讨论这一点,超出了本书讨论的范围 [1.3] ,不过我们将在3.4节谈量子理论的基本知识。
有了系统的相空间概念,我们还需要明白第二定律如何在其中运作。和讨论构形空间的情形一样,这要求我们将 粗粒化,其中属于同一粗粒化区域的两点在宏观参数上可以认为是“不可区分的”(如流体的温度、压力、密度、方向和流量,如颜色、化学组成,等等)。原来用 中的一点p来代表的系统状态的熵S,现在由著名的玻尔兹曼公式来计算:
S=k′lg V
这里V是包含p点的粗粒化区域的体积。量k′是一个小常数(如果选择自然对数,它就等于玻尔兹曼常数,k′=k ln10,ln10=2.302585……),k是玻尔兹曼常数,其值很小:
k=1. 3865……×10 -23 焦耳/开尔文
于是k′=3.179……×10 -23 焦耳/开尔文(J.K -1 )(见图1.8)。实际上,为了和物理学家通常的定义一致,以后我们还是用自然对数,将玻尔兹曼的熵公式写成
图1.8 高维空间里的粗粒化
S=k ln V
其中ln V=2.302585……×lg V。
在继续探讨这个精密定义的理由和意义及其与第二定律的关系之前(1.4节),我们先来欣赏它精彩解决的一个特别问题。有时人们(当然很对)指出某个状态的低熵并不能真的很好度量状态的“特殊性”。如果还考虑1.1节里的鸡蛋下落的例子,我们注意到,鸡蛋打碎在地板上所处的相对高熵的状态,仍然是一个非常特殊的状态。其特殊在于,构成那堆“蛋花”的粒子的运动之间有着非常特殊的关联。假如我们颠倒所有运动,那些碎花就会很快自我修复成完好的鸡蛋,弹回桌面,恰好落在原来的地方。这当然是一个非常特殊的状态,一点儿不亚于桌子上的那个鸡蛋的相对低熵的构形。但是,尽管构成地板上的碎鸡蛋的状态确实很“特殊”,却不是我们所说的“低熵”意义的特殊。低熵指显现的特殊性表现为宏观参数具有特殊的值。当一个系统的状态被赋予一定的熵,粒子运动之间的微妙关系就荡然无存了。
我们看到,尽管某些相对高熵的态(如刚才考虑的时间倒转的碎鸡蛋)能演化为低熵态,与第二定律冲突了,但它们只代表非常微小的可能性。可以说,这正是熵概念和第二定律的“整体观”。玻尔兹曼的熵定义以非常自然而恰当的方式解决了这类“特殊性”问题。
还应该指出一点。有一个重要的数学定理叫刘维尔(Liouville)定理,它断言,对物理学家考虑的常态经典动力学系统(前面说的标准哈密尔顿系统)而言,时间演化在相空间中的体积保持不变。这一点如图1.7右边所示,我们可以看到,如果在相空间中体积为V的区 域V 0 在时间t后沿演化曲线到区域V t ,那么我们会发现V t 与V 0 有着相同的体积V。不过这一点并不与第二定律冲突,因为粗粒化区域是随演化改变的。假如初始区域V 0 碰巧是粗粒化区域,那么时间t之后的V t 有可能在一个或者几个更大的粗粒化区域随意延展。
结束本节之前,我们接着1.2节简要谈过的问题,再来看看在玻尔兹曼公式里应用对数的重要性。这个问题对我们以后(特别是3.4节)有着特殊的意义。假如考虑我们本地实验室的物理,想对某个实验所涉及的一些结构的熵进行定义,那么,相对于我们实验的玻尔兹曼的熵定义应该是什么呢?我们将考虑所有相关的自由度,然后用它们来定义一个相空间 ,让体积V的粗粒化区域 落在 中,从而确定我们的玻尔兹曼熵k ln V。
然而,也可以考虑我们的实验室是一个更大的系统(例如我们所在的整个银河系)的一部分,这样就将有多得多的自由度。把所有的自由度都囊括进来,我们会发现相空间比以前大多了。而且,与我们实验室的熵计算相关的粗粒化区域也将远远大于从前,因为它包含了银河系里的所有自由度,而不仅仅是与实验室的内容有关的自由度。不过这是自然的,因为现在的熵值也适用于整个星系,而我们实验的熵只是它的一个小小的部分。
图1.9 实验者考虑的相空间只是包含了银河系的所有外自由度的外空间的一
图1.10 积空间,其中
是平面而 是直线
定义外自由度的参数(即除了决定实验室状态的参数之外的那些确定星系状态的自由度)为我们呈现了一个巨大的外相空间 ,还有 中的一个粗粒化区域 ,它刻画了实验室外的星系的状态。见图1.9。整个星系的相空间 由全部参数(决定空间 的外参数和决定空间 的内参数)的集合来定义。数学家们把空间 称作 和 的积空间 [1.4] ,写作
图1.11 积空间的粗粒化区域是各组成空间的粗粒化区域之积
其维数是 的维数与 的维数之和(因为它的坐标是 的坐标和 的坐标的合并)。图1.10说明了积空间的概念,其中 是平面,而 是直线。
假定外自由度完全独立于内自由度,空间 中的相关粗粒化区域就将是 中的粗粒化区域 与 中的粗粒化区域 的乘积(见图1.11)。
而且,积空间的体积元也是组成空间的体积元的乘积,于是 中的粗粒化区域 的体积为 中的粗粒化区域 的体积W与 中的粗粒化区域 的体积V的乘积WV。利用对数把乘积转换为求和的性质,我们就得到玻尔兹曼熵为
k ln(W V)=k ln W+k ln V
即实验室内的熵与实验室外的熵之和。这正好告诉我们独立系统的熵是“加”在一起的,表明熵的数值可以赋予物理系统的任何一个部分,而与系统的其他部分无关。
我们这儿考虑的情形中, 指的是与实验室有关的自由度, 则是与外星系有关的(假定彼此独立),我们发现实验者赋予正在进行的实验的熵值klgV,在忽略外自由度时,将不同于考虑外自由度时的熵值klg(W V),差别恰好是klgW,即赋予外星系的自由度的熵。这额外的部分对实验者没有意义,因而在研究实验室的第二定律时,可以安全地忽略它。然而,当我们在3.4节考虑整个宇宙的熵平衡时,特别是在考虑黑洞的熵贡献时,我们会发现这些外熵是不能忽略的,因而对我们具有根本性的意义!
关于整个宇宙的熵的问题,暂且放到一边。现在可以只管玻尔兹曼公式的值,因为它为我们提供了一个极好的概念,说明物理系统的熵到底应该定义成什么。玻尔兹曼是在1875年提出那个定义的,在前人的基础上大大前进了一步,从而我们现在才可能将熵的概念用于最普遍的情形 [1.5] ,而无需什么假定,例如要求系统处于什么特别的稳定状态之类的。不过,这个定义也有模糊的地方,主要在于对“宏观参数”的意义有不同的认识。例如,我们可以想象未来有可能测量流体状态的很多细节,而在今天它们是“不可测量的”。不仅是测量诸如压力、密度、温度和流体在不同位置的速度,未来还可能高度精确地确定流体分子的运动,甚至测定流体内特定分子的运动。于是,相空间的粗粒化必然要比过去精细得多。结果,这个新方法所确定的流体的某个特殊状态的熵,可能会比以前确定的熵小一些。
有些科学家提出 [1.6] ,像这样用新方法来确定系统更详尽的细节,总会使测量仪器的熵增大,它将弥补因为精密测量而必然导致的系统熵的减小。于是,精细的系统测量也会在总体上导致熵的增大。这是非常合理的,但即使我们考虑这一点,玻尔兹曼的熵定义仍然有一点儿模糊。例如,整个系统的“宏观参数”由什么构成,我们并没有客观的标准,而且也几乎不可能通过那些思考来澄清。
19世纪大数学物理学家麦克斯韦(James Clark Maxwell,他的电磁学方程我们已经在前面引介过了,见1.1和1.3节)曾想象过这类事情的一个极端例子。他构想了一个“小妖”,她能通过打开或关闭一扇小门来为单个分子引路。这样,用于气体本身的第二定律就失灵了。不过,为了考虑整个系统,将麦克斯韦小妖的身体也作为一个物理实体包括在内,那么我们的图景中就必须显现小妖的亚微观组成,倘若这样,第二定律依然能保住。
更现实地说,我们设想用某个小小的机械装置来替代小妖,然后我们可以说第二定律对整个结构依然成立。然而,在我看来,这种想象并没恰当地解决宏观参数由什么构成的问题,而且那种复杂系统的熵的定义,多少还是有点儿神秘。像流体熵那样显然确切定义了的物理量,竟要依赖于当下的技术状态,确乎有点儿奇怪!
然而值得注意的是,在通常的方式下,如此的技术进步,能给可能赋予系统的熵值带来多少改变呢?整体说来,以那种方式重新划分粗粒化区域的边界,和改进技术一样,只能很小地改变系统的熵值。我们必须记住,鉴于测量仪器在任何时候所能达到的精度,为系统赋予的熵的精确值可能总会存在一定的主观性,但我们不会因为这个理由而认为熵不是有物理意义的概念。事实上,在通常情况下,那种主观性的影响是微乎其微的。原因在于,不同粗粒化区域倾向于占据悬殊的体积,其边界的细微的重新划分对其赋予的熵值不会产生显著的变化。
为具体感受这一点,我们再来看红蓝墨水的简化图像。假定它有10 24 个组成部分,占据着相同数量的红色和蓝色小球。如果在一个10 5 ×10 5 ×10 5 的立方格子里蓝色球的比例在0.999和1.001之间,我们就认为那个位置是紫色的。而如果用更精密的仪器,那么我们能在更精细的尺度上更加精确地判断红蓝球的比例。假定只有当红球与蓝球的比例在0.9999和1.0001之间时(从而红球和蓝球的数量在万分之一的精度上相等)——比前面要求的精度高10倍——我们才认为混合体是均匀的,而且还假定检验的区域只需要原来尺度的一半——即体积为原来要求的八分之一。尽管这样能把精度提高很多,但我们发现为“均匀紫色”状态所赋予的“熵”(即满足条件的状态数的对数)几乎没有什么变化。所以,“改进技术”不会有效改变我们在这种情形下所得到的熵的数值。
这当然只是一个“玩具模型”(而且是构形空间而不是相空间的玩具模型),我们用它来强调这样的事实:在确定“粗粒化区域”过程中的“宏观参数”的精度改变,不会引起显著的熵值的改变。熵之所以具有这种刚性,就是因为我们面对的粗粒化区域的数量很大,尤其是不同区域尺度的差别很大。更现实的情形,我们可以考虑洗澡时候的熵增。为简化起见,我不想估算真正的洗澡过程的熵增(尽管它并非微不足道),而只关心冷热水混合(在浴缸里混合或在水龙头里混合)时发生的事情。我们可以合理假定,热水流出时的温度为50℃,而冷水为10℃,浴缸里的水的体积为150升(一半热水,一半冷水)。结果,熵增大约是21407J/K,相当于我们在相空间的点从一个粗粒化区域移动到一个大10 27 倍的区域!至于粗粒化区域的界线该精确划在什么地方,随你怎么划,只要看起来合理,都不会对这样尺度的数字产生大的影响。
还有一个相关问题需要在这儿提出来。我前面说的仿佛意味着粗粒化区域定义明确而且边界确定,但严格说来,不论我们用什么可能的“宏观参数族”,情况都没那么简单。实际上,不论粗粒化区域的边界划在哪儿,如果我们考虑相空间中靠得很近的两点(分别在边界的两边),则它们几乎代表同一个状态,从而有着同样的宏观表现。可是从所属不同粗粒化区域来看,这两个点却是“可以宏观区分的”! [1.7] 为解决这个问题,我们可以要求在粗粒化区域的边界处存在一个“模糊区”。另外,考虑到作为“宏观参数”的量的主观性,我们干脆就不管相空间中处于“模糊边界”的点(见图1.12)。我们有理由认为,与粗粒化区域的体积比起来,那些点占据的相空间体积是微不足道的。所以,不论把边界附近的点划归哪个粗粒化区域,都是无关紧要的,不会真的给系统在通常情形下的熵值带来什么影响。于是,我们再一次看到,系统的熵的概念是十分刚强的——尽管定义并不十分严密——这都是因为粗粒化区域数量巨大而不同区域的体积相差十分悬殊。
图1.12 分隔不同的粗粒化区域的边界的“模糊区”
尽管说了那么多,我们还要指出,在很多特别难以把握的情形下,诸如“宏观不可区分”之类的粗糙概念看起来就不够用了,甚至会给熵带来相当错误的答案!一种情形出现在用于核磁共振(NMR)的自旋回波现象[哈恩(Erwin Hahn)在1950年第一次发现的]。在这个现象里,原先处于某个特殊磁化态(核自旋 [1.8] 近似排列在一个方向)的材料,会在一个变化的外加电磁场的影响下失去磁化;然后,由于大量不同速率的自旋复杂地组合在一起,有不同的速率,自旋核将呈现杂乱无章的构形。但是,如果这时候小心地将外场倒转,那么所有核自旋都会回到原来的状态,于是,初始的磁化态奇迹般地恢复了!从宏观测量来看,熵在系统向中间态(核自旋杂乱的态)转化的过程中似乎是增大了——符合第二定律——但是当核自旋在倒转的外加电磁场作用下重新获得在中间态失去的秩序时,第二定律似乎也被彻底地颠覆了,因为在最后这个过程中,熵减小了。 [1.9]
图1.13 两个紧贴的玻璃管,其间灌注黏性液体和一条色带
事情是这样的:尽管自旋在中间状态看起来杂乱无序,在那些杂乱的自旋排列中却存在着一个精确的“隐序”,只有当外磁场的运动模式发生反转时,这个隐藏的秩序才会显露出来。类似的情形还出现在CD和DVD光碟中,任何寻常的“宏观测量”都不可能揭示贮存在光碟里的丰富信息,但为解读那些光碟而专门设计的播放器,却能毫不费力地读取其中的信息。为探测隐序,我们需要一种能适用于大多数情形的、比“普通”宏观测量更为精巧的“测量”形式。
其实,为了发现这类普遍的“隐序”,我们并不必真的像考察小磁场那样考虑任何精巧的技术。基本类似的事情也发生在更简单的装置(图1.13,详情见注释 [1.10] )。
图1.14 手柄转动几圈使色带散开,然后反向转动同样的圈数,色带重新出
这个装置由两个圆柱形玻璃管组成,其中一个放在另一个的内部,两管之间留有很小的空隙,均匀注入些许黏性液体(如甘油)。内管接一个手柄,可以让它相对于固定的外管旋转。实验开始时,将一条发亮的红色染料细带插入液体,与圆柱轴线平行(图1.14)。然后,摇动手柄转几圈,染料带会扩散开去,沿着圆柱均匀分布,而先前的色带不留下一点儿痕迹,液体却变成淡淡的红色。不管我们选择什么合理的“宏观参数”来确定染红的黏性液体的状态,熵看起来都增大了,因为现在染料已经均匀扩散到流体了。(这儿的情形看起来很像我们在1.2节里考虑的混合红蓝墨水时发生的事情。)然而,假如现在沿反方向摇动手柄,转动同样的圈数,我们会惊讶地发现,红色的染料带又重新出现了,而且几乎和它在初始的地方一样清晰!如果说熵在第一次摇动时真的增大到了那个状态下的值,而在重新摇动后它又几乎回到了初始的值,那么重新转动的过程就严重颠覆了第二定律!
在这两种情形下,通常都不认为第二定律真的被破坏了,而是这些情形下的熵的定义不够精密。在我看来,如果要求一个精确而客观的物理熵的定义,能适用于所有情形,能让关于它的第二定律普适地成立,那我们就捅了马蜂窝。我看不出有什么理由对熵的概念提那么多的要求:总要有精确的物理意义,要有明确的定义,要完全客观从而在某种绝对的意义上“自由地”回归自然 [1.11] ,而且那个“客观的熵”几乎永远不会随时间而减小。对玻璃管间染红的黏性液体,或者核自旋的构形——尽管怀着对先前秩序的精确“记忆”,但看起来已经完全失去了组织——我们真的必须要一个满足它们的实实在在的熵概念吗?我看不出这有什么必要。熵当然是一个极其有用的物理概念,但我不明白为什么要为它赋予一个真正基本而且客观的物理角色。其实,在我看来,熵的物理概念的用处似乎主要源于下面的事实:对我们可能在真实的宇宙遭遇的系统来说,通常的“宏观”物理量的度量导致了不同的粗粒化区域,它们的体积相差很多个数量级。然而,还有一个更深层的问题:为什么它们在我们的宇宙中会相差那么多数量级?这些悬殊的量揭示了我们宇宙的一个值得注意的事实,那才真的是确凿客观而且“自在”的——我们很快就会看到这一点——尽管我们承认我们的“熵”概念存在着主观性问题,但那只不过是漂浮在这个有着广泛用场的物理概念上的一层薄雾。
图1.15 系统从一个相当小的粗粒化区域的p 0 点开始演化
图1.16 随着维数增大,相邻粗粒化区域的典型数目迅速增大。(a)n=
现在我们来看,为什么系统向未来演化时,熵应该像第二定律要求的那样增大。设想我们的系统从熵相当低的状态出发——这样,刻画系统时间演化的一点p(在相空间 运动),就可以从一个相当小的粗粒化区域 中的点p 0出发(图1.15)。我们别忘了,前面说过,不同的粗粒化区域会倾向于多个数量级的悬殊,而相空间 的巨大尺度也意味着任何一个特殊的粗粒化区域附近都可能存在大量的粗粒化区域。(我们的2维和3维图像在这一点上特别容易令人误会,但我们看到,邻域的数量随着维数的增大而增大——如2维情形是6个,3维情形是14个;见图1.16)。于是,p点刻画的演化曲线,在离开起点p 0 所在的区域 而进入下一个粗粒化区域 时,极有可能发现 的体积要比 的大得多——因为,点p似乎不太可能进入一个体积小得多的区域,尽管它可能靠运气像俗话说的那样从谷草堆里找出一根绣花针。但在这里,那几乎是不可能的事情!
结果, 的体积的对数会比 的体积的对数大一些,尽管与实际的体积增长比起来要缓和得多(见前1.2节),所以熵也多少会增大一些。于是,当点p进入另一个粗粒化区域(如 )时,我们还是很可能会看到 的体积远大于 的,因此熵又会增大一些。接着,点p进入下一个区域(如 ),比先前的区域更大,因而熵继续增大,增大……另外,因为那些粗粒化区域的体积在增大,一旦点p进入一个较大的区域,我们就认为它实际上不可能——即“几乎肯定没有可能”——重新进入某个更小的区域,即那些熵值像先前那么小的尺度小得多的区域。于是,随着时间的流逝,熵肯定会不停地增大,尽管远比空间体积的增大缓和。
当然,以这种方式获得更小的熵值也并非完全不可能,我们只是说出现这种熵减小的可能性必然是微乎其微的。我们得到的熵增只是代表了一种趋势,而那趋势应该作为事物的正常状态,其演化进程并不特别偏向相空间的任何粗粒化区域,仍然可以认为点p在相空间里的轨迹在本质上是随机的,尽管演化实际上遵从确定而且完全决定论的牛顿力学的过程。
我们当然有理由问,为什么p要像上面说的那样一步步进入越来越大的粗粒化区域,而不直接进入最大的粗粒化区域 呢?这里, 指通常说的热平衡, 的体积将超过其他所有粗粒化区域加在一起的总和。实际上,可以预期p最终会达到 ,那时,它几乎会一直留在那个区域,只有非常偶然才会溜进更小的区域(即热涨落)。但演化曲线肯定描述的是一个连续的演化,一个时刻的状态不大可能与前一时刻的状态截然分开。于是,粗粒化区域的体积也不可能比相邻区域大很多数量级,也就不可能跳跃到 ,尽管演化曲线经历的粗粒化区域确实有着巨大的体积差别。我们不指望熵也那样不连续地跳跃,它只能逐步地经过越来越大的值。
这看起来很令人满意,而且令我们相信熵向着未来渐长是完全自然的期许,几乎用不着更深入的考虑——当然,为了满足纯数学的爱好,还需要一些严格的细节。前一节说的鸡蛋,从“现在”时刻处于桌子的边缘,然后落下,在地面打碎,真是一个熵增大的演化。正如上面所说,这完全符合相空间体积增大的简单图景。
然而,我们可以提出另一个问题,略不同于鸡蛋未来行为的问题。让我们来问问鸡蛋过去的可能行为。我们想知道,“鸡蛋最可能以什么方式才能在开始的时候处在桌子的边缘?”
我们可以试着用前面的方法来回答这个问题。前面我们是从系统的现在开始寻求它最可能的未来演化,而这里我们要问的是,什么样的最可能的过去演化才会引出现在的系统状态。我们的牛顿定律在过去时间方向上也能很好成立,而且给我们描绘了一幅决定论的过去演化图景。于是,某一条演化曲线在相空间 中到达点p 0 ,就描述了那个过去演化,显现了鸡蛋碰巧处于桌子边缘的路线。为发现鸡蛋“最可能”的过去历史,我们再来考察邻近 的粗粒化区域,我们会再次看到它们有着十分悬殊的大小。于是,以点p 0 为终点而进入区域 的演化曲线,绝大多数都来自体积远大于 的区域(如 ),而只有极少数来自小得多的区域。假定演化曲线来自比 大得多的区域 。
而在此之前,还应该存在大小悬殊的相邻区域,我们还会看到绝大多数进入 的演化曲线都来自远比 大的粗粒化区域。于是,我们可以再假定进入 的过去演化曲线来自某个比 大得多的区域 ,同样,进入 的来自比 更大的 ,等等。见图1.15。
我们的推理大概就得到这样的结论,但它有意义吗?这样的演化曲线将远远多于那些从一系列更小区域(如……, 等)到达点p 0 的演化曲线。那些演化可能确实发生过,在时间增大的方向上,其区域的体积从小变大,这是符合第二定律的。我们的推理路线不但没有为第二定律提供支持,似乎还把我们引向了完全错误的答案,令我们相信过去的演化在不停地粗暴地背离第二定律!
我们的推理似乎令我们相信,鸡蛋要是一开始就处于桌子边缘,那么极有可能的是,它原来是桌子底下的蛋壳碎片和一摊蛋黄蛋清的混合(有些还黏在地毯上)。然后,这一堆黏乎乎的东西自发聚合起来,地毯里的东西也自动析出来,蛋黄和蛋清完全分开,装进自动封闭的蛋壳里,形成一个完好无损的鸡蛋。接着,鸡蛋从地板上跳起来,以恰到好处的速度跳上桌子的边缘。我们上面的推理就导致类似这样的行为:一条“可能的”演化曲线依次通过体积越来越小的区域,如……, 。但这与实际发生的事情是完全矛盾的。事实是,一个粗心人把鸡蛋放在桌上,没留意它就滚下去了。那个过程是与第二定律一致的,在相空间内,它表现为一条演化曲线穿过一系列逐渐增大的区域……, 。当这样的论证用于过去的时间方向时,它带给我们的结论大概就只能错得不能再错了。
我们的推理为什么会走入歧途呢?引导我们满怀信心地认为第二定律必然(以压倒的概率)适用于普通物理系统的未来演化,不也是那个看起来一样的推理吗?我说过了,这个推理的困惑在于,我们假定演化相对于粗粒化区域来说可以认为基本上是“随机的”。当然,正如上面说的,它并不真是随机的,因为它由动力学(牛顿的)定律精确地决定着。但我们假定在那个动力学行为里对那些粗粒化区域没有什么特殊的偏向,这个假定对未来演化是很合适的。然而,当我们考虑过去演化时,我们发现事情就不是那样了。例如,在鸡蛋的过去演化行为中,就有很多偏向,如果从时间倒转的观点看,它似乎被什么东西牵着走——从一个碎鸡蛋开始,经过系列几乎不可能却符合动力学定律的行为,达到几乎不可能的平衡态,完好无损地落在桌子的边缘。如果这种行为能在未来方向的演化中看到,那就成了另一种形式的目的论或魔术,当然是不可能的。为什么我们认为这种明显的聚焦式的行为在过去方向上可以接受,而在未来方向上却要从科学上拒绝它呢?
答案——尽管还谈不上“物理的解释”——很干脆:这种“过去目的论”是一种普遍的经验,而“未来目的论”却是我们永远不会遇到的东西。我们没遇到这种“未来目的论”,只不过是我们观测的宇宙的一个事实而已,所以第二定律能很好成立,也不过是一个观测事实。在我们认识的宇宙中,动力学定律似乎并不以任何方式指向未来目标,所以与粗粒化区域没有一点儿瓜葛,而过去方向的演化曲线的“指向”却是司空见惯的事情。如果考察演化曲线在过去的行为,我们看它似乎在“用心地”寻找越来越小的粗粒化区域。我们不觉得它奇怪,只是因为我们在经验中已经习以为常了。我们看到鸡蛋从桌面滚下来在地毯上打碎一点儿也不奇怪,但在电影里逆着时间的事件,看起来的确就非常奇怪了,说明某些事情在正常的时间方向上根本不属于我们物理世界的经验。这种“目的论”在过去方向是完全可以接受的,但不是我们的未来经验的特征。
实际上,我们也可以拿宇宙演化来理解那种“过去目的性”:假定我们宇宙的起源就表现为相空间中的一个微乎其微的粗粒化区域,从而宇宙的初始状态具有特别小的熵。只要我们认为动力学定律能满足宇宙的熵可以表现上面说过的一定程度的连续性,那么我们只需要假定宇宙的初始状态——我们所谓的大爆炸——因为某个理由而有极其微小的熵(我们将在下面看到,这个微小的数值有着相当微妙的特征)。于是,熵的一定的连续性意味着宇宙的熵自大爆炸起(沿正常的时间方向)有相对渐进的增长,这为第二定律提供了一种理论的证明。所以,关键问题其实在于大爆炸的特殊性和代表那个特殊初始状态性质的初始粗粒化区域 的异常小的尺度。
大爆炸的特殊性是本书要论证的核心问题。我们将在2.6节看到大爆炸该有多么特殊,而我们不得不面对那个初始状态的特殊本性。这个问题引出的深层疑难还将把我们引向一条奇异的思路,导出本书别样的基本主题。不过现在我们只需要简单指出一个事实:一旦我们接受那个特殊的状态确实生成了我们认识的宇宙,那么第二定律(以我们陈述的方式)就是一个自然结果。只要没有对应的低熵的终极宇宙状态(或类似的什么东西)呈现某种目的论的需要——即宇宙的演化曲线将终结在相空间 的某个极其微小的“未来”区域 中——那么我们在未来方向的熵增的推理就是完全可以接受的。正是低熵的约束(要求演化曲线从极小的区域 出发)为我们在宇宙中切实体验的第二定律提供了理论基础。
不过,在更详细考察大爆炸状态(下一部分)之前,我们还要澄清几个问题。首先,偶尔有人说,第二定律的存在没什么奇怪的,因为我们的时间感觉依赖于一个增长的熵,而那是构成我们对时间的有意识感知的一部分,所以,不论我们相信“未来”的时间方向是什么,它一定就是熵增大的方向。照这个说法,如果熵相对于某个时间参数t在减小,那么我们对时间流的感觉就会投射到相反的方向,从而我们会认为小的时间值t处于我们的“过去”,而大的值在我们的“未来”。于是我们把参数t作为正常时间参数的倒转,从而熵依然向着我们感觉的未来增大。照这样的论证,我们对时间过程的心理感觉总是满足第二定律,而不管熵演进的物理学方向是什么。
然而,这种从我们的“时间过程的经验”出发的论证是暧昧不清的,因为我们几乎不知道“有意识的经验”需要什么物理条件——即使抛开这点模糊性不说,这种论证也迷失了一个关键问题:熵概念的作用依赖于我们远离热平衡的宇宙,从而远小于 的粗粒化区域才能进入我们寻常的经验。另外,熵是均匀增大或均匀减小,依赖于相空间中演化曲线的一端(不是两端)约束在一个非常小的粗粒化区域,而这只是可能的宇宙历史的一个小小场景。我们要解释的恰好是为什么我们的演化曲线遇到的粗粒化区域 竟是那么小,而刚才那个论证根本不涉及这个问题。
有时人们还说(大概与上面的观点呼应),第二定律的存在是生命的基本前提,那样我们这样的生命才可能在第二定律成立的宇宙(或宇宙的一个阶段)中生存,第二定律是自然选择的必要组成部分,等等。这是“人存论”的一个例子,我在3.2节末尾和3.3节会简要回顾这个一般性的问题。不管这类论证在其他背景下有多少价值,在这儿几乎毫无意义。这个论证同样有暧昧不清的一面:我们对生命的物理前提的认识一点儿也不比我们对意识的理解更多。但即使抛开这点不管,甚至假定自然选择确实是生命的基本前提,确实需要第二定律,这个论证也不能解释地球上的第二定律同样适用于远离局域条件的可观测宇宙的其他任何地方和任何时刻,如几十亿光年外的星系,如地球出现生命之前的时代。
我们还需要记住下面的一点:假如我们不假定第二定律,或者不假定宇宙起源于某个极其特殊的初始状态,或具有这种一般性质的其他东西,那么我们就不能将生命存在的“不可能性”作为推导第二定律的前提(它早就在发生作用了)。不论看起来多奇妙、多悖于直觉,生命的产生(如果不先假定第二定律)都不大可能以自然的方式实现——不论自然选择还是其他看起来“自然的”过程——而更可能的倒是简单地从组成粒子的随机碰撞中产生出来!为什么一定是这样呢?再来看看我们在相空间 的演化曲线。考虑粗粒化区域 ,它代表我们今天的地球,充满了生命。我们要问的是,出现这种状态的最可能方式是什么?然后我们会再次看到——正如我们在1.5节说的不断剧烈减小的粗粒化区域序列……, ——达到 的“最可能”方式应该是通过某个对应的体积不断剧烈减小的粗粒化区域序列……, ,它们代表某种看起来完全随机的以生命为目标的组合,这恰与实际发生的事情相反,完全背离了第二定律,而不是为它提供了什么例证。于是,仅凭生命存在本身并没有为第二定律的普遍有效性提供任何根据。
还有最后一点要说明的,与“未来”有关。我说过,第二定律(连同它对初始状态的巨大约束的结果)在我们的宇宙中成立,只是一个观测事实的问题。遥远的未来似乎并不存在相应的约束,那也只是一个观测的问题。可是我们真的确定未来的情形确实如此吗?我们没有多少直接证据能在细节上说明未来像什么样子。(我们手头的证据,将在3.1,3.2和3.4节讨论。)我们当然可以说,现在我们没有任何证据表明熵最终会降下来,从而遥远的未来最终会有一个逆转的第二定律。不过,我也看不出有什么根据可以从我们生存的宇宙中绝对排除那样的事情。虽然大爆炸过去了大约1.4×10 10 年(见2.1节),似乎已经很漫长了,也没见过什么逆转第二定律的效应,但这个时间跨度和宇宙的整个未来的时间跨度(我们将在3.1节讨论)相比,简直就微不足道!如果要求宇宙一定有一条终结于某个小区域 的演化曲线,那么它后来的演化终将经历粒子间的奇异关联,而那将最终导致目的论的行为,就像我们前面1.5节描述的自我复合的鸡蛋一样奇怪。
宇宙在它的相空间 中有一条约束的演化曲线,从很小的粗粒化区域 出发并终结于另一个小区域 ,这与动力学(如牛顿的)没有什么矛盾。这样的曲线比只是从 出发(而不终结于 )的曲线少得多,但我们一定已经习惯了这样的事实:从出发的曲线——这似乎正是我们宇宙的情形——只代表了所有可能性中的极小部分。两端都约束在小区域的演化曲线代表的可能性就更小了,但它们的逻辑地位没有多大不同,我们不能随便将它们排除。对这些演化来说,将有一个第二定律作用于宇宙的早期阶段,这正是我们认识的宇宙的情形;但在宇宙的极晚期,我们将看到一个逆转的第二定律,熵最终随时间而减小。
我本人并不认为第二定律最终逆转的可能有任何道理——它对我将在本书提出的主要观点也不起什么重要作用。不过,我们还是应该明白,尽管我们的经验没有为第二定律的最终逆转提供任何线索,那种终极状态从本质上说并不荒谬。类似的奇异可能性不一定能排除,我们必须有一个开放的心态。在本书第3部分,我要提出一个不同的建议,开放的心态也有助于理解我要说的东西。当然,我的观点怎么说也是基于我们宇宙的一些值得注意的事实——基于我们能从理性确定的事实。那么,我们就从下一部分开始,说说我们所知道的大爆炸。
[1.1]哈米尔顿理论是一个囊括了所有标准经典物理学的框架,建立了与量子力学的基本关联。见Penrose(2004), The Road to Reality ,Random House, Ch.20.(彭罗斯《通向实在之路》,王文浩译,湖南科学技术出版社,2007)
[1.2]普朗克公式:E=hν.符号解释见注释2.18。
[1.3]Erwin Schr dinger(1950), Statistical thermodynamics ,Second edition, Cambridge University Press.
[1.4]这个“积”与普通整数的乘法是一致的,即m-点空间与n-点空间的积空间是一个mn—点空间。
[1.5]1803年,数学家拉扎尔·卡诺(Lazare Carnot)发表《平衡和运动的基本原理》,关注了“活动矩”(即有用的功)的损失。这是能量或熵的转换概念的第一次陈述。萨迪·卡诺(Sadi Carnot)接着假定,“某些卡路里总是以机械功的形式损失”。1854年,克劳修斯(Clausius)发展了“内功”(即物体的原子作用于彼此的功)和“外功”(即物体所受的外在影响所产生的功)的概念。
[1.6]Claude E.Shannon, Warren Weaver(1949), The mathematical theory of communication ,University of Illinois Press.
[1.7]从数学来说,出现这样的问题是因为“宏观不可区分性”不属于所谓可迁的性质,即态A和B不可区分,B和C也不可区分,但A和C却可区分。
[1.8]要确切理解原子核的“自旋”,需要考虑量子力学,不过从合理的物理图像看,我们只需要想象原子核在相对于某个轴“自转”,和板球或棒球的旋转一样。“自旋”的总量部分来自构成原子核的一个个质子和中子的自旋,还有部分来自它们相对于彼此的旋转运动。
[1.9]E.H.Hahn(1950),“Spin echos”. Physical Review 80,580—594.
[1.10]J.P.Heller(1960),“An unmixing demonstration”.Am.J.Phys.28:348—353.
[1.11]不过,也许在黑洞的情形,熵概念需要一个真正客观的度量。我们将在2.6和3.4节讨论这个问题。