第一推动丛书·物理系列：新物理狂想曲最新章节_罗杰·彭罗斯著

1.1　数学美的驱动

前言说了，本书讨论的问题源自我2003年10月应普林斯顿大学邀请在那儿做的三个演讲。对这样的演讲，面对像普林斯顿科学群体这样的学霸听众，尤其是讲关于科学时尚的题目，我简直是战战兢兢，因为我选为例证的这个领域（即超弦及其衍生理论），在普林斯顿的发展高度或许超过了世界其他地方。何况，那是一个很专业的主题，它的许多重要内容都不是我能驾驭的，从我这样的局外人的立场，我对其专业的认识一定有或多或少的局限。不过，在我看来，我也不能因为这点缺陷而气馁，因为，假如说只有内行人才有资格对它品头论足，那批评多半儿只限于技术问题，而某些更广义的批评则无疑会被大大地忽略了。

自演讲以来，出现过三本批评弦论的书：沃特（Peter Woit）的《连错都不如》（ Not Even Wrong ），斯莫林（Lee Smolin）的《物理学的困惑》（ The Trouble with Physics ）和巴格特（Jim Baggott）的《告别实在：童话物理学是如何偏离真理追求的》（ Farewell to Reality : How Fairytale Physics Betrays the Search for Scientific Truth ）。当然了，沃特和斯莫林都比我接触过更多的弦论人群，更了解理论的时尚情况。我个人在《通向实在之路》（第31章和第34章部分）中对弦论的批评，大概也是那时候出现的（比那三本书略早），但跟他们不同的是，我的批评也许主要是针对弦论在物理学中的角色。我的多数意见其实都是一般性的，对高度专业性的问题不怎么敏感。

我先说明什么才是一般性的（或许是显然的）问题。我们注意一个事实：物理学在过去几百年取得的重大进步都依赖于极端精确和精致的数学图景。那么显然，未来的任何进步也必将依赖于某些特别的数学框架。任何新物理学要能在以前的成就上更进一步，要能精确而毫不含糊地做出超越从前的预言，也必须基于某个清晰的数学图景。而且，人们还认为，一个恰当的数学理论当然应该有数学意义——就是说，它在数学上是和谐一致的。从自相矛盾的图景可以导出任何令人欢喜的答案。然而，自洽性要求实际上是一个相当严苛的准则，事实也证明，过去提出的很多物理学理论——即使某些很成功的理论——其实都不完全是自洽的。那些理论通常都要牵扯一些物理学判断的硬质要素，才能无疑义地满足适当的应用。当然，实验也是物理学理论的核心，但实验验证了理论并不等于就检验了其逻辑的和谐。两者都重要，但在实践中我们发现，当理论看起来符合物理事实时，物理学家并不太关心去实现完全的数学的自洽。在很大程度上，这就是事实，我们将在第2章（及1.3节）看到，即使取得了非凡成功的量子力学也是如此。量子论的破天荒工作，即普朗克（Max Planck）为解释一定温度下与物质达到平衡的电磁辐射频谱（黑体辐射谱，见2.2和2.11节）而提出的划时代假说，需要一种并不完全自洽的混合的物理图景［Pais，2005］。玻尔（Niels Bohr）在1913年提出的原子的旧量子论也同样不能说是一个完全自洽的纲领。在量子论后来的发展中，构建了复杂的数学大厦，其强大的动力则来自对数学和谐的渴望。然而，我们以后会看到（特别如2.13节）当前的理论依然没能很好地解决自洽性问题。但是，基于大量不同类型的物理现象的实验的支持，却构成了量子理论的基石。物理学家的倾向是，如果理论在适当的判断和仔细的计算下能继续产生与观测结果符合的答案——通过精致和精确的实验，常常达到极高的精度——那就不必过分纠结数学或本体论的不一致问题。

弦论的情形则完全不同。它似乎没有任何实验支持的结果。人们常说，这一点并不稀奇，因为弦论如今主要是作为一种量子引力理论的形式，基本上只关心非常微小的所谓普朗克尺度下的距离（或至少接近那个距离），比眼下实验所能达到的距离小15或16个数量级（大约实验尺度的亿亿分之一），而相应的能量却高15或16个数量级。［注意，根据相对论的基本原理，小距离本质上等于小时间（通过光速），而根据量子力学原理，小时间本质上等于大能量（通过普朗克常数），见2.2和2.11节。］我们当然必须面对一个明显的事实：尽管今天的粒子加速器很强大，它们眼下可达到的能量还是远远赶不上弦论将量子力学原理用于引力现象的需要。不过这情形对一个物理理论来说是不会令人满意的，毕竟实验支持是理论立与废的最终裁决。

当然，我们可能正在走进基础物理学研究的新时代，数学的和谐性要求是首要的，当这些要求（包括与既有原理的一致性）还不够充分时，还需要满足数学的精致性和简单性等原则。在完全客观的物理学基本原理的探究中诉求这些美学原则似乎没什么科学意义，令人惊奇的是，这些美学的判断却常常硕果累累，而且不可或缺。我们在物理学中遇到过很多例子，美妙的数学思想是认识进步的基础。大理论物理学家狄拉克（Paul Dirac）［1963］就很清楚美学判断在他的电子方程的发现和正电子的预言中所起的重要作用。当然，狄拉克方程已经证明了其对基本物理学的根本意义，方程对美学的诉求也得到了广泛的理解。反粒子的思想也是同样情形，它源自狄拉克对他自己的电子方程的深入分析。

然而，美学判断的角色问题很难进行客观的讨论。通常的情形是，有些物理学家可能认为某个特殊的计划很美，而其他人却可能满不以为然！就美学判断说，在理论物理的世界同艺术或服装设计的情形一样，时尚的要素通常并不讲究什么理性的比例。

应该明确的一点是，物理学中的美学判断问题的微妙远远超过了人们常说的奥卡姆剃刀——即剔除不必要的复杂。实际上，要判断两个相对的理论哪个“更简单”，从而可能更优美，并不一定是一个直截了当的问题。例如，爱因斯坦的广义相对论是不是一个简单的理论呢？它比牛顿的引力论简单还是复杂？或者问，爱因斯坦的理论比霍尔（Aspeth Hall）1894年（比爱因斯坦提出广义相对论早21年）提出的理论简单还是复杂？那个理论很像牛顿理论，只不过替换了引力的平方反比律，质量 M 与 m 之间的引力为 GmMr -2.00000016 而不是牛顿的 GmMr -2 。霍尔提出他的理论是为了解释大约自1843年就已知的水星近日点进动对牛顿理论预言的偏离（“近日点”即行星在轨道上距离太阳最近的点）［Roseveare1982］。这个理论对火星运动也得出了比牛顿理论更好的结果。虽然不好说用2.00000016取代2会带来多少额外的“复杂”，但在一定意义上，霍尔理论只比牛顿理论复杂一丁点儿。确定无疑的是，指数的替换丢失了数学的精致，但正如上面说的，这种判断包含了强烈的主观因素。更确切地说，平方反比律蕴涵着某些优美的数学性质（本质上说，它表达了引力“流线”的守恒，这在霍尔理论中不可能严格成立）。可能还是有人认为这是一个美学问题，不应夸大它的物理意义。

那么，爱因斯坦的广义相对论呢？在具体的物理系统中运用爱因斯坦的理论，详细考察其意义，当然增大了困难，远远超出用牛顿理论（甚至霍尔理论）的困难。如果把方程具体写出来，那么爱因斯坦的理论复杂得多，仅写出完整的方程都很困难。而且，方程很难解，有很多牛顿方程没有的非线性特征（这些特征使霍尔理论已然废弃的简单流线守恒定律再次失效）。（关于线性的意义，见附录A4，它在量子论的特殊作用见2.4节。）更严峻的是，爱因斯坦理论的物理解释需要消除因特殊坐标系的选择而产生的虚假的坐标效应，因为坐标系的选择在爱因斯坦的理论中没有物理意义。在实际应用中，爱因斯坦理论无疑比牛顿（或霍尔）的引力理论要难以把握得多。

然而，爱因斯坦理论从某个重要意义说还是一个简单的理论，甚至比牛顿理论更简单（或更“自然”）。爱因斯坦理论基于任意弯曲四维流形（见附录A5）的黎曼几何的数学理论（更严格说是伪黎曼几何，我们将在1.7节说明）。学会这么一整套的数学技术可不容易，需要懂得什么是张量，为什么需要这些量，如何从确定几何的度规张量 g 构造特殊的黎曼曲率张量 R 。然后，还要学会借助张量的缩并和逆迹来构造爱因斯坦张量 G 。不过，这些公式背后的几何思想还是很容易把握的，一旦真正弄懂了这种弯曲几何的基本元素，就会发现可以写出一族限制非常严格的可能（或似真）的方程，满足我们提出的一般的物理和几何要求。在这些可能的方程中，最简单的就是爱因斯坦著名的广义相对论场方程 G =8πγ T （其中 T 为物质的能量-动量张量， γ 为据牛顿的特殊定义给出的引力常数，这样8π并不真的带来什么复杂，只不过是看我们如何定义 γ ）。

爱因斯坦场方程还可以做一点小小的也很简单的修正，而不会影响方程满足基本的要求，那就是添加一个常数 Λ ，叫宇宙学常数（爱因斯坦1917年为了让方程能维持宇宙稳定而引进的，后来他放弃了），这样，方程现在变为 G =8π γ T + Λ g 。 Λ 如今常常被指为暗能量，大概是为了能推广爱因斯坦理论，让 Λ 可以变化。然而，强硬的数学约束不允许这种想法，在3.1，3.7，3.8和4.3节中， Λ 将充当我们的一个重要角色，我将仅限于关注 Λ 不发生变化的情形。宇宙学常数在第3章（还有1.15节）有重要作用。实际上，近期的一些观测强烈表明了 Λ 的物理存在，而且具有微小的（似乎不变的）正的数值。 Λ ＞0的证据——也可能是更一般形式的暗能量存在的证据——时下很引人瞩目，自佩尔穆特（Saul Perlmutter）、雷斯（Adam G. Riess）等人及其合作伙伴［Perlmutter et al.1999； Riess et al.1998］最初观测以来还在不断增加，还为佩尔穆特、施密特（Brian P. Schmidt）和雷斯赢得了2011年的诺贝尔物理学奖。 Λ ＞0只跟遥远的宇宙学尺度有密切关系，局域尺度上的天体运动的观测用爱因斯坦原先的更简单的方程 G =8π γ T 来处理就足够了。现在发现这个方程模拟引力作用下的天体行为达到了前所未有的精度，观测的 Λ 值对这些局域动力学没有重要影响。

在这方面，最具历史意义的是双中子星系统PSR1913+16，系统的一个成员是脉冲星，时间精准地向地球发射电磁信号。每颗星围绕对方的运动都纯粹是引力效应，用广义相对论来模拟，达到了异乎寻常的精度，在累积40年中大约为10 14 分之一。40年的时间约为10 9 秒，因此10 14 分之一的精度意味着在那个期间里理论与观测的差别只有大约10 -5 （十万分之一）秒——令人惊奇的是，这正是我们刚发现的。最近，其他包含一个或一对脉冲星的系统还有可能大大提高模拟的精度［Kramer et al.2006］，只要像PSR19+16一样观测那么长的时间。

然而，以10 14 这个数字作为广义相对论的观测精度的度量，还存在一定的问题。实际上，星体的质量和轨道参数必须根据观测的运动来计算，而不是来自理论或其他独立观测。而且，牛顿的引力理论也差不多达到了那么高的精度。

不过，我们这里关心的是引力论的总体情况，爱因斯坦理论包含了牛顿理论作为一级近似的结果（如开普勒的椭圆轨道等），不同程度地修正了开普勒轨道（包括近日点进动），最后还提出了精确符合广义相对论惊人预言的系统能量损失：加速运动的大质量天体系统会通过发射引力波而失去能量——引力在时空中的波动，犹如带电体在加速运动中发射的电磁波（即光）。最近，LIGO引力波探测器直接探测到了引力波［Abbott et al.2016］，进一步证实了引力辐射的存在及其准确形式，还证实了广义相对论的另一个预言，即黑洞的存在。我们将在3.2节、第3章的最后部分和4.3节讨论。

应该强调的是，这个精度远远超越了爱因斯坦初建引力理论时的观测精度——大约高出8个数量级（即1亿倍）。牛顿引力论的观测精度可以说大约为千万分之一。这样看来，广义相对论的“10 14 分之一”的精度在爱因斯坦建立他的理论之前就已经在大自然那儿等着了。不过，爱因斯坦不知道的那高出的精度（大约1亿倍）对他建立理论没什么影响。于是，自然的新数学模型并不是仅仅为了寻求符合事实的最佳理论而发明的人造物，更明白地说，数学纲领其实已经在大自然的运行中发生作用了。这种数学的简单性（或简洁性或随你怎么形容它）是自然行为方式的真实部分，而不是我们的头脑习惯被数学美所感染。另一方面，当我们有心用数学美的准则去构建理论时，很容易被引向歧路。广义相对论当然是很美的理论，但该如何一般性地评判物理理论的美呢？不同的人有截然不同的美学判断。在构建一个成功的物理理论时，甲的美学观点是否与乙的一样，或他们的美学判断孰高孰低，并不一定是显而易见的。而且，理论的内在美也常常不是一眼就能看出来的，可能要后来的技术进步揭示了数学结构的深层含义，美才能显现出来。牛顿力学就是一个例子。多年以后，通过大数学家欧拉、拉格朗日、拉普拉斯和哈密顿等人的杰出工作（如欧拉-拉格朗日方程、拉普拉斯算子、拉格朗日量和哈密顿量等，都是现代物理学的基本要素），牛顿力学的结构才显露出确凿的美。例如，断言每个作用都有反作用的牛顿第三定律，就在现代物理学的拉格朗日形式中占据着中心的地位。如果说人们常常夸耀的现代理论所呈现的美在一定意义上都是后来“追认”的，我不会感到奇怪。一个物理学理论的成功，不论观测的还是数学的，都可能构成我们后来感觉的美学特征。由此我们看到，通过物理理论自诩的美学特征来断其是非，很可能是有问题的，至少也是模糊不清的。更可靠的应该是，基于理论的预言能力及其与当前观测的符合程度来评判一个新的理论。

然而，说到实验支持，我们常常没有现成的判决性实验，例如，任何量子引力理论的任何应有的观测检验，常常要求单个粒子需要获得绝对不可能达到的高能，远远超出了现有粒子加速器的能力（见1.10节）。能量要求不那么高的实验建议，也可能因为实验费用或内在困难而无法实现。即使实验很成功，通常的情形是实验者采集了大量数据，于是出现另一种问题，需要从海量数据中挖掘出关键的信息。这类事情当然发生在粒子物理学中，如今大量加速器和粒子对撞机生成了大量数据；它也出现在宇宙学中，宇宙微波背景（CMB）的现代观测也产生了大量数据（见3.4，3.9和4.3节）。很多数据都被认为没什么特别的信息，只是证实了我们已经从更早的实验中认识了的东西。为提取数据中某些微弱的残余信息（即实验家们寻找的新特征，它们可能证实也可能否定某些理论设想），需要进行大量的统计处理。

需要指出的是，这种统计处理可能对现行理论有很强的针对性，有助于发现理论能预言的其他微弱效应。可是，即使在数据背后真藏着什么确定的答案，有些异乎寻常的、偏离流行时尚的想法，仍然可能悬而不决，因为物理学家用来揭示答案的统计程序是直接根据现行理论来调整的。我们将在4.3节看到这样的突出例子。即使我们非常清楚可以统计地从现有海量的可靠数据中提取确定的信息，统计需要的过量的计算时间也可能成为实际分析工作的一大阻碍，特别是面对直接竞争的其他更流行的理论时。

更重要的是，实验本身常常是费神费钱的，特定的实验设计可能在传统观点的框架内有助于理论的检验。如果理论图景偏离大家的共识太远，就很难求得足够的经费来检验它。毕竟，昂贵的实验设备需要经过很多专家委员会的认可才能构建，而那些专家多半是形成现行观点的重要角色。

关于这个问题，我们可以考虑2008年建造的瑞士日内瓦的大型强子对撞机（LHC）。它有两条长27千米的隧道，分别建在法国和瑞士的地下，2010年开始运行。它发现了我们一直捉摸不透的希格斯粒子，这对粒子物理学有重要意义，特别是它充当着为弱相互作用粒子赋予质量的角色。2013年的诺贝尔物理学奖给了希格斯和恩格勒特，因为他们开创性地预言了这个粒子的存在和性质。这无疑是一个重大成就，我也无意低估其确凿的重要性。不过，LHC似乎提供了一个相关的案例。高能粒子碰撞的分析方法需要极其昂贵的探测器，它们适用于在主流的粒子物理学理论中采集数据。但对非传统的关于基本粒子性质及其相互作用的思想，就不那么容易获得数据了。一般说来，彻底偏离主流观点的想法很难有机会获得足够的经费，从而也很难得到确定的实验检验。还有一个重要因素是，研究生为博士论文开题，大多限于找合适的研究题目。在非传统领域做研究的同学，即使得到博士学位了，不论多么有才，多么有学问，多么有创造力，都很难找到学术性的工作。研究岗位有限，研究经费难得。导师多半会喜欢发展自己过去推动的思想，而这些思想多半属于时下流行的领域。另外，对主流外的思想发展感兴趣的导师，也不大会鼓励同学做那个领域的工作，那不利于同学以后去求职市场竞争，那些在流行领域有专长的同学更占优势。

研究计划的资助也面临同样问题。流行领域的项目显然更容易获得资助（参见1.12节）。同样地，项目还是由大家认可的专家来判断，而他们绝大多数都在流行领域中做研究，而且可能还有过重大贡献。脱离现行规范的计划，即使思想透彻且高度创新，也极有可能落选。而且，这不仅仅是经费有限的问题，美国的科学研究经费一直比较高，而那儿的时尚影响却格外显著。

当然，也应该说，多数非流行的研究领域都不会像流行领域那样发展为成功的理论。在绝大多数情形下，激进的观点很少有机会形成可行的计划。不消说，像爱因斯坦广义相对论的情形一样，任何激进的观点都必须与过去实验确立的结果一致；假如不一致，也就用不着浪费实验来否决不当的观点了。如果理论建议符合以前做过的所有实验，而且眼下看不到可以证明或否定它的实验前景（例如因为前面说到的那些原因），那么我们判断一个物理理论的合理性和重要性时，似乎必须回到数学的一致性、一般的适用性和一定的美学标准。也就是在这样的背景下，研究的风尚可能获得过分的比重，所以我们要小心别让某个理论的流行特征阻碍我们对它真正的物理合理性的判断。

1.1 数学美的驱动

1.1　数学美的驱动