无论时代的潮流和社会的风俗怎样变化,人们总是可以凭借自己的能力超越时代和潮流,走在正确的道路上。现在,大家都在四处奔走,为的就是房子和车子,这是我们生活的时代的特征。不过,也有一些人追求的不是物质,而是理想和真理,想要寻求内心的自由和平静。
——爱因斯坦
现在,我已经是67岁的老人了,今天要写一些类似于讣告的东西。我做这件事有两方面的原因,一是因为希耳普博士的劝说;二是因为我觉得和曾经一起奋斗的朋友们共同回顾我们的奋斗历程,这是一件很有意义的事情。经过考虑,我认为这种尝试一定会存在缺陷,而不是完美无缺的。无论一个人的工作生涯多么短暂、多么有限,在这个过程中肯定会走许多弯路,如果想要把有价值的东西讲述清楚,那的确是一件困难的事情。而且,我已经67岁了,不是50岁,更不是30岁或者20岁。任何回忆都会受到不可靠的信息的干扰,同时也会受到当前观点的影响。这是难以避免的,也令人非常气馁。然而,一个人还是可以从自己的积累中提炼出别人所不知道的东西。
当我处于少年时期的时候,我就深深地意识到,大部分人一辈子追求的目标和想要实现的愿望,都是没有一点价值的。不久后,我发现当时追逐的残酷性经过了精心的掩饰和巧妙的伪装,与现在赤裸裸的追逐有着明显的区别。由于每个人都有一个胃,所以注定人人都要参加这种追逐。因为参与了这种追逐,所以胃也许会得到满足。不过,人绝对不会,因为他有自己的思想和独立的情感。宗教是帮助人们摆脱这种困境的第一种方法,它通过教育的方式引导儿童前进。因此,虽然我的父母都没有宗教信仰,但我有着深深的宗教信仰。不过,当我12岁的时候,我终止了这种信仰。在科普书籍的影响下,我深信《圣经》中的许多故事都是虚构的。结果,在我经过了一场疯狂的自由考虑后发现,国家总是用谎言去欺骗年少无知的人。这个事实令人难以相信。这次经历让我对权威不再深信不疑,也会用怀疑的态度去看待社会中有着各种作用的信念。我的这种怀疑态度始终存在,尽管后来对因果关系的研究使它原有的尖锐性降低许多。
显然,我往前跨出去的第一步是抛弃少年时代的宗教信仰。这让我摆脱了原始的锁链,从愿望、期待、原始情感的统治中解放出来。在我们人类的外面,有一个独立存在的巨大世界,它就像是一个难以破解的谜团,我们通过仔细观察和认真思考只能部分地接近它。对于这个世界的思索,就像是响应自由的召唤。而且,我很快就发现,许多我敬佩和仰慕的人都在这种追求中体会到内心的自由和平静。在我力所能及的范围内,努力探索这个人类之外的世界,这成为了心目中的最高目标。过去和现在受到相同激励的人们,以及他们所取得的真知灼见,都是我渴望得到的朋友。尽管通向这个天堂的道路是曲折的,远远没有通往宗教天堂的道路平坦,但事实证明这条路是可以信赖的,我从来没有后悔选择了它。
我所说的这些内容,只是在一定程度上是正确的,就像在一张白纸上勾勒出来的简单图画,只能在有限的意义上忠实于细节错综复杂的对象。如果一个人的思想很有条理,那么,他的天性可能会牺牲其他方面来促使这方面发展的更好,而且这方面会决定他的精神风貌。在这种情况下,这种人在回忆时看到的可能是单一的、系统的发展,而他的实际经验来自于千变万化的具体情境。外部情境的多变性和瞬间意识的有限性,导致每个人的生活都会出现模糊性。像我这样的人,成长的转折点是让自己从稍纵即逝的、纯粹的个人层面中解脱出来,转而从思想上去把握事物的本质。这样的转折有着重要的意义。从这个角度来说,上面通过简单文字进行的概述,包含了许多真理。
准确地说,“思维”指的是什么呢?当我们由于接受感觉印象而在脑海中产生图像的时候,这不是“思维”;当这些图像形成一个系列,每一个形象都可以产生另一个形象时,这也不是“思维”。不过,当某一个形象在多个这样的系列中反复出现时,它就成了这些系列中的组织性要素,因为它把这些毫无关系的系列联系在一起了。这种要素是一种工具、一种概念。我认为这是一个标志,代表着从自由联想或者“梦想”向思维过渡的标志,“概念”在里面有着支配作用。概念不一定要和某个感觉上可以识别的、再现的符号或者词语绑定在一起,但如果出现了这样的情况,思维就是可以交流的。
也许,人们会有这样的疑问,在没有进行证明之前,在这样一个充满问题的领域中,一个人有权利这么轻率、这么简单地运用观念吗?我的回答是:从本质上来说,我们的所有思维都是概念的一种自由游戏。这种游戏的价值就是,在它的帮助下,我们可以更好地了解自己的感觉。“真理”这个概念不能用在这样的结构中,我认为只有当大家都认同了这种游戏的要素和规则的时候,这个概念才能使用。
我深信在大多数情况下,我们的思维不用符号或者词语也能进行,而且通常是在无意识中进行的。否则,我们有时候为什么会对某个经验感到“惊奇”呢?如果某个经验和根植在我们内心深处的概念世界相互矛盾时,这种“惊奇”就会诞生。当我们强烈地感受到这种矛盾时,它就会反作用于我们的思维世界,而且有着决定性作用。从某种意义上来说,这个思维世界的发展体现的是“惊奇”的一步步飞跃。
当我四五岁的时候,父亲送给我一个指南针,那时我就体会过这种惊奇。这个指南针的行动如此准确,和发生在毫无意识的概念世界中的事情 (通过直接“接触”产生的效应) 完全不同。我还记得,至少我相信自己清楚地记得,这次经历给我留下了深刻的印象。事物背后一定隐藏着什么东西。只要是人们可以看见的东西,都不会产生这种反应:物体的下落,狂风和暴雨,月亮不会掉到地面上的事实,生物和非生物有着本质的不同,这一切都不会令他觉得惊奇。
当我12岁的时候,我又经历了一次惊奇,这次的惊奇和上次的完全不同。这次惊奇是从一本关于欧几里得的平面几何的小书中得到的,这本书是我拥有的。书中有许多著名的命题,例如:三角形的三条高线相交于一点。这些命题本身看起来不是特别清楚明了,但证明过程非常清晰,所以对它们不能再有任何怀疑。这种明晰性和确定性给我留下了难以磨灭的印象。公理不用经过证明就要相信,这件事并没有令我觉得不安。因为只要根据一些确定的命题来证明,我就觉得毫无疑问。例如,我记得在没有得到这本小书之前,就听说过毕达哥拉斯定理。历尽波折之后,我终于凭借三角形的相似性“证明”了这条定理。在证明的过程中,我自设了一个前提条件:直角三角形的一个锐角决定了三条边之间的关系。在我眼中,只有缺乏这种“自明性”的东西时,才需要进行证明。此外,几何学研究的对象和感官感觉到的对象看起来像是同一种东西,都能够被看到或者被摸到。这种朴素观念 (大概来自于康德对“先验综合判断”的可能性的专题研究) 的立足点是:几何概念和直接经验对象 (刚性杆、有限区间等) 的关系是无意识存在状态。
如果只是用纯粹思维就可以得到关于经验对象的可靠性知识,那么,这种“惊奇”的立足点就是错误的。不过,对于第一次感觉到它的人而言,仅仅依靠纯粹思维就可以达到既准确又纯粹的程度,这就像希腊人第一次在几何学中告诉我们的内容,已经非常了不起了。
既然我已经把开头所说的讣告打断了,而且把话题延伸到很远的地方,那么,我要简单陈述一下我的认识论信条,虽然有些话在前面已经说过了。实际上,这个信条在很久之后才慢慢变得成熟,而且和我开始时所说的观点并不相同。
我不仅看到感觉经验的总和,还看到书中记载的概念和命题的总和。概念和命题之间是逻辑关系,而思维逻辑的任务是严格按照某些已有的规则 (这属于逻辑学的研究范畴) 建立概念和命题之间的联系。概念和命题只有依靠它们和感觉经验的联系,才能够体现出“意义”和“内容”。后者和前者的联系是直观的、纯粹的,没有任何逻辑性。这种联系或者直觉联结所需要的确定性来自于科学“真理”和空洞幻想的区别,而不是其他东西。概念体系和构成概念体系的语句法则,都是人类伟大的创造。虽然各种概念体系在逻辑上都是任意的,但它们都会受到一个限制,那就是:首先,和感觉经验的总和的对应关系要尽可能是确定的、完善的;其次,尽可能少地使用在逻辑上处于独立状态的元素 (基本概念和公理) ,也就是没有定义的概念或者不是派生出来的命题。
在某一个逻辑体系中,如果一个命题是通过一个可以接受的逻辑规则推导出来的,那么,这个命题就是正确的。一个系统和经验总和的对应关系的可靠性和完备性决定了这个系统的真理内容。系统的真理内容决定了从属于它的正确命题的“真理性”。
接下来,我要谈论一下对历史发展的看法。休谟清楚地知道,有些概念 (例如,因果性概念) 无法用逻辑方法从经验材料中推导出来。康德确定某些概念具有独立性,他把这些概念看作所有思维都要遵循的前提条件,并且把它们和从经验中得到的概念区分开。不过,我认为这种区分是不对的,也就是说,只有按照自然方式来处理这个问题才是正确的。从逻辑观点来说,所有的概念都是自由选择的假设,包括那些最接近经验的概念。因果性概念就是如此,它是这些探索的起点。
现在,我要回到开头所说的讣告上去。在12岁到16岁的这段时间内,我掌握了数学中的基本原理,包括微积分原理。这个时期,我接触了一些不错的书,虽然它们不讲究逻辑上的严密性,但在表述主要观点上简单明确。总体而言,这段时间的学习成果令人满意。有几次,我达到了顶峰,它们留给我的印象和初等几何——解析几何的基本思想、无穷级数、微积分概念等——留给我的印象一样深。在一本很好的通俗读物中,我了解到自然科学领域中的重大成果和主要方法。这套著作是伯恩斯坦的《自然科学通俗读本》,每一部都有五六卷,主要讲的是定性方面的知识,我认真地阅读完了这套书。因此,当我17岁进入苏黎世工业大学学习数学和物理学的时候,我已经了解了一些物理学的基本知识。
在大学中,我遇到几位杰出的老师,例如胡尔维兹、闵可夫斯基等,按理说我的数学应该有明显的进步。不过,我把大部分时间用在了物理学实验室中,沉迷于做实验。其余时间,我主要是在家里阅读基尔霍夫、亥姆霍兹、赫兹等著名人士的作品。从一定程度上来说,我忽略了去学习数学,因为我更喜欢自然科学,这和下面所说的奇特经验有着密切的联系。我发现数学分成好多个分支,每一个分支都值得我们花费一辈子的时间去研究。因此,我感觉自己就像是布里丹的驴子,不知道要去吃哪一捆稻草。也许我在数学领域的判断能力比较低,所以才不能明白:什么是具有根本性的最重要的东西,什么是在一定程度上可有可无的东西。此外,我对自然科学的兴趣更加浓厚一些。另外,对于我这样一个年轻的学生来说,还没有认识到,如果想要研究关于物理学的深层知识,必须要依靠精密的数学方法。关于这一点,我是在几年后进行科学研究时才明白的。
当然,物理学也有许多分支,每一个分支都可以耗尽人的一生,而且有可能依然无法满足人们对深层知识的渴求。在这里,有大量的实验数据尚未找到它们的关联之处。不过,关于物理学领域,我在不久后就可以识别能够指向基本原理的内容,从而不去管其他的东西,以免它们影响我的思路,导致我远离精髓。当然,这里存在一个不可避免的问题,为了应付考试,人们要把这些没用的东西装在脑袋中,无论自己是否愿意。这种强制性的教育令我不满,以致在结束考试之后的整整一年时间里,我对科学问题的任何思考都感到不愉快。需要说明的是,我们在瑞士受到的强制性教育,远远比其他地方宽松得多。在这里,只需要参加两次考试,而且可以去做自己喜欢的任何事情。如果和我一样,有一个喜欢听课的朋友,并且认真地做笔记,情况就更好了。在这种情况下,人们有一定的自由空间,直到考试之前,你还可以选择自己要从事哪类研究。我非常喜欢这种自由,伴随而来的内疚也无法影响我的心情。现在的教学方法,竟然没有把人们对于研究问题的好奇心扼杀掉,这真是一大奇迹。因为这株脆弱的幼苗,不仅需要鼓励,更需要自由,离开自由之后,它一定会夭折。某些人认为依靠强制性和责任感就可以增加对观察和探索的兴趣的想法,绝对是错误的。即使是一只健康的野兽,如果在它不饿的时候用鞭子强迫它不停地吃东西,尤其是经过某些标准选出来的东西,那么,它可能会丧失爱吃的本性。
现在,我来谈谈当时的物理学处于什么水平。当时,虽然物理学在某个方面有着不错的成果,但那些僵硬的教条依然占据着统治地位:创世之初 (如果有这个时期) ,牛顿运动定律和不可或缺的质量和力诞生了,这就是所有的一切。此外,其他的东西都是通过数学方法推算出来的。19世纪,在此基础上取得的进步,尤其是偏微分方程的应用,一定会引起热爱科学的人的兴趣。牛顿向人们展示了偏微分方程的功效,他在关于声传播的理论中首次应用了这个方程。欧拉为流体动力学奠定了基础。不过,19世纪最大的成就是质点力学的发展,它是整个物理学的基础。但是,对于一个大学生而言,他所关注的不是力学的技术性发展及其能够解决的复杂问题,而是力学在其他领域中的成就,尽管这些领域看起来好像与它无关:光的力学理论,它把光假设成准刚性的弹性以太的波运动;气体动力学,单原子气体的比热和原子量没有关系,气体状态方程的导出及其和比热之间的关系,气体分子的扩散运动,尤其是气体的黏滞性、热传导和扩散之间的定量关系,原子的绝对量就是由这种关系决定的。这些成果说明,物理学和原子假说的基础是力学,而物理学和原子假说在化学中有着重要的地位。不过,在化学中有重要作用的是原子的质量之比,而不是原子的绝对大小。因此,与其说原子论代表的是物质的实在结构,不如说它代表的是形象化符号。另外,依靠古典力学的统计理论可以推导热力学的基本定律,这就引起了人们的普遍关注,从本质上来说,波尔兹曼已经完成了这种推导。
因此,我们不用感到诧异。可以这样说,只要是19世纪的物理学家,就在经典力学中看到了整个物理学的牢固的、决定性的基础,甚至是全部自然科学的,而且,他们还在努力把当时已经非常成功的麦克斯韦电磁理论建立在力学的基础上。即使麦克斯韦和赫兹在思考的时候,也是始终相信物理学的基础是力学,而现在我们回顾那段历史,却可以这样认为,正是他们动摇了把力学当作整个物理学基础的信念。马赫把它推翻了,他的著作《力学史》彻底颠覆了教条式的信念。当我处于学生时代的时候,这本书就给我留下了深刻的印象。我认为,马赫最伟大的地方就是他那始终不变的怀疑态度和独立性。在我更小的时候,马赫的认识论观点也对我产成了影响。这个观点在现在根本没有立足之处,因为马赫的理解是错误的。所有思想在本质上都具有构建性和推断性,尤其是科学思想。因此,在理论的构建上,关于思辨特征的某些方面,正是他的不足之处,例如,原子动力学。
在驳斥力学是物理学基础的观点之前,我要先讨论一下我们在物理学理论中需要驳斥的某些观点。第一个观点是:理论必须和经验事实相符,而不是相互矛盾。乍看之下,这个理论毫无不妥之处,但应用起来绝非如此。因为人们常常需要通过人为补充让理论和事实相一致,从而保留大家都认可的理论基础。不过,无论怎样,这个观点想要说明的是:通过得到的经验事实来证明理论基础的可靠性。
第二个观点和观察没有关系,说的是理论本身的前提 (基本概念和它们之间的关系) ,这些前提具有人们模糊地称为自然性或者简单逻辑性的特点。在理论的选择和评价中,这个观点一直有着重要的作用,但难以把它准确地表述出来。这里不是在分析逻辑上有着独立前提的问题 (如果这种列举可以清楚地进行) ,而是在难以比较的性质间进行权衡的问题。另外,在几种基于“简单”前提的理论中,对理论体系的可行性质的要求越严格 (即包含最确定的论点的理论) ,这种理论的优越性越强。在这里,我们所讨论的理论的对象是所有物理现象的整体,所以不必去考虑理论的“范围”。第二个观点和理论本身有着紧密的联系,可以称为“内在完备性”;而第一个观点说的是“外部确证”。我觉得下面的说法也可以归纳到理论的“内在完备性”之中:从逻辑观点而言,如果一种理论不是来源于等价的、结构类似的理论,那么,这种理论得到的评价可以高一些。
我明白上面两段话中的论点不太明确,我也不想用篇幅太短来为自己开脱。我要承认,此刻我可能无法用明确的定义来代替上面的内容。不过,我相信进行更加明确的阐释还是可以的。无论怎样,我们可以看到,“预言家”们在关于理论的“内在完备性”的判断上意见是一致的,在关于理论的“外部确证”程度的判断上更是如此。
接下来,我要驳斥一下力学物理学中的基础观点。
根据第一个观点 (经验确证) 判断,如果把波动光学划分到力学的范围内,一定会引起大家的质疑。如果把光看成是一种弹力体 (以太) 中的波动,那么,弹力体就是可以穿透所有东西的介质。由于光波具有横向性,和固体物质类似,而且不可以压缩,所以不存在纵波。这种弹性体好像幽灵一样和其他物质共存,因为它无法阻止“可量”的物体运动。为了解释清楚透明物体的折射率、辐射的发射和吸收过程,我们要假设这两种物质之间有着复杂的相互作用。不过,人们从来没有尝试过这样做,更不用说取得什么成就了。
此外,为了研究电磁力,我们要引进一种带电物质,虽然它们没有显著的惰性,却可以相互作用,而且这种相互作用属于极性类型,和引力有着本质区别。
法拉第和麦克斯韦的电动力学,使物理学家们在考虑了很长时间之后放弃了他们的信念,那就是所有的物理学都是建立在牛顿力学的基础上的。因为电子力学理论和赫兹对它进行的实验表明,存在着和一切有质量的物体在本质上有所不同的电磁现象,这就是通过电磁“场”组成的波。如果物理学的基础是力学,那么,麦克斯韦方程一定要力学化。曾经,人们尝试过这样去做,只是促进了方程本身的发展而已。人们总是把这些“场”看成独立的事物进行处理,认为没有必要探索它们的力学性质。这样一来,人们在不知不觉的情况下放弃了力学是所有物理学基础的观点,因为力学无法适用于所有的事实。此后,出现了两种概念要素:一种是质点及其之间的超距作用力,另一种是连续不断的“场”。这表明我们处于物理学的过渡状态,而且它不存在统一的基础。尽管人们不满意这种状态,但要取代它也不是一件容易的事情。
现在,我们从第二个观点 (内部完备性) 出发,对物理学中的形而上学基础进行驳斥。抛弃了力学是所有物理学的基础之后,对于现在的科学状况而言,这种驳斥仅仅在方法论上具有意义。不过,在将来的理论体系中,当基本概念和公理与可以直接观察到的东西之间的距离越来越远时,这种批判所体现出来的论点的作用就会越来越大。首先,我要说的是马赫的论点。实际上,在很早之前,牛顿已经清楚地意识到了 (水桶实验) 。从纯粹的几何角度来说,所有的“刚性”坐标系在逻辑上处于等价地位,而力学方程 (例如,惯性定律) 只是在某一类的坐标系 (惯性系) 中有效。在这类联系中,无论坐标系是否是有形客体都不重要。因此,为了解释这种特殊选择的重要性,所以要从理论所涉及的对象 (物体、距离等) 之外去寻找某些东西。因此,牛顿引进了“绝对空间”这个限制词,让它去参与所有的力学过程。“绝对”的含义是指不会受到物体及其运动的影响。这个事实导致这种事态变得难以忍受:应该有无限个惯性系存在,它们之间的关系是一种均衡的、毫无漩涡的匀速平移运动,但和其他的刚性坐标系有所不同。
马赫推断,在一个合理的理论体系中,惯性一定取决于物体的相互作用,就像牛顿理论的其他力一样。很长一段时间,我都认为这种说法是正确的。不过,它里面隐含的基本理论是一般的牛顿力学,把物体和物体之间的相互作用当成原始概念。这时,人们清楚地发现,这种解决问题的方法不符合统一的场论。
通过下面的类比,我们可以发现,马赫的批判在本质上是正确的。试想一下,有人想要建立一个力学体系,但他们只是了解了地球表面上的很小一部分,看不见其他的星体。这时,他们会把一些特殊的属性归纳到空间的竖直维度 (物体的加速度方向) 上,在这种概念的帮助下,他们认为大地是水平的。下面的观点不会对他们产生影响:对于几何特性而言,空间的各个方向是同性的,那么,偏爱某个方向的物理学定律就是错误的。也许,有些人像牛顿一样,倾向于竖直方向的绝对性,因为这经过了证明,也是人们能够接受的。与空间的其他方向相比,人们更加偏爱竖直方向,就像偏爱坐标系中的惯性系一样,这两者是相同的。
现在,我们来分析其他观点,它们和力学内在的简单性或者自然性有关。如果人们毫无疑问地接受了空间 (包括几何) 概念和时间概念,那么,他们没有理由反对超距作用力概念,尽管这个概念和人们从日常生活中的经验基础上得到的概念不同。不过,还有一个原因导致把力学作为所有物理学基础的做法有些可笑。力学上最主要的两条定律是:
1. 运动定律;
2. 关于力或者势能的表达式。
尽管运动定律的准确性毋庸置疑,但在确定力的表达式之前,这个定律是空洞的。不过,当我们确定力的表达式时,在很大程度上存在任意性,尤其是人们放弃了仅仅是坐标 (不是力相对于时间的导数) 决定了力这个不恰当的条件时,更是这样。势函数决定着从一个点出发的引力或者电力,这在理论体系内部的表达是任意的。需要补充说明的是:人们早就发现,最简单的 (旋转不变的) 微分方程的中心对称解就是这个函数。因此,如果以此认为它来自于某个空间定律,这是能够接受的,从而打破了选择力定律的任意性。实际上,这是我们背离超距离理论的第一步,法拉第、麦克斯韦、赫兹为这一步做了铺垫,以后在实验事实的基础上继续发展。
我还想说一下这个理论的内在上的不对称性,那就是出现在运动定律中的惯性质量也会出现在引力定律中,但不会出现在其他力的表达式中。最后,我要说明的是,把能量划分成有着本质区别的动能和势能,这是绝对不科学的。对此,赫兹觉得非常烦恼,所以他在最后的著述中想要把力学从势能概念 (即力的概念) 中分离出来。
牛顿啊,你已经非常了不起了!在你所处的那个时代,这是一位推断能力最好、创造力最佳的人能够找到的唯一一条路。你创造出来的概念,在今天依然有着重要的作用,指导着物理学的思想。不过,我们非常清楚,如果想要深入地理解各种关系,就要用一些远离直接经验的概念去替代它们。
读者可能会产生这样的疑问:“这是讣告吗?”我的回答是:“从本质上来说是。”对于我这样的人来说,一生的精华在于想到的东西和自己的想法,而不是做过的事情或者承受的压力。所以,这个讣告的主要作用是传达我一生中的重要想法。一种理论的前提越是简单,它牵扯到的事物就会越繁多,应用范围也就越广泛,越能够引起人们的兴趣。因此,经典热力学留给我的印象非常深刻。我深信,在它的基本概念覆盖的范围内,它是永远存在的唯一含有普遍内容的物理学理论 (请那些在原则上保持怀疑态度的人特别注意) 。
当我还是一名学生的时候,最受人欢迎的是麦克斯韦理论。这个理论体现的是从超距作用力过渡到作为基本变量过渡的“场”,而且显示了革命性。光学并入到电磁理论中,光速和绝对电磁单位制有着一定的联系,折射率和介电常数相关,物体的反射系数和它的金属导电率之间有着定性关系,这一切好像是某种启发。除了向场论过渡之外,也就是用微分方程去表示基本定律,麦克斯韦还缺少一个假设,把位移电流及其磁效应引入真空和电介质中。这和微分方程的形式特征有着一定的关系。关于这一点,我想说明的是,法拉第、麦克斯韦这两个人和伽利略、牛顿这两个人存在着明显的内在相似性,法拉第和伽利略凭借直觉抓住了事物之间的联系,而麦克斯韦和牛顿则用公式把这些联系表示出来,并且让这些联系得到应用。
当时,下面的特殊情况让人们不容易准确地掌握电磁理论的本质:电或者磁的“场强度”和“位移”都被看成基本变量,而把虚拟空间看成是电介体的特殊形式。人们认为“场”的载体是物质,而不是空间。这就说明,“场”的载体有一定的速度。而且,这种说法也可以用在“真空” (以太) 上。在这种基本观点上,赫兹建立了关于移动物体的电动力学。
在这里,洛伦兹通过令人信服的方式完成了变革。按照他的观点,“场”必须存在于虚空中,是无数的“原子”组合成的物质,而且是电荷的唯一基体;物质的粒子之间是空虚空间,这是电磁场的基体,物质粒子上的点电荷的速度变化和位置变化形成了电磁场。那些构成物体的粒子之间的力学联系的种类决定了介电常数、传导率等数值。粒子上的电荷形成了“场”,反之,“场”通过力的方式对粒子上的电荷产生作用,这里电荷的运动取决于牛顿运动定律。与牛顿体系相比,这里的革新之处是:“场”代替了超距作用,而且“场”可以用来解释辐射。由于引力非常小,所以不去考虑,但扩充场的结构 (即扩充麦克斯韦场定律) 之后,引力就有可能包含在里面。在现在的物理学家眼中,只有洛伦兹的观点有着可取之处。当时,这是一个大胆的尝试,离开了它,以后的发展就不存在了。
如果人们批判地看待理论发展的这个阶段,那么,他们一定会发现二元论,那就是牛顿意义上的质点和连续不断的“场”是并存的,一起被称为基本概念。动能和场能是两种完全不同的物质。在麦克斯韦的理论中,运动电荷的磁场可以表示惯性,这种说法更不能让人们信服。不过,为什么不是惯性的总和呢?这样一来,剩下的就是场能了,而粒子仅仅是场能的密度比较大的地方。这时,人们可以希望,通过场方程推导出质点的概念和粒子的运动方程,那个令人讨论的二元论就会消失。
对此,洛伦兹的认识比较透彻。不过,通过麦克斯韦方程无法推导出构成粒子的电的平衡,只有通过非线性场方程才可以推导出这一点。但是,只有冒险地尝试,才能够发现这种场方程。无论怎样,人们有信心,沿着法拉第和麦克斯韦开创的道路,一定可以找到一个新的可靠基础把假设一步步转换成现实。
因此,由“场”引起的这场革命,还没有结束。在19世纪末、20世纪初的时候,出现了一场和我们讨论的事情没有关系的基本危机,麦克斯·普朗克对热辐射的研究 (1900年) 使人们认识到它的重要性。下面的事实导致这个事件更加引人注意:在刚开始的时候,任何有着惊人成就的实验都没有对它产生影响。
基尔霍夫凭借热力学的基础得到这样的结论:在一个不透明的容器壁为T度的容器内,辐射的能量密度和光谱组成与容器壁的性质没有关系。也就是说,频率和绝对温度的普通函数是单色辐射的密度。这就引出了一个问题:这个函数是如何确定的呢?关于这个函数,我们在理论上可以做些什么呢?麦克斯韦理论告诉我们,辐射会对腔壁造成压力,总能量密度决定了这个压力的大小。根据这一点,玻尔兹曼用热力学方法推导出辐射的总能量密度和温度T呈正比关系。因此,他为斯藩早就根据经验发现的定律找到了理论基础,而且将这条经验定律与麦克斯韦理论的基础建立了联系。之后,维恩把麦克斯韦理论用在热力学的思考上,还发现了包含两个变量的普通函数的简单形式。两个普通常数中的一个引发了量子论。
在普朗克公式中,某一个常量代表着原子的真实大小。
普朗克明白这是一个伟大的发现。不过,普朗克没有注意到里面的一个重要缺陷。出于相同的考虑,普朗克公式在低温状态下也应该可以使用。然而,如果真是这样的话,这个公式就没有价值了。因此,从现在的角度来看,正确的结论是:通过气体理论得出的振子的平均动能是不对的。这就否定了统计力学的价值,或者说依靠麦克斯韦理论得到的振子的平均动能不正确,这就否定了麦克斯韦理论。在这样的情况下,最可能的是,这两种理论在一定的范围内是适用的,除此之外则不正确。后面的事实让我们明白,的确是这样。如果普朗克得出了这个结论,他的发现就不存在了,因为他失去了纯粹思考的基础。
现在,我们看看普朗克的推论。波尔兹曼根据气体分子运动论得知,除了常数因子之外,我们所观察到的状态的“几率”的对数和熵的数值相等。通过这种观点,波尔兹曼认为从热力学的意义上来说,过程是“不可逆”的。不过,从分子力学的角度来看,所有的过程都是可逆的。如果人们把通过分子论定义的状态叫做微观描述的状态,也可以叫做微观状态,而把通过热力学定义的状态叫做宏观状态,那么,有许多状态可以划分到宏观状态的范畴内。这种观点之所以有着重要的作用,那是因为它的适用范围比较广泛,并不是局限在将热力学作为基础的微观描述中。普朗克想到了这一点,还把波尔兹曼理论运用到一个由许多频率相同的振子组成的体系中。所有振子振动的总能量决定了宏观状态,而单个振子的瞬间能力决定了微观状态。因此,为了找到一个有限的数值来表示宏观状态中的微观状态的个数,所以普朗克把总能量划分成个数有限但比较大的同质能量元,并且考虑在振子之间有多少种方式来分配这些能量元。于是,便产生了系统的熵,它是由这个数目的对数决定的,并因此在热力学的基础上决定了系统的温度。如果普朗克赋予他提出的能量元数值,便会得到辐射公式。这种思考方式让人们无法清楚地意识到,这个推导过程和所依据的力学、电动力学的基础不一致。实际上,推导过程暗含了一个难以察觉的事实,那就是能量被单个振子吸收的时候只能是固定大小的“量子”。也就是说,辐射能量和可以振动的力学结构的能量都必须通过这种量子进行传递。这完全不符合力学定律和电动力学定律。与动力学基础的冲突显而易见,但与电动力学基础的冲突则不是这么明显。因为尽管辐射能量密度的表达式和麦克斯韦方程能够相互兼容,但这些方程的结果不一定是它。依靠这个表达式建立起来的斯蒂芬—波尔兹曼定律和维恩定律完全符合所说的经验,这表明这个表达式只是给出了有着重要意义的平均值。
普朗克的推理发表之后,我就已经清楚上面所说的一切了。因此,虽然没有其他理论可以代替经典力学理论,我还是发现,这条温度—辐射定律,为光电效应、其他和辐射能量的转换相关的现象、固体的比热 (比热容) 等带来了重要的作用。不过,我所进行的让这些认识和物理学的理论基础相符合的尝试都没有成功。这类似于把脚下的土地抽空后,人们看不到任何可以用来建造房屋的基地。在这个难以确定且相互矛盾的基础上,有着独特直觉和敏锐思维的普朗克竟然发现了光谱线和原子电子壳的重要定律,及其在化学上的重要意义。这件事确实是一个奇迹,对今天的我来说依然如此。这是思想领域中的伟大进步。
尽管普朗克的研究成果有着重要的意义,但对于那个年代而言,我所关心的不在于此。我最感兴趣的问题是:从关于辐射结构的公式中,也可以说,从关于物理学的电磁基础的辐射公式中,我们可以得出什么结论呢?在论述这个问题之前,我需要简单地说一下布朗运动和关于这个课题 (波动现象) 的某些研究。它们的基础主要是经典分子力学。关于这个问题,波尔兹曼和吉布斯早就研究清楚了,而且发表了研究成果,但我并不知道。于是,我把统计力学进行扩展,并在此基础上发展了热力学的分子运动论。我之所以这样做,只是为了寻找事实证明有限大小的原子确实是存在的。这时,我发现在原子论的基础上,能够看见一种悬浮微粒的运动。我并不知道这就是“布朗运动”,而且是人们早就发现的运动。我是这样进行推理的:如果分子运动论是对的,那么,那些由可见粒子组成的悬浮液类似于分子组成的溶液,一定符合气体定律中所说的渗透压。这种渗透压和分子的大小有着紧密的联系,即和1克物质中的分子数量有关。如果悬浮液的密度大小不同,那么,各处的渗透压也会不同,这就导致了一种趋向均匀的扩散运动,这可以通过已知粒子的迁移率进行计算。从另一方面来说,这种运动可以认为是悬浮粒子受热后导致的。开始时,我们并不清楚无轨偏移的数值。通过比较两种不同的推导方式得到的扩散电流数值的大小,人们就可以定量得出这种位移的统计定律,这就是布朗运动定律。这些研究完全符合经验,再加上普朗克依靠辐射定律得出的分子的真实大小,让当时许多保持怀疑态度的人无法否认原子的实在性。这些学者对原子论的怀疑态度来源于他们所信奉的实证主义哲学立场。这个例子说明,那些具有冒险精神和敏锐直觉的学者可能会受到哲学偏见的影响,从而导致他们无法看清真正的事实。这种偏见依然存在,它相信不需要借助任何概念构造,事实本身就可以为我们提供科学知识,而且应该为我们提供这些知识。这种误解之所以没有消失,那是因为人们无法认识到对这些概念的自由选择:经过了很长时间的成功使用之后,看起来这些概念和经验材料有着直接的关系。
布朗运动理论表明:当速度对时间的高阶求导的结果小到可以忽略时,可以把经典力学运用到这种运动上,结果总是正确的。根据这个事实,我们可以通过直接的方法获得关于辐射结构的知识。我们可以得到这样的论证:在布满辐射的空间中,一块 (和自身平面垂直) 进行自由运动的准单色反射镜,同时还做着布朗运动。如果局部波动不会影响辐射,镜子就会慢慢地静止下来,因为它的运动会使正面得到的辐射多于背面。不过,由于构成辐射的波束可以相互干扰,所以作用在镜子上的压力是不同的,这就形成了不规则的波动。通过麦克斯韦理论可以计算出这种波动。为了得出这个结果,人们需要对另一种类型的压力变化进行假设。这种方法通过直接且激烈的方式展现出来,普朗克的量子绝对是一种直接的实在,所以从能量角度来说,辐射一定具有某种分子结构。显然,这和麦克斯韦理论不一致。根据波尔兹曼的熵概率关系 (概率和统计的时间频率相等) 对辐射的影响,得出的结果也是一样。辐射的 (和物质微粒) 这种双重性属于实在的主要性质,量子力学通过巧妙的方式对它进行了成功的解释。当时,大部分物理学家都认为这种解释是最好的,但在我眼中,这只不过是一个权宜之计。我在后面会进行深入地论述。
在1900年的不久之后,也就是普朗克的创造性工作完成之后,我已经清楚地意识到,只有在极限情况下,力学和电力学才是有效的。对于根据已知事实用创造性的思维去寻找真实定律的方法,我已经毫无信心了。我努力得越久,付出得越多,就越认识到:只有发现了具有普遍性的原理,才能得到真实可靠的结果。热力学就是摆在我面前的一个实例。在热力学中,我们通过一定的定理形式得出了普遍原理:自然规律使得我们无法去建造第一类永动机和第二类永动机。不过,如何去寻找普遍原理呢?经过十年的研究和思考,我从一个悖论中得知:如果我用速度c (光在真空中的速度) 去追逐一束光线,那么,我应该看到这样的现象,虽然这一束光线在空中不停地振荡,但它像是一个难以前进的电磁场。不过,无论是依靠经验还是依靠麦克斯韦方程,都不会出现这样的情况。开始时,我就感觉到,从这样一个观察者的立场进行思考,所有的事物都会按照一些相同的定律进行,就像相对于地球是静止的观察者看到的现象。不过,第一个观察者要如何去判断自己处于高速的匀速运动状态呢?
人们发现,这个悖论体现了狭义相对论的萌芽。现在,所有人都非常清楚,只要人们的潜意识中存在时间或者同时性的绝对性这条公理,那么,尝试着去澄清这个悖论的做法就会失败。只有认识清楚这条公理及其任意性,才有可能抓住解决问题的根源。对于我来说,在阅读了休谟和马赫的哲学作品之后,我才了解到这个要点中包含的批判思想,而且取得了很大的进步。
人们一定要清楚,在物理学中,某个事件的空间坐标和时间点的含义是什么。空间坐标的物理含义预示着一个刚性参照物,而且这个参照物还有处于某个程度上所说的运动状态中 (惯性系) 。在一个确定的惯性系中,用坐标来表示 (静止不动的) 刚性杆测量出的某些结果 (人们应该明白,假如原则上存在刚性杆,这种假设是从一种近似经验的暗示中得出的,但这个假设在原则上具有任意性) 。由于对空间坐标的解释是这样的,所以欧几里得几何的有效性问题转变成物理学问题。
这样一来,如果人们在对事件的时间进行解释的时候采用相似的方法,那么,便要借助测量时间差的工具 (这是一个由内在决定的周期过程,这个过程的实现需要一个空间广延足够小的体系的帮助) 。一只钟表定义了“当地时间”,前提条件是它相对于惯性系是静止的。如果有一种尺度可以对所有的钟表进行“校准”,那么,所有空间点上的当地时间组合在一起就形成了惯性系的“时间”。人们发现,通过这种方式定义的“时间”,在不同的惯性系中可以是不同的。对于人们平常的实践经验来说,如果不是用光定义绝对同时性 (因为光速的数值非常大) ,也许人们早就发现这一点了。
从原则上来说,对于量杆和时钟的假设之间有着一定的联系,如果针对真空中的光速是恒定不变的假设是正确的,那么,刚性杆两端来回反射的某个信号可以称为最理想的时钟。
我们对上面的悖论进行总结:根据经典物理学得知,事件的空间坐标和时间点从一个惯性系转移到另一个惯性系的时候,它们之间会产生关联;这个关联规则导致下面的两条假设难以相互兼容 (尽管两条假设的基础都是经验) :
1. 光速不变;
2. 定律 (尤其是光速不变定律) 和所选择的惯性系 (狭义相对性原理) 没有关系。
对狭义相对论的基本认识:如果事件的坐标和时间的转换能够出现新的关系 (洛伦兹变换) ,那么,上面的两个假设就会相互兼容。由于考虑到已经存在的关于坐标和时间的物理学观点,这个假设绝对不是普通的尝试,里面包含着关于运动的量杆和时钟的实际行为的假设,这些假设不是被证实就是被推翻。
这个假设还包含了狭义相对论的普遍原理:关于洛伦兹变换 (从一个惯性系转换到任意一个惯性系) 的物理学定律恒常不变。这是用来限制自然法则的一条原理,它类似于那条以热力学基础建立的永动机不存在的限制性原理。
首先,我来解释一下这个理论和“四维空间”之间的关系。有这样一个荒谬的观点,狭义相对论在某种程度上发现了物理连续区的四维性,至少通过新的方法引进了这种四维性。但是,事实绝对不是这样。经典力学的建立基础也是空间和时间的四维连续区,但在经典物理学中,时间值不变的截面具有绝对的实在性,即和选取的参照物没有任何关系。因此,四维连续区被划分成三维和一维 (时间) ,所以人们没有必要去了解关于四维的说法。狭义相对论却不是这样,它使空间坐标和时间坐标在进入自然规律的过程中,在某种形式上建立了相互依存的关系。
关于这个理论,闵科夫斯基的贡献非常巨大。在此之前,人们要先进行一次洛伦兹转换,然后去验证一条定律在这种转换下的不变性;闵科夫斯基引进一种形式体系,促使定律的数学形式本身完全可以保证它在洛伦兹变换下的不变性。他在创造了四维张量演算之后说,普通的矢量演算可以从三维中得到的东西,借助张量演算完全可以从四维中得到。闵科夫斯基还解释说,洛伦兹变换 (消除了由于时间的特殊性造成的正负差异) 体现的是坐标系在四维空间中的转动。
首先,我们要对上面的理论进行适当的批评。仔细观察就会发现,这个理论 (除了四维空间之外) 引入物理学的两类东西:①量杆和时钟;②其他的所有东西,例如,电磁场、质点等。从某种意义上来说,这是无法保持一致的。准确来说,量杆和时钟应该是基本方程 (运动的原子组成的客体) 的解,而不是理论上所谓的独立实体。不过,这种做法完全可以理解,因为开始的时候就非常明白,这个理论的假设存在缺陷,从其中无法推导出完全独立、能够排除任意性的关于物理事件的方程,并在此基础上确立量杆和时钟的理论。如果人们依然坚持在一般意义上对坐标进行的物理解释 (本来这是不可能的) ,那么,最好能够接受这种不一致,当然,在以后的研究中我们会慢慢消除它。不过,人们不要认为上面的缺点不存在,并把距离当成是和其他物理量有着本质区别的特殊物理实体 (物理学可以被还原成几何学等) 。
接下来,我们来分析一下,狭义相对论为物理学中哪些确定性的认识提供了依据。
1. 由于不同地点发生的事情之间不具备同时性,所以牛顿力学中的直接超距作用变得毫无意义。虽然根据牛顿力学可以引入关于光速传播的超距作用,但看起来非常不自然。因为在这样的理论中,关于能量守恒原理的陈述难以让人信服。因此,必须要用空间的连续函数表示物理实在。所以,质点这个基本概念就不存在了。
2. 动量守恒定律和能量守恒定律合并成一条定律。在封闭的体系中,惯性质量等于能量,所以质量这个独立的概念消失了。
在物理方程中,光速c是一个常数,也是“普适常数”中的一个物理量。不过,如果我们把光走过1厘米所需要的时间定义为时间单位,并以此来代替秒,那么,这个方程中的c就可以去掉了。从这个意义上来说,c仅仅是表面上的一个普适常数。
显然,有一点是大家都认可的,如果选择合适的“自然”单位 (例如,电子的质量和半径) 去代替表示质量的克和表示长度的厘米,那么,物理学中的另外两个普适常数也可以被消灭掉。
如果我们这样去做,在物理学的基本方程中,就只剩下“无量纲”常数了。另外,我要提出一条命题,目前它只是建立在关于自然的简单性或者可理解性的观点上。这个命题是:这种任意的常数根本不应该存在。也就是说,自然界促使人们去建立一些决定性定律;在这些定律中,只有理性决定的常数 (不是在这种理论下数值可以改变的常数) 才可以保留下来。
麦克斯韦的电磁场方程引出了狭义相对论。相反,只有通过狭义相对论,人们才能更好地理解麦克斯韦的电磁场方程。麦克斯韦方程是通过矢量场推导出来的方程,用来反对称张量假定的最简单的洛伦兹不变场方程。如果我们不是从量子现象中得知,麦克斯韦理论不能准确地解释辐射的能量特征,那么,这个理论不会引起人们的怀疑。不过,麦克斯韦理论要如何修改呢?对此,狭义相对论没有给出令人满意的答案。而且,它也无法回答马赫提出的问题:在物理学中,惯性系为什么具有特殊性呢?
当我想要通过狭义相对论解释引力的时候,我才发现,狭义相对论不是最终的结果,只是发展中的第一步而已。在经典力学中,引力被解释成一种标量场 (在理论上来说,这是具有单一分量的最简单的场) 。首先,这种标量理论和洛伦兹变换群很容易保持一致。因此,下面的说法看起来很正确:一个标量场 (引力场) 加上一个矢量场 (电磁场) 组成了物理场的总体。以后,也许会引入一些更加复杂的“场”,但人们没有必要担心那些未知的事情。
不过,这个说法一开始就受到人们的质疑,因为它必须具备下面的性质:
1. 对狭义相对论进行研究后发现,物理学体系的惯性质量随着它的总能量的增加而增加 (例如,随着动能的增加而增加) 。
2. 根据厄缶的扭秤实验或者其他精确的实验,可以得到这样的结论:物体的引力质量等于惯性质量。
通过上述1和2可以推断出,一个体系的总能量决定了它的重量。如果理论不符合这一点,或者无法自然地体现出这一点,那么,这个理论就应该被放弃。这种情况可以表示为:在某个确定的重力场中,自由下落系统的加速度和这个系统的本性 (尤其是它的能量含量) 没有关系。
事实显示,上面的说法无法满足这个情况,或者说难以用自然的形式表达这个情况。这一点让我明白,在狭义相对论中,不可能存在毫无缺憾的引力理论。
现在,我已经知道,惯性质量等于引力质量,也就是下落加速度和下落物体的本性无关,这件事情可以这样表述:在某个 (小空间范围) 引力场中,我们引入一个参照系,然后用它去替代“惯性系”,这个参照系相对于这个惯性系进行加速运动,那么,在这个“场”中,物体的运动和没有引力的空间一样。
这样一来,如果我们把物体相对于后一个参照系进行的运动看成是“真实的” (不是表面的) 引力场造成的,那么,根据前一个参照系,我们可以把这个参照系看成“惯性系”,而且和前一个参照系一样合理。
因此,如果人们对引力场存在的物理学可能性进行深入研究,而且空间界限不会对这个引力场产生限制,那么,“惯性系”这个概念就失去存在的价值了。同理,“相对空间加速度”的概念、惯性原理、马赫悖论都会变得毫无意义。
惯性质量等于引力质量这个事实让人们想到,狭义相对论的假设 (在洛伦兹变换这个条件下,这些定律的恒常性) 范围太狭窄了,也就是说,我们要进行这样的假设,定律的不变性和四维连续区中的坐标的非线性变换有着一定的联系。
这个假设出现在1908年,为什么需要花费七年时间去建立广义相对论呢?根本原因是:如果想要抛弃坐标必须有直接的度规意义这个观点非常困难。接下来,我们看一下这个转变是如何发生的。
首先,我们假设一个空虚空间,这个空间中没有“场”,在狭义相对论中,这是我们能够想象出来的关于惯性系的最简单的物理状况。现在,我们假设需要引入一个非惯性系,相对于惯性系 (在三维的描述中) 来说,这个新的参照系在一个 (传统意义上的) 方向上进行匀速运动。于是,对于这个参照系而言,存在一个静止的、平行的引力场。这时,这个参照系可以具有刚性,还具有欧几里得性质中的三维度规关系。不过,如果想要度量那个“场”出现静止状态的时间,使用的不是具有相同构造的静止的时钟。通过这个例子我们可以得知,只要允许坐标发生非线性变换,那么,坐标就会失去直接的度规意义。不过,如果人们想要利用这个理论去验证引力质量等于惯性质量这个事实,打破马赫关于惯性理论的悖论,那么,我们一定要引入坐标的非线性变换。
不过,如果打算放弃坐标系的直接的度规意义 (坐标的差=可测长度或者时间) ,那么,人们就必须将由坐标的连续变换形成的坐标系看成是等价的。
因此,广义相对论的出发点是:通过在连续的坐标变换群下协作的方程表示自然规律。用这个群去替代狭义相对论中的洛伦兹变换,而洛伦兹变换成为广义相对论中的一个子群。
当然,这个要求本身无法成为推导物理学基本方程的起点。开始时,人们无法相信这个假设本身能够限制物理规律。因为最初适用于某些坐标系的定律,可能需要重新进行描述,使新的表达方式具有广义协变性。更确切地说,现在面临的一个事实是,可以建立许多个具有这种协变性特征的场定律。不过,广义相对性最重要的启发性意义是,它引导我们去寻找最简单的广义协变形式的方程组,我们应该从这些方程组中去探索物理空间中的场定律。通过这样的变换能够相互转换的“场”,都具有相同的实在状况。
对于研究这个领域的学者来说,他们需要解决的问题是:首先需要确定哪种数学类型可以用来表示空间的物理性质 (结构) 的量 (坐标的函数) ,然后去分析这些量要满足哪些方程。
直到今天,一直没有找到这两个问题的准确答案。最初,可以这样描述广义相对论的途径。尽管我们不清楚要用哪一种场变量来表示物理空间,但我们确定存在一种特殊状况,那就是狭义相对论中所欠缺的“没有场”的空间。
现在,我要说一下人们对于“场”结构和“变量”群的看法。在一般情况下,人们判断一个理论的依据是:理论基础的“结构”越简单,场方程不变性能够满足的群的范围越广泛,这个理论就越完善。现在,人们已经发现,这两个要求是相互矛盾的。例如,根据狭义相对论 (洛伦兹群) ,人们可以建立一条协变定律用来满足想象出来的最简单的结构 (标量场) ,但在广义相对论中,有一个不变场定律,只适用于比较复杂的对称张量结构。对此,我们进行了物理学说明。在物理学中,一定要满足范围比较广泛的群的不变性。从数学角度出发,我认为没有必要为了范围广泛的群去牺牲比较简单的结构。
广义相对论的群的基本要求是,最简单的不变性定律的场变数和它的导数不是线性的、齐次的,这一点绝对要满足。如果场定律是线性的、齐次的,那么,两个解的和会是另一个解,例如,麦克斯韦方程在虚空中的应用就是如此。根据这种理论,人们无法根据场定律去推导系统各个解的结构之间的相互作用。因此,在所有的理论中,除了场定律之外,还要去寻找场作用下的物体的运动定律。对于相对论中的引力论来说,不仅确定了场定律,还假设了运动定律 (短程线) 。不过,后来人们才知道,根本不需要 (也不应该) 假设这条运动定律,因为场引力定律中已经包含了它。
在本质上,这种复杂的情况可以形象地描述为:一个各处有限且匀称的引力场可以用来表示一个单一的静止质点。不过,如果想用场方程的积分来表示两个静止质点的“场”,那么,这个“场”不仅要在两个质点所在的位置有两个奇点,还要有一条连接两个奇点的曲线。但是,人们可以这样来定义质点的运动,用来保证除了质点所在的位置以外,这些质点所形成的引力场各处绝对不具有奇异特征。这些正好符合牛顿定律在第一级近似下描述出来的运动。所以,人们可以认为物体通过这样的方式进行运动,除了质点以外,无论在任何地方,场方程的解都不会是奇点。引力方程的这种属性和方程的非线性有着直接联系,而范围比较广泛的变换群决定了这种非线性。
现在,人们可能会产生这样的疑问:如果质点所在的位置可以出现奇点,那么,空间的其他地方为什么不可以出现奇点呢?如果引力场方程和总场的方程是等价的,那么,人们的疑问就是正确的。但是,实际情况不是这样,物质质点的“场”和粒子所在点的距离越短,这个场越不是单纯的引力场。根据总场的场方程,人们一定希望粒子本身可以被描述成完备的场方程中没有奇点的解。这样一来,广义相对论就会变成最完善的理论。
在讨论如何使广义相对论更加完善之前,我要解释一下这个时代最成功的理论,那就是统计性量子理论。二十多年前,薛定谔、海森堡、狄拉克、玻尔这四个人就给出了这个理论的统一逻辑形式。现在,它是唯一一个能够解释感知到的微观力学事件的量子特征的理论。这个理论和相对论有着同样的价值,在一定意义上都被认为是准确无误的,尽管想要把它们融合在一起的尝试一直没有成功。也许,这就是当代理论物理学家们对未来物理学理论基础如何发展持有不同意见的原因。它是不是一个场论?或者在本质上来说是统计性的理论?接下来,我要说一下我是如何看待这个问题的。
物理学一直尝试着从概念上去把握实在,而不去关心实在能不能被观察到。在这个意义上,人们去讨论“物理实在”。在量子力学诞生之前,对于这一点的解释没有任何疑惑。在牛顿提出的理论中,用空间和时间中的质点表示实在;在麦克斯韦提出的理论中,用空间中的“场”表示实在。不过,在量子力学中,情况变得比较复杂,想要解释清楚不是一件简单的事情。如果有人提出这个问题:在量子理论的函数中,表示实在的方法是不是和质点系或者电磁场一样呢?这时,人们难以用简单的“是”或者“不是”来回答,这是为什么呢?因为函数 (在某个确定的时刻) 的意义是:如果我们用表示时间的字母t去量度,那么,在已知的一段时间内,我们可以得到一个确定的物理量q的概率。在这里,这个概率看成是从经验上可以测量的值,所以是“真实”的量,只要可以同时创造相同的函数,而且每一次都可以测量,也许就能够确定。不过,每次得到的值是如何变化的呢?相关的体系在测量之前是不是就有了这个值呢?对于这些问题,现在的理论体系还无法给出明确的答案。因为测量是一个过程,这表示外界对系统施加了一些干扰,所以只有依靠测量本身系统才能得到确定的数值。为了进行深入讨论,我假设有A和B两个物理学家,关于量子函数所描述的实在状态,他们持有不同的意见。
A. 单个系统对于所有的变量都有一个确定的q (或者p) 值,这个值是在测量变量时取得的。根据这个观点,他的看法是:量子函数只是对体系的实在状况的不完备描述,而不是完整的描述,它只是向我们展现了先前通过测量得出的系统知识。
B. 单个系统没有确定的q (或者p) 值,这个值是通过复合函数所表达的概率的测量行为本身得出的。根据这个观点,他的看法是:函数是对系统的真实状况的一种穷尽的描述。
接下来,我们来看另一种情况。在我们进行观察的时刻t,两个局部系统组成了一个新的系统,在这个时刻,这两个局部系统在空间上是分离的,两者之间 (在经典物理学的意义上) 只有很小的相互作用。根据量子力学可以得知,通过一个已知的函数可以用来描述这个系统。
现在,我们要去分析局部系统的真实状况。开始时,在没有研究系统一之前,我们对这个真实状况的了解非常少,远远不如我们对通过函数描述的系统的了解多。不过,我认为我们应该始终坚持这个假设:体系的真实状态和我们对在空间上与它相互分离的系统采取的研究方法毫无关系。对于同一个实在状况而言,可以 (根据人们选择的量度) 用不同类型的函数去描述 (通过下面的方法,人们可以避免这种结论:假设度量可以通过传心术的方法改变实在状况,或者不承认在空间上处于分离状态的事物具有独立的实在状况。我认为,这两种情况都是无法接受的) 。
如果A和B这两个物理学家支持这种推论,那么,B就要承认自己的观点是不对的,即函数是对实在状况的一种完整描述。因为在这种情况下,系统二的同一个实在状况无法去对应两种不同类型的函数。
因此,目前理论中的统计特征是由量子力学对系统的不完备描述造成的,而人们也要放弃统计学决定了未来物理学的基础这个观点。
我觉得,如果能够创造一些确定的概念,在经典力学的基本概念上形成的量子理论,就会出现一种关于联系的最合适的表达方式。不过,这个理论不能当作起点去研究未来的发展方向。在这一点上,我的看法和当代许多物理学家有着不同之处。他们认为,依靠满足微分方程的空间的连续函数去描述事物的实在状况的理论,不能用来解释量子现象 (一个体系在状态上的变化,表面上没有连续性,时间上没有确定性,能量基本载体具有粒子性和波动性) 的本质特征。他们还认为,通过这种方式,人们难以了解物质的原子结构和辐射的原子结构。相反,他们觉得为了解释这种理论而引入微分方程体系,绝对不会存在四维空间中各处都是均匀 (不含有奇点) 的解。不过,他们相信,只有用本质上属于统计性的理论才能去描述基本过程表面上的非连续性,因为在这个理论中,在解释系统的非连续变化时,要使用可能状态的概率的连续变化。
关于这些意见,我有着深刻的印象。不过,我认为真正的问题是:在现有的物理学理论基础上,哪些尝试有可能成功呢?引力论中的经验给我指出了研究方向。我觉得,相对于其他的物理方程来说,这些方程更有可能带给我们一些准确的东西。例如,人们可以把这些方程和虚空中的麦克斯韦方程放在一起,比较它们的相同点和不同之处。这些方程和我们所知道的无限弱的电磁场的经验相符合,这个经验决定了方程的线性形式。不过,我们在前面已经说过,真正的定律绝对不是线性的,反之,通过这些线性方程也不可能得到真正的定律。在引力论中,我还发现了别的东西:无论收集的经验事实多么丰富,也不可能创造出这样复杂的方程。尽管可以通过经验去验证理论,但经验不会告诉人们如何寻找理论。只有借助于逻辑上的简单数学条件才能发现像引力场方程这样复杂的方程,这些方程是由这种数学条件决定的。只要找到了合适的条件,少量的事实知识就可以帮助人们构造复杂方程。在引力方程这个实例中,这些方程是由表述四维性和空间结构的对称张量及连续变换群的不变性决定的。
我们需要找到能够适用于总场的场方程,所求的结构一定是对称张量的变化形式,它能够满足的群的范围绝对不会小于连续坐标变换群。如果可以引入一个比较丰富的结构,那么,相对于以对称张量为结构时来说,这个群对这些方程的决定性会降低。因此,如果人们能够再次把群进行扩张,就像从狭义相对论扩张到广义相对论一样,那是最理想的状态。我尝试过使用复数坐标变换群,但所有的努力都遇到了失败的结果。曾经,我放弃了想要去增加空间维数的想法,这种努力来自于卡鲁查,直到今天依然存在拥护者,尽管发生了很大的变化。现在,我们应该把范围限制在四维空间和连续的实数坐标变换群上。
从物理学角度来说,空间结构的推广是自然而然的事情,因为我们非常清楚,电磁场和反对称张量有着紧密的联系。
在引力理论中,对于一个已知的对称的“场”来说,可以定义一个下标对称的“场”,这是最重要的一点。从几何学角度而言,矢量的平移是由它决定的。对于非对称的“场”来说,根据公式可以定义一个非对称的“场”。这个公式完全符合对称的相应关系,只有在这里才需要去注意它的下标的位置。
如果读者通过上面的论述明白了我一生的努力有着怎样的联系,还有这些努力为什么会形成一种确定的期望,那么,我的目的就实现了。
1946年,爱因斯坦
几乎所有的物理学定律都在解释空间中的物体运动随着时间的推移所发生的变化。只有选择合适的参考物,才能清楚地表达一个物体的位置,或者一件事情发生的时间。例如,在阿脱武德机的实验中,物体的速度和加速度的参考物是机器本身,其实就是地球。天文学家在研究行星的运动时,可以选择太阳的重心当作参考物。因此,只要选择出恰当的参考系,我们就可以描述出所有的运动。
我们可以进行这样的假设,有一个架子是由杆组成的,它和参考物连在一起,一直延伸到空间中。如果把这个架子当作三维空间中的笛卡尔坐标系,那么,空间中的任意一个点的坐标都可以用三个数来表示。我们把这样和参考物连在一起的架子称为参考系。
不过,并不是任何物体都能当作参考物。在没有提出相对论的时候,人们已经发现选择参考系的重要意义了。17世纪后半叶,伽利略为了让人们了解日心参考系这个学说,冒着生命危险去传播它。后来,我们慢慢了解到,伽利略和当时专制势力争论的主题就是如何选择参考系。
牛顿在物理学概论中对此进行了详细的解释,促使人们接受了日心参考系这个观点。不过,牛顿并没有就此止步,为了证明在描述自然状态这方面,有的参考系要比其他参考系更合适,他设计出了水桶实验。首先,他在水桶中装满水,然后开始拧转系在水桶上的绳子,让水桶转起来。我们看到,当水随着水桶一起旋转的时候,水的表面会由平面变成抛物面。当水的旋转速率等于水桶的旋转速率时,让水桶停止旋转,水面会慢慢变成平面。
显然,水桶实验的参考物是地球。我们可以把水面的变化描述为:水在不转动的时候是平面状态,而在转动的时候是抛物面状态。而且,这种状态的改变和水桶的运动状态没有关系。
现在,我们假设一个参考系,它以相对于地球来说恒定的角速度进行转动,而且这个角速度和水桶转动的最大角速度的值相等。借助于这个参考系,我们再次观察上面所说的水桶实验。开始时,水桶、绳子、水都以相同的角速度在“转动”,水处于平面状态;接着,水桶和绳子的“转动”慢慢停下来,水从平面变成了抛物面;然后,让水桶和绳子再次“转动” (对于地球这个参考系来说,水是静止的) 起来,水会慢慢地回到平面状态。在这个参考系中,我们可以这样来描述水面的状态:只有当水按照一定的角速度“转动”的时候,水才会是平面状态,如果水的转动速度发生了变化,水就不再是平面状态了,而且,水偏移的角度和运动的偏移程度成正比关系。也就是说,在静止的状态下,水也可以呈现抛物面状态,同样,水面的状态和水桶的转动无关。
牛顿的水桶实验让我们明白,只要选择恰当的参考系,就可以描述自然现象或者自然界中的定律。不过,在所有的参考系中,只有一个或者少数几个可以让描述出来的自然定律变得简单明了。换言之,在这极少数的参考系中,自然定律包含的因素相对于其他的参考系来说要少一些。我们依然用牛顿的水桶实验为例进行解释。如果我们要用后一个参考系来描述自然现象,那么,我们需要在描述的物理定律面前加上一个前提条件,那就是水桶相对于其他的参考系 (例如,地球) 来说,具有一个角速度w。
在描述行星的运动规律时,相对于地心参考系来说,日心参考系要简单一些。这就是哥白尼和伽利略的描述能够战胜托勒密的描述的原因,尽管牛顿和开普勒关于基本定律的表述还没有出现。
当人们认识到所选择的参考系可以影响自然定律的形式时,许多人想用数学形式来测量选择的效果,为此,他们进行了各种实验和探索。
在物理学的分支中,最早用完整的数学定律进行描述的是力学。在所想象出来的一切参考系中,有些参考系可以让惯性定律呈现出人们比较熟悉的形式,那就是在不受外力的作用下,一个质点的空间坐标和时间坐标之间的关系是线性函数。我们把这样的参考系叫做惯性系。在同一个参考系中,我们会用相同的形式来描述其他的力学规律。如果我们选择其他的参考系,那么,我们需要考虑的因素会增加,从而使得物理描述和数学描述变得比较复杂,上面所说的牛顿的水桶实验就是一个很好的例子。我们用任何一个参考系来描述不受力作用的质点的运动,但它们的惯性定律的表达式会变得非常复杂,它们的空间坐标和时间坐标的关系也不再是线性函数。
由于在所有的惯性参考系中,力学规律使用的是相同的形式,所以我们无法通过力学去观察不同的参考系在物体身上体现出来的区别,因为从力学的角度来说,所有的惯性系都具有等效性。我们把某个运动的物体和不受力作用的质点的运动进行比较,就能判断出这个物体的运动状态是不是加速的。不过,我们非常清楚,要判断一个物体的运动状态是“静止”还是“匀速运动”,这是由所选择的参考系决定的,因此,没有绝对意义上的“静止”或者“匀速运动”。无论我们选择哪一个参考系,我们描述出来的自然现象都具有等效性,这就是相对性原理。
麦克斯韦在研究他的电磁场方程组的时候,肯定没有考虑相对性原理,这导致他提出的方程和相对性原理相互矛盾。因为根据关于电磁场方程的理论得知,电磁波在真空中的传播速度是c,而c是一个常量,大约是3×10 10 cm/s。不过,对于两个处于相对运动的惯性系来说,这个说法显然是错误的,因为假如有这样一个参考系,可以使电磁辐射在各个方向上的速率都相等,即存在一个定值,那么,通过这个参考系可以去定义“绝对静止”或者“绝对运动”。无数的物理学家尝试着去寻找这样的参考系,然后去定义地球的运动状况。
不过,所有的尝试都失败了,相反,这些努力得出了一个结论,相对性原理不仅可以用在力学定律上,还可以用在电动力学定律上。H·A·洛伦兹提出了一个理论,他在这个理论中承认这个特殊参考系是存在的,并解释了为什么实验不能发现这个参考系。不过,在解释的过程中,他又引入了一些假设,而且没有实验能够证明这些假设是否正确,所以他的理论没有足够的说服力。爱因斯坦的观点是,只有经过修正的空间——时间概念可能会消除理论和实践之间的差距。如果这种修正可以成功,那么,相对性原理就可以用在所有的物理学中,这就是所谓的狭义相对论,它证明所有的惯性系具有等效性。在所有的参考系中,它有着特殊的地位,直到广义相对论出现之后,这种特殊地位才被推翻,提出了新的引力理论。然而,广义相对论更加复杂、更加难懂,这不是我要分析的问题。