我已经67岁了,现在我坐在这里,是为了写点类似自己的讣告那样的东西。我这样做,不仅因为希耳普博士的说服,而且我自己也确实相信,向为共同目标奋斗着的人们回顾一个人努力和探索的历程,在回顾中思考过去,应该是一件好事。但稍作考虑,我便觉得,这种尝试的结果肯定不会完满。因为,无论一个人工作的一生多么短暂、有限,其间的曲折不论怎样占优势,要把那些值得讲述的东西讲清楚,毕竟不容易——67岁的人已完全不同于他50岁、30岁或者20岁的时候了。
任何回忆都会被“现在”干扰,同时,也会受到不靠谱的观点的浸染。这种情形令人气馁。然而只要我们善于思考、敏于甄别,还是可以从自己的经验里提取出许多别人不曾意识到的货真价实的东西的。
当我还是一个早熟的少年时,我就深切地意识到,大多数人终生无休止追逐的那些希望,甚至努力都是一文不值的。而且,不久我也发现了这种追逐的残酷,与现在相比,当年这种追逐的残酷被精心的伪善和漂亮的词句掩饰着。每个人只是因为有胃,就注定要参与这种追逐。而且,因为这种追逐,他的胃更可能得到满足;但是,一个有思想、有感情的人是不会因此而满足的。摆脱这白费劲的追逐的第一条路径就是宗教,它通常都是通过传统的教育机构灌输给每一个儿童。因此,尽管我是没有宗教信仰的犹太人双亲的儿子,我童年所受的教育还是给了我很深的宗教影响,直到12岁那年,这种信仰才突然中止了。
爱因斯坦解释公式 资料图 1934年
1934年,爱因斯坦与400名美国科学家进行了改造模型的讨论。在卡耐基技术研究院小剧场的讲台上,爱因斯坦向他们讲述能量聚集的理论。图为演讲后他正在向人们解释他的公式。思想系统的存在与交流同物质世界的静止与运动一样真实,关于真理知识的交流永远推动着人们对真理的靠近。
因为读了许多科普书籍,我很快就相信,《圣经》里的故事许多都不可能是真实的,其结果导致了一种真正狂热的自由思想,同时还形成了这样一种印象:国家在刻意用谎言来欺骗年轻人。这样的印象一定会令大多数人瞠目结舌,但它却唤起了我对所有权威的怀疑,甚而对任何社会环境里都会存在的信念抱完全怀疑的态度。这种态度伴随着我的一生,即使在后来,即使已经更好地搞清楚了其中的因果关系,即使这种态度已失去了原有的尖锐性时也是如此。
孩童时的爱因斯坦和他妹妹
爱因斯坦幼时还不可能向世人解释自己个性的内涵。他独来独往,寡言少语,时有不可理喻的举动。有几次,爱因斯坦竟向比自己小2岁的妹妹扔东西,大发脾气。
我很清楚,我在少年时代就远离了宗教天堂,开始了我从“仅仅作为个人”的桎梏中,从那种被愿望、希望和原始感情所支配的世界中解放出来的第一个尝试。我进而发现,在我们之外有一个更为巨大的世界,它独立存在着,就像一个伟大而永恒的谜,却只有极少部分是我们的观察和思维所能及的。对这个世界的凝视静思,宛若辽阔的自由对我们的吸引。
不久,我更注意到,许多我所尊敬和钦佩的人,都在对这一事业的专注中找到了内心的自由和安宁。在我们力所能及的一切可能的范围内,从思想上探究这个个人以外的世界,也总是作为至高目标在我的心目中时常浮现。有类似欲望的古今人物,以及他们已有的真知灼见,都是我不可或缺的朋友。通向这一世界的道路,虽然不像步入宗教天堂的道路那样舒坦、诱人,但很多人的工作已经证明,它是可以信赖的,而且我也从没为自己的选择后悔过。
我在这里简约述及的,仅仅在一定意义上是正确的,正如一张简笔画,只能大体表现一个复杂的,甚至细节混乱的对象一样。如果一个人热衷于思想条理的清晰,那么他的本性的这一面,很可能会以牺牲其他方面为代价而显得更为突出,而且愈来愈明显地决定着他的精神面貌。像他这样的人,在回忆往事时所看到的,很可能只是平庸乏味的有系统的发展景象,然而,一个人的实际经验只可能产生于千变万化的单个情况中,外界情况多种多样,意识的瞬息内容也十分狭隘,人生事件的原子化,使得每个人的生活都具有某种程度的真实的模糊性。
爱因斯坦与父母 油画
幼年时期的爱因斯坦给人的印象并不聪慧,甚至有些平庸。他举止迟缓而又害羞,连说话也是支支吾吾的。图为幼年时期爱因斯坦与父母在一起的情景。
像我这样的人,思维发展出现转折点的关键在于,自己的主要兴趣逐渐摆脱并远离了短暂的和完全属于个人的方面,转而力求从思想上掌握事物。从这一角度看,在上面简约的纲要式的评述里,已包含着尽可能多的真理了。
“思维”是什么呢?准确地说,当我们接受感觉印象的同时出现记忆形象,这还不是“思维”。而且,当一个形象引发另一个形象,直至形成一个系列时,这也不是“思维”,但是,当某一形象在许多这样的系列中反复出现,这一不断再现的形象,就成了这些系列中起支配作用的元素,它把那些原本没有联系的系列联结了起来。这一元素便成为一种工具或一种概念。我认为,从自由联想或“梦想”过渡到思维,是以“概念”在其中所起作用的多少为表征的。概念不是一定要与可以知觉和可以再现的符号联系的,但是一旦出现联系,那么思维就成为可以交流的了。
人们也许会问,在没有努力给出证明之前,这个人有什么权利,在这样一个争议的领域里,如此轻率而本能地运用概念呢?我的辩护是:我们的一切思维都是概念的自由游戏,而且这种游戏的合理性是毋庸置疑的,关键是看我们借助观念,在概括感觉经验时所能达到的程度。“真理”的概念还不能用于这样的结构,在我看来,只有当这种游戏的元素和规则已经取得普遍一致的意见 (或约定) 时,才能达到“真理”的概念。
毫无疑问,我们的思维不涉及符号 (词) ,绝大部分也能进行,而且在很大程度上是无意识地进行的。否则,我们为什么有时会完全自发地对某一经验感到“惊奇”呢?这种“惊奇”往往在我们的经验同完全固定的概念冲突时才会发生。每当我们强烈地面对这种冲突,它就会以一种决定性的方式反过来作用于我们的思维世界。思维世界的发展,在某种意义上说就是对“惊奇”的不断摆脱。我还在四五岁时,父亲给我看一个罗盘,我就经历过这种惊奇。没有直接“接触”的作用,指南针却能移动到如此确定的方向,根本不符合概念中确定位置的事物的本性。我现在还记得,至少相信我还记得,这种经验给了我极为深刻而持久的印象。
我想一定有什么东西隐藏在事情后面。从小就看到的现象,不会引发这种反应:物体的下落、风和雨、月亮或月亮不会掉下来、生物和非生物的区别,对一切习惯的现象,我们都不会感到惊奇。
爱因斯坦的小学毕业照
在学校里,爱因斯坦经常会受到老师和同学的嘲笑,大家都称他为“笨家伙”。学校要求学生上下课都按军事口令进行,由于爱因斯坦的反应迟钝,经常被教师呵斥、罚站。有的老师甚至指着他的鼻子骂:“这鬼东西真笨,什么课程都跟不上!”
12岁时,我经历了另一种性质的惊奇:那是在一个学年开始时,我第一次拿到一本关于欧几里得平面几何的小书,我立即被书中的内容惊呆了。这本书里有许多定理,比如,三角形三条高线交于一点,这一点称为三角形的垂心。它们本身并不是显而易见的,却可以很可靠地加以证明,以致任何怀疑似乎都不可能。这种明晰性和可靠性给了我难以言表的印象。
毕达哥拉斯定理的证明
建分别以
a,b,c
为边的正方形BAB’A”,ACA’C’,BCB”C”。BAB’A”的面积是
a
2
,ACA’C’的面积是
b
2
,BCB”C”是
c
2
。那么,BAB’A”+ACA’C’=BCB”C”
因为,过A作CB”的平行线,此平行线与BCB”C”的交点是E。连接AE和A’B
因为,∠ACA’=∠BCB”,同加上∠ACB,其和仍然相等,
且BC=CB”,AC=CA’
边边角相等,那么三角形A’CB=ACB”
因为,三角形ACB”与四边形CE等底等高
因此,CE的面积是ACB”的两倍
同理,ACA’C’的面积是A’CB的两倍
所以,CE与ACA’C’面积相等。
类似的,连接C”A与A”C,可证
BAB’A”=BE
因为BE+EC=BCB”C”,同时BAB’A”+ACA’C’=BE+CE
所以,BAB’A”+ACA’C’=BCB”C”
又因为BAB’A”的面积是
a
2
,ACA’C’的面积是
b
2
,BCB”C”是
c
2
即毕达哥拉斯定理成立。
其中不用证明就得承认的公理,却没有使我感到不安。对那令人惊奇的定理,如果我能有效地加以证明,我就心满意足了。我记得,在拥有这本神圣的几何学小书之前,我的一位叔叔曾经把毕达哥拉斯定理告诉了我。经过艰难的努力,我根据三角形的相似性成功地“证明了”这条定理。在求证的过程中,我感觉到,直角三角形各个边的关系“显然”决定于它的一个锐角,同时,我感觉只有不是表现得很“显然”的东西,才需要证明。而且,几何学研究的对象,同那些“能被看到和摸到的”对象似乎是同一类型的东西。这种朴素观念,明显源自这样的事实:几何概念与直接经验对象的关系,冥冥之中早已存在。这种朴素观念大概就是康德提出的“先验综合判断”可能性问题的根据。
如果因此认为,用纯粹思维就可能得到关于经验对象的可靠知识,那么这种“惊奇”就是错误的。但是,对第一次与经验对象打交道的人而言,在纯粹思维中竟能达到如此可靠而又纯粹的程度,就像希腊人在几何学中第一次告诉我们的那样,已经够了不起了。
既然我已经中断了开头的讣告,把话题扯到了这里,我索性用几句话陈述一下我的认识论信条,虽然有些话是在前面已经谈过的。这个信条实际上是以后慢慢发展起来的,而且同我年轻时候所持的观点并不一致。
我一方面看着感觉经验的总和,另一方面又看着书中记述的概念和命题的总和。概念和命题之间具有逻辑性,而逻辑思维的任务又严格受限于按照既定的规则 (这是逻辑学研究的问题) 以建立概念和命题之间的相互关系。概念和命题只有与感觉经验产生联系才能获得其“意义”或“内容”。后者与前者的联系是纯粹直觉的,并不具有逻辑性。
这正是科学“真理”与空洞幻想的区别所在。概念体系连同那些构成概念体系结构的句法规则,都是人创造的。虽然概念体系本身在逻辑上是完全任意的,但它们却受到这样一个目标的限制:一是需要同感觉经验的总和有尽可能可靠、完备的对应关系;其次,它们应当尽可能少地使用逻辑上独立的元素 (基本概念和公理) ,即尽可能少地使用不下定义的概念和推导不出的命题。
在某一逻辑体系里,如果命题是按照公认的逻辑规则推导出来的,那它就是正确的。某一体系是否具有真理内容,取决于它同经验总和对应的可靠性和完备性。总之,正确的命题只能从它所属的体系的真理内容中取得。
康德
康德,(1724—1804年),德国哲学家、天文学家、星云说的创立者之一、德国古典美学的奠定者。被认为是对现代欧洲最具影响力的思想家之一,也是启蒙运动最后一位主要哲学家。
对历史发展的一点看法。休谟 清楚地认识到,有些概念,比如因果性概念,不能用逻辑方法从经验材料中推导出来。康德则确信某些概念的不可缺少,他认为这些不可缺少的概念是所有思维的必要前提,并且把它们与那些来自经验的概念严加区别。但我的看法是,这种区分阻止了人们按自然的方式来正确对待问题,是错误的。从逻辑观点看来,一切概念,甚至那些最接近经验的概念,完全像因果性概念一样,都是自由选择的约定。因果性概念就是这样,它促成问题的提出。
现在再回到讣告上来。12~16岁,我学习并了解了基础数学,包括微积分原理。我幸运地接触到一些书,它们在逻辑严密性方面不太严格,基本思想却简单明了。总的说来,这个阶段的学习是令人神往的,印象之深并不亚于之前的平面几何,特别是解析几何的基本思想、无穷级数、微分和积分的概念,印象之深几乎无以复加。
当时,我还幸运地从一部卓越的科普读物中,了解了整个自然科学领域的主要成果和研究方法。这部著作就是《伯恩斯坦的自然科学通俗读本》,它几乎只叙述已有的定论,我聚精会神逐字逐句地阅读了它。可以说,在我17岁时作为数学和物理学的学生进入苏黎世工业大学时,我已经掌握部分理论物理学的知识了。
在苏黎世工业大学,我有几位卓越的老师,比如,胡尔维兹 [1] 、赫尔曼·闵可夫斯基 [2] 他们都是在数学领域取得杰出成就的数学家。照理说,我在数学方面应该得到更好的学习机会,可是我大部分时间都待在物理实验室里,迷恋于同经验直接接触,其余时间,则主要用于在家里阅读基尔霍夫 、亥姆霍兹 、赫兹 等人的著作。我在一定程度上忽视了数学,不仅因为我对自然科学的兴趣超过对数学的兴趣,而且与下述奇特的认识有关。我看到数学分成了许多专门领域,而且每一个领域都足以耗费我短暂的一生。面对数学,我觉得自己的处境像布里丹的驴子一样,无法决定自己究竟该吃哪一捆干草。这显然是由于当时我对数学的认识不够,以致不能把根本性的最重要的东西与那些可有可无的知识区分开来。
此外,我对自然知识的兴趣无疑更强,作为一个学生,我还不清楚,即使在物理学中,要深入理解基本原理也少不了对最精密的数学方法的应用。对于这一点,只是在几年独立的科学研究后,我才逐渐明白。
爱因斯坦故居
爱因斯坦的这个故居位于瑞士首都伯尔尼最主要的街道克拉姆街49号。他在伯尔尼生活了7年,其中1902至1905年生活在这里。这里不仅是他娶妻生子的地方,也是他写出相对论的地方。
其实,物理学也分为众多研究领域,每一个领域也足够耗费短暂的一生,而且还不一定能满足一个人对更深邃知识的渴望。那些已有的、尚未充分联系起来的实验数据的数量也是非常庞大,只是在这一领域里,我不久就学会了如何识别那种能导致深邃知识的东西,而把其他偏离主要目标的东西撇开不管。
问题在于,人们为了考试,不论愿意与否,都得把所有的东西统统塞进自己的脑袋,包括那些废物。这种强制的结果使我惧怕,以致在我通过最后的考试后,整整一年对科学问题毫无兴趣。公道地说,我们在瑞士所受到的这种强制,比许多地方要少得多。这里总共只有两次考试,我们差不多都可以做自己愿意做的事情。而我则有一个朋友,他经常去听课,并且总会认真地整理听课记录,能与他共享听课记录,那我的情况就更是自由了。直到考试前几个月为止,我都充分享受了这种自由,并把伴随而来的内疚看作是乐意忍受的小毛病。
现代的课堂教学,竟然没有把研究问题的好奇心完全扼杀掉,还真是个奇迹。一株脆弱的幼苗,除了需要鼓励,它的成长更需要自由,要是没有自由,它肯定难免夭折。认为强制和培养责任感就能增进观察和探索的兴趣,无疑是一种严重的错误。即使一头健康的猛兽,在它不饿时,如果用鞭子强迫它不停吞食,特别是强喂它不加选择的食物,也无疑会使它丧失贪吃的习性。
现在谈谈物理学当时的情况。当时,物理学的各个方面虽然取得了丰硕的成果,但在原则问题上,主导思想却教条而顽固:它一开始(假如有这样的开始),就是上帝创造的牛顿运动定律 [3] ,以及必需的质量和力。这就是一切,此外的一切,都可以用适当的数学方法演绎出来。19世纪以此为基础取得的成就,特别是偏微分方程的应用,让所有理解能力好的人赞叹。牛顿在他的声传播理论中,第一次揭示了偏微分方程的功效。欧勒 奠定了流体动力学的基础。作为物理学基础的质点力学更加精确的发展,也是19世纪的成就。
原子结构 合成图片
1905年9月,爱因斯坦写了一篇短文《物体的惯性同它所含的能量有关吗》,作为相对论的一个推论。质能相当性是原子核物理学和粒子物理学的理论基础,也为20世纪40年代实现的核能的释放和利用开辟了道路。此图就是原子的结构示意图。
对于一个大学生,我印象最深刻的并不是力学的专门结构或者它所解决的复杂问题,而是那些表面上与力学无关的领域中的成就。光的力学理论,它把光设想为准刚性的弹性以太波动,但印象最深的还是气体分子运动论:单原子气体的比热与原子量无关,气体状态方程的导出及其比热的关系,气体扩散的分子运动论,特别是气体的黏滞性、热传导和扩散之间的定量关系,还有气体扩散所反映的原子的绝对大小。这些研究成果也证明了力学是物理学和原子假说的基础,特别是原子假说,它在化学中已经确立了牢固的地位。但是在化学中,起作用的仅仅是原子的质量比,而不是它们的绝对大小,因此,与其说原子论是对物质的实在结构的认识,不如说是一种形象化的比喻。此外,古典力学的统计理论能够导出热力学的基本定律,也让我很感兴趣。现在,统计物理学的基础已经由玻耳兹曼 完成了。
可以说19世纪所有的物理学家,都把经典力学看作是物理学,甚至是全部自然科学的牢固的最终基础,而且,他们还孜孜不倦地企图把这一时期的麦克斯韦电磁理论也建立在经典力学的基础之上,甚至麦克斯韦 和H.扬兹,在其自觉的思考中,也都始终坚信力学是物理学的唯一基础。从现在看,他们恰巧是动摇了力学是物理学最终基础这一信念的人,对此我们不必惊奇。
牛顿三大定律 合成图片
牛顿的三大运动定律的应用与力学有关。此三大定律为:①物体在未受到外力作用时,保持静止状态,或作匀速直线运动。②物体在受到合外力作用会产生加速度,加速度方向和合外力方向相同,加速度大小与合外力大小成正比,与物体的惯性质量成反比。③物体相互作用时,第一物体作用于第二物体的力和第二物体作用于第一物体的力必定大小相同,方向相反。
是恩斯特·马赫 在他的《力学史评》中,冲击了经典力学教条式的信念。在我还是一介书生时,这本书给了我深刻的影响。我真正地感觉到了马赫的伟大在于他坚不可摧的怀疑精神和独立态度。我年轻时,虽然马赫的认识论观点对我影响甚大,但从今天看来,这种观点是站不住脚的。因为他没有正确阐明思想,特别是科学思想,本质上是构建性的、推断性的。因此,在理论的构建中,当推断的特征表现得过于明显,他就会指责理论,比如对原子运动论,他就曾经作出过严厉的指责。
在批判经典力学之前,我首先得谈谈某些一般观点。明确了这些观点,才有可能去批判各种物理理论。第一个观点是很明显的:理论不应当同经验事实相矛盾。这个貌似明显的观点,在应用时却很伤脑筋,因为人们常常,甚至总是用人为的补充假设来使理论同事实相呼应,从而确认其已是一种普遍的理论基础。无论如何,第一个观点的关键,是如何用经验事实来证实理论基础。
第二个观点涉及的,并非理论与观察材料的关系问题,而是理论本身的前提,即人们可以简单地,但总是比较含糊地称之为前提 (基本概念以及这些概念之间作为基础的关系) 的“自然性”或“逻辑的简单性”。这一观点在选择和评价各种理论时起着重大作用,但要确切地加以表达却很困难。这不是列举逻辑上独立的前提问题,而是一种在不能比较的性质间如何权衡的问题。其次,在面对基础同样“简单”的几种理论时,那种对理论体系的可能性质限定最严格的理论 (即含有最确定论点的理论) 被认为是比较优越的。这里不涉及理论的“范围”,因为我们只限于某些理论,它们的对象是一切物理现象的总和。
第一个观点涉及与理论本身有关的“外部的证实”,第二个观点则涉及“内在的完备”。下面这一观点也属于理论的“内在的完备”:从逻辑立场来看,如果一种理论并不是从那些等价的方式构造起来的理论中任意选出的,那么我们就给予这种理论以较高的评价。
我不想借口篇幅有限来为上面几段所包含的不够明确的论点辩解,我得承认,我不能立刻,也许根本就没有能力立刻用明确的论点代替这些提示。但是我相信,要作出比较明确的阐述还是可能的。我们不难发现,在判断理论的“内在的完备”时,“预言家”们的意见往往是一致的,对“外部的证实”程度的判断更是如此。
爱因斯坦手稿 摄影
爱因斯坦是20世纪伟大的科学家,他于1905年发表的《论动体的电动力学》是相对论诞生的标志,这篇文章是20世纪最伟大的论文。爱因斯坦在这篇论文中提出的狭义相对论,在很大程度上解决了19世纪末出现的经典物理学的危机,推动了整个物理学理论的革命。图为爱因斯坦的研究手稿。
从第一个观点,即从经验确证的观点出发,把波动光学纳入力学世界必将受到人们质疑。如若把光解释为一种弹性体 (以太) 中的波动,那么以太就应当是一种可以穿透任何东西的媒质。由于光波具有横向性,大体类似固体,又不可压缩,所以并不存在纵波。这种以太必须像幽灵一样与其他物质并存,因为它对“可量”物体的运动似乎并没有任何阻碍。为了解释透明物体的折射率以及辐射和吸收过程,人们必须假定在这两种物质之间存在复杂的相互作用,但人们对此还未有过尝试,也谈不上有何成果。
此外,电磁力的存在还迫使我们引进一种带电物质,它们虽然没有明显惰性,却能相互作用,并且这种相互作用属极性的类型,与引力完全不同。即便如此,物理学家们对法拉第和麦克斯韦的电磁学理论的接受也有较长时间的犹豫,但他们最终放弃了他们的固有识见,即牛顿创立的力学基础。因为电动力学理论以及赫兹的实验证明,物理世界存在着在本质上同所有有重量物质相分离的电磁现象——它们是虚空中由电磁“场”组成的波。如果牛顿的经典力学 必须作为物理学的基础,那么麦克斯韦方程就必须力学化。人们朝这个方向作过很多努力,其结果反倒是麦克斯韦方程组的成果越来越明显。在朝这个方向努力的过程中,人们往往把电磁“场”当独立的物质看待,并未坚持寻找它的力学本性,人们就这样在不知不觉间放弃了物理学的力学基础,力学终于无望地适应了各种事实。从那时候起,两种概念要素出现了:一是质点以及它们之间的超距作用力,另一个是连续的“场”。也是从那时候起,物理学处于了一种过渡状态,它不再有一个统一的基础。这种状态虽然不能令人满意,但要形成一个统一的基础却为时尚早。
磁铁的两极 合成图片
我们把铁屑喷洒在磁铁附近,就可以看到解释磁场的“力线”。铁屑被磁铁的北极和南极吸引,在两极(即力线)之间呈曲线形排列。
现在从第二个观点,即“内在完备”的观点出发,对作为物理学的形而上学基础提出一些批判。在抛弃了物理的力学基础后,对今天的科学境况而言这种批判仅有方法论上的意义,但是在将来的理论选择中,当基本概念和公理距离直接可观察的东西愈来愈远时,这种批判所表明的论点就会发挥越来越重要的作用。首先,我要提到的是马赫的论点。其实,在此之前,这早已被牛顿清楚地认识到了 (比如水桶实验) 。从纯粹几何学的角度来看,一切“刚性”坐标系在逻辑上都是等价的。力学方程 (如惯性定律) 只是在某一类特殊的坐标系,即“惯性系”中才是有效的。在这些关系中,至于坐标系究竟是不是有形客体并不重要。因此,为了说明这种特殊选择的必要性,人们就必须在理论所涉及的对象 (物体、距离) 之外去寻找某些东西。因此,牛顿把“绝对空间”作为最初限定词引入,让它成为一切力学过程的无所不在的能动参与者。所谓“绝对”,显然是指不受物体及其运动的影响。使这一事态特别显得不堪的是这样的事实:应当存在无限个惯性系,它们之间是一种相互均衡的、无旋涡的匀速平移关系,同时又区别于一切别的刚性坐标系。
马赫推测,在一个真正合理的理论中,惯性必须像牛顿理论的其他各种力一样,取决于物体的相互作用。在很长一段时间内,我也认为这种推测是正确的。但是,它隐含的基本理论预设就应该是一般的牛顿力学:以物体和物体之间的相互作用作为原始概念,人们立刻就会发现,这种解决问题的方式与统一的场论是不相符的。
然而,从下面的类比中我们可以清楚地看到,马赫的批判在本质上是多么正确。试想,有人想创立一种力学体系,但他们只知道地球表面的很小部分,却看不见任何星体,他们自然会倾向于把一些特殊的物理属性归因于空间的竖直维度 (落体的加速度方向) ,有了这种观念,他们自然也就有理由认为大地大体上是平的。他们可能不会受以下观点的影响:空间就几何特性而言是各向同性的,那么,偏爱某个方向的物理学基本定律就是不能令人满意的;他们可能 (像牛顿一样) 倾向于断言竖直方向的绝对性,因为这是经验证明了的,也是人们必须接受的。较全部空间方向而言,更偏爱竖直方向,与偏爱惯性系甚于其他刚性坐标系,这两点完全类似。
粒子之间的力 合成图片
电磁力作用于带电荷的粒子之间,但不和不带电荷的粒子相互作用。电子存在着正负两种电荷,同种电荷之间的力是相互排斥的,而异种电荷则相互吸引。一个大的物体,譬如太阳或地球,包含了几乎等量的正负电荷。这样在地球和太阳中的粒子之间的力大部分都被抵消了。
现在来讨论其他观点,它们涉及力学的内在的简单性或自然性。如果人们未经批判地就接受空间(包括几何)和时间概念,那么他们就没有理由反对超距作用力的观念,即使这个概念并不符合人们在日常生活的原始经验基础上形成的观念。但是,还有另一个因素使得那种把力学当作物理学基础的看法显得幼稚。力学主要有两条定律:
1)运动定律;
2)关于力或势能的表示式。
运动定律是精确的,但在力的表示式定出前它是空泛的。但在规定力的表示式时,任意“选择”的余地还有很大,特别是当人们抛弃了力仅仅同坐标有关 (而不依赖于其相对于时间的导数) 这个本身很不自然的要求时更是如此。从一个点发出的引力作用 (和电力作用) 受势函数(1/ r )支配,这在理论的框里描述,本身就带有任意的色彩。补充一点:很久以前人们就已认识到,这个函数是最简单的 (转动不变的) 微分方程8 P =0的中心对称解;因此,若以此为依据,认为这函数产生于某一空间定律,这倒容易理解,而且以此也可以消除选择力定律的任意性。这实际上也是使我们避开超距力理论的第一种认识,这种认识,由法拉第、麦克斯韦和赫兹最早提出,以后在实验事实的外来压力下才开始发展。
我还要提到这一理论的一种内在不对称性,即在运动定律中出现的惯性质量同样也在引力定律中出现,但不会在其他各种力的表示式里出现。最后我还要指出,把能量划分为本质上不同的两部分(即动能和势能),必定会被认为是不自然的;赫兹对此深感不安,以致在他最后的著作中,他曾企图把力学从势能概念中分离出来。
这已经够了。牛顿啊,请原谅我。你所发现的,在你的时代,是具有至高思维能力和创造力的人才能发现的。你所创立的观念,至今仍指导着我们的物理学思想,虽然我们知道,如果要更加深入地理解世界的各种联系,必须用另外的离直接经验领域更远的观念来代替。
好奇的读者可能会问:“难道这也算是讣告?”我的回答是:“本质上是的。”因为像我这种类型的人,一生的重点正是在于我所想的是什么和我是怎样想的,而不在于我做了或者经受了什么。所以,这个讣告可以主要在讲述那些在我的努力中起重要作用的思想。一种理论的前提越简单,它所涉及的事物的种类就越多,他的应用范围也更广,更醒目。经典热力学给了我深刻的印象,所以我确信,在它的基本概念适用的范围内,其物理理论决不会被推翻 (对这一点,那些原则上是怀疑论者的人应特别注意) 。
在我的学生时代,最使我着迷的是麦克斯韦理论。这一理论从超距作用力向以场作为基本变量的理论过渡,而使其具有明显的革命性。光学被并入电磁理论,连同光速同绝对电磁单位制的关系,以及折射率同介电常数的关系,反射系数与金属体的传导率之间的定性关系……这一切如同一种启示。在这里,除了转变为场论,即转变为用微分方程来描述的基本定律外,麦克斯韦仿佛只需要一个唯一的假设性的步骤了。在真空和电介质中引进位移电流及其磁效应,这一切几乎都是由微分方程的形式性征预先规定了的。谈到这里,我禁不住要说,在法拉第和麦克斯韦与伽利略 和牛顿之间有非常值得注意的内在相似性,即前者都直觉地抓住了事物的联系,而后者则严格地用公式把这些联系表述了出来,并且定量地进行了应用。
电磁 示意图
金属导线在一个空心筒上沿一个方向一匝一匝缠绕起来,形成螺线管。如果使这个螺线管通电,螺线管的内部和外部每一匝线圈都会产生磁场,而产生的磁场会互相叠加起来,而磁场的方向如图中箭头所示。
法拉第
法拉第,(1791—1867年),英国物理学家、化学家,也是著名的自学成才的科学家。生于萨里郡纽因顿一个贫苦铁匠家庭,仅上过小学。1831年,他作出了关于力场的关键性突破,永远改变了人类文明。1815年5月回到皇家研究所在戴维指导下进行化学研究。1824年1月当选皇家学会会员,1825年2月任皇家研究所实验室主任,1833—1862年任皇家研究所化学教授。1846年荣获伦福德奖章和皇家勋章。
当时使人难以把握电磁理论的本质的是下述特殊情况:电或磁的“场强度”和“位移”都被当作同样基本的“物理”量来处理,而空虚空间则被认为是电介体的一种特殊情况。场的载体看来是物质,而不是空间。这就暗示了场的载体具有速度,而且,这当然也适用于“真空”(以太)。赫兹的动体电动力学是完全建立在这种基本观点上的。
洛伦兹 的伟大功绩就在于他在这里以令人信服的方式完成了一个变革。按照他的看法,场原则上只能在空虚空间里存在。被看作是由“原子”组成的物质,则是电荷的唯一基体;物质粒子之间是空虚空间,它是电磁场的基体,而电磁场则是由那些位于物质粒子上的电荷的位置和速度产生的。介电常数、传导率等等,只取决于那些组成物体的粒子之间的力学联系的方式。粒子上的电荷产生场,另一方面,场又以力作用在粒子的电荷上,而且按照牛顿运动定律决定粒子的运动。如果人们把这同牛顿体系作比较,那么其变化就在于:超距作用力由场代替,而场同时也描述辐射。引力通常是由于它相对地说来比较小而不予考虑;但是,通过充实场的结构,或者扩充麦克斯韦场定律,总有可能考虑到引力。现在这一代的物理学家认为洛伦兹所得到的观点是唯一可能的观点;但在当时,它却是一个惊人大胆的步骤,要是没有它,以后的发展是不可能的。
如果人们批判地来看这一阶段理论的发展,那么令人注目的是它的二元论,这种二元论表现在牛顿力学意义上的质点同作为连续区的场,彼此并列地都作为基本概念来运用。动能和场能表现为两种根本不同的东西。既然按照麦克斯韦理论,运动电荷的磁场代表惯性,所以这就显得更加不能令人满意。那么,为什么不是全部惯性呢?在磁场代表全部惯性的情况下,只有场能仍然留下,而粒子则不过是场能特别稠密的区域。在这种情况下,人们可以希望,质点的概念连同粒子的运动方程都可以由场方程推导出来——那种恼人的二元论就会消除了。
H.A.洛伦兹对此了解得很清楚。可是从麦克斯韦方程不可能推导出那构成粒子的电的平衡。也许只有另一种非线性场方程才有可能做到这一点。但是,不冒任意专断的危险,就无法发现这种场方程。无论如何,人们可以相信,沿着法拉第和麦克斯韦如此成功地开创的道路前进,就能一步一步为全部物理学找到一个新的可靠基础。
普朗克假设 合成图片
普朗克认为,任何物体在任何温度下,都向外发射波长不同的电磁波.在不同的温度下发出的各种电磁波的能量按波长的分布不同。这种能量按波长的分布随温度而不同的电磁辐射叫做热辐射。
辐射影像的对比校正
辐射影像的对比校正是指由于大气对电磁辐射的散射和吸收等因素,对数据获取和传输系统产生的辐射失真或畸变影像进行对比和校正的过程。
因此,由于引进场而开始的革命,绝没有结束。那时又发生了这样的事:在世纪之交,同我们刚才讨论的事情无关,出现了第二个基本危机,由于马克斯·普朗克 对热辐射 的研究(1900)而突然使人意识到它的严重性。这一事件的历史尤其值得注意,因为,至少在开始阶段,它并没有受到任何实验上的惊人发现的任何影响。
基尔霍夫以热力学为根据,曾得到这样的结论:在一个由温度为 T 的不透光的器壁围住的空腔里,辐射的能量密度和光谱组成,同器壁的性质无关。这就是说,单色辐射的密度 ρ 是频率和绝对温度 T 的普适函数。于是就产生了怎样来决定这个函数 ρ ( V·T )的有趣问题。关于该函数,可用理论方法探寻些什么呢?依据麦克斯韦理论,辐射必然会对腔壁产生压力,该压力决定于总能量密度。由此,玻耳兹曼由纯粹热力学方法推导出:辐射的总能量密度( S ρdv )同 T 4 成正比。从而他为早先已由斯忒藩 在经验上发现的定律找到了理论根据,也就是说,他把这条经验定律同麦克斯韦理论的基础联系了起来。此后,W.维恩 从热力学上经过一种巧妙的考虑,同时也应用了麦克斯韦理论,发现了这个含有两个变量 v 和 T 的普适函数 ρ 应当具有如下形式:
此处 f ( v/T )是一个只含有一个变数 v/T 的普适函数。很明显,从理论上决定这个普适函数 f 是有根本性意义的——这正是普朗克所面临的任务。仔细的量度已经能相当准确地从经验上来确定函数 f 。根据这些实验量度,普朗克首先找到了一个确实能把量度结果很好地表达出来的表达式:
此处 h 和 k 是两个普适常数,其中第一个引出了量子论。这公式由于它的分母而显得有点特别。它是否可以从理论上加以论证呢?普朗克确实找到了一种论证,这种论证的缺陷,最初并没有被发现,这一情况对物理学的发展可以说是真正的幸运。如果这个公式是正确的,那么,借助于麦克斯韦理论,就可以算出准单色振子在辐射场中的平衡能量 E 为:
普朗克喜爱从理论上试图算出这平均能量。首先热力学对于这种尝试再也帮不了什么忙,麦克斯韦理论同样也帮不了忙。但是,在这公式中,非常鼓舞人心的是下述情况。它在高温时 (在 v 是固定的情况下) 得出如下的表示式:
E=KT
普朗克 摄影
马克斯·普朗克,(1858~1947),德国物理学家,量子论的奠基者,致力于热力学。从1894年起,开始研究黑体辐射问题,发现普朗克辐射定律,并在论证过程中提出量子的概念和常数h。1900年12月14日,普朗克在德国物理学会上报告了这一结果,标志着量子论的诞生。由于这一发现,普朗克获得了1918年的诺贝尔物理学奖。
这式子同气体分子运动论中所得到的作一维弹性振动的质点的平均能量的表达式相同。在气体分子运动论中,人们得到
E = (R/N)T
此处 R 是气体状态方程的常数; N 是每克分子的分子数,从这个常数,可以算出原子的绝对大小。使这两个式子相等,我们就得到
N=R/K
因而普朗克公式中的一个常数给我们准确地提供了原子的真实大小。其数值同用气体分子运动论定出的 N 符合得相当令人满意,尽管后者并不很准确。
普朗克清楚地认识到这是一个重大的成功。但是这件事有一个严重缺陷,幸而当初普朗克没有注意到。由于同样的考虑,应当要求( E=KT )这一关系对于低的温度也必须同样有效。然而,在这种情况下,普朗克公式和常数 h 也就完蛋了。因此,从现有的理论所得出的正确结论应当是:要么,由气体理论给出的振子的平均动能是错误的,那就意味着驳斥了统计力学;要么,由麦克斯韦理论求得的振子的平均动能是错误的,那就意味着驳斥了麦克斯韦理论。在这样的处境下,最可能的是,这两种理论都只有在极限情况下是正确的,而在其他情况下则是不正确的;我们往后会看到,情况确实是如此。如果普朗克得出了这样的结论,那么,他也许就不会作出他的伟大发现了,因为这样就会剥夺他的纯粹思考的基础。
现在回到了普朗克的思考。根据气体分子运动论 ,玻耳兹曼已经发现,除了一个常数因子外,熵等于我们所考察的状态的概率的对数。通过这种见解,他认识到在热力学意义上的不可逆过程的本质。然而,从分子力学的观点来看,一切过程都是可逆的。如果人们把由分子论定义的状态称为微观描述的状态,或者简称为微观状态,而把由热力学描述的状态称为宏观状态,那么就有非常多个( Z 个)状态,同属于一个宏观状态。于是 Z 就是一个所考察的宏观状态的概率的一种度量。这种观念,还由于它的适用范围并不局限于以力学为基础的微观描述,而显得格外重要。普朗克看到了这一点,并且把玻耳兹曼原理应用于一种由很多个具有同样频率 v 的振子所组成的体系。宏观状态是由所有这些振子振动的总能量来决定的,而微观状态则由每一单个振子的 (瞬时) 能量来决定的。因此,为了能用一个有限的数来表示属于一个宏观状态的微观状态的数目,他把总能量分为数目很大但还是有限个数的相同的能量元 ε ,并问:在振子之间分配这些能量元的方式能有多少。于是,这个数目的对数就提供这体系的熵,并因此 (通过热力学的方法) 提供这体系的温度。当普朗克为他的能量元 ε 选取 ε = hv 的值时,他就得到了他的辐射公式。在这样做时,决定性的因素在于只有为 ε 选取一个确定的有限值,也就是不使它趋于极限 ε =0才能有这一结果。这种思考方式不是一下子就能看出它同推导过程的其他方面所依据的力学和电动力学的基础是相矛盾的。可是,实际上,这种推导暗中假定了单个振子只能以大小为 hv 的“量子”吸收和发射能量,也就是说,不论是可振动的力学结构的能量,还是辐射的能量,都只能以这种量子方式进行转换,这是同力学定律和电动力学定律相违背的。在这里,同动力学的矛盾是基本的;而同电动力学的矛盾可能没有那么基本。因为辐射能量密度的表示式虽然同麦克斯韦方程是相容的,但它并不是这些方程的必然结果。以这个表示式为基础的斯忒藩—玻耳兹曼定律和维恩定律是同经验相符合的这一事实,就显示了这个表示式提供着重要的平均值。
氢原子光谱区的各种线系 示意图
氢原子是最简单的原子,从氢气放电管可以获得氢原子光谱,这种光谱在可见区和近紫外线区有许多谱线,构成一个有规律的系统,谱线的间隔和强度都向短波方向递减。图为氢原子光谱区的各种线系。
在普朗克的基本工作发表以后不久,所有这些我都已十分清楚;尽管没有一种古典力学的代替品,我还是能看出,这条温度—辐射定律,对于光电效应和其他同辐射能量的转换有关的现象,以及 (特别是) 对于固体的比热,将会得出什么结果。可是,我要使物理学的理论基础同这种认识相适应的一切尝试都失败了。这就像一个人脚下的土地都被抽掉了,使他看不到哪里有可以立足的巩固基地。至于这种摇晃不定、矛盾百出的基础,竟足以使一个具有像玻尔那样独特本能和机智的人发现光谱线和原子中电子壳层的主要定律以及它们对化学的意义,这件事对我来说,就像是一个奇迹。而且即使在今天,在我看来仍然像是一个奇迹。这是思想领域中最高的音乐神韵。
布朗运动 合成图片
微小粒子表现出的无规则运动就是布朗运动。在显微镜下,看起来连成一片的液体实际上是由许多分子组成的。这些分子不停地做不规则运动,并且随机撞击其他悬浮微粒,当悬浮微粒足够小时,收到的来自各个方向的撞击作用并不平衡;在某一瞬间,微粒在另一个方向受到撞击的作用强,会致使微粒向其他方向运动,这样的运动并不规则,这是布朗运动。在无风的情形下观量空中的烟粒、尘埃时也会看到这种运动。
在那些年代里,我自己的兴趣主要不在于普朗克的成就所得出的个别结果,尽管这些结果可能非常重要。我的主要问题是:从那个辐射公式中,关于辐射的结构,以及更一般地说,关于物理学的电磁基础,能够得出什么样的普通结论呢?在我深入讨论这个问题之前,我必须简要地提到关于布朗运动 及有关课题 (起伏现象) 的一些研究,这些研究主要是以古典的分子力学为根据的。在不知道玻耳兹曼和吉布斯 的已经发表而且事实上已经把问题彻底解决了的早期研究工作的情况下,我发展了统计力学,以及以此为基础的热力学的分子运动论。在这里,我的主要目的是要找到一些事实,尽可能地确证那些有确定的有限大小的原子的存在。这时我发现,按照原子论,一定会有一种可以观察到的悬浮微粒的运动,而我并不知道,关于这种“布朗运动”的观察实际上早已是人所共知的了。最简单的推论是以如下的考虑为根据的。如果分子运动论原则上是正确的,那么,那些可以看得见的粒子的悬浮液就一定也像分子溶液一样,具有一种能满足气体定律的渗透压。这种渗透压同分子的实际数量有关,亦即同一克当量的分子个数有关。如果悬浮液的密度并不均匀,那么这种渗透压也会因此而在空间各处有所不同,从而引起一种趋向均匀的扩散运动,这种扩散运动可以从已知的粒子迁移率计算出来。但另一方面,这种扩散过程也可以看作是悬浮粒子因热骚动而引起的,原来不知其大小的无规则位移的结果。通过把这两种考虑所得出的扩散通量的数值等同起来,就可以定量地得到这种位移的统计定律,也就是布朗运动定律。这些考察同经验的一致,以及普朗克根据辐射定律 (对于高温) 对分子的真实大小的测定,使当时许多怀疑论者 (奥斯特瓦尔德 、 马赫) 相信了原子的实在性。这些学者之所以厌恶原子论,无疑可以溯源于他们的实证论的哲学观点。这是一个有趣的例子,它表明即使是有勇敢精神和敏锐本能的学者,也可以因为哲学上的偏见而妨碍他们对事实作出正确解释。这种偏见——至今还没有灭绝——就在于相信无须自由的概念构造,事实本身就能够而且应该为我们提供科学知识。这种误解之所以可能,只是因为人们不容易认识到,经过验证和长期使用而显得似乎同经验材料直接相联系的那些概念,其实都是自由选择出来的。
玻尔的原子模型 示意图
在卢瑟福模型的基础上,玻尔提出了电子在核外的量子化轨道,解决了原子结构的稳定性问题,描绘出了完整而令人信服的原子结构;波尔的原子模型给出了这样的宇宙图像:①电子在一些特定的可能轨道上绕核作圆周运动,离核愈远能量愈高;②可能的轨道由电子的角动量必须是h/2π的整数倍决定;③当电子在这些可能轨道上运动时,原子不能发射也不吸收能量,只有当电子从一个轨道跃迁至另一个轨道时,原子才发射或吸收能量,而且发射和吸收的能量是单频的。
布朗运动理论的成功再一次清楚表明:当速度对时间的高阶微商小到可以忽略不计时,把古典力学用于这种运动,总是提供可靠的结果。依据这种认识,可以提出一种比较直接的方法,使我们能够从普朗克公式中求得一些关于辐射结构的知识。也就是说,我们可以得出这样的结论:在充满辐射的空间里,一面 (垂直于它自身的平面) 自由运动着的准单色反射镜,必定要作一种布朗运动,其平均动能等于 ( R/N ) T ( R 为1克分子的气体方程中的常数, N 为每克分子中的分子数目, T 为绝对温度) 。如果辐射没有受局部起伏的支配,镜子就会渐趋静止,因为,由于它的运动,在它的正面反射的辐射要比背面反射的多。可是由于组成辐射的波束互相干涉,镜子必然要遇到作用在它身上的压力的某种不规则的起伏,这种起伏必定能够从麦克斯韦理论计算出来。然而,这种计算表明,这些压力起伏 (特别是在辐射密度很小的情况下) 要给镜子以平均动能 ( R/N ) T 是无论如何做不到的。为了能够得到这个结果,就必须假定另外有第二种压力起伏,可是它是不能从麦克斯韦理论推导出来的,而符合于这样的假定:辐射能量是由许多能量为 hv (动量为 hv/c,c =光速) 好像集中在一点上的不可分割的量子所组成的,而量子在被反射时也是不可分割的。这种考虑以激烈而直接的方式表明,普朗克的量子必须被认为是一种直接的实在,因而,从能量角度来看,辐射必定具有一种分子结构,这当然是同麦克斯韦理论相矛盾的。直接依据玻耳兹曼的熵——概率关系 (取概率等于统计的时间频率) 对辐射所作的考察也得到同样的结果。辐射的 (和物质微粒的) 这种二象性是实在的一种主要特性,它已经由量子力学以巧妙而且非常成功的方式作了解释。几乎当代所有物理学家都认为这种解释基本上是最终的解释,而在我看来,它不过是一条暂时的出路;关于这一点,有些意见留待以后再谈。
早在1900年以后不久,即在普朗克的首创性工作以后不久,这类思考已使我清楚地看到:不论是力学还是热力学 (除非在极限情况下) 都不能要求严格有效。渐渐地我对那种根据已知事实用构造性的努力去发现真实定律的可能性感到绝望了。我努力得愈久,就愈加绝望,也就愈加确信,只有发现一个普遍的形式原理,才能使我们得到可靠的结果。我认为热力学就是放在我面前的一个范例。在那里,普通原理是用这样一条定理来说明的:自然规律是这样的,它们使 (第一类和第二类) 永动机的制造成为不可能。但是这样一条普通原理究觉是怎样找到的呢?经过十年沉思以后,我从一个悖论中得到了这样一个原理,这个悖论我在16岁时就已经无意识中想到了:如果我们以速度为 c (真空中的光速) 追随一条光线运动,那么我就应当看到,这样一条光线就好像一个在空间里振荡着而停滞不前的电磁场。可是,无论是依据经验,还是按照麦克斯韦方程,看来都不会有这样的事情。从一开始,在我直觉地看来就很清楚,从这样一个观察者的观点来判断,一切都应当像一个相对于地球是静止的观察者所看到的那样按照同样的一些定律进行,因为,第一个观察者怎么会知道或者能够判明他是处在均匀的快速运动状态中呢?
人们看得出,这个悖论已经包含着狭义相对论的萌芽。今天,当然谁都知道,只要时间的绝对性或同时性的绝对性这条公理不知不觉地留在潜意识里,那么任何想要令人满意地澄清这个悖论的尝试,注定要失败。清楚地认识这条公理以及它的任意性,实际上就意味着问题的解决。对于发现这个中心点所需要的批判思想,就我的情况来说,特别是由于阅读了大卫·休谟和恩斯特·马赫的哲学著作而得到决定性进展。
布鲁塞尔会议
德国物理学家能斯特用量子理论研究低温环境下的辐射现象,得出了光化学的"原子链式反应"理论,从而计算出熵的绝对值,为此能斯特获得了1920年诺贝尔化学奖。图为布鲁塞尔会议上能斯特在为居里夫人、爱因斯坦等科学家演算熵的绝对值。
人们必须清楚地了解,在物理学中一个事件的空间坐标和时间值意味着什么。要从物理上说明空间坐标,就得预先假定一个刚性的参照体,而且,这参照体必须处在多少是确定的运动状态中 (惯性系) 。在一个既定的惯性系中,坐标就是用 (静止的) 刚性杆作一定量度的结果。 (人们始终应当意识到,原则上有刚性杆存在的假定,是一种由近似的经验启示的,但在原则上却是任意的假定。) 由于对空间坐标作这样一种解释,欧几里得几何的有效性问题便成为一个物理学上的问题了。
如果人们想用类似的方法来说明一个事件的时间,那就需要一种量度时间差的工具 (这是借助于一个空间广延足够小的体系来实现的自行决定的周期过程) 。一只相对于惯性系是静止的钟规定着一个“当地时间”。如果人们已经定出一种方法去相互“校准”这些“空间各个点上的”钟,那么,这些空间点的当地时间合在一起,就是所选定的那个惯性系的“时间”。人们看到,根本没有必要先验地认为这样定义的“时间”在不同的惯性系中是彼此一致的。假如在日常生活的实际经验中光 (因为 c 的数值很大) 看起来不像是一种能断定绝对同时性的工具,那么,人们早就该注意到这一点了。
光速
光在真空中的速率是一个常数,并且不因光源与观测者之间的相对速度而发生变化,这是从麦克斯韦电磁力学方程组得出的结果,爱因斯坦把它作为狭义相对论的基本定理。
关于 (原则上) 有 (理想的,即完善的) 量杆和时钟存在这样的假定并不是彼此无关的,因为,只要光速在其空中恒定不变的假设不导致矛盾,那么,在一根刚性杆两端之间来回反射的一个光信号就构成一只理想的时钟。
上述悖论现在就可以表述如下。从一个惯性系转移到另一个惯性系时,按照古典物理学所用的关于事件在空间坐标和时间上的联系规则,下面两条假定:
1)光速不变,
2)定律 (并且特别是光速不变定律) 同惯性系的选取无关 (狭义相对性原理) ,二者是彼此不相容的 (尽管两者各自都是以经验为依据的) 。
狭义相对论所依据的认识是:如果事件的坐标和时间的换算是按照一种新的关系( “洛伦兹变换” [4] ),那么,1)和2)这两个假定就是彼此相容的了。根据前面对坐标和时间的物理解释,这决不仅仅是一种约定性的步骤,而且还包含着某些关于运动着的量杆和时钟的实际行为的假说,而这些假说是可以被实验证实或者推翻的。
狭义相对论的普遍原理包含在这样一个假设里:物理定律对于 (从一个惯性系转移到另一个任意选定的惯性系的) 洛伦兹变换是不变的。这是对自然界定律的一条限制性原理,它可以同不存在永动机这样一条作为热力学基础的限制性原理相比拟。首先就这理论对“四维空间”的关系说几句话。认为狭义相对论似乎首先发现了,或者第一次引进了物理连续区的四维性,这是一种广泛流传的错误。情况当然不是这样的。古典力学也是以空间和时间的四维连续区为基础的。只是在古典物理学的四维连续区中,时间值恒定的截面有绝对的实在性,即同参照系的选取无关。因此,四维连续区就自然而然地分为一个三维连续区和一个一维连续区 (时间) ,所以,四维的考察方式就没有必要强加于人了。与此相反,狭义相对论在空间坐标作为一方和时间坐标作为另一方如何进入自然规律的方式方法之间,创立了一种形式上的依存关系。
闵可夫斯基对这理论的重要贡献如下:在闵可夫斯基的研究之前,为了检验一条定律在洛伦兹变换下的不变性,人们就必须对它实行一次这样的变换;可是闵可夫斯基却成功地引进了这样一种形式体系,使定律的数学形式本身就保证了它在洛伦兹变换下的不变性。由于创造了四维张量演算,他对四维空间也就得到了同通常的矢量演算对三维空间所得到的结果一样。他还指出,洛伦兹变换 (且不管由于时间的特殊性造成的正负号的不同) 不是别的,只不过是坐标系在四维空间中的转动。
首先,对上述理论提一点批评性意见。人们注意到,这理论 (除四维空间外) 引进了两类物理的东西,即①量杆和时钟;②其余一切东西。比如电磁场、质点等等。这在某种意义上是不一致的。严格说来,量杆和时钟应当表现为基本方程的解 (由运动着的原子实体所组成的客体) ,而不是似乎理论上独立的实体。可是这种做法是有道理的,因为一开始就很明白,这理论的假设不够有力,还不足以从其中为物理事件推导出足够完备的而且充分避免任意性的方程,以便以此为基础来建立量杆和时钟的理论。如若人们根本不愿意放弃坐标的物理解释 (这本来是可能的) ,那么,最好还是允许这种不一致性,然而有责任在理论发展的后一阶段把它消除。但是,人们不应当把上述过失合法化,以致把间隔想象为本质上不同于其他物理量的特殊类型的物理实体 (“把物理学归结为几何学”等等) 。
维度空间
“维”是一种度量,在物理学的领域内,指独立时空坐标的数目。零维是一点,一个没有长度的奇点;一维是线,只有长度;二维是一个平面,是由长度和宽度(或曲线)形成面积;三维是二维加上高度形成体积面;而四维则是在三维基础上加上了时间。
我们现在要问,物理学中有哪些具有确定性质的认识应该归功于狭义相对论。
1)在距离上分隔开的事件之间没有同时性;因而也没有“牛顿力学”意义上的直接的超距作用。虽然,按照这种理论,引入以光速传播的超距作用是可以想象的,但是却显得很不自然;因为在这样一种理论中,不可能有能量守恒原理的合理陈述。因此,看来不可避免地要用空间的连续函数来描述物理实在。所以质点就难以再被认为是理论的基本概念了。
2)动量守恒定律和能量守恒定律融合成为单独的一条定律。封闭体系的惯性质量就是它的能量,因此,质量不再是独立的概念了。
重力 合成图片
重力是最常见的力,人类生活在地球上,时时刻刻都受到重力作用。地球和月亮之间存在相互吸引的力,这个力跟地球吸引地面的物体使物体下落的力是同一种力,即万有引力。
附注,光速 c 是那些作为“普适常数” [5] ,在物理方程中出现的物理量之一。可是,如果人们用光走过1厘米的时间作为时间单位,来代替秒,那么 c 在这方程中就不再出现。在这个意义上,人们可以说,常数 c 只是一个表观的普适常数。
如果采用适当选取的“自然”单位 (比如电子的质量和半径) 来代替克和厘米,那么还可以从物理学中再消去另外两个普适常数,这是很明显的,而且也是大家所公认的。设想我们这样做了,那么在物理学的基本方程中就只能出现“无量纲的”常数。关于这些常数,我想讲这样一条命题,它在目前,除了相信自然界是简单的和可以理解的外,还不能以其他任何东西为依据。这命题就是:这种任何常数是不存在的;也就是说,自然界是这样构成的,它使得人们在逻辑上有可能规定这样一些十分确定的定律,而在这些定律中只能出现一些完全合理地确定了的常数 (因而,不是那些在不破坏这种理论的情况下也能改变其数值的常数) 。
狭义相对论的起源要归功于麦克斯韦的电磁场方程。反过来,后者也只有通过狭义相对论才能在形式上以令人满意的方式被人们理解。麦克斯韦方程是对于一种从矢量场导出的反对称张量所能建立的最简单的洛伦兹不变的场方程。要不是从量子现象中我们知道麦克斯韦理论不能正确说明辐射的能量特性,那么,这一切本来是会令人满意的。但是,怎样才能自然地修改麦克斯韦理论呢?对于这个问题,狭义相对论也提供不出充分的依据。而且对于马赫的问题:“为什么惯性系在物理上比其他坐标系都特殊,这是怎么一回事?”这个理论同样作不出回答。
当我力图在狭义相对论的框子里把引力表示出来的时候,我才完全明白,狭义相对论不过是必然发展过程的第一步。在用场来解释的古典力学中,引力势表现为一种标量场 (只有一个分量的、理论上可能的最简单的场) 。首先,引力场的这种标量理论,很容易做到对于洛伦兹变换群是不变的。因此,下述纲领看来是自然的:总的物理场是由一个标量场 (引力场) 和一个矢量场 (电磁场) 组成的;以后的认识也许最终还有必要引进更加复杂的场;但是开始时人们还是不需要为此担心。
然而,实现这个纲领的可能性,一开始就成问题,因为这种理论必须把下面两件事结合起来:
1)根据狭义相对论的一般考虑,可以清楚地看到,物理体系的惯性质量随其总能量 (因而,比如也随其动能) 的增加而增加。
2)根据很精确的实验 (尤其是根据厄缶 的扭秤实验) ,在经验上非常精确地知道,物体的引力质量同它的惯性质量是完全相等的。
从1)和2)得知一个体系的重量以一种完全清楚的方式取决于它的总能量。如果理论不能做到这一点,或者不能自然地做到这一点,那么它就应当被抛弃。这条件可以极其自然地表述如下:在既定的重力场中,一个体系的降落加速度同这降落体系的本性 (因而特别是同它的能量含量) 无关。
那么这就表明,在上述拟定的纲领的框子里,根本不能满足,或者无论如何不能以自然的方式满足这种基本情况。这就使我相信,在狭义相对论的框子里,是不可能有令人满意的引力理论的。这时,我想到:惯性质量同引力质量相等这件事,或者降落加速度同落体的本性无关这件事,可以表述如下:如果在一个 (空间范围很小的) 引力场里,我们不是引进一个“惯性系”而是引进一个相对于它作加速运动的参照系,那么事物就会像在没有引力的空间里那样行动。
这样,如果我们把物体对于后一参照系的行为,看作是由“真实的” (而不只是表观的) 引力场引起的,那么像原来的参照系一样,我们有同样的理由把这个参照系看作是一个“惯性系”。
因此,如果人们认为,可能有任意广延 的引力场,这种场不是一开始就受到空间界限的限制的,那么,“惯性系”这个概念就成为完全空洞的了。这样,“相对于空间的加速”这个概念就失去了任何意义,从而惯性原理连同马赫的悖论也都失去了意义。
因此,惯性质量同引力质量相等的事实,很自然地使人认识到,狭义相对论的基本要求 (定律对于洛伦兹变换的不变性) 是太狭窄了,也就是说,我们必须假设,定律对于四维连续区中的坐标的非线性变换也是不变的。
这发生在1908年。为什么建立广义相对论还需要7年时间呢?其主要原因在于,要使人们从坐标必须具有直接的度规意义这一观念中解放出来,可不是那么容易的。它的转变大体上是以如下方式发生的。
我们从一个没有场的空虚空间出发,在狭义相对论的意义上,它——对于一个惯性系来说——是一切可以想象的物理状况中最简单的一个。现在我们设想引进一个非惯性系,假定这新的参照系相对于惯性系 (在三维的描述中) 在一个 (适当地规定的) 方向上作等加速运动,于是,对于这个参照系来说,就有一个静止的、平行的引力场。这时,这个参照系可以被选定为刚性的,并具有欧几里得性质的三维度规关系。但是,场在其中显示为静止的那个时间,却不是用构造相同的静止的钟来量度的。从这个特例中,人们已经可以认识到,如果完全允许坐标的非线性变换,那么坐标也就失去了直接的度规意义。可是,如果人们想要使理论的基础适合于引力质量同惯性质量相等,并且,想克服马赫关于惯性系的悖论,那么,就必须容许坐标的非线性变换。
但是,如若人们现在必须放弃给坐标级直接的度规意义 (坐标的差=可量度的长度或时间) ,那就不可避免地要把一切由坐标的连续变换所能创造的坐标系都当作是等价的。
因此,广义相对论由此出发的是下述原理:自然规律是用那些对于连续的坐标变换群是协变的方程来表示的。这种群在这里也就代替了狭义相对论的洛伦兹变换群,后一种群便成为前者的一个子群。
洛伦兹吸引子 合成图片
洛伦兹混沌吸引子已成为混沌理论的徽标,代表着复杂性新科学,是以自组织理论、复杂性理论为标志的新型自然观。混沌首先是数学上的新发现,而非自然科学的新发现。这种表述的根据是,混沌是数学模型中存在的一种理想化的运动形式。这是大批杰出数学家经过多年努力证明了的事实。
这种要求本身,当然不足以成为导出物理学基本方程的出发点。起初,人们甚至会否认这一要求本身就包含着一种对物理定律的真正限制;因为一个最初只是对某些坐标系规定的定律,总有可能重新加以表述,使新的表述方式具有广义的协变形式。此外,从一开始就很清楚,可以建立无限多个具有这种协变性质的场定律。但是,广义相对性原理的著名的启发性意义就在于,它引导我们去探求那些在广义协变的表述形式中尽可能简单的方程组;我们应当从这些方程组中找出物理空间的场定律。凡是能用这样的变换进行和互转换的场,它们所描述的都是同一个实在状况。
对于在这个领域里从事探索的人们来说,他们的主要问题是:可以用来表示空间的物理性质“结构”的量 (坐标的函数) 是属于哪一种数学类型?然后才是:这些量满足哪些方程?
我们今天还不可能对这些问题作出确实可靠的回答。最初表述广义相对论时所选择的途径可以表述如下。即使我们还不知道该用什么样的场变数 (结构) 来表征物理空间,但是我们确实知道一种特殊情况,那就是狭义相对论中的“没有场”的空间。这种空间的特征是:对于一个适当选取的坐标系来说,属于相邻两点的表示式
黎曼
德国数学家、物理学家,对数学分析和微分几何做出了重要贡献,他的名字出现在黎曼积分、黎曼引理、黎曼流形、黎曼映照定理、黎曼-希尔伯特问题、黎曼思路回环矩阵和黎曼曲面当中。他还开创了黎曼几何,这为广义相对论提供了数学基础。
代表一个可量度的量 (距离的平方) ,因此它具有实在的物理意义。对于任意的坐标系,这个量可表示如下:
式中的指示应从1到4。这些 g ik 形成一个对称张量。如果对场 (1) 进行一次变换以后, g ik 关于坐标的一阶导数不等于零,那么在上述考虑中对于这个坐标系来说,就存在着一个引力场,而且是一个十分特殊的引力场。多亏黎曼对维度规空间所作的研究,这种特殊场总是能够表征为:
1)由度规(2)的系数形成的黎曼的曲率张量 R iklm 等于零。
2)对于惯性系 (对它来说,(1)是有效的) ,一个质点的轨迹是一条直线,因此是一条极值曲线 (短程线) 。然而,后者已经是以(2)为依据的关于运动的一种表征。
因而物理空间的普遍定律,必须是上述定律的一种推广。我现在假定,有二个推广步骤:
1)纯粹的引力场;
2)一般的场 (其中也会出现一些以某种方式同电磁场相对应的量) 。
情况1)的特征是:这个场仍然可以用黎曼度规(2),也就是用对称张量来表示,但是,不能写成(1)的形式 (除了在无限小区域中) 。这意味着,在情况1)中,黎曼张量不等于零。可是,很明显,在这种情况下,必然有一条作为这条定理的推广 (防宽) 的场定律是有效的,那么,只有经过一次降秩而得到的方程
才能被认为是情况1)的场方程。而且,如果我们假定,在情况1)中,短程线仍然表示质点的运动定律,那么,这也显得很自然。
那么,我认为,冒险尝试把总场2)表示出来,并为它确定场定律,是没有希望的。因此,我宁愿为表示整个物理实在建立一个初步的形成框架;至少为了能初步研究广义相对性的基本思想是否有用,这是必要的。是这样进行的:
在牛顿的理论中,在物质密度 ρ 等于零的那些点上,引力场定律可以写成:
Δ φ =0 ( φ =引势力) 一般则写成 (泊松方程)
Δ φ =4π kρ ( ρ 为物质密度)
在引力场的相对性理论中, R ik 代替了Δ φ 。于是,我们在等式右边也必须同样用一个张量来代替 ρ 。因为我们从狭义相对论知道, (惯性) 质量等于能量,所以在等式右边应该是能量密度的张量,就其不属于纯粹的引力场而论,更准确的说,应该是总的能量密度的张量。这样,人们便得到场方程
左边第二部分是由于形式上的理由而加进去的;左边之所以写成这样的形式,是要使它的散度在绝对微分学意义下恒等于零。右边是对一切在场论意义上看来其含意还成问题的东西所作的一种形式上的总括。当然,我一刻也没有怀疑过,这种表述方式仅仅是一种权宜之计,以便给予广义相对性原理以一个初步的自圆其说的表示。因为它本质上不过是一种引力场理论,这种引力场是有点人为地从还不知道其结构的总场中分离出来的。
如果说,在上述理论中——除要求场方程对连续坐标变换群有不变性外——还有什么东西可能被认为是有最终意义的话,那么,这就是关于纯引力场极限情况的理论及其对空间度规结构的关系。因此,我们接下去就只讲纯引力场的方程。这些方程的特点,一方面在于它们的复杂结构,特别在于它们对于场变数及其导数的非线性特征,另一方面在于变换群几乎是以强制的必然性决定了这种复杂的场定律。如果人们停留在狭义相对论上,即停留在对洛伦兹群的不变性上,那么在这个比较狭小的群的框子里,场定律 R ik =0仍然是不变的。但是,从较小的群的观点看来,最初也没有理由要用像对称张量所表示那么复杂的结构来表示引力。然而,假如人们能为此找到足够的理由,那么就会有非常多个由量 g ik 构成的场定律,它们对于洛伦兹变换 (但不是对一般的变换群) 都是协变的。可是,即使从所有可以想象得到的洛伦兹不变的定律中,偶然恰巧猜中了一条属于较宽广的群的定律,人们还是没有达到广义相对性原理所已达到的认识程度。因为,从洛伦兹群的观点看来,两个解如果可以用非线性坐标变换来互相转换,也就是说,从范围较宽广的群的观点看来,它们只是同一个场的不同表示,那么这两个解就会被错误地认为在物理上是各不相同的。
引力场
在广义相对论中,一个物体的引力场理论上是可以延伸到整个宇宙,但实际上在它的近邻区域影响才是显著的。引力被描述为时空曲率,而这种时空曲率与处在时空里的物质和能量辐射直接相关,其关联方式即爱因斯坦场方程。
关于场结构和变换群再提一点一般性的意见。显然,一般说来,人们会这样来判断一个理论:作为理论的基础的“结构”愈简单,场方程对之不变的变换群愈宽广,那么这理论也就愈完善。现在人们可以看出,这两个要求是互相冲突的。比如,按照狭义相对论 (洛伦兹群) ,人们能为可想象的最简单的结构 (标量场) 建立一条协变 定律,而在广义相对论中 (比较宽广的坐标连续变换群) ,只是对于较复杂的对称张量结构才有一条不变的场定律。我们已经提出了物理上的一些理由来说明,在物理学中,必须要求对于较宽广的群是不变的:根据纯数学的观点,我看不出有必要为较宽广的群而牺牲较简单的结构。
广义相对论的群第一次不再要求最简单的不变定律关于场变函数及其微商该是线性的齐次的。这一点由于下述原因而具有基本的重要性。如果场定律是线性的 (和齐次的) ,那么,两个解之和也是一个解;比如,空虚空间中的麦克斯韦场方程就是这样。在这样一种理论中,不可能单单从场定律推导出那种能用方程组的各个解分别加以描述的物体之间的相互作用。因此,到现在为止的所有理论中,除场定律外,还需要有物体在场作用下运动的特殊定律。在相对论的引力论中,固然除场定律外,最初还独立地假定了运动定律 (短程线) 。可是,后来发现,这条运动定律并不需要 (也不应该) 独立地予以假定,因为它已经隐含在引力场定律之中了。
引力场的负能量
宇宙大爆炸后形成正物质(如星系,星云)和反物质(如黑洞)。而引力场具有负能量,并且刚好能抵消物质所代表的正能量,所以宇宙的总能量为零。
这种真正复杂情况的本质可以形象地说明如下:一个单个的静止质点 将由这样一个引力场来表示,除了这质点所在的地点以外,它到处都是非无限小的并且是正则的;而在质点所在的地点,场有一个奇点。可是,如果通过对场方程的积分来计算属于两个静止质点的场,那么,这个场除了在两个质点所在地点上有两个奇点外,还有一条由许多奇点组成的线,把这两个质点连接起来。可是,人们可以这样来规定质点的运动,使得由这些质点所决定的引力场,除质点所在地点以外,任何地方都不出现奇点。这些正是在第一级近似下由牛顿定律所描述的运动。因此,人们可以说:物体是以这样的方式运动的,它使场方程的解除在质点所在地点以外,在空间里,没有任何地方出现奇点。引力方程的这种属性,同它们的非线性直接有关,而这种非线性则是较宽广的变换群的一个结果。
现在,人们当然可能会提出这样的反对意见:如果允许在质点所在地点出现奇点,那么有什么理由可以禁止在空间的其他地方也出现奇点呢?如果引力场方程被看作是总场的方程,那么,这种反对意见就应当是正确的。可是,人们必须说,当我们愈趋近质点的位置时,就愈不能把质点的场看作是纯粹的引力场。如果人们有总场的场方程,那么势必要求:粒子本身到处都可以被描述为完备的场方程的没有奇点的解。只有在这种情况下,广义相对论才是一种完备的理论。
在我着手讨论如何完成广义相对论问题以前,我必须对我们时代最成功的物理理论,即统计性量子理论表示我的态度,这种理论大约在25年以前就已经具有贯彻一致的逻辑形式 (薛定谔 、海森堡 、狄拉克 、玻恩 ) 。现在,它是能对微观力学过程的量子特征方面的经验提供一个统一理解的唯一的理论。以这个理论为一方,以相对论为另一方,两者在一定意义上都被认为是正确的,虽然迄今为止想把它们融合起来的一切努力都遇到了抵制。这也许就是当代理论物理学家中,对于未来物理学的理论基础将是怎样的这个问题存在着完全不同意见的原因。它会是一种场论吗?它会是一种本质上是统计性的理论吗?在这里我将简单地说一说我对这个问题的想法。
物理学是从概念上掌握实在的一种努力,至于实在是否被观察,则被认为是无关的。人们就是在这种意义上来谈论“物理实在”的。在量子物理学以前,对这一点应当怎样理解,那是没有疑问的。在牛顿的理论中,实在是由空间和时间里的质点来表示的;在麦克斯韦的理论中,是由空间和时间里的场来表示的。在量子力学中,可就不是那么容易看得清楚了。如果有人问:量子理论中的ψ函数,是否正像一个质点系或者一个电磁场一样,在同样意义上表示一个实在的实际状况呢,那么,人们就会踌躇起来,不敢简单地回答“是”或者“不是”;为什么呢?因为, ψ 函数 (在一个确定的时刻) 所断言的是:如果我在时间上进行量度,那么在一个确定的已知间隔中能找到一个确定的物理量 q (或 ρ ) 的概率是多少呢?在这里,概率被认为是一个可以在经验上测定的,因而确实是“实在的”量;只要我们经常能造出同样的 ψ 函数,并且每次都能进行 q 的量度,我就能测定它。但是,每次测定的 q 值是怎么样的呢?有关的单个体系在量度前是否已经有这个 q 值呢?对于这些问题,在这个理论的框子里,没有确定的回答,因为,量度确实意味着外界对体系施加有限干扰的一个过程。因此,可以想象,只有通过量度本身,体系才能为被量度的数值 q (或 ρ ) 得到一个确定的数值。为了作进一步的讨论,我设想有两个物理学家A和B,他们对 ψ 函数所描述的实在状况持有不同的见解。
A.〔认为〕对于体系的一切变量 (在量度以前) ,单个体系都具有一个确定的 q (或 ρ ) 值,而且,这个值就是在量度这个变量时所测得的。从这种观念出发,他会说: ψ 函数不是体系的实在状况的穷尽的描述,而是一种不完备的描述;它只是表述了我们根据以前对这体系的量度所知道的东西。
超引力 合成图片
超强的低能理论即超引力理论,所谓低能是指能量低于弦的张力所确定的能标,这样的理论只包括无质量的弦态,有趣的是,几乎所有超引力的发现都在对应的弦论发现之前。
B.〔认为〕单个体系 (在量度前) 没有一个确定的 q (或 ρ ) 值。只有通过量度动作本身,并且结合由 ψ 函数赋予量值的特有的概率,才能得出这个量度的值。从这种观念出发,他会 (或者,至少他可以) 说: ψ 函数是体系的实在状况的一种穷尽的描述。
现在,我们向这两位物理学家提出如下的情况:有一个体系,在我们观察的时刻 t 由两个局部体系 S 1 和 S 2 组成,而且在这个时刻,这两个局部体系在空间上是分开的,彼此 (在古典物理学的意义上) 也没有多大相互作用。假定这总体系在量子力学意义上是由一个已知的 ψ 函数 ψ 12 完备地来描述的。现在所有量子理论家对下面这一点都是一致的:如果我对 S 1 作一次完备的量度,那么从这量度结果和 ψ 12 中就得到体系 S 2 的一个完全确定的 ψ 函数 ψ 2 。于是 ψ 2 的特征便取决于我对 S 1 所作的是哪一种量度。现在我觉得,人们可以谈论局部体系 S 2 的实在状况了。起初,在对 S 1 进行度量以前,我们对这个实在的了解,比我们对一个由 ψ 函数描述的体系的了解还少。但是,照我的看法,我们应当无条件地坚持这样一个假定:体系 S 2 的实在状况 (状态) ,同我们对那个在空间上同它分开的体系 S 1 所采取的措施无关。可是,按照我对 S 2 所作的量度的类型,对于第二个局部体系,我将得到不同的 ψ 2 :( ψ 2 , ……)。但是, S 2 的实在状况应当同 S 1 所碰到的事情无关。因此,对于 S 2 的同一个实在状况,可以 (按照人们对 S 1 选择哪一种量度) 找到不同类型的 ψ 函数。人们只有通过下述办法才能避开这种结论:要么假定对 S 1 的量度会改变 S 2 的实在状况;要么根本否认空间上互相分开的事物能有独立的实在状况。在我看来,两者都是完全不能接受的。
现在如果物理学家A和B认为这种考虑是站得住脚的,那么就必须放弃他认为 ψ 函数是关于实在状况的一种完备描述这个观点。因为,在这种情况下, S 2 的同一个实在状况,不可能同两种不同类型的 ψ 函数相对应。
因此,目前这理论的这种统计特征应当是量子力学对体系描述的不完备性的一个必然结果,而且也不再有任何理由可以假定物理学将来的基础必须建立在统计学上。
我的意见是,当前的量子理论,借助于某些确定的主要取自古典力学的基本概念,形成了一种对联系的最适宜的表述方式。可是,我相信,这种理论不能为将来的发展提供任何有用的出发点。正是在这一点上,我的期望同当代大多数物理学家有分歧。他们相信,用满足微分方程的空间的连续函数来描述事物的实在状态的那种理论不可能说明量子现象的主要方面 (一个体系的状态的变化,表面上是跳跃式的,在时间上是不确定的,能量基元同时具有粒子性和波动性) 。他们也想到,人们以这种方式无法理解物质和辐射的原子结构。他们可以料想,由这样一种理论的考查所能得出的微分方程组,根本不会有那种在四维空间里到处都是正则的 (没有奇点的) 解。但是,在一切之上,他们首先相信,基元过程外观上跳跃式的特征,只能用一种本质上是统计性的理论来描述,而在这理论中,体系的跳跃式变化,是用可能实现的状态的概率的连续变化来说明的。
所有这些意见,给我的印象是十分深刻的。可在我看来,起决定性作用的题是:在理论的目前情况下,可以作哪些尝试才有点成功的盼头?在这一点,在引力论中的经验为我的期待指明了方向。照我的看法,这些方程,比所其他物理方程有更多的希望可以说出一些准确的东西。比如,人们可以取空空间里的麦克斯韦方程来作比较。这些方程是同无限弱的电磁场的经验相符的表述方式。这个经验根源,已经决定了它们的线性形式;可是,上面已经调指出,真正的定律不可能是线性的。这种“线性”定律对于它们的解来说是满足叠加原理的,因而并不含有关于基元 物体的相互作用的任何论断。真正的定律不可能是线性 的,而且也不可能从这些线性方程中得到。我从引力论中还学到了另外一些东西:经验事实不论收集得多么丰富,仍然不能引导到提出如此复杂的方程。一个理论可以用经验来检验,但是并没有从经验建立理论的道路。像引力场方程这样复杂的方程,只有通过发现逻辑上简单的数学条件才能找到,这种数学条件完全地或者几乎完全地决定着这些方程。但问上有虚合强是,人们一旦有了那些足够强有力的形式条件,那么,为了创立理论,就只需要少量关于事实的知识;在引力方程的情况下,这就是四维性和表示空间结构的对称张量 [6] ,这些同时对于连续变换群的不变性,实际上完全决定了这些方程。
普朗克常数 合成图片
普朗克常数h作为空间上的一个依据,为什么它的单位却是以能量(物质)和时间单位的乘积为单位呢?这是分析力学中作用量的单位(当然也是角动量的单位),因此被称做作用量子。可以用费曼方程来解释,指数项没有单位,因此h与作用量有相同的量纲。
我们的任务是要为总场找到场方程。所求的结构必须是对称张量的一种推广。它的群一点也不应当比连续坐标变换群狭小。如果人们现在引进一个更丰富的结构,那么这个群就不会再像在以对称张量作为结构的情况下那样强有力地决定着方程了。因此,如果能够做到类似于从狭义相对论到广义相对论所采取的步骤,把群再一次扩充,那该是最美的了。我曾特别尝试过引用复数坐标变换群。所有这样的努力都没有成功。我也放弃了公开地或隐蔽地去增加空间维数,这种努力最初是由卡鲁查开始的,而且这种努力以及由此变化而来的投影形式,至今还有其拥护者,我们只限于四维空间和连续的实数坐标变换群。在多年徒劳的探索之后,我认为,下面概述的解在逻辑上是最令人满意的。
代替对称的 g ik ( g ik = g ik ) ,引进非对称的张量 g ik 。这个张量是由一个对称的部分 s ik 和一个实数的或纯虚数的反对称部分 cd ik 相加而成的,因此:
g ik = s ik + a ik
从群的观点看来, s 和 a 的这种组合是任意的,因为张量 s 和 a 各自具有张量的特性。但是,结果表明,这些 g ik (作为整体来看) 在建立新理论中所起的作用,很像对称的 g ik 在纯引力场理论中所起的作用。
空间结构的这种推广,从我们的物理知识的观点来看,似乎也是很自然的,因为我们知道,电磁场同反对称张量有关。
此外,对引力理论重要的是:由对称的 g ik 有可能形成标量密度 ,以及按照定义
( =克罗内开尔张量)
有可能形成抗变张量 g ik 。对于非对称的 g ik ,这些构成可以用完全对应的方式来定义,对于张量密度也是如此。
在引力理论中更重要的是,对于一个既定的对称的 g ik 场,可以定义一个场 ,它的下坐标是对称的,从几何学上看,它支配着矢量的平移。与此相似,对于非对称的 g ik ,可以按照公式
来定义一个非对称的 。这公式同对称的相应关系是符合的,自然只是在这里才有必要注意 g 和Γ的下坐标的位置。
正如在 g ik 是对称的理论中一样,可以由Γ形成曲率 ,并且由此形成降秩的曲率 R kl 。最后,运用变分原理以及(A),可以找到相容的场方程:
因此,如果(A)得到满足,两个方程(B 1 )(B 2 )中的每一个就是另一个的结果。 R kl 表示 R ik 的对称部分,而 R kl 则是它的反对称部分。
在 g ik 的反对称部分等于零的情况下,这些公式就简化成(A)和(C 1 )——纯引力场的情况。
我相信,这些方程是引力方程的最自然的推广。要考验它们在物理上是否有用,则是一项极其艰巨的任务,因此只靠近似法是办不到的。问题是:这些方程对于全部空间都没有奇点的解是什么?
如果这些叙述向读者说明了我毕生的努力是怎样相互联系的,以及这些努力为什么已导致一种确定形式的期望,那就已经达到目的了。
爱因斯坦写于1946年
[1] 胡尔维兹:(1859—1919年),德国数学家。生于希尔德斯海姆,卒于苏黎世。在代数学中,胡尔维兹定理(又名“1,2,4,8定理”)表明:任何带有单位元的赋范可除代数同构于以下四个代数之一: R,C,H 和 O ,分别代表实数、复数、四元数和八元数。
[2] 赫尔曼·闵可夫斯基:德国数学家。闵可夫斯基工作的主要领域在数论、代数和数学物理方面。在1881年法国科学院悬赏的大奖中,闵可夫斯基钻研了高斯、狄利克雷等人的论著,深入研究了 n 元二次型,建立了完整的理论体系。此后,闵可夫斯基继续研究,于1905年建立了实系数正定二次型的约化理论,被称为“闵可夫斯基约化理论”。
[3] 牛顿运动定律:是由艾萨克•牛顿总结于17世纪并发表于《自然哲学的数学原理》的牛顿第一运动定律( Newton's first law of motion )(惯性定律( law of inertia ))、牛顿第二运动定律( Newton's second law of motion )和牛顿第三运动定律( Newton's third law of motion )三大经典力学基本运动定律的总称。
[4] 洛伦兹变换:是观测者在不同惯性参照系之间对物理量进行测量时所进行的转换关系,在数学上表现为一套方程组。洛伦兹变换因其创立者——荷兰物理学家亨德里克•洛伦兹而得名。洛伦兹变换最初用来调和19世纪建立起来的经典电动力学同牛顿力学之间的矛盾,后来成为狭义相对论中的基本方程组。
洛伦兹变换( Lorentz transformation )是狭义相对论中关于不同惯性系之间物理事件时空坐标变换的基本关系式。设两个惯性系为 S 系和 S’ 系,它们相应的笛卡尔坐标轴彼此平行, S’ 系相对于 S 系沿 x 方向运动,速度为 v ,且当 t = t’ =0时, S’ 系与 S 系的坐标原点重合,则事件在这两个惯性系的时空坐标之间的洛伦兹变换为 x’=γ ( x-vt ), y’=y , z’=z , t’ = γ ( t-vx / c 2 ),式中 γ =(1- v 2 / c 2 )-1/2; c 为真空中的光速。不同惯性系中的物理定律必须在洛伦兹变换下保持形式不变。
[5] 普适常数:理想气体物态方程 pV =( m/M ) RT , p 为气体的压强, V 为气体的体积, Μ 为气体的摩尔质量, m 为气体的质量, R 为气体普适常数, T 为气体的热力学温度,其中的 R 也就是普适常数,单位J·mol ^-1 ·K ^-1 或k Pa·L·K ^-1 ·mol ^-1 。
R =8.314(J·mol -1 ·K -1 ),也称气体常量( gas constant ),表示气体性质的普适常量。全称为摩尔气体常量,又称普适气体常量,简称气体常量,常用符号 R 表示。根据理想气体状态方程 pV = nRT , R 等于1摩尔任何理想气体的压力 p 和体积 V 的乘积除以绝对温度 T ,取标准状态 T =273.15K, p =1大气压,标准状态下的气体体积 V 0 可由实验得出比较准确的数值,为 V 0 =22.41410×10 -3 m 3 /mol(m 3 ·mol -1 ),由此算出 R =8.314510 J·mol -1 ·K -1 。
[6] 张量:一个物理量如果必须用 n 阶方阵描述,且满足某几种特定的运算规则(也就是说,这方阵通过这几种运算后得到的结果是规则指出的),则这个方阵描述的物理量称为张量。