你可能仍然记得在学校学过的知识,如图0–2所示,你可以通过画一个箭头来表示从原点 O 到坐标系中某一点 P 的方向。这是矢量的一个例子或模型,即一个“位置”矢量,以其相对于 O 的方向和距离表示 P 的位置。但是,为多于一个事物编码是相当复杂的,因为单个数字无法完成这个任务,本书讲述的故事将指引我们去了解这一切的前因后果。正如我们将会看到的那样,将大小与方向融于一个符号的矢量概念,经历了漫长的时间才出现。
所以,以下几页只是一个快速预览,带你重温你可能学过却没有意识到其开创性意义的两个基本概念。稍后我们将更详细地了解它们,但我之所以在此提及,是要为我们在这趟旅程中需要了解的一些术语和概念打下基础,也想让你一窥矢量在今天为什么如此重要。作为矢量的多维表亲,张量将在故事的后半部分出场,因为它建立在关于矢量的概念和符号之上,而通往矢量的旅程出人意料地纷繁复杂。但是,在探索的过程中,我们也在构建支撑张量的想法。
图0–2表示点 P 位置的矢量 r ,具有 r x 和 r y 两个分量。 r 的大小即箭头的长度,代表从 O 到 P 的距离,用| r |或 r 表示,可以通过毕达哥拉斯定理计算得出
第一个概念是符号。数学符号可能有时看起来很神秘,所以我写作本书的目的之一,就是与你一起观察一些概念上的突破,它们促使人们不得不为新思想发明新符号。正如我们将在下一章中看到的那样,即使我们熟悉的
x
和
y
也是经过很长时间才出现的。我们在接下来的几章中不会说到现代矢量符号的出现,这表明这些符号的演变经历了漫长的时间。现在,我只想铺设几条将这个故事与你可能知道的内容连接起来的桥梁。比如,位置矢量通常用
r
、
或
表示。即使不熟悉矢量,你可能也记得,教科书里有类似的将符号与普通字母和数字混用的情况。这是因为黑体、字母顶部加上“帽子”或箭头,或字母下面加上波浪线,都是今天用于表示矢量的常见方式,以区别于代表数字且没有方向的量的普通字母。在这种情况下,没有黑体或帽子或其他标记的
r
只表示距离的大小,而不涉及方向,这样的量被称为标量,与矢量相对。表示速度的
v
是一个例子,它包括方向和速率,而
v
表示速率,即速度的大小。
第二个关键概念是矢量有“分量”。在书页的二维空间内,比如在绘图纸上,你能看到两个独立的空间方向,通常以 x 轴和 y 轴表示;这样你的点就有两个坐标,两点之间的箭头也就有两个分量。换言之,分量是箭头投影到每个坐标轴上得到的值,见图0–2。
同样,在三维空间内有三个独立方向和三个分量。在时空中有四个坐标轴,包括三个空间轴和一个时间轴,矢量则有四个分量。所以,你的位置矢量测量的不仅是旅行的距离,还有花费的时间。这可能比简单地测量三个空间分量并从你的手表上读取时间分量要麻烦一点儿,因为如果你与你想要测量的对象之间存在相对运动,时间和空间坐标就会以相互交织的方式发生变化。而当你处于一个引力场时,情况则会更加复杂,因为这是广义相对论而不是狭义相对论的范畴。我稍后会更多地谈及相对论,但在此只指出一点,即时空内的矢量有四个分量。
这里的箭头极具争议性,或者说,它与其分量之间的微妙区别是有争议的。人们只要理解了其中的精妙之处,就不仅能创造出现代大学水平的矢量,也能为张量的问世铺平道路。我们将会看到,发生这种混淆的部分原因在于,你也可以简单地通过列出它们的分量来表示矢量,这比画一个箭头更简单也更经济,尤其是当你想要跳出三维空间时。比如,假设你以每小时35英里 [7] 的速度向北行驶(沿着一条平坦的二维街道:数学家喜欢通过简化假设来探索新想法!),而你选择南北方向作为 y 轴。从几何上看,你的速度矢量将在图0–2中沿着 y 轴指向上方,长度为35个单位。但你也可以用 v =(0, 35)来表示该速度,这意味着你沿 y 轴以每小时35英里的速度运动,沿 x 轴以每小时0英里的速度运动。所以,标量35给出了你的速度(以英里/小时为单位),矢量(0, 35)显示你向北行驶。[用一个矢量符号标记(0, 35),比如 v =(0, 35),可以将其与笛卡儿坐标系中的单个点区分开来,由此你可以看到符号的重要性。]你可以像这样表示任何速度,无论方向如何。比如,如果你以每小时35英里的速度向东北方向行驶,那么你的矢量分量为(35/√2, 35/√2 ),如我在本段尾注7中所示。 [8]
图0–3一个半径为 r 的圆上的点 P 的极坐标; θ 按逆时针方向测量。如图所示,速度分量是在 r 方向和 θ 增大的方向上测量的
让我们暂时忘记从数字到符号代数的漫长演变道路,提出一种更一般的说法:我们可以用( v x , v y , v z )来表示三维空间中的速度分量,表示你沿 x 方向以每小时 v x 英里的速度行驶,沿 y 方向以每小时 v y 英里的速度行驶,沿 z 方向以每小时 v z 英里的速度行驶。甚至可以再一般地说,三维空间内的速度分量可以表示为( v 1 , v 2 , v 3 ),因为笛卡儿的 x 、 y 、 z 坐标系不是唯一的。比如,由图0–3可见,二维极坐标 ( r , θ ) 对于在圆周上定位某个点很有用;矢量 ( v 1 , v 2 ) 意味着,你以每小时 v 1 英里的速度沿 r 方向行驶,以每小时 v 2 英里的速度沿 θ 方向行驶。要在球面上定位一个点,你可以使用球坐标( r , θ , φ ),其中 φ 是矢量和 z 轴之间的夹角。但细节在这里没那么重要,真正有趣的是这个符号背后的故事,当然还有它的应用。
比如,在四维时空中,爱因斯坦将他的坐标记为( x 1 , x 2 , x 3 , x 4 ),其中前三个是通常的空间坐标,而第四个是时间坐标。所以,四维速度矢量(或“四维速度” [9] )在这个坐标系中的分量被标记为( v 1 , v 2 , v 3 , v 4 )。
我们可以通过类比想象任何数量的维度。这正是将向量的信息表示为一串分量的优美之处:既然你可以写下( v 1 , v 2 , v 3 , v 4 ),那你为什么不能将你想要的任何(有限的!)维度写成( v 1 , v 2 , v 3 , v 4 , v 5 , …)?这就是弦理论学家认为我们的宇宙可能不止4个维度,而是有10个、11个甚至26个维度时所做的事。弦理论有很多种,你可以认为,额外的维度使空间得以容纳微小弦的多种振动方式,每种振动方式都代表一种不同的基本粒子或力。
数学“矢量空间”中的维度可以代表比普通空间和时间更奇特的含义,弦理论就是其中一例。在量子力学中有另外一个例子,即电子的磁取向或“自旋方向”可以是“上”或“下”,也可以是二者的“叠加”,就像电子无法决定它想要向上还是向下自旋一样。这类似于一个在 x 方向有一个分量,在 y 方向也有一个分量的二维速度矢量。所以,对于电子自旋,你可以将两个自旋方向(“上”和“下”)定义为你的坐标轴。
同样,在计算中,你利用两个二进制数字(“比特”)0和1编码信息,它们可以用物理上的开闭电路来表示。在量子计算中,比特对应于量子比特。在物理上,量子0和1可用于表示电子自旋的两个基本态,其中0表示自旋向上,1表示自旋向下,所以量子比特在数学上也可以表示成二维矢量。
矢量在现代商业和技术应用方面也大有可为。比如,轴或“维度”可以代表网站问卷或政治调查中的不同问题,或者影响房价或其他社会经济数据的不同因素,或者图像处理中像素的位置和颜色。顺便说一下,如果你熟悉图像处理,你就会知道在一些计算应用中,“矢量”这个词的含义与我刚才概述的通常数学意义略有不同。图像处理中的“矢量文件”使用方程生成图形,而不是存储像素等信息的矢量。这些“矢量文件”产生的图形确实将点与点“搭载”,而“载体”正是“矢量”原本的含义。将数学矢量视为箭头,你可以看到它们也“搭载”着从箭头的尾部到顶端的线。无论是在物理学、商业领域还是在计算中,我们更多地使用的矢量类型是箭头,或者说是箭头的分量串。
但是,让威廉·罗文·汉密尔顿大为振奋的,并非只是我们可以用任何个数的分量来表示各种物理、数字和经济系统或场景。自人类能够计数与书写以来,存储和表示数据就很重要,但计算也同样重要,而矢量和张量能够集数据表示与计算功能于一身。这就是它的魔力所在:尽管将矢量写成分量串的方法简单又实用,但让汉密尔顿兴奋不已的是,当你将矢量视为一个整体而不只是它的各个分量时,矢量算术的规则将使矢量的威力远超单独的数字。
比如,麦克斯韦预言了电磁波的存在,麦克斯韦方程如果以整体的矢量形式书写,就会相对容易推导出电磁波方程。另一个例子是,从数学上定义亚原子粒子(如电子)的自旋时,磁场矢量和矢量积也发挥了作用,从而使自旋能在现实世界中得到应用,比如在磁共振成像(MRI)中,它被用于“观察”患者的体内情况,进而诊断病情。
汉密尔顿做梦也不会想到会有这种事情发生。而事实上,他的矢量算术一经问世,便引起了其他数学家的兴趣,尤其是那些热衷于探索数学规则和语法逻辑能延伸至何种境地的人。有时他们推得太远,以至于跌入了一种新的现实,就如同爱丽丝穿过镜子掉进兔子洞一样。