抛硬币、掷骰子之类游戏中涉及的概率是离散的,抛掷结果的数目有限(2或6)。或者用更数学一点的语言来说,此类随机事件的结果所构成的“样本空间”是离散的、有限的。如果硬币或骰子是对称的,每个结果发生的概率基本相等。这一类随机事件被称为古典概型。数学家们将古典概型推广到某些几何问题中,使得随机变量的结果变成了连续的,数目成为无限多,这种随机事件被称之为“几何概型”。古典概型向几何概型的推广,类似于从有限多个整数向“实数域”的推广。了解几何概型很重要,因为与之相关的“测度”概念(长度、面积等),是现代概率论的基础。
布丰投针问题,是第一个被研究的几何概型。
18世纪的法国,有一位著名的博物学家乔治•布丰伯爵(George Buffon, 1707—1788)。他研究不同地区相似环境中的各种生物族群,也研究过人和猿的相似之处,以及两者来自同一个祖先的可能性。他的作品对现代生态学影响深远,他的思想对达尔文创建进化论影响很大。
难得的是,布丰同时也是一位数学家,是最早将微积分引入概率论的人之一。他提出的布丰投针问题(图1-3-1)是这样的:
用一根长度为 L 的针,随机地投向相隔为 D 的平行线( L < D ),针压到线的概率是多少?
图1-3-1 布丰投针问题
(a)数学模型;(b)概率简化为面积计算;(c)实验计
……布丰投针问题中,求的也是概率,但这时投掷的不是硬币或骰子,而是一根针。硬币投下去只有“正反”两种基本结果,每种概率为1/2。骰子有6种结果,每一个面出现概率为1/6。我们现在分析一下布丰投针的结果。按照图1-3-1(a)所示的数学模型,针投下之后的状态可以用两个随机变量来描述,针的中点的位置 x ,以及针与水平方向所成的角度 q 。 x 在- D /2到 D /2之间变化, q 在0到2π间变化。因为 x 和 q 的变化是连续的,所以其结果有无限多。古典概型中的求和在几何概型中要用积分代替,使用积分的方法不难求出布丰的针压线的概率:
因为布丰投针中的概率是对于 x 和 q 的二重积分,所以概率的计算可以简化为如图1-3-1(b)所示的几何图形的面积计算,即所求概率等于图1-3-1(b)中阴影面积与矩形面积之比。
布丰投针的结果提供了一个用概率实验来确定圆周率π的方法(蒙特•卡罗法)。从公式(1-3-1)可得:
当投掷针的次数(样本数)足够大,得到的概率 P 足够精确时,便可以用公式(1-3-2)来计算π。的确有些出乎意料,真没想到用一根针丢来丢去也能丢出一个数学常数来!
从上面的介绍可知,几何概型将古典概型中的离散随机变量扩展到了连续随机变量,求和变成积分,变量的样本空间从离散和有限扩展到无穷。几何概型和古典概型都使用“等概率假设”。然而,只要涉及无穷大,便经常会产生一些怪异的结果。布丰投针问题中条件清楚,没有引起什么悖论。著名的几何概型悖论是法国学者贝特朗(Joseph Bertrand, 1822—1900)于1889年提出的贝特朗悖论。
贝特朗提出的问题是:在圆内任作一弦,求其长度超过圆内接正三角形边长 L 的概率。奇怪之处在于,这个问题可以有3种不同的解答,结果完全不同但听起来却似乎都有道理。
求解贝特朗问题中的概率,不需要真用微积分,只需要利用几何图形的对称性便能得到答案。与计算布丰投针问题中概率的情况类似(图1-3-1(b)),一般来说,可以将几何概率的计算变换成几何图形的计算,即计算弧长或线段的长度,或者是面积或体积。从下面计算贝特朗问题的3种不同方法,读者可以更为深入地理解这点。
方法1:首先假设弦的一端固定在圆上某一点(比如 A ),如图1-3-2(a),弦的另一端在圆周上移动。移动端点落在弧 BC 上的弦,长度均超过圆内接正三角形的边长 L ,而其余弦的长度都小于 L 。由于对称性, BC 弧长占整个圆周的1/3,所以可得弦长大于 L 的概率为 BC 弧长与圆周长之比,即 P =1/3。
方法2:首先选择圆的一个直径,比如图1-3-2(b)中的 AD 。过该直径上的任何点做直径的垂线,与圆相交形成弦。从图1-3-2(b)中可以看出:当直径上动点的位置在 B 和 C 之间时,所得弦的弦长大于正三角形的边长 L ,动点位置在 BC 之外的弦的弦长小于 L 。因为线段 BC 的长度是整个直径的一半,所以由此可得弦长大于 L 的概率为 P =1/2。
图1-3-2 贝特朗悖论(彩图附后)
(a)方法1;(b)方法2;(c)方法3
方法3:如图1-3-2(c)所示,作一个半径只有所给圆的半径的1/2的同心圆(称为小圆),称所给的圆为“大圆”。考虑大圆上任意弦的中点的位置可知:当中点位于小圆内部时,弦长符合大于 L 的要求。因为小圆的面积是大圆面积的1/4。所以,概率也为 P =1/4。
以上3种方法听起来都很有道理,但得出3种不同的结果,这是怎么回事呢?
按照传统解释,关键在于“随机”选择弦的方法。方法不同,“等概率假设”的应用区间也不一样。方法1假定端点在圆周上均匀分布(即等概率);方法2假定弦的中点在直径上均匀分布;方法3则假定弦的中点在圆内均匀分布。图1-3-3给出了3种解法中弦的中点在圆内的分布情形。图1-3-4则是用3种方法直接画出弦,以比较弦在圆内的分布情形。也可以说,贝特朗悖论不是悖论,只是问题中没有明确规定随机选择的方法,方法一旦定好了,问题自然也就有了确定的答案。
图1-3-3 弦的“中点”在3种方法中的分布情况
(a)方法1;(b)方法2;(c)方法3
图1-3-4 “弦”在3种方法中的分布情况
(a)方法1;(b)方法2;(c)方法3
概率论中的悖论很多,基于经验的直觉判断很多时候往往并不靠谱。下一节将要介绍的本福特定律,也是一条初看起来有些奇怪、不合直觉的定律,不过这条定律用处很大,有时候甚至还能帮助侦破“财务造假”。