除必然事件与不可能事件外,任一随机事件在未来的一次试验中都有可能发生,也有可能不发生.人们常常更加关心某一事件发生或不发生的可能性有多大,因为这个数字往往非常重要.例如,一粒种子发芽的可能性的大小即种子的发芽率,一件产品是次品可能性的大小即产品的次品率等,都是这样的数字.那么人们如何计算出这样的数字呢?很早以前,人们通过观察发现:事件在一次试验中发生的可能性的大小与这一事件在过去若干次试验中发生的频繁程度有莫大的关系.为此,我们首先引入频率的概念,用以描述事件在已知的试验中发生的频繁程度,进而再给出表示事件在一次试验中发生的可能性大小——概率.
在 n 次重复试验中,如果件 A 发生了 m 次,则 称为事件 A 发生的 频率 (frequency).同样若事件 B 发生了 k 次,则 为事件 B 发生的频率果 A 是必然事件,有 m = n ,即必然事件的频率是 1.反之,不可能的频率为 0.如果 AB 互不相容,则事件 A ∪ B 的频率为 ,它恰好等于两个事件的率之和,这称为频率的加性.
频率是否能够确切地描述事件发生的可能性大小呢?经验告诉我们多次重复同一试验,随机事件的频率具有稳定性.随着试验次数 n 的增加,事件 A 的频率 会逐渐稳定于某个常数附近,而发生较大偏离的可能性很小.这种频率的稳定性就是定义概率的经验基础.这就是说频率不能确切地描述事件发生的可能性大小,但频率的稳定值可以描述.
为了说明频率稳定性,先来看一些著名的例子.
例 1.6 抛掷一枚硬币,可能出现正面也可能出现反面,事先做出确定的判断是不可能的,但假如硬币是均匀的,那么我们有理由认为出现正面和反面的可能性应该一样,即在大量试验中出现正面和反面的频率都接近于 0.5,为了验证这一点,历史上曾有不少人做过试验,如表 1.2.
表 1.2 历史上的掷硬币试验统计表
从表 1.2 的数据可以看出:当抛掷次数较小时,频率的随机波动较大;随着抛掷次数的增大,频率呈现出稳定性;即当 n 逐渐增大时,频率总是在 0.5 附近摆动而逐渐稳定于 0.5.
例 1.7 对于新生婴儿的性别情况,很多人做了大量的统计.法国数学家拉普拉斯在《概率论哲学探讨》一文中指出,法国男婴出生率为 .1935年,瑞典数学家克拉美统计出瑞典的男婴出生率为 0.518.我国的几次人口普查,得到类似的结论,男婴与女婴的比率为 1.04∶ 1.这个例子指出,对于同一现象,不同时期、不同国家及不同的调查人得到的几个非常接近的数字表明:随机现象具有一定的规律性.
例 1.6 和例 1.7 的数据表明,随机现象有其偶然性的一面,也有其必然性的一面.这种必然性表现为大量试验中随机事件出现的频率的稳定性,即一个事件出现的频率常在某个固定的常数附近摆动,这种稳定性我们称为统计规律性.频率的稳定性说明随机事件发生的可能性大小是随机事件本身固有的,不随人们意志改变的一种客观属性,因此可以对它进行度量.
定义 1.3(概率的统计定义)在一定的条件下,事件 A 在 n 次重复试验中发生了 m 次,当 n 很大时,事件 A 发生的频率 m / n 稳定地在某一常数 p 的附近摆动,且一般说来, n 越大,发生较大摆动的可能性越来越小,则称这个常数 p 为事件 A 的概率,记作 P ( A ).
数值 P ( A )就是一次试验中事件 A 发生的可能性大小的数量描述,它指出了事件概率的存在性,但并不能用这个定义计算事件的概率.实际中,人们常常采取大量试验的频率或用一系列频率的平均值作为事件的概率的近似值.这样定义的概率并不严格,而只是描述了一个大数定律,这是概率论中极限理论的雏形,它的严格讨论将放在本书的第 5 章给出.
古典方法是对被考察事件发生的可能性进行逻辑分析后得出该事件的概率,这种方法简单、直观、不需做试验,但只能在一类特定的随机现象中使用.这类试验的特点为:
①每次试验样本空间 Ω 中只有有限个样本点;
②每次试验中,各基本事件出现的可能性完全相同.
具有这两个特点的试验称为 古典概型试验 ,简称为 古典概型 .
在古典概型中,如果总共有 n 个可能的试验结果,因此每个基本事件发生的概率为 .若事件 A 包含有 m 个基本事件,则事件 A 发生的概率为 .
定义 1.4 若试验结果一共由 n 个基本事件 A 1 , A 2 ,…, A n 组成,并且这些事件的出现具有相同的可能性,而事件 A 由其中某 m 个基本事件组成,则事件 A 的概率可以用下式计算:
例 1.8掷一次骰子的试验,基本事件有6个,因此每个基本事件的概率为 ,则 P {出现偶数点 , P {出现的点数小于5 .
古典概型在生活中有着广泛的应用,产品抽样检查就是其中之一.
例 1.9 为了检验某厂生产的产品质量,从该厂生产的产品中随机抽取 1 000 件产品进行检验,经检验发现有 5 件次品,若 A 表示产品是次品,则基本事件有 1 000 个, A 所包含的样本点数有 5 个,则可以认为该厂生产的产品的次品率为 0.005.
例 1.10 两封信随机地向 4 个邮筒投寄,求第二个邮筒恰好投入 1 封信的概率及前两个邮筒中各有一封信的概率.
解 设事件 A = {第二个邮筒恰有一封信},事件 B = {前两个邮筒中各有一封信}.两封信投入 4 个邮筒共有 4 × 4 种投法,事件 A 有 2 × 3 种投法,事件 B 只有 2 种投法.因此
例 1.11 一批产品共 100 个,废品有 2 个,求:
①这批产品的废品率;
②任取 3 个恰有一个是废品的概率;
③任取 3 个全不是废品的概率.
解 设 P ( A 1 ), P ( A 2 ), P ( A 3 )分别表示①,②,③中所求概率,则
例 1.12 一个宿舍中住有 6 位同学,计算下列事件的概率:
①6 人的生日各不相同(设 1 年有 365 天);
②6 人中恰有 4 人生日在 10 月份.
解 设 A 表示“6 个人的生日各不相同”的事件, B 表示“6 人中恰有 4 人生日在 10 月份”的事件,则
在古典概型中利用等可能性的概念,成功地计算了某一类问题的概率.但是古典概型要求基本事件的总数必须是有限的,而实际生活中有很多问题具有某种等可能性但却有无限多的结果.对于这类现象,一般可用几何方法来求解.
假设某试验具有以下特点:
①样本空间 Ω 是一个几何区域,这个区域的大小可以度量(如长度、面积、体积等),并把 Ω 的度量记作 m ( Ω ).
②向区域 Ω 内任意投掷一个点,落在区域内任意一个点处都是“等可能的”,或者设落在 Ω 中的区域 A 内的可能性与 A 的度量 m ( A )成正比,与 A 的位置和形状无关,则称此试验为 几 何概型.
不妨也用 A 表示“掷点落在区域 A 内”的事件,那么事件 A 的概率可用下列公式计算
例 1.13 两个人相约6 点到7 点到某地会面,先到者要等候另一人20 min,过时就可以离去,试求这俩人能会面的概率.
解 设 x , y 分别表示这两个人到达的时刻,则两人能够会面可以表示为
这是一个几何概型的问题,所有可能的结果是边长为 1 的正方形里的点,能会面的点的区域如图 1.7 的阴影部分,则所求概率为 .
图 1.7
由于概率的统计定义和古典定义的应用范围的局限性,作为概率论的数学定义来建立概率论是不完整的.从概率的统计定义和古典定义可知,一个事件的概率具有下面的基本性质:
①对任何事件 A ,有 0≤ P ( A )≤1;
② P ( Ω )= 1;
③若事件 A 1 , A 2 ,…, A n 为两两互不相容事件,则有 .
通过抽象概括概率统计定义和古典定义的共性,给出概率的公理化定义,作为概率的数学理论基础.
定义 1.5 在一随机现象中,用来表示任一随机事件 A 发生可能性大小的实数称为该事件的概率(probability),记为 P ( A ),并规定:
公理 1(非负性) 对于任意事件 A ,必有 0≤ P ( A )≤1;
公理 2(规范性) 必然事件的概率为 P ( Ω )= 1;
公理 3(可数可加性) 若 A 1 , A 2 ,…, A n ,…是互不相容的事件,则有
这一定义刻画了概率的本质,称为公理化定义.在这个定义出现之前曾有过概率的古典定义、统计定义,它们各适合一类随机现象.那么适合一切随机现象的概率的最一般定义应如何给出呢?很多人思索过这个问题.1900 年,大数学家戴维·希尔伯特(David Hilbert)在巴黎第二届国际数学家大会上公开提出要建立概率的公理化体系,即从概率的少数特性来刻画概率的概念.直到 1933 年,苏联数学家柯莫哥洛夫在他的《概率论基本概念》一书中首次提出概率的公理化定义.这个定义概括了历史上几种概率定义中的共同特性,又避免了各自的局限性和含混之处,不管什么随机现象,只有满足定义中的三条公理才能说它是概率.这一公理化体系的出现迅速获得了举世公认,为现代概率论的发展打下了坚实基础,从此数学界才承认概率论是数学的一个分支.有了这个公理化体系后,概率论得到迅速发展,这个公理化体系是概率论发展史上的一个里程碑.
由概率的公理化定义可以推出概率的一些性质.
性质 1 P (φ)= 0.
证 令 A n = φ( n = 1,2,…),
则
由概率的可数可加性得
而由 P (φ)≥0 及上式知 P (φ)= 0.
这个性质说明,不可能事件的概率为 0.但其逆命题不一定成立,我们将在第 2 章中加以说明.
性质 2(有限可加性) 若 A 1 , A 2 ,…, A n 为两两互不相容事件,则有
证 令 A n + 1 = A n + 2 = …= φ,则 A i A j = φ.当 i ≠ j , i , j = 1,2,…时,由可数可加性,得
性质 3 设 A , B 是两个事件,若 A ⊂ B ,则有
证 由 A ⊂ B ,知 B = A ∪( B - A ),且 A ∩( B - A ) = φ.
再由概率的有限可加性有
即 P ( B - A ) = P ( B ) - P ( A );
又由 P ( B - A )≥0,得 P ( A )≤ P ( B ).
性质 4 对任一事件 A , P ( A )≤1.
证 因为 A ⊂ Ω ,由性质 3 得 P ( A )≤ P ( Ω )= 1.
性质 5 对于任一事件 A ,有
证 因为 ,
由有限可加性,得
即
性质 6( 加法公式 ) 对于任意两个事件 A , B 有
证 因为 A ∪ B = A ∪( B - AB ),且 A ∩( B - AB ) = φ.
由性质 2,3 得
P ( A ∪ B ) = P ( A ∪ ( B - AB )) = P ( A ) + P ( B - AB ) = P ( A ) + P ( B ) - P ( AB ).
性质 6 还可推广到三个事件的情形.例如,设 A 1 , A 2 , A 3 为任意三个事件,则有
P ( A 1 ∪ A 2 ∪ A 3 )= P ( A 1 )+ P ( A 2 )+ P ( A 3 )- P ( A 1 A 2 )- P ( A 1 A 3 )- P ( A 2 A 3 )+ P ( A 1 A 2 A 3 ).
一般地,设 A 1 , A 2 ,…, A n 为任意 n 个事件,可由归纳法证得
例 1.14 掷 3 次硬币,求至少一次正面朝上的概率.
解 假设 A = {至少一次正面},则 = {全是反面},只包含一个样本点,基本事件总数为2 3 .因此, .
例 1.15 每个路口有红、绿、黄三色指示灯,假设各色灯的开闭是等可能的.一个人骑车经过三个路口,试求下列事件的概率: A = “三个都是红灯”= “全红”; B = “全绿”; C = “全黄”; D = “无红”; E = “无绿”; F = “三次颜色相同”; G = “颜色全不相同”; H = “颜色不全相同”.
解
例 1.16 设一批产品共 100 件,其中 98 件正品,2 件次品,从中任意抽取 3 件考虑两种取件方式:
(a)第一次取一个,观察后放回,搅匀后再取一个.这种称为有放回抽取.
(b)第一次取一个不放回,第二次从剩余的产品中再取一个.这种称为不放回抽取.
试分别就上面两种情形求:
①取出的 3 件中恰有 1 件是次品的概率.
②取出的 3 件中至少有 1 件是次品的概率.
解 设 A 表示“取出的 3 件中恰有 1 件是次品”,设 B 表示“取出的 3 件中至少有 1 件是次品”,
在条件(a)下:
在条件(b)下: