除必然事件与不可能事件外,任何一个事件在一次试验中都有可能发生,也有可能不发生.人们常常希望了解某些事件在一次试验中发生的可能性大小.例如,管理者在制订决策时常基于以下分析:
①因价格提高而导致销售量下降的“可能性”有多大?
②引入新的装配方法提高生产率的“可能性”有多大?
③某项投资获利的“可能性”有多大?
概率是表示事件在一次试验中发生的可能性大小的数,在进行推断时起着非常重要的作用.
如何计算事件的概率,历史上很多数学家进行了一系列研究,并逐步改进和完善.计算概率的主要方法有古典概率法、相对频率法、主观概率法、统计定义法、公理化定义法等.无论哪种方法,都必须满足概率的两个基本条件:
①每个事件发生的概率都介于 0 和 1 之间,样本空间 S 发生的概率为 1.
②所有试验结果的概率之和必须等于 1.
在本节,首先引入频率的概念,它描述了事件发生的频繁程度.通过频率的稳定性特征得到概率的统计定义,最后给出概率的公理化定义.
定义 2.2.1 设在相同的条件下,进行了 n 次试验.若事件 A 在 n 次试验中发生了 k 次,则比值 k / n 称为事件 A 在这 n 次试验中发生的 频率 (Frequency),记为 f n ( A ) = k / n.
相对频率法适用于可以大量重复并能够取得各种试验结果发生频率的场合.
例 2.2.1 在例2.1.1 中,有关消费者年龄和年薪的双向表数据见表2.3,试用相对频率法计算得到各个事件的概率.
用同样的方法可得其他对应事件的概率,具体结果见表 2.4.
表 2.4
续表
由定义 2.2.1 容易推知,频率具有以下性质:
①对任一事件 A ,有 0 ≤ f n ( A ) ≤ 1.
②对必然事件 S ,有 f n ( S ) = 1.
③若事件 A 和 B 互不相容,则
一般地,若 m 个事件 A 1 , A 2 ,…, A m 两两互不相容,则
事件 A 发生的频率 f n ( A )表示事件 A 发生的频繁程度.频率越大,事件 A 发生就越频繁,在一次试验中发生的可能性也就越大,反之亦然.因而,直观的想法是用频率 f n ( A )表示事件 A 在一次试验中发生的可能性大小.但是,由于试验的随机性,即使同样进行 n 次试验, f n ( A )的值也不一定相同.大量的试验证实,随着重复试验次数 n 的增加,频率 f n ( A )会逐渐稳定于某个常数附近,而偏离的可能性很小.频率具有“稳定性”这一事实,说明了刻画事件 A 发生可能性大小的数——概率具有一定的客观存在性(严格来说,这是一个理想的假设,实际上并不能绝对保证在每次试验时条件都完全一样).
为研究频率的稳定性,德·摩根(De Morgan)、蒲丰(Buffon)和皮尔逊(Pearson)曾进行过大量掷硬币试验,所得结果见表 1.1,硬币出现正面的频率总在 0.5 附近摆动.随着试验次数的增加,它逐渐稳定于 0.5,这个 0.5 反映正面出现的可能性大小.每个事件都存在一个这样的常数与之对应,将频率 f n ( A )在 n 无限增大时逐渐趋向稳定的这个常数定义为事件 A 发生的概率,这就是概率的统计定义.
定义 2.2.2 设事件 A 在 n 次重复试验中发生的次数为 n A ,随着重复实验次数 n 的增加,频率值 逐渐稳定到一个实数 p ,这个实数称为事件 A 发生的概率,记为 P ( A ) = p.
要注意的是,上述定义是对事件A发生可能性大小的数量描述,它指出了事件的概率是客观存在的,但是并没有提供确切计算概率的方法.在实际中,不可能对每一个事件都做大量的试验,且不知道 n 取多大才行;如果 n 取很大,不一定能保证每次试验的条件都完全相同.而且也没有理由认为,当试验次数分别为 n + 1 和 n 时,频率 f n+ 1( A )总比频率 f n ( A )更准确、更逼近所求的概率.
由相对频率的性质,可得统计定义中的概率具有以下性质:
①对任意一个事件 A ,有 0 ≤ P ( A ) ≤ 1.
②设 S 为必然事件,则 P ( S ) = 1.
③若 m 个事件 A 1 , A 2 ,…, A m 两两互不相容,则
为理论研究需要,从频率的稳定性和统计定义中概率的性质得到启发,给出概率的公理化定义.
定义 2.2.3 设 S 为样本空间, A 为事件,对每一个事件 A 赋予一个实数,记为 P ( A ).如果 P ( A )满足以下条件:
①(非负性) P ( A ) ≥0.
②(规范性) P ( S ) = 1.
③(可列可加性)对两两互不相容的可列无穷多个事件 A 1 , A 2 ,…, A n ,有
则称实数 P ( A )为事件 A 的 概率 (Probability).
在第 5 章中将证明,当 n → + ∞时,频率 f n ( A )在一定意义下趋近于概率 P ( A ).基于这一事实,有理由用概率 P ( A )来表示事件 A 在一次试验中发生的可能性大小.这里事件的频率与概率有本质区别,频率是具有随机波动性的变数,而概率是常数.而且当试验的次数 n 很大时,频率可作为概率的近似值.
由概率的公理化定义,可推出概率的以下性质:
① P (⌀) = 0.
这个性质说明,不可能事件的概率为 0,但逆命题不一定成立.
②(有限可加性)若 A 1 , A 2 ,…, A n 为两两互不相容事件,则有
③(减法公式) P ( B - A ) = P ( B - AB ) = P ( B ) - P ( AB ).(2.2.3)
推论 设 A 和 B 是两个事件,若 A ⊂ B ,则有
④(逆概率公式)对任一事件 A ,有
在许多问题中,某事件的概率不容易计算时,常用逆概率公式.
⑤(加法公式)对任意两个事件 A 和 B ,有
加法公式可通过韦恩图(图 2.1)来理解.加法公式可推广到多个事件的情形.设 A 1 , A 2 , A 3 为任意 3 个事件,则有
一般地,设 A 1 , A 2 ,…, A n 为任意 n 个事件,可由归纳法证得
例 2.2.2 ( 入院病人分析 ) 某医院的记录表明:12%的病人接受了外科治疗,14%的病人接受了妇产科治疗,1%的病人同时接受了两种治疗.现有一个新的病人进入医院.
(1)她接受外科治疗或者妇产科治疗,或同时接受两种治疗的概率是多少?
(2)她只接受外科治疗但是不接受妇产科治疗的概率是多少?
(3)她既不接受外科治疗也不接受妇产科治疗的概率是多少?
解 A = {病人接受外科治疗}, B = {病人接受妇产科治疗},则
(1){病人接受外科或妇产科治疗、或同时接受两种治疗} = A ∪ B ,
(2){病人只接受外科治疗但是不接受妇产科治疗} = A - B ,
(3){病人既不接受外科治疗也不接受妇产科治疗} = ,
例 2.2.3 假设以下事件, A 和 B 的概率分别为 P ( A ) = 27%, P ( B ) = 29%,且 P ( A ∩ B ) = 10%,计算 P ( ), P ( A ∪ B ), P ( A - B )和 P ( B - A ).
定义 2.2.4 若随机试验E满足以下两个条件:
①(有限性)样本空间S中的样本点(基本事件)总数有限, S = { e 1 , e 2 ,…, e n }.
②(等可能性)每次试验中各个基本事件发生的可能性相同,
则称这样的试验为古典概型(或等可能概型).
由定义可知,基本事件{ e 1 },{ e 2 },…,{ e n }两两互不相容,有
因每个基本事件发生的可能性相同,故有
设事件 A 中包含 n A 个基本事件,则有
称古典概型中事件 A 发生的概率为古典概率.当样本空间的元素较多时,一般不再将样本空间 S 中的元素一一列出,只需分别求出 S 和 A 中所包含的元素个数(即基本事件个数),再由式(2.2.7)求出事件 A 的概率.通常可利用排列、组合及乘法原理、加法原理的知识计算 n A 和 n ,进而求得相应的概率.以下简单介绍计数原理、排列和组合的基本知识.
①(非重复的选排列)从 n 个不同元素中,每次取出 k 个不同的元素,按一定的顺序排成一列称为选排列,选排列的种数记为
②(可重复的排列)从 n 个不同的元素中每次取出一个元素后放回,共取 k ( k < n )次,则 k 个元素排成一列的所有可能排法为 n k .
③(组合)从 n 个不同的元素中任取 k ( k ≤ n )个元素,不管其顺序合成一组,所有可能取法用 表示,且 .
④(加法原理)完成某件事情有 n 类方法(各类方法彼此独立),在第一类方法中有 m 1 种方法,在第二类方法中有 m 2 种方法,以此类推,在第n类方法中有 m n 种方法,则完成这件事共有 N = m 1 + m 2 + … + m n 种不同的方法.
⑤(乘法原理)完成某件事情需要先后分成 n 个步骤,做第一步有 m 1 种方法,第二步有 m 2 种方法,以此类推,第n步有 m n 种方法,则完成这件事共有 N = m 1 × m 2 × … × m n 种不同的方法,特点是各个步骤逐步完成.
例 2.2.4 箱中装有 a 只白球, b 只黑球,现作不放回抽取,每次一只.求第 k 次恰取到白球的概率.
解 基本事件总数为 .第 k 次必取到白球,可为 a 只白球中任一只,有 种不同的取法,其余被抽取的 k - 1 只球可以是其余 a + b - 1 只球中的任意 k - 1 只,共有 种不同的取法.由乘法原理,第 k 次恰取到白球的取法有 种,所求概率为
值得注意的是, p 与 k 无关,也就是说其中任一次抽球,抽到白球的概率都等于 ,跟第一次抽到白球的概率相同,而跟抽球的先后次序无关(如购买福利彩票时,尽管购买的先后次序不同,但各人得奖的机会是一样的).
例 2.2.5 有 n 个人,每个人都以同样的概率 1 / N 被分配在 N ( n < N )间房中的任何一间,求恰好有 n 个房间,每个房间各住一人的概率.
解 每个人有 N 种分法,这是可重复排列问题, n 个人共有 N n 种不同分法.每个房间各住一人,这是非重复的选排列问题,选排列的种数为 .所求概率为
许多直观背景不相同的实际问题,都和本例有相同的数学模型,如生日问题.假设每人的生日在一年 365 天中的任一天是等可能的,那么随机选取 n ( n ≤ 365)个人,他们的生日各不相同的概率为
n个人中至少有两个人生日相同的概率为
上述古典概型的计算,只适用于具有等可能性的有限样本空间.若试验结果无穷多,显然不适合.为克服样本空间有限的局限性,将古典概型加以推广.首先看一个约会问题.
例 2.2.6 两人相约在某天下午 2:00—3:00 在预定地方见面,先到者要等候 20 min,过时则离去.如果每个人在指定的 1 h内任一时刻到达是等可能的,求约会的两人能够见面的概率.
解 设 x , y 为两人到达预定地点的时刻,那么两人到达时间的一切可能结果落在边长为 60(单位:min)的正方形内,这个正方形就是样本空间 S. 两人能会面的充要条件是 ,即
令事件 A 表示“两人能会到面”,区域如图 2.5 所示.
图 2.5
例 2.2.6 属于几何概型的问题,具有一般性.假设试验具有以下特点:
①样本空间 S 是一个几何区域,这个区域大小可以度量(如长度、面积、体积等),并把 S 的度量记为 m ( S ).
②向区域 S 内任意投掷一个点,落在区域内任一个点处都是“等可能的”,或者假设“落在 S 中的任何区域 A 内的可能性与 A 的度量 m ( A )成正比,与 A 的位置和形状无关”.
不妨也用 A 表示事件“投掷点落在区域 A 内”,那么事件 A 的概率可用公式
计算,称它为 几何概型 .