定义 2.2 设 X 是离散型随机变量,它所有可能取的值为 x i ( i = 1,2,3,…), X 取各个可能值的概率为
称上式为 随机变量 X 的分布律 (law of probability distribution)或 X 的概率分布 ,简称 分布 .
分布律也可用表格的形式来表示,见表 2.1.
表2.1
容易验证,分布律满足以下性质
① p i ≥0( i = 1,2,…).
② .
反之,任何一个满足上述两个性质的一组数{ p i }一定是某一离散型随机变量的分布律.
例 2.3 在汽车经过的路上有 4 个交叉路口,设在每个交叉路口碰到红灯的概率都是 p ,且设各路口信号灯的工作是相互独立的.求汽车首次停下时,已通过的交叉路口个数的分布律.
解 设 X = “汽车首次停下时已通过的交叉路口的个数”,则 X 所有可能的取值为 0,1,2,3,4;事件{ X = k }( k = 0,1,2,3),表示前 k 个路口都是绿灯,而第 k + 1 个路口是红灯,其概率为(1 - p ) k p ;事件{ X = 4}表示所有 4 个路口都是绿灯,其概率为(1 - p ) 4 .于是, X 的分布律如表 2.2 所示.
表 2.2
或写成
例 2.4 一袋中有 5 个乒乓球,编号分别为 1,2,3,4,5.从中任取 3 个,以 X 表示取出的 3个球中的最大号码.
①求 X 的分布律;
②求 P ( X ≤4)的概率.
解 ①本题的试验为古典概型,基本事件总数为 = 10, X 可能取的值为 3,4,5,则
所以, X 的分布律见表 2.3.
② P { X ≤4} .
下面我们来介绍几种常见的离散型随机变量及其分布.
若随机变量 X 只取 0 与 1,其概率分布为
则称 X 服从 参数为 p 的 0—1 分布 .0—1 分布的分布律也可用表格的形式表示,见表 2.4.
表 2.4
例 2.5 100 件产品中有 95 件正品,5 件次品,从中随机取一件,求抽样结果的概率分布.
解 令
则有
即 X 服从参数为 0.95 的 0—1 分布.
定义 2.3 若随机变量 X 的分布律为
则称 X 服从 参数为 n , p 的二项分布 (binomial distribution),记为 X ~ B ( n , p ).
易知,二项分布满足随机变量 X 的分布律的两个性质式 . P { X = k }≥0( k = 0,1,2,…, n )是显然的,由二项展开式可知
而 恰好是二项式[ p + (1 - p )] n 的展开式中出现 p k 的一项.
特别,当 n = 1 时,二项分布即为
因此,此时 0—1 分布就是二项分布在 n = 1 的特殊情况.
例 2.6 设某射手每次射击的命中率为 0.6,现在连续射击 6 次,求击中目标次数的概率分布.又设至少命中 2 次才可以参加下一步的考核,求此射击手能参加考核的概率.
解 设 X 表示击中目标的次数,那么 X ~ B (6,0.6),所以
又因为“此射手能参加考核”等价于事件{ X ≥2},所以此射手能参加考核的概率为
例 2.7( 工作效率问题 ) 某公司研发楼有 4 层,每层有电脑 20 台,发生故障的概率都是0.01.考虑两种方案配备电脑维护人员:其一是由 4 人维护,每人 1 层(20 台);其二是由 3 人共同维护 80 台.试比较这两种方法在电脑发生故障时不能及时维修的概率大小?
解 第一种方案:每人维护 20 台电脑.设事件 B 表示电脑出故障, X 表示 20 台电脑中同时发生故障的台数,则
由题意可知,需求 P { X ≥2}.
设事件 A 表示电脑不能及时维修, A i 表示第 i 层的电脑不能及时维修( i = 1,2,3,4),则
即采用第一种方案电脑不能及时维修的概率为 0.065 9.
第二种方案:3 人共同维护 80 台电脑.设事件 Y 表示 80 台电脑中同时发生故障的台数.则 Y ~ B (80,0.01).从题意可知,需求 P { Y ≥4}.
即采用第二种方法电脑不能及时维修的概率降为 0.008 7.
从计算结果知,在后一种情况尽管任务重了(每人平均维护约 27 台),但工作质量不仅没有降低,反而提高了.这个例子表明概率方法可以用来讨论经济管理的某些问题,以便达到优化地使用人力、物力资源的目的.
若随机变量 X 的概率分布为
则称 X 服从 参数为 λ 的泊松 (Poisson) 分布 .
显然, P { X = k }≥0( k = 0,1,2,…),且
例 2.8 一家商场销售某一型号的电视机.由该商场过去的销售记录知道,此型号电视机每月的销售数可以用参数为 λ = 10 的泊松分布来描述.为了以 95%以上的把握保证不脱销,问商场在月底至少应进该型号电视机多少台?
解 设 X 表示商场每月销售该型号电视机的台数,且月底的进货为 t 台,则当 X ≤ t 时就不会脱销,因而按题意要求为 P { X ≤ t }≥0.95.
又因为 X ~ P (10),所以上式也可表示为 .
由于
所以满足条件的最小的 t 为 15.
由此可知,这家商场只要在月底进货 15 台该型号电视机(假定上个月无存货,否则应扣除),就可以有 95%以上的把握保证这种电视机下个月内不会脱销.
历史上泊松分布是作为二项分布的近似,于 1837 年由法国数学家泊松引入的,下面介绍这个有名的定理.
二维码 2.1
网球比赛赛制分析
定理 2.1 ( 泊松定理 ) 在 n 重伯努利试验中,设 p n (0 < p n < 1)表示事件 A 在每次试验中发生的概率,它与试验总数 n 有关,若 ,则有
证 记 λ n = np n ,则
对于固定的 k ,有
及
因此
从上面的推导过程可以看出,泊松分布是当 np n → λ ( n →∞ )时二项分布的极限分布.因此在 n 很大,而 p 较小的情况下,可以利用泊松分布来作为二项分布的近似计算.在实际计算中,一般地当 n > 20, p < 0.05 或者 n > 100, p < 0.1 时,泊松分布与二项分布的计算结果就比较近似.
例 2.9(三胞胎问题) 假如生三胞胎的概率为 10 -4 ,求在 100 000 次生育中有 0,1,2 次生三胞胎的概率?
解 设 X 表示 100 000 次生育三胞胎的次数,则 X ~ B (10 5 ,10 -4 ),即
题目中 n =100 000(很大), p = 10 -4 (很小),可利用泊松分布近似计算.由泊松定理知, λ = np =10, P { X = k } .
从表 2.5 中可以直观地看出二项分布和泊松分布计算结果的近似程度.
表 2.5
表中泊松分布的值有表可查(见本书附表 2).
例 2.10 某厂共有 300 台同类型车床,它们独立地工作,且每台发生故障的概率为 0.01.在通常情况下,一台车床的故障可由一个工人来处理,问至少要配备多少维修工,才能保证车床发生故障而不能及时维修的概率小于 0.01?
解 设 X 为“同时发生故障的车床数”,需要配备的工人数为 N ,由题意可知
所需解决的问题是确定最小的 N ,使得
由泊松定理知, λ = np = 300 × 0.01 = 3,
查泊松分布表,得 N + 1≥9,因此至少要配备 8 个维修工才能满足要求.
二维码 2.2
母鸡孵蛋问题
泊松分布是概率论中最重要的概率分布之一,可以作为描述大量试验中稀有事件出现的次数 k = 0,1,…的概率分布情况的一个数学模型.在各种服务系统中大量出现泊松分布.例如,大量产品中抽样检查时得到的不合格品数;一个集团中员工生日是元旦的人数;一页中印刷错误出现的数目;观察某电话交换台在单位时间内收到用户的呼唤次数;某公共汽车站在单位时间内来车站乘车的乘客数等均是服从泊松分布的.所以,在运筹学及管理科学中泊松分布有着广泛的应用;在工业生产中,每米布的疵点数、纺织机上的断头数、每件钢铁铸件的缺陷数等也近似地服从泊松分布.
对于随机变量,我们不仅要知道它可能取哪些值,还需要知道它在数轴上各种区间内取值的统计规律,即求随机变量落在某区间( x 1 , x 2 ]中的概率 P ( x 1 < X ≤ x 2 ).但由于 P ( x 1 < X ≤ x 2 )= P ( X ≤ x 2 )- P ( X ≤ x 1 ),由此可见研究 P ( x 1 < X ≤ x 2 )就归结为研究形如 P ( X ≤ x )的概率问题,其中 x 为任意实数.显然这个事件( X ≤ x )的概率 P ( X ≤ x )依赖于 x 的变化而变化,它是 x 的函数,我们称之为分布函数.于是引入随机变量分布函数的概念.
定义 2.4 设 X 是一个随机变量, x 为任意实数,函数
称为 随机变量 X 的分布函数 (distribution function).
对于任意实数 x 1 , x 2 ( x 1 < x 2 ),有
因此,若已知 X 的分布函数 F ( x ),我们就能知道 X 在任何一个区间( x 1 , x 2 ]上的概率,从这个意义上说,分布函数完整地描述了随机变量的统计规律性.
分布函数是定义在全体实数上的一个普通实值函数,同时分布函数也具有明确的概率意义:对任意实数 x , F ( x )在 x 点的函数值就是随机变量 X 落在区间(-∞ , x ]上的概率.
分布函数具有如下基本性质:
① F ( x )关于 x 是单调不减的函数.
②0≤ F ( x )≤1(-∞ < x < + ∞ ),且
③ F ( x )是右连续的,即对于任意实数 x 0 ,有
证 略.
反之,任何一个满足上述三条性质的单值实函数,一定是某一随机变量的分布函数.
上述三条性质是判定一个函数 F ( x )能否成为某一随机变量的分布函数的充分与必要条件.
例 2.11 设随机变量 X 的分布律见表 2.6.
表2.6
求:① X 的分布函数.
②
解 ①由分布函数的定义,得
终上所述
F ( x )的图形是一条阶梯状右连续曲线,如图 2.2 所示,点 x = -1,0,1 是函数的跳跃点,跳跃值分别为 0.2,0.3,0.5.这条曲线从左至右依次从 F ( x ) = 0 逐步上升到 F ( x ) = 1.
图 2.2
一般地,设离散型随机变量 X 的概率函数为 P { X = x i } = p i ( i = 1,2,3,…),由概率的可加性可得 X 的分布函数为
上式表示对满足 X ≤ x i 的所有 P { X = X i }求和.
显然,离散型随机变量 X 的分布函数 F ( x )是一个逐段连续函数,在每个 x = x i 处跳跃,其跳跃值为 p i ( i = 1,2,3,…).
知道了离散型随机变量 X 的分布函数 F ( x ),则其概率分布可由 F ( x )求出: