泊松(Poisson)分布更多地专用于研究单位时间、单位人群、单位空间内,某罕见事件发生次数的分布,该分布由法国数学家SD POISSON(1781-1840)首先提出而得名。如某种细菌在单位容积空气中出现的情况,某段时间特定人群中某种恶性肿瘤患者的分布,放射性物质在单位时间内的放射次数,单位空间某种昆虫数的分布等。泊松分布有以下性质:
(1)总体均数等于总体方差。
(2)可加性。如果X 1 ,X 2 ,…,X k 相互独立,且它们分别服从参数为λ 1 ,λ 2 ,…,λ k 的泊松分布,则T=X 1 +X 2 +…+X k 也服从泊松分布,且参数λ=λ 1 +λ 2 +…+λ k 。
(3)正态分布近似性。λ无限大时,泊松分布趋近于正态分布N(λ,λ)。
(4)二项分布近似性。在p很小,样本含量n趋向于无穷大时,二项分布趋近于泊松分布。
在分析了泊松分布的特点后,我们来计算泊松分布的概率大小。
不妨记单位时间内某事件发生的次数为X,若它服从泊松分布,那么单位时间内事件发生次数为x的概率为
这也称做泊松分布的密度概率函数。其中,X的取值为整数x,e=2.718为自然对数的底。λ为均数,是泊松分布的唯一参数,因此常将泊松分布记为X~P(λ)。
由式6-3可以推出,单位时间内事件发生次数不超过x的概率是:
式(6-4)也称泊松分布的累积概率函数。
利用Excel 2013自带统计函数“POISSON”则可以准确地计算出给定参数条件下泊松分布的概率值,其格式公式为POISSON(x,λ,cumulative)
其中,x 为事件发生的次数,λ 为期望值,cumulative 为一个逻辑值,确定所返回的概率分布形式。如果cumulative为1,则函数POISSON返回泊松累积分布概率,即随机事件发生的次数不超过x;如果cumulative为0,则返回泊松概率密度函数,即随机事件发生的次数恰好为x。
实验6-3:已知某医院单位时间内前来就诊的病人数服从参数为30的泊松分布,那么这段时间内就诊病人人数为40的概率是多少?原始数据文件如图6-7所示。
实验的分析过程和具体步骤如下:
如图6-7所示,就诊病人人数为40,即x=40,在单元格A3中输入40;参数为30,即λ=30;求单位时间内就诊病人人数是40的概率,即求概率密度值,所以cumulative=0。然后,在单元格C2中输入“=POISSON(A2,B2,0)”,其中A2,B2,0分别代表x,λ,cumulative的值,按下Enter键便可得到如图6-8所示的计算结果,即给定参数下,就诊病人人数为40的概率值。
图6-7 实验6-3的原始数据
图6-8 实验6-3完成计算后的数据文件
图6-8的表格中单元格C3中的值0.013943就是就诊人数为40的概率值。
在分析和研究泊松分布时,与二项分布类似,为了更直观地展现出泊松分布的特点,我们经常绘制泊松分布的概率分布图。Excel 2013中提供了非常强大的泊松分布绘图功能,绘图方法也是多种多样。
实验6-4:绘制P(λ)的概率分布图,其中λ=5。原始数据文件如图6-9所示。
实验的分析过程和具体步骤如下:
(1)先计算x取遍0~20时分别对应的概率值。如图6-9所示,在单元格A2~A22中依次输入0~20,在单元格B2~B22中都输入5,求概率密度值,所以cumulative=0。在单元格C2中输入“=POISSON(A2,B2,0)”,其中A2,B2,0分别代表x,λ,cumulative的值,按下Enter键,然后选中单元格C2,向下拖动公式至单元格C22,得到如图6-10所示的计算结果。
图6-9 实验6-4的原始数据
图6-10 实验6-4完成
(2)同时选中区域A1:A22和区域C1:C22,然后选择“插入”选项卡,执行“图表”组内的“散点图”下的“仅带数据标记的散点图”命令,得到如图6-11所示的P(λ)的概率分布图。
图6-11 实验6-4完成的P(λ)概率分布图