Excel统计分析与应用（第3版）最新章节_刘志红著

6.1 二项分布

有一些随机事件是只具有两种互斥结果的离散型随机事件，如对病人治疗结果的有效与无效，某种化验结果的阳性与阴性，接触某传染源的感染与未感染等。二项分布（binomial distribution）就是对这类只具有两种互斥结果的离散型随机事件的规律性进行描述的一种概率分布。一般来说，符合二项分布的数据有以下特点：

（1）每次试验观察个体的结果只有两种可能，且相互排斥（A或非A）。

（2）每次试验观察个体的条件保持不变。即每次观察个体发生A的概率保持不变，均为常数p。

（3）每次试验观察个体间相互独立。即观察个体将出现的结果与其他个体出现的结果无关。

6.1.1 计算二项分布的概率

在分析了二项分布的特点后，我们来计算二项分布的概率大小。

不妨设在一项试验当中，试验的结果为A或非A，即试验结果服从二项分布。记试验结果为A的概率是p，结果为非A的概率则为1-p，那么，从总体中随机抽取n次独立试验，其中有x次试验结果为A的概率是：

x x−p n−p= =P (X x) x(1 ) n ，X=0,1,…,x，…,n （6-1）

其中。

式（6-1）也称二项分布的概率函数，并且称相应的随机变量X服从二项分布，记为X～B(n,p)。二项分布概率函数有两个参数，一个是总体概率p，另一个是试验次数n。

另外，由式（6-1）可以推出，n次试验至多有x次独立试验结果为A的概率是：

=0i∑=P（X≤x）x n x pi −p− n i(1 ) ，X=0,1,…,x …,n （6-2）

式（6-2）也称二项分布的累积概率函数。

6.1.2 使用二项分布函数

利用Excel 2013自带统计函数“BINOMDIST”，则可以准确地计算出给定参数条件下二项分布的概率值，其格式公式为

BINOMDIST(x，n，p，cumulative)

其中，x为试验成功的次数，n为独立试验的次数，p为每次试验中成功的概率，cumulative为一个逻辑值，决定函数的形式。如果cumulative为1，则函数BINOMDIST返回累积分布函数，即至多x次成功的概率；如果cumulative为0，则返回概率密度函数，即x次成功的概率。

实验6-1：现生产一批产品，已知产品的次品率是2%，那么随机抽取500件产品，其中有5件是次品的概率是多少？至多有10件是次品的概率是多少？原始数据文件如图6-1所示。

实验的分析过程和具体步骤如下：

（1）如图6-1所示，第一问当中，有5件是次品，即试验结果为次品的次数x=5，在单元格A3中输入5；随机抽取500件产品，即独立试验次数n=500，在单元格B3中输入500；次品率是2%，即试验结果为次品的概率p=0.02，在单元格C3中输入0.02；求试验结果为次品的次数是5的概率，即求概率密度值，所以cumulative=0，在单元格D3中输入0。然后，在单元格E3中输入“=BINOMDIST（A3，B3，C3，D3）”，其中A3，B3，C3，D3分别代表x，n，p，cumulative的值，按下Enter键便可得到如图6-2所示的计算结果，即给定参数下，有5件次品的概率值。

（2）同样，如图6-1所示，第二问当中，至多有10件是次品，即试验结果至多为次品的次数x=10，在单元格A4中输入10；随机抽取500件产品，即独立试验次数n=500，在单元格B4中输入500；次品率是2%，即试验结果为次品的概率p=0.02，在单元格C4中输入0.02；求试验结果至多有10次为次品的概率，即求累积分布值，所以 cumulative=1，在单元格D3中输入1。然后，在单元格E4中输入“=BINOMDIST（A4，B4，C4，D4）”，其中A4，B4，C4，D4分别代表x，n，p，cumulative的值，按下Enter键便可得到如图6-2所示的计算结果，即给定参数下，至多有10件是次品的概率。

图6-1 实验6-1的原始数据

图6-2 实验6-1完成计算后的数据文件

图6-2的表格中单元格E3中的值0.037069281就是500件产品中有5件次品的概率值；单元格E4中的值0.583044006就是500件产品中次品数不超过10件的概率值。

6.1.3 二项分布的概率分布图与累积概率分布图的绘制

在分析和研究二项分布时，仅仅计算出二项分布的概率值是远远不够的，为了更直观地展现出二项分布的特点，我们经常会绘制二项分布的概率分布图和累积概率分布图。Excel 2013中提供了非常强大的二项分布绘图功能，绘图方法也是多种多样。

实验6-2：绘制B(n,p)的概率分布图与累积概率分布图，其中n=20，p=0.3。原始数据文件如图6-3所示。

实验的分析过程和具体步骤如下：

（1）先计算x取遍0～20时分别对应的概率值和累计概率值。如图6-3所示，在单元格A2～A22中依次输入0～20，在B2～B22中都输入20，在C2～C22中都输入0.3，先求概率密度值，所以cumulative=0，在单元格D2中输入“=BINOMDIST（A2，B2，C2，0）”，其中A2，B2，C2，0分别代表x，n，p，cumulative的值，按下Enter键，然后选中单元格D2，向下拖动公式至单元格D22。同样，再求累积概率值，所以cumulative=1，在单元格E2中输入“BINOMDIST（A2，B2，C2，1）”，其中A2，B2，C2，1分别代表x，n，p，cumulative的值，按下Enter键，然后选中单元格E2，向下拖动公式至单元格E22，得到如图6-4所示的计算结果。

图6-3 实验

图6-4 实验

（2）同时选中区域A1:A22和区域D1:D22，然后选择“插入”选项卡，执行“图表”组内的“散点图”下的“仅带数据标记的散点图”命令，得到如图6-5所示的B(n,p)的概率分布图。

图6-5 实验6-2完成的B(n,p)的

（3）同样，同时选中区域A1:A22和区域E1:E22，然后选择“插入”选项卡，执行“图表”组内的“散点图”下的“仅带数据标记的散点图”命令，得到如图6-6所示的B(n,p)的累积概率分布图。

图6-6 实验6-2完成的B(n,p)的