购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

实验五
假设检验

一、实验目的及要求

(一)实验目的

应用统计软件,在样本数据已获取的基础上,对总体参数进行假设检验。

(二)实验要求

(1)了解不同假设检验内容要求的不同检验统计量和检验方法。

(2)掌握Microsoft Excel中应用函数表单进行假设检验的方法和步骤。

(3)掌握Microsoft Excel中应用分析工具库进行假设检验的方法和步骤。

二、总体标准差已知,总体均值的假设检验—— Z 检验

假设检验是对总体的概率分布或分布参数做出某种声明(断言或假设),然后根据抽样得到的样本观测值,运用数理统计的分析方法,检验这种声明是否应被否定,从而决定拒绝还是不拒绝该声明的统计推断过程。

小贴士:总体标准差已知,总体均值的假设检验—— Z 检验

(一)临界值法构建函数表单

一般假设检验要完成六步工作:

第一步,提出原假设H0及备择假设H1。

第二步,选择显著性水平 α ,列示已知数据,如样本容量 n 等。

第三步,确定合适的检验统计量及抽样分布。

第四步,确定划分拒绝域的临界值。

第五步,搜集样本数据,计算检验统计量的值。

第六步,将检验统计量与拒绝域临界值对比,给出统计学和专业上的结论。统计学的结论表达为拒绝还是不拒绝原假设H0;专业性结论则要结合研究问题及数据背景等,给出拒绝或不拒绝原假设在专业问题上意味着什么。

Microsoft Excel假设检验的临界值法函数表单方法,就是将上述六个步骤在工作表上逐步实现的过程。由于函数表单的设计是要开发一个能反复使用的工具,所以一般第六步函数表单仅给出统计学意义上的结论,而经济管理学等专业意义上的结论可以依据统计学的结论并结合实际分析的经济管理等专业含义来表述。下面使用数据来说明“总体标准差已知,总体均值的假设检验”的临界值法函数表单的构建方法和步骤。

比如,统计了学生早上起床到收拾好东西去上课所需要的时间,随机选取25个人,统计时间单位为分钟,取整数值统计,样本数据如图1-5-1所示。总体的标准差已知为8分钟,能否在0.05的显著性系数下认为全部学生该类时间耗费的均值为50分钟呢?

图1-5-1 “总体标准差已知,总体均值的假设检验”样本数据

第一步,用鼠标左键单击A列的列标,选中激活整个A列。在“公式”菜单中找到“定义的名称”卡片集,点击“根据所选内容创建”卡片,打开“以选定区域的值创建名称”对话框,选中“首行”复选框后,点击“确定”按钮,将A列命名为“样本数据”。

第二步,构建函数表单框架。C2单元格输入“双侧检验”;C3单元格输入“H0:总体均值=总体均值假设值”;C4单元格输入“H1:总体均值≠总体均值假设值”;C5单元格输入“样本统计量”;C6单元格输入“样本容量”;C7单元格输入“样本均值”;C8单元格输入“用户输入”;C9单元格输入“总体标准差”;C10单元格输入“显著性水平”;C11单元格输入“总体均值假设值”;C12单元格输入“双侧结果”;C13单元格输入“抽样平均误差”;C14单元格输入“检验统计量”;C15单元格输入“检验临界值双”;C16单元格输入“双侧检验结论”;C17单元格输入“左侧检验”;C18单元格输入“H0:总体均值≥总体均值假设值”;C19单元格输入“H1:总体均值<总体均值假设值”;C20单元格输入“检验临界值左”;C21单元格输入“左侧检验结论”;C22单元格输入“右侧检验”;C23单元格输入“H0:总体均值≤总体均值假设值”;C24单元格输入“H1:总体均值>总体均值假设值”;C25单元格输入“检验临界值右”;C26单元格输入“右侧检验结论”。按住“Ctrl”键,选中C6:D6、C7:D7、C9:D9、C10:D10、C11:D11、C13:D13、C14:D14、C15:D15、C20:D20和C25:D25等十组单元格,在“公式”菜单中找到“定义的名称”卡片集,点击“根据所选内容创建”卡片,打开“以选定区域的值创建名称”对话框,选中“最左列”复选框后,点击“确定”按钮,完成对函数表单框架的命名。

第三步,输入框架下对应的数据和函数公式。D6单元格输入公式“=Count(样本数据)”;D7单元格输入公式“=Average(样本数据)”;D9单元格输入已知的总体标准差,如示例中的8;D10单元格输入显著性水平值,如0.05;D11单元格输入总体均值的假设值,如示例中的50;D13单元格输入公式“=总体标准差/Sqrt(样本容量)”;D14单元格输入公式“=(样本均值-总体均值假设值)/抽样平均误差”;D15单元格输入公式“=ABS(Norm.s.inv(显著性水平/2))”;D16单元格输入公式“=If(Abs(检验统计量)>检验临界值双,"拒绝H0","不拒绝H0")”;D20单元格输入公式“=Norm.s.inv(显著性水平)”;D21单元格输入公式“=If(检验统计量<检验临界值左,"拒绝H0","不拒绝H0")”;D25单元格输入公式“=Norm.s.inv(1-显著性水平)”;D26单元格输入公式“=If(检验统计量>检验临界值右,"拒绝H0","不拒绝H0")”。输入内容如图1-5-2所示。

图1-5-2 “总体标准差已知,总体均值检验”临界值法函数表单

对示例给出的数据使用函数表单的结果如图1-5-3所示。显然,由抽出的25个随机样本数据来看,在0.05显著性水平条件下,双侧检验结果拒绝了平均时间为50分钟的假设。我们可以试着去改变函数表单中D11单元格代表总体均值的假设值,或者改变D10单元格的显著性水平值,来观察检验结果。比如我们观察到D7单元格的样本均值为45.60,可以在D11单元格中输入45,双侧检验结果就会变为“不拒绝”,说明通过样本数据分析,能在0.05显著性水平条件下认为平均时间为45分钟。

图1-5-3 “总体标准差已知,总体均值检验”临界值法函数表单结果

当然,一次具体的假设检验工作,只可能是双侧、左侧或右侧检验其中的一个。但作为应用性工具开发,假设检验临界值法函数表单的开发,因为有很多的内容在双侧、左侧和右侧检验中是重复的(比如检验的方向并不会影响样本容量、样本均值、抽样平均误差等),所以在开发时可以在一个表单里同时呈现双侧、左侧和右侧的统计结论。在使用时,依据假设检验的工作来观察相应的结论(忽略其他的结论)就可以了。

小贴士:IF函数

用途:判断一个条件是否满足,如果满足返回一个值,如果不满足则返回另一个值。

语法:IF(logical_test,value_if_true,value_if_false)。

参数:logical_test表示计算结果为true或false的任意值或表达式。例如,A10=100就是一个逻辑表达式,如果单元格A10中的值等于100,表达式即为true,否则为false。Logical_test参数可使用任何比较运算符。value_if_true是logical_test结果为true时返回的值,如果logical_test为true而value_if_true为空,则返回0(零)。value_if_true也可以是其他公式。value_if_false是logical_test结果为false时返回的值。如果logical_test为false且忽略了value if__false(即value_if_true后没有逗号),则会返回逻辑值false。如果logical_test为false且value if__false为空(即value_if_true后有逗号,并紧跟着右括号),则本参数返回0(零)。value_if_false也可以是其他公式。

需要注意的是,value_if_true或value_if_false的值如果是文本型,需要用英文双引号框定。比如计划返回的是“拒绝原假设”这五个字,需要输入“拒绝原假设”,把字符框在英文双引号内。

(二) P 值法函数表单

包括Microsoft Excel在内的很多软件,在运行扩展函数的时候都会计算出 P 值。 P 值通常被认为是观察到的显著性水平(或由样本计算出的显著性水平),是在给定的原假设正确的情况下,统计量等于或超过由样本计算出的统计量的值的概率。它是原假设不被拒绝的最小概率水平。 P 值法就是利用计算出来的 P 值同给定的显著性水平 α 进行比较:如果 P 值大于等于 α ,不拒绝原假设;如果 P 值小于 α ,拒绝原假设。

假设检验中求 P 值要经过五个步骤:

(1)提出原假设H0及备择假设H1。

(2)选择显著性水平 α ,给出已知量,比如样本容量 n 等。

(3)确定合适的检验统计量及抽样分布。

(4)搜集样本数据计算样本统计值和 P 值。

(5)比较 P 值和显著性水平 α ,给出统计学意义上的结论和经济管理学等专业上的结论。

Microsoft Excel假设检验的 P 值法函数表单,就是将上述五个步骤在工作表上逐步实现的过程。下面我们仍然使用图1-5-1的数据和假设来说明“总体标准差已知,总体均值的假设检验” P 值法函数表单的基本情况。图1-5-4即为“总体标准差已知,总体均值的双侧假设检验”的 P 值法函数表单。

将图1-5-1的数据和假设输入 P 值法函数表单当中,返回的结果如图1-5-5所示。当然你也可以通过调整D11单元格代表总体均值的假设值,或者改变D10单元格的显著性水平值来观察结果的变化。

图1-5-4 “总体标准差已知,总体均值检验” P 值法函数表单

图1-5-5 “总体标准差已知,总体均值检验” P 值法函数表单结果

小贴士:Norm.s.dist函数

P 值法函数表单中,我们使用了Norm.s.dist函数来计算 P 值,下面就这个函数的用法作简要介绍:

用途:返回标准正态分布的函数(或累计函数)值,该分布的平均值为0,标准偏差为1。

语法:NORMSDIST(z,cumulative)。

参数:z为需要计算其分布的区间点;cumulative是逻辑值,当函数为累计分布函数时,返回为true,当函数为概率密度函数时,返回值为false。

举例:公式“=Norm.s.dist(1.96,true)”的计算结果为0.975002105。

(三)综合函数表单

从临界值法和 P 值法的函数表单来看,基本计算量都差不多,所以我们可以把它们合并成一个综合表格,同时用临界值和 P 值来判定结论。图1-5-6展示了“总体标准差已知,总体均值检验”的综合函数表单。实际上,两种方法针对同一个样本数据、同一个具体的假设,其统计结论肯定是一样的。所以,综合函数表单只是给大家提供了综合性的展示,不用在 P 值和临界值法的选择上纠结。

图1-5-6 “总体标准差已知,总体均值检验”综合函数表单

三、总体标准差未知,总体均值的假设检验—— t 检验

就如同我们在总体均值区间估计的时候所说的那样,在很多情况下,我们并不知道总体标准差。如果样本为大样本,则可以继续用类似于“总体标准差已知,总体均值假设检验”的函数表单,只是不能在用户输入处输入已知的总体标准差,而要在样本统计量下增设一行,用以计算样本标准差,并在计算抽样平均误差时,用样本标准差对总体标准差进行点估计,带入抽样平均误差的计算公式。

如果总体服从正态分布,样本为小样本,则样本均值的抽样分布服从自由度为 n -1的 t 分布。

小贴士:总体标准差未知,总体均值的假设检验—— t 检验

接下来,我们就不再分临界法和 P 值法,直接来讨论“总体标准差未知,总体均值假设检验”的综合函数表单,如图1-5-7所示。

图1-5-7 “总体标准差未知,小样本,总体均值假设检验”的综合函数表单

函数表单中使用了T.inv.2t、T.inv两个函数分别计算双尾和左尾 t 分布的概率度临界值,还使用了T.dist.2t、T.dist、T.dist.rt三个函数分别计算双尾、左尾和右尾 t 分布的概率 P 值。其中T.inv.2t函数,我们在实验四中已经做了介绍,下面就其他四个函数的基本情况作简要介绍:

1.T.inv

用途:返回作为概率和自由度函数的 t 分布的左尾概率度。

语法:T.inv(probability,degrees_freedom)。

参数:probability为对应于左尾 t 分布的累积概率,degrees_freedom为分布的自由度。

举例:公式“=T.inv(0.25,2)”返回-0.816496581。

2.T.dist.2t

用途:返回双尾学生 t 分布的百分点(概率)。

语法:T.dist.2t(x,degrees_freedom)。

参数:x为需要计算分布的数字,一般为双尾右侧分布数字,所以需要是正数;degrees_freedom为表示自由度的整数。

举例:公式“=T.dist.2t(60,2)”返回0.000277662。

3.T.dist

用途:返回左尾学生 t 分布的百分点(概率)。

语法:T.dist(x,degrees_freedom,cumulative)。

参数:x为需要计算分布的数字,degrees_freedom为表示自由度的整数,cumulative是逻辑值。当函数为累计分布函数时,返回为True;当函数为概率密度函数时,返回值为False。

举例:公式“=T.dist(60,2,True)”返回0.999861169。

4.T.dist.rt

用途:返回右尾学生 t 分布的百分点(概率)。

语法:T.dist.rt(x,degrees_freedom)。

参数:x为需要计算分布的数字,degrees_freedom为表示自由度的整数。

举例:公式“=T.dist.rt(60,2)”返回0.000138831。

四、比率的假设检验—— Z 检验

总体比率的假设检验构建的检验统计量为

其中, p 代表样本比率, π 代表总体比率假设值, n 为样本容量,且要求 np n (1 -p )均大于5。

图1-5-8展示了总体比率假设检验的综合函数表单。

图1-5-8 总体比率假设检验的综合函数表单

五、总体方差的检验——卡方检验

总体方差的假设检验构建的检验统计量为

其中, S 代表样本标准差, σ 0 代表总体标准差假设值, n 为样本容量。检验统计量服从自由度为 n- 1的卡方分布。

图1-5-9展示了总体方差假设检验的综合函数表单。

图1-5-9 总体方差假设检验的综合函数表单

函数表单中使用Chisq.inv、Chisq.inv.rt两个函数来分别计算左尾和右尾卡方概率度临界值,使用Chisq.dist、Chisq.dist.rt两个函数来分别计算左尾和右尾卡方概率 P 值。其中,Chisq.inv.rt函数已经在实验四介绍了,下面就其他三个函数的基本情况作简要介绍:

1.Chisq.inv

用途:返回具有给定左侧累计概率的卡方分布概率度。

语法:Chisq.inv(probability,degrees_freedom)。

参数:probability为卡方分布的左侧累计概率,degrees_freedom为自由度。

举例:公式“=Chisq.inv(0.5,2)”返回1.386294361。

2.Chisq.dist

用途:返回卡方分布的左尾概率。

语法:Chisq.dist(x,degrees_freedom,cumulative)。

参数:x为需要计算分布的数字,由于卡方分布只能在第一象限取值,所以x为非负数。degrees_freedom为表示自由度的整数,cumulative是逻辑值。当函数为累计分布函数时,返回为True;当函数为概率密度函数时,返回值为False。

举例:公式“=Chisq.dist(6,2,True)”返回0.950212932。

3.Chisq.dist.rt

用途:返回卡方分布的右尾概率。

语法:Chisq.dist.rt(x,degrees_freedom)。

参数:x为需要计算分布的数字,由于卡方分布只能在第一象限取值,所以x为非负数。degrees_freedom为表示自由度的整数。

举例:公式“=Chisq.dist.rt(6,2)”返回0.049787068。

六、两个总体方差的 F 检验

通常,你需要判断两个独立总体是否具有相同的波动性,这个判断需要通过对方差的检验来进行。两个独立总体方差的检验是基于两个样本方差的比率。如果假定每个总体是正态分布,则两个样本方差之比服从 F 分布。

小贴士:两个总体方差的 F 检验统计量

F检验统计量是样本1的方差除以样本2的方差:

F检验统计量服从自由度为n 1 -1和n 2 -1的F分布,其中,n 1 -1是样本1自由度(分子的自由度),n 2 -1是样本2自由度(分母的自由度)。

Microsoft Excel提供了“F-检验双样本方差”分析工具扩展函数来完成两个方差的 F 检验。比如,图1-5-10列示的两组数据分别是按标准方法和改进方法获取的样本数据,分析它们对应总体的方差检验。

图1-5-10 两个总体方差的F检验示例数据

第一步,使用“数据-数据分析”菜单,打开数据分析对话框,选择“F-检验双样本方差”分析工具,点击“确定”按钮打开“F-检验双样本方差”对话框。

第二步,点击变量1的区域右侧的箭头,选择B1至B11单元格;点击变量2的区域右侧的箭头,选择C1至C11单元格;数据包含了标志,所以选中标志复选框;显著性系数α默认为0.05;输出区域点击右侧的箭头,选择E1单元格,如图1-5-11所示。

第三步,点击“确定”按钮,返回分析结果,如图1-5-12所示。

图1-5-11 “F-检验双样本方差分析”对话框

图1-5-12 “F-检验双样本方差分析”返回结果

“F-检验双样本方差”分析相当于构建了以下假设内容:

原假设H0:总体1的方差=总体2的方差

备择假设H1:总体1的方差≠总体2的方差

返回结果判断是:(1)若 F 大于临界值,拒绝H0,说明在给定的显著性水平 α 条件下(例子中是0.05),两总体方差存在显著差异;反之,不拒绝H0,说明在给定的显著性水平 α 条件下(例子中是0.05),两总体方差不存在显著差异。(2)若 P 小于显著性水平 α ,拒绝H0,说明在给定的显著性水平 α 条件下(例子中是0.05),两总体方差存在显著差异;反之,不拒绝H0,说明在给定的显著性水平 α 条件下(例子中是0.05),两总体方差不存在显著差异。

以示例数据的返回结果来看, F 统计量=1.49448< F 单尾临界=3.17889,结果说明不能拒绝原假设,也即可在0.05的显著性水平下认为两个总体方差相等; P 值=0.27951> α =0.05,结果也说明不能拒绝原假设。

七、两个独立总体均值比较的检验

(一)两个总体均值比较的 Z 检验

假定从第一个总体中抽取一个容量为 n 1 的随机样本,从第二个总体中抽取一个容量为 n 2 的随机样本,并且已知第一个总体标准差为 σ 1 ,第二个总体标准差为 σ 2 ;如果用 μ 1 表示总体1的均值,用 μ 2 表示总体2的均值,检验统计量用于确定总体均值的差异,是基于样本均值的差构建的。如果假定样本是随机独立地从正态分布总体中抽取的,则统计量服从标准正态分布。如果总体不是正态分布的,但当样本容量足够大时( n 1 n 2 ≥30), Z 检验仍然适合。

小贴士:两个总体均值比较的 Z 检验

Microsoft Excel提供了“Z-检验:双样本平均差检验”分析工具扩展函数来完成两个总体均值比较的Z检验。使用“数据-数据分析”菜单,打开数据分析对话框,选择“Z-检验:双样本平均差检验”分析工具,点击“确定”按钮打开“Z-检验:双样本平均差检验”对话框,如图1-5-13所示。变量1的区域选择样本1数据所在单元格;变量2的区域选择样本2数据所在单元格;假设平均差是总体1均值和总体2均值的假设离差,如果输入0,则检验两个总体均值是否相等;变量1的方差输入总体1的方差值;变量2的方差输入总体2的方差值;数据包含了标志,则选中标志复选框,反之不选;显著性系数α默认为0.05;输出区域点击右侧的箭头,选择一个右侧和下侧没有数据的单元格。

图1-5-13 “Z-检验:双样本平均差检验”对话框

图1-5-14是某次“Z-检验:双样本平均差检验”的返回结果。

图1-5-14 “Z-检验:双样本平均差检验”返回结果

由于假设平均差为零,所以相当于构建了以下假设内容:

原假设H0:总体1的均值-总体2的均值=0

备择假设H1:总体1的均值-总体2的均值≠0

返回结果判断是:(1)若 Z 的绝对值大于 Z 双尾临界值(或 Z 单尾临界),拒绝H0,说明在给定的显著性水平 α 条件下,两总体均值存在显著差异;反之,不拒绝H0,说明在给定的显著性水平 α 条件下,两总体均值不存在显著差异。(2)若 P 双尾(或 P 单尾)小于显著性水平 α ,拒绝H0,说明在给定的显著性水平 α 条件下,两总体均值存在显著差异;反之,不拒绝H0,说明在给定的显著性水平 α 条件下,两总体均值不存在显著差异。示例的结果中, P 双尾0.001992081 <0.05, Z 的绝对值3.091410387> Z 双尾临界值1.959963985,两条均说明统计结论为“在0.05的显著性水平条件下,拒绝H0”。

(二)等方差假设两个总体均值比较的 t 检验

大多数情况下,两个总体的方差是未知的,仅有的信息是样本均值和样本方差。如果假定样本是从随机独立地从正态分布总体中抽取的,总体方差相等,则可以使用等方差假设两个总体均值比较的 t 检验。如果总体不是正态分布的,但当样本容量足够大时( n 1 n 2 ≥30),等方差假设两个总体均值比较的 t 检验仍然适合。

小贴士:等方差假设两个总体均值比较的 t 检验

检验统计量 服从自由度为 n 1 +n 2 -2的 t 分布。

式中,合并样本方差 。当 n 1 =n 2 时,

Microsoft Excel提供了“t-检验:双样本等方差假设”分析工具扩展函数来完成等方差假设两个总体均值比较的t检验。使用“数据-数据分析”菜单,打开“数据分析”对话框,选择“t-检验:双样本等方差假设”分析工具,点击“确定”按钮打开“ t-检验:双样本等方差假设”对话框,如图1-5-15所示。对话框输入内容与“Z-检验:双样本平均差检验”对话框类似,这里就不再赘述。

还记得图1-5-10的数据,由于该数据经过“F-检验双样本方差分析”可在0.05的显著性水平下认为两个总体方差相等,满足等方差的假设。所以可以对其进行等方差假设两个总体均值比较的 t 检验,检验结果如图1-5-16所示。

图1-5-15 “t-检验:双样本等方差假设”对话框

图1-5-16 “t-检验:双样本等方差假设”返回结果

由于假设平均差为0,所以相当于构建了以下假设内容:

原假设H0:总体1的均值-总体2的均值=0

备择假设H1:总体1的均值-总体2的均值≠0

返回结果判断是:(1)若 t 统计量的绝对值大于 t 双尾临界值(或 t 单尾临界),拒绝H0,说明在给定的显著性水平α条件下,两总体均值存在显著差异;反之,不拒绝H0,说明在给定的显著性水平 α 条件下,两总体均值不存在显著差异。(2)若 P 双尾(或 P 单尾)小于显著性水平 α ,拒绝H0,说明在给定的显著性水平 α 条件下,两总体均值存在显著差异;反之,不拒绝H0,说明在给定的显著性水平 α 条件下,两总体均值不存在显著差异。示例的结果中, P 双尾0.00044 <0.05, t 统计量的绝对值4.2957> t 双尾临界值2.10092,两条均说明统计结论为“在0.05的显著性水平条件下,拒绝H0”。

(三)异方差假设两个总体均值比较的 t 检验

在两个独立总体均值比较的检验中,如果不能假设两个总体方差相等,则不能用等方差假设两个总体均值比较的 t 检验,而要使用异方差假设两个总体均值比较的 t 检验。当数据不符合等方差假设时,如果强行使用“t-检验:双样本等方差假设”分析,就会得出错误的结论,所以对于两个总体方差是否相等的评价是相当重要的,方差是否相等是选择检验方法的依据。其实,“两个方差的 F 检验”在很大程度上就是起到这个作用,判断两个总体的方差是否相等。

Microsoft Excel提供了“t-检验:双样本异方差假设”分析工具扩展函数来完成异方差假设两个总体均值比较的 t 检验。使用“数据-数据分析”菜单,打开“数据分析”对话框,选择“t-检验:双样本异方差假设”分析工具,点击“确定”按钮打开“ t-检验:双样本异方差假设”对话框,如图1-5-17所示。

我们用一个例子来说明“t-检验:双样本异方差假设”分析工具的使用。示例数据如图1-5-18所示,为新旧灯泡使用寿命的抽样数据。

图1-5-17 “t-检验:双样本异方差假设”对话框

图1-5-18 “t-检验:双样本异方差假设”示例数据图

首先,对数据进行“F-检验双样本方差分析”,返回的结果如图1-5-19所示。

图1-5-19 示例数据“F-检验双样本方差分析”返回结果

由“F-检验双样本方差分析”返回结果可以知道,在0.05的显著性水平条件下,不能认为新旧灯泡两个总体使用寿命的方差是相等的。所以对其均值比较的检验只能使用“t-检验:双样本异方差假设”分析工具。为了方便比较,我们用图1-5-20把“t-检验:双样本异方差假设”分析工具和“ t-检验:双样本等方差假设”分析工具的返回结果都列示出来。

图1-5-20 “t-检验:双样本异方差假设”返回结果

设置假设平均差为0,相当于构建了以下假设内容:

原假设H0:总体1的均值-总体2的均值=0

备择假设H1:总体1的均值-总体2的均值≠0

返回结果判断是:(1)若 t 统计量的绝对值大于 t 双尾临界值(或 t 单尾临界),拒绝H0,说明在给定的显著性水平 α 条件下,两总体均值存在显著差异;反之,不拒绝H0,说明在给定的显著性水平 α 条件下,两总体均值不存在显著差异。(2)若 P 双尾(或 P 单尾)小于显著性水平 α ,拒绝H0,说明在给定的显著性水平 α 条件下,两总体均值存在显著差异;反之,不拒绝H0,说明在给定的显著性水平 α 条件下,两总体均值不存在显著差异。

从结果来看,如果强行使用等方差假设,结果不论单尾还是双尾都不拒绝原假设,即在显著性水平为0.05的条件下,新旧灯泡的平均使用寿命相等。可是按照异方差假设,单尾结果拒绝原假设。

八、两个相关总体均值比较的检验

两个总体相关一般有两种情况:一是你对相同的项目或个体进行重复测量;二是项目或个体在某些特性方面是匹配的。Microsoft Excel提供了“ t-检验:平均值的成对二样本分析”分析工具扩展函数来完成两个相关总体均值比较的检验。使用“数据-数据分析”菜单,打开数据分析对话框,选择“t-检验:平均值的成对二样本分析”分析工具,点击“确定”按钮打开“t-检验:平均值的成对二样本分析”对话框,如图1-5-21所示。

图1-5-21 “t-检验:平均值的成对二样本分析”对话框

图1-5-22是某次“t-检验:平均值的成对二样本分析”的返回结果。

图1-5-22 “t-检验:平均值的成对二样本分析”返回结果

设置假设平均差为0,相当于构建了以下假设内容:

原假设H0:总体1的均值-总体2的均值=0

备择假设H1:总体1的均值-总体2的均值≠0

返回结果判断是:(1)若 t 统计量的绝对值大于 t 双尾临界值(或 t 单尾临界),拒绝H0,说明在给定的显著性水平 α 条件下,两总体均值存在显著差异;反之,不拒绝H0,说明在给定的显著性水平 α 条件下,两总体均值不存在显著差异。(2)若 P 双尾(或 P 单尾)小于显著性水平 α ,拒绝H0,说明在给定的显著性水平 α 条件下,两总体均值存在显著差异;反之,不拒绝H0,说明在给定的显著性水平 α 条件下,两总体均值不存在显著差异。从示例结果来看,无论是临界值判断,还是 P 值判断,统计结论均为“在0.05的显著性水平条件下,拒绝原假设H0”。

思考练习

1.构建“两个总体比率之差的假设检验”函数表单,并保存工作簿文件名为“练习10.xls”。

2.根据以往资料,某种电子元件的使用寿命服从均值为2350小时、标准差为25小时的正态分布。现从一周内生产的一批电子元件中随机的抽取15只,测得其使用寿命为:2315,2360,2340,2325,2350,2320,2335,2385,2325,2355,2360,2350,2345,2340,2370。试在显著性系数为0.05的条件下,检验这批电子元件的平均使用寿命是否发生变化。(将数据录入Microsoft Excel工作表,构建并使用函数表单,并保存工作簿文件名为“练习11.xls”。)

3.某砖瓦厂所生产的砖块的抗压强度服从正态分布,并且标准差为0.6,从其甲、乙两个砖窑中分别抽取10块和8块,检测其抗压强度如下:

甲砖窑:3.05,2.55,3.07,3.72,3.62,2.59,3.62,2.69,2.46,2.53

乙砖窑:2.66,2.56,3.25,3.30,3.10,3.48,3.16,3.37

试在显著性系数为0.05的条件下,检验两砖窑所产砖的抗压强度有无明显差异。(将数据录入Microsoft Excel工作表,并保存工作簿文件名为“练习12.xls”。)

4.某种食品含脂率服从正态分布。抽样分析该种食品在处理前和处理后的含脂率,测得数据如下:

处理前:0.19,0.18,0.21,0.30,0.41,0.12,0.27,0.25,0.32

处理后:0.15,0.13,0.07,0.24,0.19,0.06,0.08,0.12,0.14,0.16

试在显著性系数为0.05的条件下,检验处理前后食品含脂率差异是否显著。(将数据录入Microsoft Excel工作表,并保存工作簿文件名为“练习13.xls”。)

5.从过去的数据可知某场生产的电子元件的寿命服从均值为500小时、标准差未知的正态分布。通过改进工艺以后,抽检15件样品的数据(小时)如下:502,509,513,504,498,506,510,495,501,508,507,511,508,507,496。试在显著性系数为0.05的条件下,检验改进工艺后这种电子元件的寿命是否有所提高。(将数据录入Microsoft Excel工作表,构建并使用函数表单,并保存工作簿文件名为“练习14.xls”。)

6.骨髓中的血管增加(血管生成)是患有骨髓瘤的重要预兆。骨髓瘤的治疗方法是用患者自己的干细胞进行干细胞移植。下面的数据展示了对干细胞一直有完全反应的患者进行干细胞移植前后的骨髓微血管密度。

试在显著性水平0.05下,检验干细胞移植之前的平均骨髓微血管密度是否显著高于干细胞移植之后的平均骨髓微血管密度?(将数据录入Microsoft Excel工作表,并保存工作簿文件名为“练习14.xls”。)

7.一家坐落在商业区的银行的分行提升了从12点到13点午餐时间的服务,在一个星期中记录了所有顾客在此期间的等待时间(从顾客开始排队到顾客到窗口的时间)。随机抽取了15位顾客的样本,数据如下(分钟):4.21,5.55,3.02,5.13,4.77,2.34,3.54,3.20,4.50,6.10,0.38,5.12,6.46,6.19,3.79。该银行的另一家分行位于居民区,也是随机抽取15位顾客从12点到13点的服务等待时间,数据如下(分钟):9.66,5.90,8.02,5.79,8.73,3.82,8.01,8.35,10.49,6.68,5.64,4.08,6.17,9.91,5.47。

(1)试在0.05的显著性水平下,检验两家分行的等待时间的方差是否有显著差异。(将数据录入Microsoft Excel工作表,并保存工作簿文件名为“练习15.xls”。)

(2)基于(1)中的结果,数据适合使用哪种均值比较检验方法? hzzV0cnwxpbDpllKsjXJjRxehu2BJhqZ4oCuiV0JrH2vr3CLBa5ABi/y4CAs4ioe

小贴士:假设检验实验方法的选择路径
点击中间区域
呼出菜单
上一章
目录
下一章
×