



参数估计是由样本统计量去估计总体参数,即对总体参数进行画像,而假设检验(hypothesis testing)是进行两个或多个总体参数差异是否有统计学意义的一种检验,就是让两个或多个总体参数进行“对决”。假设检验非常重要,无论是干预性研究,还是关系性分析,均需要进行假设检验。
1.假设检验的思想
假设检验的思想是“一分为二,灭其一”。在科学研究中,我们将事件的结局归纳为两种可能,然后利用小概率事件和反证法的原理,将其中的一种可能给消除,剩下的那种可能就是真理所在。例如,研究某种降压药的疗效,结局可能为有效或无效;两种降压药A和B效果比较,结局可能为疗效相等或疗效不等。
假设检验原理图如图4.3所示。假设一个警察正在追一个小偷,到了一个Y形路口,小偷此时逃跑路线有两种可能,即左边和右边,此时采用统计分析的方法,证明小偷逃往右边的概率P ≤ 0.05,是小概率事件,而小概率事件实际应用意义是小概率事件在一次事件过程中不可能发生,也就是说小偷不可能逃往右边,那么小偷只能逃往左边,因此警察应该往左边追捕。在科学研究中,假定研究结局为无效与有效,而通过统计分析,发现无效发生的概率P ≤0.05,因此认为干预结局是有效的。
图4.3 假设检验原理图
我们再看看上述案例是如何利用反证法和小概率事件的。首先,“一分为二”,把小偷逃跑路线分为左边和右边两种可能。然后,“灭其一”,先假设小偷逃往右边,计算出小偷逃往右边的概率P≤0.05,为小概率事件,从而证明小偷不会逃往右边,而会逃往左边。本例没有直接证明小偷逃往左边,而是证明没有逃往右边,这种思路就是反证法,利用什么规律进行反证呢?就是小概率事件,小概率事件是一把刀,用这把刀把两种可能中的一种给砍断,那么剩下的那种可能往往就是真理的所在。
2.单侧检验与双侧检验
假设检验分为单侧检验和双侧检验。如果假设结局为疗效相等(A = B)和疗效不等(A ≠ B),则为双侧检验,因为疗效不等包括A > B和A < B两种可能;而如果假设结局为疗效相等(A = B)和A疗效优于B疗效(A > B),或者疗效相等(A = B)和A疗效劣于B疗效(A < B),则均为单侧检验。
3.两种界值的关系
我们还应该知道,假设检验利用的是小概率事件原理,而小概率事件的界值有P ≤ 0.05和P ≤0.01,如果没有特殊说明,我们一般是将P ≤ 0.05作为检验的界值。如果两个人分别做课题验证降压药1号的降压效果,假设为无效或有效,结果研究者A得出P < 0.05,研究者B得出P < 0.01,两人都得出降压药1号具有降压效果,但是研究者B得到的结果更可信,因为其统计发生统计错误的概率P < 0.01,换种说法,研究者B的结果有99%的把握正确,而研究者A的结果只有95%的把握正确。
4.假设检验的步骤
虽然假设检验思想为“一分为二,灭其一”,但在实际科研中,一般分为三大步和八小步。例如,以检验不同性别大学生的肺活量差别为例,采用t检验展示具体步骤,如表4.1所示。
表4.1 假设检验的三大步和八小步
续表
5.假设检验的两类错误
虽然我们可以通过假设检验推论不同总体之间是否存在差别,但是假设检验本身也会有自己的缺陷,假设检验本身也会犯错误,就像某种诊断疾病的方法,本身也会出现假阳性和假阴性的错误,即把没病的诊断为有病,把有病的诊断为没病。
(1)假设检验I类错误:假阳性(弃真)。
例如,我们采用统计方法验证松哥是男还是女,进行如下一分为二假设。
H 0 :松哥 = 男性
H 1 :松哥≠男性
检验水准α = 0.05
我们在假定H 0 成立的情况下,去验证统计量发生可能性的P值大小,如果此时得到P ≤ 0.05,说明松哥 = 男性的可能P ≤ 0.05,是小概率事件,小概率事件在一次假设检验中不可能发生,因此,松哥 = 男性是不可能的,所以认为,假设H 1 :松哥≠男性成立。
而如果我们知道,松哥本来就是男性,通过统计分析,结论抛弃了H 0 ,抛弃了真理或真值,因此,这种错误,被称为“弃真”。
(2)假设检验Ⅱ类错误:假阴性(存伪)。
如果我们再换一个假设,具体如下。
H 0 :松哥 = 女性
H 1 :松哥≠女性
检验水准:α = 0.05
在假定H 0 成立的前提下,检验统计量发生的概率P值,如果得到P > 0.05,则说明H 0 是可以成立的,即H 0 :松哥 = 女性是可以成立的,但如果松哥事实上是男的,那么松哥 = 女性就是一个伪命题,但统计分析竟然认为其成立,因此这种错误被称为“存伪”。
弃真和存伪就像地球的南极和北极,我们不可能同时到达,即我们的假设检验只会发生其中的一种错误,不可能一次检验同时发生这两种错误。
当我们统计分析得到P ≤ 0.05时,虽然得到阳性结果,认为差异有统计学意义,但要考虑“弃真”存在的可能性。当我们得到P > 0.05,认为差异无统计学意义,但有可能发生“存伪”的错误。所谓“人有悲欢离合,月有阴晴圆缺,此事古难全”。