



在探索复杂知识的领域中,那些富含思想性的内容往往更难以驾驭。电影《阿凡达》中有个引人注目的场景,主人公勇敢地攀爬天梯,抵达飞龙的巢穴,试图捕获一只飞龙作为自己的坐骑。飞龙作为极具个性的生物,不会轻易屈服于他人。然而,在阿凡达星球上,所有生物都拥有一个独特的触角,驯服飞龙的唯一秘诀,就是将主人公的触角与飞龙的触角紧密相连,让彼此的思想相互交融,从而驯服这强大的生物。
统计思想则是统计学的灵魂与根基,只有深入理解和掌握这些思想,才能在统计学的领域绽放耀眼的科学之光。在学习统计的过程中,我们就像电影《阿凡达》的主人公,而统计学则是那只飞龙。只有当我们真正理解并应用统计思想,才能驾驭这门应用广泛且实战情况多变的学科。以下是统计学的五个基本思想,希望能为大家提供参考。
除非研究目的特殊,否则我们的研究对象不可能获取到总体,而是获取总体中的某个样本。这些样本几乎都是从总体中按照随机化的原则抽取获得的。而随机化抽样则要求:根据研究目的确定的研究总体中,任何一个研究对象都要有同等的机会被抽到作为样本。
抽样思想的精髓为化繁为简,化无限为有限,化不可能为可能。通过抽样我们可以获取研究样本,对有限的研究样本进行研究,从而得到描述样本的统计指标,即“统计量”。这些统计量是我们进一步研究总体的数据基石。
虽然样本统计量是实际可以检测获得的,但是我们的目的是研究总体。因为抽样误差的必然存在,样本统计量必然不等于总体参数,但会与总体参数比较接近。我们在一定误差的控制下,可以通过样本统计量去预测总体参数,具体包括两种方法:点值估计法和区间范围估计法,如图2.1所示。
图2.1 点值估计法和区间范围估计法
点值估计法认为样本统计量等于总体参数,忽略了抽样误差,因此该方法风险偏大,正式场合基本不用;区间范围估计法是指通过样本统计量,基于特定的分布,去预测一个总体参数的可信区间,例如95%或90%、99%,根据研究目的确定95%是最为常用的。
抽样思想与总体推断思想需相互结合应用。只抽样,不推断,偏离了抽样的初衷;不抽样,又失去了推断的基础。抽样与推断结合使用,方能完成一个完整的流程。
反证法思想就是将我们要研究的问题凝练为两种可能A和B,然后证明其中的A不可能发生,得出B必然成立。例如,两个人面对面站着,他们闭上眼睛,然后第三个人给他们每个人戴上一顶帽子,帽子的颜色分别是红色和蓝色。随后,这两个人睁开眼睛,但他们只能看到对方帽子的颜色,而无法看到自己帽子的颜色。那么请问,这两人能够知道自己头上戴的是什么颜色的帽子吗?
由于只有红色和蓝色两种帽子,且每人都只能看到对方帽子的颜色,那么每个人都可以根据以下逻辑判断自己帽子的颜色。
(1)如果一个人看到对方戴的是红色帽子,那么他就可以确定自己戴的是蓝色帽子。
(2)同理,如果一个人看到对方戴的是蓝色帽子,那么他就可以确定自己戴的是红色帽子。
因此,只要其中一个人看到对方帽子的颜色,他就能准确地推断出自己帽子的颜色。如图2.2所示。
图2.2 反证法思想示意图
在科研过程中,验证某药是否有疗效时,我们将研究结局分为两种可能,H 0 :药物无效,H 1 :药物有效。然后采用对应的统计分析方法,去获取H 0 (药物无效)发生的概率,如果P≤0.05,则H 0 (药物无效)不可能发生,从而H 1 (药物有效)成立。若P > 0.05,则H 0 (药物无效)是可能发生的,我们不能够拒绝H 0 ,因此尚不能认为该药物有效。
在第1章中,我们已经学过小概率事件,即发生概率P ≤ 0.05或P ≤ 0.01的事件。这种小概率事件的应用意义就是小概率事件在一次抽样或试验过程中发生的概率为0。因此,一旦我们判断出某事件的发生概率P ≤ 0.05,则可以判断该事件在个体水平上不会发生。
小概率思想既是统计推断的核心,又是统计学价值的基础。假设检验就是反证法与小概率事件思想相结合的具体体现。
小概率思想是统计学大厦的基础,我们必须承认与接受这个前提,后续方可进行相应的统计学检验与推导。
虽然可以采用小概率事件原理进行统计推断以保证推论的准确性,但如果整个试验或调查没有进行很好的质量控制,那也会前功尽弃。因此,试验设计必须要有误差控制的思想。误差控制可以具体体现在“三要素”和“四原则”上。同时,假设检验也会发生统计学I类和Ⅱ类错误,统计分析时均需加以考虑,才能在最大程度上推测总体的真实情况。统计学误差包括系统误差、抽样误差、随机误差和过失误差,第1章已经讲过,此处不再赘述。