购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

1.1 医学统计核心概念

1.1.1 总体与样本

1.总体

总体(population)是指根据研究目的所确定的观察单位某项特征的集合。比如我们想研究某大学所有在校学生的平均体重,根据此目的,我们研究的总体就是该大学所有在校学生的体重数据的集合。但是需要注意,总体分为有限总体和无限总体,上面的例子就是有限总体,毕竟该大学的学生数量是有限的,然而科研过程中大多数情况下面临的是无限总体,如茫茫宇宙中星体的平均质量;空气中某种物质的浓度等,我们是无法取得其总体进行研究的,那我们面对无限总体时该怎么办呢?

古人云:“君子生非异也,善假于物也。”意思是聪明的人并不是本质上就与一般人不一样,只不过善于利用某种工具罢了。因此,我们为了研究无限总体,发明了抽样的方法,就像我们想知道一锅老母鸡汤的咸淡,并不需要喝完所有的汤,只需要充分摇匀,尝其一勺就可以了,这种思想就叫“抽样”。

2.样本

样本(sample)就是从总体中抽出的部分观察单位某项特征的集合,但是在抽样过程中应当遵守随机化的原则(random principle)。我们通常通过研究样本来推断研究总体的属性与特征,去探索事物背后的规律和本质。

生活中处处存在抽样的思想,如“一叶知秋”“豹窥一斑”“尝鼎一脔”“以小见大”,“3·15质量抽检报告”等。

抽样除了要求有代表性,还要达到一定的样本量,因为只有足够的样本,得到的统计量才会稳定,才能代表真正的总体。

1.1.2 参数与统计量

1.参数

参数(parameter)是指用于描述总体特征的指标,如总体均数(μ),总体标准差(σ)、总体率(π)、总体相关系数(ρ)等。参数一般用希腊字母表示。

2.统计量

统计量(statistic)是指用于描述样本特征的指标,如样本均数( ),样本标准差(s)、样本率(p)、样本相关系数(r)等。统计量一般用英文字母表示。

一般而言,我们进行科学研究直接获取的仅是样本的统计量,而我们的研究目的却是获知总体的属性特征,即总体参数。统计学存在的核心价值就在于,可以通过描述样本的统计量去推断描述总体的参数,这就是通过偶然去发现必然、通过一般去发现普遍,以小见大的过程。参数与统计量的关系如图1.1所示。

图1.1 参数与统计量的关系

正所谓“生活不止眼前的苟且,还有诗和远方的田野”,虽然统计着眼于样本和统计量,但是“心中”永远期待的是总体和参数。对于某一指标的参数与统计量,其本质一样,只不过一个来自总体,一个来自样本。

1.1.3 概率与频率

1.概率

概率(probability,P)是用于反映某一随机事件发生的可能性大小的一种量度。一般用大写的斜体P表示。例如,我们可以用学生的考试成绩,反映该门课程掌握的情况,而概率就像成绩,是一个度量尺度,用于反映某事件发生可能性的大小。

我们根据随机事件发生概率的大小,把事件分为三类:P = 1为必然事件,发生率为100%;P =0为不可能事件,发生率为0;0 < P < 1为偶然事件。某事件在未进行之前,该事件既可能发生,也可能不发生。其中,发生概率P ≤ 0.05或P ≤ 0.01的事件为小概率事件,其实际应用意义是在一次试验、抽样或研究过程中,该事件不可能发生。

小概率事件非常重要,它是统计推断的基础。举个例子,统计起源于赌博游戏,我们虚构一个游戏,假设在一个不透明的箱子中有100个乒乓球,其中5个是黄色的,95个是白色的,现在,在一个有100名学生的班级中,每人支付1元,然后随机抽取一个球。如果抽中黄球给10元,抽不中则“谢谢参与”,请问你抽呢,还是不抽呢?

基于统计的判断,你是不该抽的,为什么呢?因为黄球所占的比例为0.05,是小概率事件,而小概率事件的应用意义是在一次抽样过程中发生的概率近似为0。因此,你基本不可能抽中。

然而小概率事件在一次抽样过程中发生概率近似0,但在群体事件中仍然可以发生。在这个例子中,发生的概率为5%,班上100名同学,理论上有5名同学可以抽到。算一下,每人1元,总共可以收100元,减去5名抽中黄球的奖金50元,是不是还稳赚50元呢?

那为什么小概率事件的界值定在0.05呢?其实这是我们人类的一种常识,有人说我也是人类,怎么就没这个常识呢,其实你也有,只不过没有发现而已。下面我们一起做个试验,然后请你回答几个问题,问题如下。

(1)你能够把一枚硬币向上抛起后,落地正面朝上吗?

(2)你能够连续抛起2次,连续正面朝上吗?

(3)你能够连续抛起3次,连续正面朝上吗?

(4)你能够连续抛起4次,连续正面朝上吗?

(5)你能够连续抛起5次,连续正面朝上吗?

在200多年前,英国的一个会场进行了类似的试验,发现会场中连续4次说能够的人寥寥无几,问到是否能够连续5次正面朝上时,几乎没人说能够。

我们用统计学理论分析一下刚才的试验,连续1次正面朝上的概率为0.5;2次正面朝上的概率为0.25;3次正面朝上的概率为0.125;4次正面朝上的概率为0.0625;5次正面朝上的概率为0.03125。因此,近似取连续4次和5次正面朝上的中间值,即为0.05,也可以理解为二十分之一。

既然有了0.05的标准,那为什么还要0.01呢?这就相当于,我们普通老百姓吃的食品肯定要满足食品卫生要求,但是宇航员吃的食品,不仅要满足食品卫生要求,还要考虑更多的营养与安全因素。当我们采用P ≤ 0.01的标准时,统计推断错误的概率将会比P ≤ 0.05时更低,结果也更加准确。

2.频率

频率(frequency,f)是指我们进行了N次试验,其中一个事件出现的次数m与总的试验次数N的比值。

统计是基于概率进行的,我们如何能够得到某一事件发生的概率呢?比如谁能够计算出一根半截粉笔从讲台上垂直落下摔断的概率P是多少呢?科学发展至今也没有办法通过公式去计算该值。那我们怎么做到呢?

“有些事情越想越烦,做起来却极其简单”,我们只需要拿两盒同样的粉笔进行重复摔试验就可以了。如果总共有100根粉笔,断了98根,那断的频率就是f = 98/100 = 0.98。而统计学证实,当某事件发生次数较多时,频率就会收敛于概率,即f ≈ P。因此,在现实研究中,我们就是通过频率去估计概率的。概率与频率类似于量子纠缠,当我们知道某事件的频率之后,就可以用频率去估计概率。

可以这样理解:频率是针对过去的,概率是针对未来的。频率是针对已经发生的样本的,概率是针对尚不知晓的总体的;频率就像样本统计量,概率更像总体参数,我们就是用频率去估计概率的。

1.1.4 误差

误差(error)就是观察值与真值之差,即我们通过一次试验得到的结果与事件真实结果之间的差值,也可以理解为想获得的值与实际检测到的值之间的差别。误差根据其产生的原因,可以分为以下四种。

1.系统误差

系统误差(systematic error)是指由试剂未校正或仪器未校准等因素造成的研究结果倾向性的增大或减小。例如,我们路过药房,门口放着一个体重秤,请问我们在称自己的体重之前,要注意的第一件事情是什么呢?有人说先把手上的包放掉;有人说把鞋子脱掉;还有人说看看是不是要收费。但从统计学系统误差的角度分析,我们应该看看体重秤的指针是不是对准零点,如果体重秤本身就有5千克底重,那我们所有人去称,都会重5千克,即发生倾向性的增大。

系统误差的特点:倾向性的增大或减小,“要么不错,要么全错”。但系统误差不可怕,它是可以避免的,如果我们事先进行校准或调零,那么系统误差就可以避免。

2.随机误差

随机误差(random error)是由各种偶然因素造成的观察值与真值之差。例如,某班级所有同学用同一把尺子测量A同学的身高,结果可以发现,测出的A同学的身高值是不一样的,有高有低。

随机误差的特点:不可以避免,但可以减少。统计学有一个定律叫作“测不准定律”,好像不管你怎么测,就是测不准。那对于重要的指标我们怎么办呢?正如网上流行的一句话“重要的事情说三遍”,对于重要的指标,我们就多测几遍!

3.抽样误差

抽样误差(sampling error)是由抽样造成的样本统计量与总体参数之间的差异,或是多次抽样的样本统计量之间的差异。有人会说,前面说样本的时候,还说那一勺老母鸡汤的咸淡应该和锅里汤的咸淡是完全一样的啊!

是的,前面的例子是让你明白抽样的思想,而我们科学研究和喝老母鸡汤是不一样的,因为汤里的氯化钠是均匀分布的,而我们医学科学研究的目标事件绝大多数是不均匀分布的。例如,某个班级有120名同学,整体近视眼患病率为50%,如果我们按照随机化原则随机抽取50名同学进行调查,这50名同学的近视眼患病率理论上不会等于50%,因为近视同学在班级中的分布是不均匀的。

因此抽样误差的特点是不可以避免,但可以减少。我们可以通过增大样本量减少抽样误差。可以看图1.2来帮助理解,图中右侧目标事件的分布相对较均匀,而左侧目标事件则呈现明显的聚集性。

图1.2 不均匀分布与均匀分布

4.过失误差

过失误差(gross error)是指由于观察过程中的不仔细造成的错误判断或记录。过失误差可以通过仔细核对来避免。

统计学的存在主要是解决哪种误差呢?我们通过统计设计来减少系统误差;通过统计学检验去排除抽样误差的影响;随机误差不可避免,但可以通过培训来降低其影响;过失误差可以通过质量控制来消除其影响。

在上面的四种误差中,统计学的假设检验主要是为了控制抽样误差对研究结果的影响,毕竟我们所研究的样本都是从总体中抽样得来的,而抽样必然会发生抽样误差。因此,对抽样样本得到的结果,需要统计检验以排除抽样误差的干扰。

1.1.5 同质与变异

1.同质

同质(homogeneity)是指观察单位所受的影响因素相同。我们医学科研的观察单位所受的影响因素只可能相对的相同,不可能绝对的相同,因此,同质是相对的。我们科研所确定的总体或样本,在某些因素上必须是同质的,才能将其作为一个群体进行研究。

2.变异

变异(variation)是指观察单位在同质基础上的个体差异。很多哲言或谚语都说明了变异的存在,如“天底下没有两片完全一样的树叶”“一个人不可能两次踏入同一条河流”“刚才说话的我已经不是现在说话的我了”。天下唯一不变的就是变化。因此,变异才是绝对的。

同质和变异这一对概念对研究统计具有重要的意义:没有同质,就没有我们研究的总体或样本。因为如果不同质,我们是不可能把它们放在一起进行研究的。如果没有变异,就没有统计学产生的必要,因为没有变异,我们拿1种药物治疗某种病的1个病人有效的话,该药对所有患该病的病人应该都有效,而那是不可能的,因为人与人之间的变异性是绝对存在的,对你有效,对我未必有效,所谓“吾之蜜糖,彼之砒霜”。统计学就是在群体的水平上去发现有变异的事物背后的本质与规律。

1.1.6 随机化原则

随机化原则(random principle)是指我们在选择受试对象、对受试对象分组及对受试对象施加不同的干预措施时,受试对象被抽到的概率、被随机分到各组的概率及接受不同干预措施的概率是相等的。统计学中随机化具体包括随机化抽样、随机化分组和随机化顺序。三种随机化模式如图1.3所示。

图1.3 三种随机化模式图

1.随机化抽样

随机化抽样是指我们从研究总体中抽取研究样本时,总体中的任何一个个体被抽到作为样本进行研究的概率相等。常用方法包括单纯随机抽样、系统抽样、分层抽样、整群抽样和多级抽样等,该部分内容属于流行病学的内容,此处不再详细讲解。

2.随机化分组

随机化分组是指我们获取研究样本后,样本中的每个受试对象具有同等的机会被分配到各个研究组中。常用方法包括随机数字表法、计算机随机分组法。

3.随机化顺序

随机化顺序是指当我们进行交叉试验时,随机化分组后的研究组接受不同干预措施的顺序是随机的。

随机化是有方法的,必须按照规定的章法进行随机,如此得到的结论才可靠。然而,今天很多人在科研过程中的随机,并不是真正的随机,而是统计学的禁忌“随便”和“随意”,毫无章法可循。

1.1.7 因素与水平

1.因素

因素(factor)是可能对因变量(结局变量)有影响的变量,而统计分析的目的就是比较该因素不同水平对因变量的影响是否相同。例如,性别可能对性格有影响,性别此时就是因素;而性格可能对某种疾病有影响,此时性格就是因素了。某个变量到底是不是研究因素,是由研究目的确定的。

2.水平

水平(level)是指因素的不同取值,例如,性别这个因素有男、女两个水平;血型有A、B、O和AB型四个水平。水平往往是统计学分组的依据。

1.1.8 变量与资料

变量为观察单位的某项特征,如人的身高、体重、性别、年龄、血型、营养程度等。这些变量是我们研究的指标。根据变量特征的属性,变量可以分为数值变量、等级变量和分类变量。变量及其取值构成了研究的资料或数据。

1.数值变量

数值变量(numerical variable)是通过定量的方法检测出来的指标,通常以阿拉伯数字呈现,具有单位,并可以进行定量的比较。比如身高(cm)、体重(kg)、血压(mmHg)、脉搏(次/分)、工资、年龄等。数值变量支持加减法(+/-)运算,我们也可以联想,数值变量是否可以用均数±标准差来表示,从而帮助我们记忆。很多书中又称数值变量为计量变量、连续性变量、定量变量等。

2.等级变量

等级变量(ordinal variable)既具备分类变量的性质,又具有半定量比较的性质,如病情(轻/中/重)、职称(初级/中级/高级)、学历(小学/初中/高中/本科)、福利待遇(好/中/差)。这类资料各水平之间互不相容,但又有级别上的轻重关系。等级变量之间的关系可以用大于号和小于号(>/<)来表示。

3.分类变量

分类变量(categorical variable)反映的是互不相容的属性和类别,是一种“我中无你,你中无我”的关系。分类变量常通过计数的方式获得,如血型(A/B/O/AB)、性别(男/女)、生肖属相等。分类变量之间可以用不等号(≠)进行区分。

分类变量的各水平之间是互不相容的,相互排斥的。比如性别是男,就不可能再是女;血型是A型,就不可能是其他类型。其选项就是对受试对象进行分类,具有互斥性。

分类变量可以进一步分为二分类和多分类。二分类就是水平数为两个级别的分类变量,如性别(男/女);多分类是水平数大于两个级别的分类变量,如血型(A/B/O/AB)。

为什么分类变量要区分二分类和多分类呢?这是由统计特征决定的,二分类和多分类在统计分析方法上就有差异,这就是所谓的“2K效应”。具体可见后面的统计方法选择章节。

4.变量转换

同一受试对象身上可以检测出上述三种变量,三种变量反映受试对象信息的能力顺序依次为数值变量、等级变量和分类变量。为了方便大家记忆,我们把三种变量依次称为“老大”“老二”和“老三”。

变量之间可以进行转换,但只能从高级别变量向低级别变量转换。意思是数值变量可以转换为等级变量和分类变量,等级变量可以转换为分类变量,数值变量也可以直接转换为分类变量,但不可以逆转。

例如,某医院的院长是“老大”、科室主任是“老二”、科里的医生是“老三”。如果这位院长不想做院长了,他可以做科室主任,也可以做普通医生,但是普通医生不是想当主任、院长就能当的。

从专业角度举个例子,假设某人收缩压为180mmHg(数值变量),可以转换为等级变量(高血压/正常/低血压),也可以转换为分类变量(正常/异常)。但是如果只告诉你,某人的血压不正常,你是无法知道他的血压是偏高还是偏低,以及具体的血压数值。这点也给我们一个启示:科研过程中尽量去获取数值变量资料(如果该变量具有数值变量形式的话),因为其信息多,而且可以转换。在后续分析过程中,可以根据研究目的,选择以不同的形式进行分析。这也是统计学的思维。

统计学的概念很多,本章只讲入门核心概念,后面讲到具体内容时,还会讲解一些概念。 /xLVuYl8/hHI/nOh+HTnyxrAK6mYyRx97VvfyQ3W4dVCnO6ehQehpdybtGwp4lDz

点击中间区域
呼出菜单
上一章
目录
下一章
×

打开