购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

1.2 医学统计学的基本概念

医学统计学涉及许多概念和原理,下面的几组基本概念是医学统计学的基础。

1.2.1 同质与变异

同质是指个体的观察指标所受的影响因素相同。这里所说的“相同”有时是相对的,也就是说,观察单位所受的影响因素有时不可能达到绝对一致。

特别是在医学研究中,有些影响因素是难以控制的,甚至是未知的,如遗传、心理等因素,这时只要保证主要影响因素相同或基本相同就可以认为个体是同质的。

变异是指在同质的基础上个体间的差异性,如相同年龄、性别、身高的正常儿童的体重不是都相同的,这种情况就称为体重的变异。对于人和其他生物体,变异是广泛存在的。尽管变异具有一定的随机性和偶然性,但变异是有规律的。统计学正是探讨并利用变异规律的科学,若无变异则无须统计。

1.2.2 总体与样本

总体就是根据研究目的确定的同质个体的全体,它实际上是某一指标值的集合。样本是从总体中随机抽取的部分个体,样本中的个体的数目称为样本含量。

由于直接研究总体通常是不可能或不必要的,因此实际工作中总是从总体中抽取个体组成样本,根据样本所提供的信息推断总体的特征。从总体中抽取的样本必须具有代表性、随机性和可靠性。

(1)代表性

代表性是指样本要满足总体对个体同质性的规定,属于所规定的总体的范围。

(2)随机性

随机性是指总体中任何个体都有同等机会被抽取进入样本,样本中的任何个体都有同等机会被分配到任何一个处理组中。

(3)可靠性

可靠性是指样本含量要足够大,这样根据样本推断总体得出的结论才是可靠的。在实际工作中,确定样本含量大小的原则是既要保证研究结果可靠,又要避免浪费。

1.2.3 误差

统计学所说的误差泛指测量值与真实值之差,以及样本指标与总体指标之差。根据误差产生的原因及其性质,可以将误差分为3类。

(1)系统误差

系统误差是指由确定原因(如测量仪器未校准、医生判断标准偏高或偏低等)引起的观测值与真实值呈倾向性的偏差。由于系统误差影响了原始资料的准确性,且其产生的原因是明确的,因此在收集资料的过程中必须消除系统误差。

(2)随机测量误差

随机测量误差是指由于非人为的偶然因素造成的同一个体的多次观测结果之间存在的没有固定倾向的偏差。对于这类误差应尽可能加以控制,至少将其控制在一个允许的范围内。在实际工作中,可以通过多次测量后计算平均值的方法减小甚至消除随机测量误差。

(3)抽样误差

抽样误差是指由于研究的对象是样本而非总体以及总体中个体存在变异而造成的样本指标与总体指标之间的偏差。抽样误差是不可避免的,但抽样误差是有规律的,因而是可控制的。统计推断过程正是对抽样误差进行计算后由样本估计总体的过程。

1.2.4 频率与概率

频率是指某事件出现的次数与总试验次数的比值。随着总试验次数无限增加,某事件出现的频率在某一确定值附近摆动并无限趋近于这个值,这个值就确定为该事件出现的概率。在医学统计中常将频率简称为率,如患病率、有效率等,这时频率也称为统计概率。概率是对随机事件发生可能性大小的量度,用符号 P 表示。概率的范围为0~1,必然发生的事件其概率为1,不可能发生的事件其概率为0。某事件的发生概率 P 越大,该事件发生的可能性越大。

在医学研究中,通常将 P <0.05或 P <0.01的事件称为小概率事件。一般认为在一次随机抽样中小概率事件基本不会发生,这就是小概率事件原理。小概率事件原理是统计推断的一个重要原理。

1.2.5 变量与资料

变量是描述研究对象某种特征的指标,变量全部或部分的测量值构成资料。例如在研究癌症患者的影响因素时,获得了癌症患者的年龄、性别、用药类型、生存时间等变量,这些变量的测量值构成资料。

统计分析中识别变量和资料的类型非常重要,这决定了统计分析方法的选择,不同类型的变量和资料要用不同的统计方法去分析。资料分为计量资料、计数资料和等级资料,变量分为定量变量和定性变量。

(1)计量资料

每个研究对象的变量值为一数值,表现出量的大小,由这样的一组研究对象的定量测量值所构成的资料即计量资料。

计量资料可以是离散变量资料,也可以是连续变量资料。离散变量(如一年中的住院患者数、新生儿数等)只能取整数值;连续变量可以取实数轴上的任何数值,“连续”是指该类型变量可以在实数轴上连续变动,如身高、体重、骨密度等。

(2)计数资料

每个研究对象的变量值为互不相容的属性(类别)之一,由这样的一组研究对象的定性变量值组成的资料即计数资料,包括二分类计数资料与多分类计数资料。

若变量值的属性(类别)为二分类,则称该资料为二分类计数资料,如性别(男或女)、疾病预后(生或死)等资料;若变量值的属性(类别)为无序多分类,则称该资料为无序多分类计数资料,如血型(O型、A型、B型、AB型)资料。

(3)等级资料

每个研究对象的变量值为互不相容的属性(类别)之一,且这些属性(类別)间有不同程度的递增或递减关系,由这样的一组研究对象的变量值组成的资料即等级资料,如结核患者的痰涂片结果(阴性、可疑、阳性)、临床检验结果(–、±、+、++、+++)等资料。

为了研究需要或数据分析方便,有时要对资料进行转换,一般是将计量资料转为计数资料或等级资料。

(4)定性变量

定性变量又名分类变量,观测的个体只能归属于几种互不相容类别中的一种时,一般是用非数字来表达其类别。

(5)定量变量

定量变量也就是通常所说的连续量,如长度、重量、产量、人口、速度和温度等,它们是由测量或计数、统计所得到的量,这些变量具有数值特征。

1.2.6 参数与统计量

参数是根据总体中个体值计算出来的描述总体特征的指标。参数一般用希腊字母表示,如总体均数、总体方差、总体率等。

统计量是根据样本中个体值计算出来的描述样本特征的指标。统计量一般用英文字母表示,如样本均数、样本方差、样本率等。 JYVzOdJ79bumjYl/uNQ6d+05ZXfE7p1tidBEbcUYK5g0l6aYRk7AGFDFeMk7Qt9o

点击中间区域
呼出菜单
上一章
目录
下一章
×