购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

第二节
集中趋势描述指标

统计学用平均数(average)这一指标体系来描述一组变量值的集中位置或平均水平。主要作用为:①作为一组观测值的代表值,表明该组观测值集中趋势的特征。②便于对同类研究对象进行对比分析。卫生管理研究中常用的平均数有算数均数、几何均数和中位数。

一、算术均数

算术均数(arithmetic mean)简称均数(mean),表示一组性质相同的观察值在数量上的平均水平。总体均数的符号为 μ ,样本均数的符号为

(一)算术均数的计算

1.直接法 算术均数直接法计算公式如下:

式中: X 1 X 2 ,…, X n 为样本观察值, n 为样本含量,∑(希腊字母,读sigma)为求和符号。

利用例3-3的数据,计算算术均数:

2.加权法 算术均数加权法计算公式见式5-2。

对于频数分布表资料,计算算术均数时要考虑各组的权重(频数),即计算加权算术平均数。

式中: m 1 m 2 ,…, m n 为所有观察组段的组中值, f 1 f 2 ,…, f n 为对应组段的频数。

根据例3-3的数据,计算120名正常成年人血清铜平均含量:

(二)算术均数的应用

对于对称分布资料,特别是正态分布或近似正态分布资料,均数最能反映分布的集中趋势,并位于分布的中心。因此,均数常用于这类数据资料集中趋势的描述。对于偏态分布资料,均数则不能较好地描述分布的集中趋势,这时需要利用几何均数或中位数来描述。

二、几何均数

几何均数(geometric mean)是 n 个变量值乘积的 n 次方根,记为 G 。适用于各观察值之间呈倍比关系的偏态分布资料或对数正态分布的资料,如抗体滴度资料、细胞计数等,这种情况下,几何均数可以较好地反映它们变化的集中趋势或平均水平。

(一)几何均数的计算

几何均数的计算公式如下:

【例5-1】 在某医院传染科病人中随机抽样获得10例慢性乙型肝炎患者,测得其血清相关抗原滴度分别为1∶8、1∶16、1∶32、1∶32、1∶64、1∶64、1∶128、1∶512、1∶512、1∶1024。求平均抗原滴度。

故该10例慢性乙型肝炎患者的血清相关抗原平均滴度为1∶119。

(二)几何均数的应用

变量值呈倍数关系或呈对数正态分布(正偏态分布),如抗体效价及抗体滴度,某些传染病的潜伏期、细菌计数,投资风险、回报率等,宜采用几何均数表示其平均水平。

(三)应用几何均数的注意事项

1.观察值不能有0,因为0不能取对数,不能与任何其他数呈倍比关系。

2.观察值不能同时有正有负,因为同时有正有负,相乘后,积可能为负,负数不能开 n 次方。

3.观察值若同为负数,计算时,可以先舍去负号计算,得到结果后再加上负号。

三、中位数和百分位数

中位数(median)指将 n 个数据从小至大按顺序排列,位次居中的观察值或位次居中两个观察值的均数,记为 M e 。中位数是一位置指标,在全部观察值中大于和小于 M e 的观察值的个数相等,它反映了一批观察值在位次上的平均水平。百分位数(percentile)也是一位置指标,用符号 P x 表示,读为第 X 百分位数,意指将 n 个观察值从小到大依次排列,再分成100等份,对应于 X %位的数值。 P x 将全部观察值分为两部分,理论上有 X %的观察值比它小,有(100- X )%的观察值比它大,其中, P 50 为第50百分位数即 M e ,可通过求 P 50 得到中位数,适用于观察值较多的频数分布资料。

(一)计算

1.直接计算法 先排序,再找出位次居中的观察值或计算出位次居中两个观察值的均数即可。

2.百分位数法 P x 的计算步骤如下。

(1)编频数分布表,并计算各组段累计频数和累计频率。

(2)确定 P x 所在的组段:为累计频率略大于 X %的那一组段。

(3)按公式5-4计算 M e 或其他 P x

式中: L 为欲求的 P x 所在组段的下限, i 为该组段的组距, f x 为该组段的频数, n 为总频数,∑ f L 为该组段之前的累计频数。

【例5-2】 某市120名肺癌患者中西医结合治疗后的生存期资料如表5-3,试求平均生存时间(月份)。

表5-3 某市120名肝癌患者中西医结合治疗后的生存月数

据表可知,第四组段累计频率为68.3%,略大于50%,因此,该组段即为 P 50 所在组段,按公式5-4求解如下:

某市120名肺癌患者中西医结合治疗后的平均生存期为8.7个月。

(二)应用

中位数可用于各种分布的定量资料,但对于正态或近似正态分布资料以及适合几何均数的资料,更适宜采用算术均数和几何均数描述集中趋势(如例5-1)。因此,实际工作中,中位数常用于描述偏态分布资料的集中趋势(如例5-2),反映位次居中的观察值的水平。此外,中位数还用于“开口资料”以及分布不明资料的集中趋势的描述。

四、众数

众数(mode)是一组数据中出现次数最多的数值,也就是一组数据中占比例最多的那个数,用 M o 表示。

(一)众数的计算

1.众数简单而言,就是一组数据中出现次数最多的数值。

例如:1,2,3,3,4的众数是3。

2.有时一组数据中的众数不止一个,甚至有好几个。如果有两个或两个以上的数出现次数都是最多的,那么这几个数都是这组数据的众数。

例如:1,2,2,3,3,4的众数是2和3。

3.如果所有数据出现的次数都一样,那么这组数据没有众数。

例如:1,2,3,4,5就没有众数。

(二)众数应用的注意事项

1.用众数代表一组数据,可靠性较差,不过,众数不受极端数据的影响,并且求法简便。在一组数据中,如果个别数据有很大的变动,选择中位数表示这组数据的“集中趋势”就比较适合。

2.当数值或被观察者没有明显次序(常发生于非数值型资料)时,由于可能无法计算算术平均数和中位数,则适于用众数来表达其集中趋势。如:鸡、鸭、鱼、鱼、鸡、鱼的众数是鱼。 xqayx3yLFGQ1IzzaUOPOFIfD4nPI8JRiyabTqqC+tkZOxv5Cz9MwCpND1j7ArpEZ

点击中间区域
呼出菜单
上一章
目录
下一章
×