我国统计学家田凤调教授于1988年提出秩和比法,此后,该方法广泛应用于医疗卫生领域的多指标综合评价、统计预测预报、统计质量控制等各方面。在此基础上,田凤调教授和多位学者不断对此方法进行了充实和扩展。
秩和比(rank sum ratio,RSR)指行(或列)秩次的平均值,是一个非参数统计量,具有0~1连续变量的特征。在综合评价中,秩和比综合了多项评价指标的信息,表明多个评价指标的综合水平, RSR 值越大越优。
在一个 n 行( n 个评价对象) m 列( m 个评价指标)矩阵中, RSR 的计算公式为:
式中 i =1,2,…, n , j =1,2,…, m , R ij 表示第 i 行第 j 列元素的秩, RSR i 是第 i 个评价对象的秩和比。
当各评价指标的权重不同时,计算加权秩和比 WRSR ,其计算公式为:
式中
i
=1,2,…,
n
,
j
=1,2,…,
m
,
R
ij
表示第
i
行第
j
列元素的秩,
W
j
为第
j
个评价指标的权重,
。
RSR
值无量纲,最小值为:
,最大值为:
RSR
max
=1。
RSR 的优越性主要表现为:综合能力强,可代替一些专用综合指数,也可显示微小变动,而对离群值不敏感;但其局限性主要为:指标值采用秩代换,会损失一些信息,有时难以恰如其分地给各个指标编秩等。
秩和比法指利用 RSR 进行统计分析的系列方法。其基本思想是:在一个 n 行 m 列矩阵中,通过秩转换,获得无量纲统计量 RSR ;在此基础上,运用参数统计分析的概念与方法,研究 RSR 的分布;以 RSR 值对评价对象的优劣直接排序或分档排序或比较各组 RSR 的可信区间。本法的理论意义在于扩大了非参数统计的功能,并揭示了近代非参数统计与古典参数统计的结合点,使两者相互补充,相得益彰,为最终实现完全融合创造条件。
利用秩和比法对多个对象进行综合评价时通常可用两种方法:排序分档法和可信区间法。
可计算各评价对象的 RSR 值,对评价对象进行直接排序或分档排序,并可进一步检验是否为最佳分档。具体步骤如下:
1.根据评价目的选择恰当的评价指标 RSR 有极强的综合力,除常用的评价指标外,还可容纳一些专用统计量的信息,如:样本含量 n 、标准差 S 、变异系数 CV 等,及根据已有指标计算得到的指标,如:变化量、发展速度等,或流行病学指标,如:比值比 OR 、相对危险度 RR 、人群归因危险度 PAR 等,因此在进行综合评价时应根据评价目的选择最恰当的评价指标。
2.确定各指标权重。
3.列原始数据表 将 n 个评价对象的 m 个评价指标排成 n 行 m 列的原始数据表,如各个指标不等权,则各指标权重系数单独列一行。
4.编秩 编出每个指标各对象的秩是秩和比法运用成败的关键之一。编秩时,应充分体现专业要求,力求所编秩次无逻辑上的混乱,按照研究目的,用辩证的观点来编秩。常用的编秩技巧见下文。
5.计算秩和比 根据公式(6-1)或公式(6-2)计算秩和比,按 RSR 值对评价对象的优劣进行直接排序。
6.确定
RSR
的分布
RSR
的分布是指用概率单位
Probit
表达的
RSR
值特定的向下累计频率。其方法为:①编制
RSR
频数分布表,列出各组频数
f
,计算各组累计频数∑
f
;②确定各组
RSR
的秩次
R
及平均秩次
;③计算向下累计频率
;④将百分率
p
换算为概率单位
Probit
,
Probit
为百分率
p
对应的标准正态离差
u
加5;例如百分率
p
=0.025 0对应的标准正态离差
u
=-1.96,其相应的概率单位
Probit
为5-1.96=3.04;百分率
p
=0.975 0对应的标准正态离差
u
=1.96,其相应的概率单位
Probit
为5+1.96=6.96。
7.计算回归方程
以累计频率所对应的概率单位值
Probit
为自变量,以
RSR
值为应变量,计算回归方程:
。
8.分档排序 根据 RSR 值对评价对象进行分档排序。分档依据为标准正态离差 u 。常用分档情况下的百分位数 P x 临界值及其对应的概率单位 Probit 值见表6-1。依据各分档情况下概率单位 Probit 值,确定 RSR 分档的阈值,对评价对象进行分档排序。具体分档数由研究者根据实际情况决定。
表6-1 常用分档情况下的百分位数 P x 临界值及其对应的概率单位 Probit 值
续表
9.最佳分档的检验 可以在按 RSR 值对评价对象进行分档排序后进行是否最佳分档的检验,适合多组 RSR 的比较。最佳分档的涵义是指各档方差一致,且 RSR 差异具有统计学意义。最佳分档的准则为:参照常用分档情况下的百分位数 P x 临界值及其对应的概率单位 Probit 值表,每档至少2例,尽量多分几组。检验步骤包括:
(1)方差一致性检验(Bartlett检验):设经分析,将
RSR
值分为
g
档,记各档包含的评价对象数为
n
i
,各档
RSR
均数为
、样本方差为
。假设检验为:
H 1 :各总体方差不全相等
α =0.10
在 H 0 成立的条件下,Bartlett检验统计量为:
式中
为合并方差,计算公式为:
通常,有
。
按
α
=0.10水准,查
χ
2
界值表得
。若
,则
P
>0.10,不拒绝
H
0
;反之,若
,则
P
≤0.10,拒绝
H
0
,接受
H
1
。
(2)统计检验(
F
检验、
q
检验):在方差一致的前提下,作统计检验。设全部评价对象数为
N
,
C
=
,则各档
RSR
比较的方差分析表见表6-2。
若各档 RSR 之间差别有统计学意义,可用SNK- q 检验对各档 RSR 进行两两之间的全面比较。检验统计量 q 有专门的 q 界值表,计算公式为:
式中,
,
n
i
和
,
n
j
为两对比档
RSR
的均数和评价对象数。
表6-2 各档 RSR 比较的方差分析表
通过可信区间的计算,可以对两组或几组 RSR 进行比较,在排序分档法基本步骤1~5的基础上,常用以下两种计算方法得到 RSR 的可信区间:
(1)将 RSR 当累计频率看待,作平方根反正弦代换,可得
式中,当
RSR
为1时,以
代替,
y
的标准误为:
式中, N 为各组调和均数,当分组较多,指标计算复杂,可用格子数代之,即 N = m × n 。
y 的双侧1- α 可信区间为:
例如, y 的双侧95%可信区间为 y ±1.96 S y 。
(2)将 RSR 当相关系数看待,作反正切双曲代换,可得
Z 的标准误为:
Z 的双侧1- α 可信区间为:
例如, Z 的双侧95%可信区间为 Z ±1.96 S Z 。
各对比组的可信区间,如果交叉重叠少于一半,则按照 α 水准,可以认为差异有统计学意义,对比组 RSR 不同;如果交叉重叠超过一半,则按照 α 水准,还不能认为差异有统计学意义;如果交叉重叠恰好一半,下结论应慎重,最好结合其他检验方法考虑。
通常,可根据专业知识区分指标是高优还是低优,如:治愈率、人均期望寿命、受检率等可视为高优指标;失访率、漏诊率、病死率等可视为低优指标。有时,指标的属性要根据不同的研究目的确定,如:体重作为衡量青少年生长发育状况的一个指标时是高优指标,但在研究肥胖症儿童病情控制时,则为低优指标。还有一些指标为中优(不分高优与低优)的指标。指标编秩的基本方法如下:
(1)高优指标从小到大编秩,即以指标最小值编以秩次1,指标次小值编以秩次2,……,指标最大值编以秩次 n ;低优指标则相反,从大到小编秩。同一指标数值相同者编以平均秩。
(2)中优的指标各评价对象统一编以平均秩;或者可将标准值编为1,按三角函数或梯形函数规则对其他不同取值范围内的观测值编秩。
(3)运用高优、低优与中优指标进行各种组合,可表达秩次的细微差别。此时,秩次赋予的标准为:偏高(低)优=1/2(高(低)优+中优),稍高(低)优=1/2(偏高(低)优+中优)。通常,最多编秩不超过7个层次(低优、偏低优、稍低优、中优、稍高优、偏高优及高优)。
例6-1 5家三甲医院患者候诊等待时间,具体数据及结果见表6-3。
表6-3 5家三甲医院患者候诊等候时间分布情况的综合评价 单位:%
本例在编秩时7个分组选用了7个层次。分析表明,5家三甲医院患者候诊等待时间相差不大。如以百分计,最低为A医院45.7分,最高为E医院69.6分。
(4)如果某指标存在标准值
X
S
,即当指标值
X
i
取
X
S
时最优,超过或不及
X
S
,距离越远越差,则当
X
i
<
X
S
,用换算值
编秩;当
X
i
≥
X
S
,用换算值
编秩。
例6-2 某地区2010—2018年单年卫生工作质量与效率的综合评价,治愈率、好转率、病死率等资料及综合评价结果见表6-4。
本例中政策范围内住院费用医保支付比例和人口自然增长率通常为高优指标,但考虑到过高仍属不正常现象,值得管理者注意,因此,在计算 RSR 值时,标准值 X S 的引入,体现了辩证的观点。
(5)如果某指标为低优指标,且存在某临界值 X S ,则取值小于 X S 均编以最大秩次,超过(或达到) X S 的指标值均编以最小秩次;如果某指标为高优指标,且存在某临界值 X S ,则超过 X S 编以最大秩次,小于(或等于) X S 的指标值均编以最小秩次。
例6-3 10批酱油样品卫生监测及其评价,各批卫生监测指标具体数据及综合评价结果见表6-5。
分析表明,10批酱油由优至劣的排序为样品10、样品8、样品9、样品4、样品6、样品3、样品7、样品2、样品5、样品1。
表6-4 某地区2010—2018年卫生工作指标 *
* X S 的 值来源于该地“十三五”健康规划
表6-5 10批酱油样品卫生监测指标
例6-4 某年某省10个地区孕产妇保健工作的产前检查率 X 1 (%)、孕产妇死亡率 X 2 (1/10万)、围产儿死亡率 X 3 (‰)资料见表6-6,拟综合上述3个指标进行综合评价。
(1)列原始数据表:将 n 个评价对象的 m 个评价指标排成 n 行 m 列的原始数据表,本例 n =10, m =3,见表6-6。
表6-6 某年某省10个地区孕产妇保健工作的3项指标值及 RSR 计算
(2)编秩:根据专业知识,产前检查率为高优指标,指标值越大其秩越高;孕产妇死亡率、围产儿死亡率均为低优指标,指标值越大其秩越低,编秩结果见表6-6。
(3)计算秩和比,根据 RSR 值对评价对象的优劣进行直接排序:根据公式(6-1)计算孕产妇保健工作的 RSR 。例如对A地区:
余类推。据 RSR 值,可直接对10个地区的孕产妇保健工作排序。显然,孕产妇保健工作综合评价相对最劣的为J地区,其次为B、D地区,相对最优的为H地区。
(4)确定 RSR 的分布:孕产妇保健工作 RSR 的分布见表6-7。
表6-7 表6-6的 RSR 值的分布
*
按
估计
(5)计算回归方程:以累计频率所对应的概率单位值 Probit 为自变量,以 RSR 值为应变量,求得回归方程:
(6)分档排序:本例将孕产妇保健工作拟分上、中、下3档。参照表6-1,以相应概率单位 Probit 值代入上述回归方程推算所对应的 RSR 估计值,确定分档标准。根据 RSR 值进行分档排序,结果见表6-8。例如J地区的 RSR j =0.100 0,因此J地区分档等级为下,余类推。
表6-8 某省某年10个地区孕产妇保健工作分档排序
* 按分档规则每档至少2例,下调
综合评价亦可结合实际情况对不同指标赋予不同的权重,见下例。
例6-5 某研究者拟综合8个指标对山西省2008—2014年孕产妇保健工作进行评价,资料见表6-9。
表6-9 山西省2008—2014年孕产妇保健工作评价指标加权秩和比值
(1)列原始数据表:见表6-9,其中 W j 为各指标权重。
(2)编秩:根据专业知识,建卡率、系统管理率、产前检查率、产后访视率、住院分娩率和新法接生率为高优指标,指标值越大其秩越高;高危产妇比重、孕产妇死亡率为低优指标,指标值越大其秩越低,编秩结果见表6-9。
(3)计算秩和比,根据 WRSR j 值对评价对象的优劣进行直接排序。根据公式(6-2)计算各年度住院医疗质量的 WRSR ,结果见表6-9。例如2008年:
余类推。据 WRSR j 值,可直接对7个年度的孕产妇保健工作质量排序。显然,孕产妇保健工作评价相对最劣的为2008年,其次为2009年、2011年和2010年,相对最优的为2014年。
(4)确定 RSR 的分布:2008—2014年度的孕产妇保健工作质量的 WRSR 的分布见表6-10。
表6-10 表6-9的 RSR 值的分布
*
按
估计
(5)计算回归方程:以累计频率所对应的概率单位值 Probit 为自变量,以 WRSR 值为应变量,求得回归方程:
(6)分档排序:本例将7个年度的孕产妇保健工作质量拟分上、中、下三档。根据 WRSR 值进行分档排序,结果见表6-11。
表6-11 山西省2008—2014年孕产妇保健工作评价结果分档排序
* 按分档规则每档至少2例,下调
例6-6 某医生综合考虑某种疾病8种治疗方案的有关信息,见表6-12,试对8种方案进行综合评价。
表6-12 8种治疗方案的综合比较
(1)列原始数据表:将 n 个评价对象的 m 个评价指标排成 n 行 m 列的原始数据表,本例 n =8, m =5,见表6-12。
(2)编秩:根据专业知识,5项指标均为低优指标,指标值越大其秩越小。
(3)计算秩和比:根据 RSR 值对评价对象的优劣进行直接排序:根据公式(6-1)计算各治疗方案的 RSR ,结果见表6-12。
据 RSR 值,可直接对8种治疗方案排序。可见,综合评价相对最劣的为方案6,其次为方案3和方案4,相对最优的为方案1。
(4)确定 RSR 的分布:8种治疗方案 RSR 的分布见表6-13。
(5)计算回归方程:以累计频率所对应的概率单位值 Probit 为自变量,以 RSR 值为应变量,求得回归方程:
表6-13 表6-12的 RSR 值的分布
*
按
估计
(6)分档排序:本例将8种治疗方案拟分优、良、中、差四档。根据 RSR 值进行分档排序,结果见表6-14,由于无任一方案归为差档,故实际分为优、良、中三档。
表6-14 8种治疗方案 RSR 的排序与分档
* 按分档规则每档至少2例,上调
(7)方差一致性检验:
H 1 :各总体方差不全相等
α =0.10
算得
按
α
=0.10水准,查
χ
2
界值表得
,即
,则
P
>0.10,不拒绝
H
0
,还不能认为各组方差不等。
(8) F 检验(与 q 检验): F 检验提示各档间 RSR 差别有统计学意义,结果见表6-15与表6-16。
表6-15 例6-6各档 RSR 的部分分析结果
表6-16 例6-6各档 RSR 比较的方差分析表
进一步用SNK- q 检验对各档 RSR 进行两两之间的全面比较:
H 0 : μ A = μ B ,即任两对比较组的总体均数相等
H 1 : μ A ≠ μ B ,即任两对比较组的总体均数不等
α =0.05
将三档
由小到大排列,并编组次:
列出对比组,并计算两对比组的均数之差,并写出两对比组包含的组数 a (表6-17)。
计算检验统计量 q 值。例6-6已求得 MS 误差 =0.010 4, ν 误差 =5。良、中、优三档包含的方案数为4,2,2,按公式(6-5)和公式(6-6)计算 q 值,结果见表6-17。查 q 界值,得出相应的 q 界值。以实际的 q 值和相应的 q 界值作比较,确定对应的 P 值。
表6-17 例6-6各档 RSR 两两比较的 q 检验分析表
按 α =0.05水准,8种治疗方案中,较好的依次为方案1、方案7、方案2、方案5,较差的依次为方案6、方案3、方案4、方案8。
例6-7 某研究者尝试比较两种碘伏:碘伏A(有效碘含量5.483g/L,pH 2.18)、碘伏B(有效碘含量5.324g/L,pH 2.00)和一种碘酊(有效碘含量8.860g/L,pH 5.18)的杀菌效果,试验菌为大肠杆菌(8099)、金黄色葡萄球菌(ATCC 6538)和白色念珠菌(ATCC 10231)。实验数据见表6-18,对三种消毒剂的杀菌效果进行综合评价。
(1)列原始数据表:将 n 个评价对象的 m 个评价指标排成 n 行 m 列的原始数据表,本例 n =3, m =11,见表6-18。
(2)编秩:根据专业知识,在相同作用时间下,各含碘消毒剂达到消毒标准的最低有效碘浓度越低越好,视为低优指标。
(3)计算秩和比:根据 RSR 值对评价对象的优劣进行直接排序:根据公式(6-1)计算三种含碘消毒剂杀菌效果的 RSR ,结果见表6-19。
表6-18 三种消毒剂杀毒效果及编秩情况
* A,作用不同时间杀灭率达99.90%的最低有效碘含量(mg/L)
B,作用不同时间杀灭率达100.00%的最低有效碘含量(mg/L)
(4)计算各秩和比的95%可信区间:根据可信区间的重叠情况对消毒剂杀菌效果进行优劣评价,结果见表6-19和图6-1。
表6-19 三种含碘消毒剂杀菌效果评价
图6-1 三种含碘消毒剂杀菌效果的95%可信区间
例如,对碘伏A,由公式(6-7)和公式(6-8)得
由公式(6-9)得 y 的95%可信区间为45.86±1.96×4.99,即(36.09,55.63)。
余类推。由图中可见,碘酊的95%可信区间与两种碘伏的95%可信区间均无交叉,可以认为碘酊的杀菌效果较两种碘伏好。碘伏A与碘伏B的95%可信区间交叉重叠长度为53.90-36.09=17.81>9.77,超过一半,还不能认为碘伏A与碘伏B的杀菌效果有差异。
(史静琤 王仕文)