在对事物进行评价时,通常要综合考察诸多因素的影响,确定评价的指标体系是基础。指标是根据研究目的和研究对象特征选取的,是能够表征研究对象某一方面特征的依据。评价指标体系是指由表征评价对象各方面特性及其相互联系的多个指标所构成的具有内在结构的有机整体。它能够综合反映研究对象根据研究目的确定的各个方面特征。指标体系的建立,要根据具体的研究目的和研究问题来确定。只有建立科学合理的评价指标体系,才有可能得出科学公正的综合评价结论。建立评价指标体系时,以下几条原则可供参考:
指标宜简不宜繁。评价指标并非多多益善,过于冗长的指标体系,会增加评价的时间和成本,也可能会降低评价质量。
指标要内涵清晰、相对独立。同一级别的各指标之间应尽量不相互重叠,不具相关性。
指标应能很好地反映研究对象某方面的特征。研究对象通常包含若干特征,每一个特征可能由若干指标来表征。指标应对其所属特征具有较好的代表性。
指标应能反映不同特征研究对象之间的差异。评价指标和评价标准的制定要能够体现不同特征对象的差异,便于比较。
指标应具有可测性、可获得性。指标收集应易于操作和测量。评价指标含义要明确,数据要规范,资料收集要简便易行。
选择评价指标的方法有很多,大致分为主观选择法和客观选择法,本章介绍以下几种常见方法。
即根据有关的理论和实践知识,来分析各个指标对评价结果的影响,“系统分析法”是一种常用的凭经验挑选指标的方法,这种方法从整体出发,将与评价结果有关的诸指标按系统(或属性、类别)划分,在对各系统的指标进行分析的基础上,通过座谈的方法或填写调查表的方法获得各指标的专家评分,确定其主次,再从各系统内挑选主要的指标作为评价指标。在缺乏有关历史资料,或指标难于数量化时,此法可较简便地确定评价指标集。此外,尚可采用“文献资料分析优选法”,即全面查阅有关评价指标设置的文献资料,分析各指标的优缺点并加以取舍。
在掌握有关历史资料的基础上,对所有可能的指标逐个进行单因素分析,依据可能的评价结果进行分组,并逐个进行单因子的假设检验,挑选那些在某一概率水准上有统计学意义的指标作为评价指标。或者将各指标与可能的评价结果进行简单相关分析,挑选那些与所属概念相关性较好的指标作为评价指标。该法较为直观简便,但缺乏对所有影响因子的全盘考虑,忽略了评价指标间的相互作用,因此最好结合其他方法使用。
即所谓相关度分析。在掌握有关历史资料的基础上,以全体可能的评价指标作为自变量,以可能的评价结果作为应变量进行多元线性相关分析,计算各指标的标准化偏回归系数。一方面,可根据偏相关系数的绝对值大小将各指标排序,另一方面,可逐个对这些偏相关系数进行假设检验,挑选那些偏相关系数在某一概率水准上有统计学意义的影响因子作为评价因子。这种方法既考虑到各影响因素的单独作用,又考虑到各影响因素间的相互关系,无疑是一种效率较高的指标选择方法。
在掌握有关历史资料的基础上,以全体可能的评价指标作为自变量,以可能的评价结果作为应变量进行多元线性回归分析,计算诸影响指标的标准化偏回归系数,依据其绝对值大小,可将诸影响指标排序;或对计算出的偏回归系数逐个进行假设检验,在某一概率水准上挑选那些对评价结果作用显著的指标作为评价指标。逐步回归是多元回归的发展和深化。它是在考虑对回归平方和贡献大小的基础上,逐个选入或剔除自变量,在最终建立的回归方程中,只包含那些对应变量作用显著的自变量,因而本方法有自动挑选主要影响指标的功能,是目前最常用的指标挑选方法。
所谓多重共线性是指一些自变量之间存在较强的线性关系,这种情况在实际应用中非常普遍,如研究高血压与年龄、吸烟年限、饮白酒年限等因素的关系,这些自变量通常是相关的,如果这种相关程度非常高,使用最小二乘法建立回归方程就有可能失效,引起下列一些不良后果:参数估计值的标准误变得很大,从而 t 值变得很小;回归方程不稳定,增加或减少某几个观察值,参数估计值可能会发生很大的变化; t 检验结果不准确,误将应保留在方程中的重要变量舍弃;估计值的正负符号与客观实际不一致。在这种情况下,岭回归方法将是进行数据处理的较为理想的方法。
多重共线性是一种近似的线性相关现象,假定存在不全为零的常数 C i ( i =1,2,…, m ),使得公式(2-1)成立:
则称变量 X 1 , X 2 ,…, X m 具有多重共线性。
对于成对变量的共线性,可用简单相关系数来考察,当简单相关系数值高达0.70以上时,就有共线性的可能;但多个变量的共线性,却不宜用此法识别,因为在任何两个变量间的简单相关系数都不大的情况下,仍有可能存在多重共线现象。检测数据中是否存在多重共线性的一般方法是,先求解自变量相关矩阵的特征值。如果出现特别小的特征值,例如比0.01还小,或者所有特征值倒数之和为自变量数的5倍以上时,就表明存在多重共线性。一个基于特征值的常用量称为条件数 k ,定义为(最大特征值/最小特征值) 1/2 ,大的 k 值示意共线性,例如 k ≥30时,认为有共线性。此时不宜采用基于最小二乘法的回归分析,而应采用岭回归分析。
简单说来,岭回归就是用“1.0+ K ”( K >0)代替自变量相关矩阵中的主对角线元素“1.0”,以降低多元共线现象的影响。只要 K 值选择得当,岭回归不仅能减小多元共线性效应,而且岭估计比最小二乘估计可能更接近于真实的回归系数。
这是20世纪70年代初期提出的一种选择模型的方法,这个方法基于所谓 AIC 统计量:
所谓“模型最大似然值”,理解为 Supf θ ( x , θ ),此处 f ( x , θ )表示模型参数为 θ 时,观察结果 x 的密度函数。不同模型的选择,意味着 θ 的形状不同,因而 Supf θ ( x , θ )也不同。式中第二项对模型中参数个数起约束作用,在“模型最大似然度”接近时,参数个数越少越好。
对满足正态假定的线性回归模型而言,上式经变换可得到:
式中 n 为观测次数或样品数; RSSp 为模型中含 p 个自变量时的剩余平方和; p 为模型中包含的自变量个数。
AIC 准则归结为:选择评价指标子集 p ,使(2-3)式达到最小值。或者说,在各种自变量的组合中,挑选使 AIC 为最小的那个组合作为挑选的评价指标子集。
在存在众多指标的情况下,可将相近指标聚成类,然后每类找一个典型指标作为该类指标的代表,从而用少量几个典型指标作为评价指标代替原来众多的指标建立评价模型。具体实施步骤请参考有关专著。
在实际工作中,我们往往综合使用多种方法进行指标筛选,在获得较为满意的专业解释的基础上,优先考虑那些被多种方法同时选入的指标。
在利用挑选出来的评价指标建立综合评价模型时,还应当考虑各指标对评价结果的影响大小,即各个评价指标在评价模型中的权重问题。权重是指某一评价指标相对于评价目标的重要程度,其不同于一般的比重,体现的不仅仅是某一因素或指标所占的百分比,更强调因素或指标的相对重要程度。
通常用于确定指标权重的方法很多,归纳起来,有主观赋权法、客观赋权法和主客观结合赋权法三类,主观赋权法主要包括专家评分法、成对比较法、Saaty权重法等;客观赋权法主要包括模糊定权法、秩和比法、熵权法、相关系数法等。不论哪一种方法所定权重分配既有相对合理的一面,又有局限的一面,这表现为:主观定权指在权重形成过程中因渗入人的主观因素而可能产生因人而异的差异性。客观权重的形成则受样本和数据的代表性影响,因此用不同方法确定的权重分配,可能不尽一致,这将导致权重分配的不确定性,最终可能导致评价结果的不确定性。因而在实际工作中,不论用哪种方法确定权重分配,都应当依赖于较为合理的专业解释,也可以通过不确定性分析(详见本书第三章)进行可靠性的评估。
以下介绍几种较为常用而简便的赋权方法。
这是一种依靠有关专家,凭借他们在某一学科领域内的理论知识和丰富经验,以打分的形式,对各评价指标的相对重要性进行评估,然后借助统计手段,以确定各评价因子权重大小的方法。
所谓专家,应当是在自己所擅长的领域很少犯错误的专门人才。擅长领域 A i 是大系统 S 中某个子系统 S i 的组成部分,评估专家在 A i 领域拥有专门的知识和经验。例如,在临床医学系统中, A i 领域可能是内科、外科、妇产科或儿科等。在 A i 领域,评估专家应当拥有一定的信息贮备量,例如:一般方法学和基础;理论规律性与基本趋势的知识; A i 领域及其相近领域的交叉学科知识;以往评估的经验;对该部门其他评估专家不同观点的独立见解等。
在实际工作中,常用专家擅长系数和专家意见一致性系数等指标来估计专家评分方法所定权重分配的相对合理性。
某一评估专家的水平可以用“擅长系数”来表示。
式中 q 为擅长系数; p 为答错的概率。
若答对与答错的概率相等( p =0.50),则 q =0;理想的“绝对正确”评估专家, p =0, q =1。当然,错答的概率还取决于提问的复杂性与重要性。通常在选择评估专家时,其擅长系数不应低于0.80。
专家组人数取决于评估问题的规模。人数太少,限制学科代表性;人数太多,难以组织与进行结果处理。据研究,对于评价而言,评价精度与参加人数呈函数关系,即随人数增加精度提高,但当人数接近15时,进一步增加专家人数对评价精度影响不大,此点似可供确定评估专家人数时借鉴。有人提出以10~50人为宜。
(1)直接评分法
1)评分方式:可分别采用专家个人判断、专家会议、“头脑风暴”等各种方式。
个人判断,即分别征求专家个人意见,在专家各自单独给评价因子的相对重要性打分的基础上,进行统计处理,以确定各因子的权重。该法主要优点是专家打分时不受外界影响,没有心理压力,可以最大限度地发挥个人创造能力;主要缺点在于仅凭个人判断,易受专家知识深度与广度的影响,难免带来片面性。
专家会议,即召集所有被挑选的专家开会,以集体讨论的方式进行评分,然后再借助统计方法确定各指标的权重。该法目前较为常用,其主要优点是可以交换意见,相互启发,弥补个人之不足。然而专家会议也有明显的缺点,主要表现在易受心理因素的影响,如不愿公开修正已发表的意见等。为了克服以上缺点,近年来有人提出召开“头脑风暴”式的专家会议。所谓“头脑风暴”,是通过专家间的相互交流,使专家的意见不断集中和精炼。该方法作为一个创造性思维方法,已在预测与评价中得到广泛应用。这种方法对参与会议的专家及专家发表意见的方式都有一些相应的规定,例如,当参加会议的专家相互认识时,要从同一职位人员中选取,领导人员不应参加,否则下属人员将产生心理压力;当参加者互不认识时,可在不同职位的人员中选取,这时不论成员的职务与职称等级,都给以同等对待;而且提倡会议参加者即席发言,不对别人的意见提出质疑和批评等。这样将有助于克服一般专家会议的短处,而发扬其长处。
2)评价指标权重的确定:首先由参加评估的专家给各评价指标的相对重要性一个评价分数,通常用100分制或10分制评分法;有时也可根据需要采用等差或等比级数评分法。例如将权重分为极重要、重要、一般和不重要四级时,各级权重评分之比可按等差(例如4、3、2、1)给分,或按等比(例如16、8、4、2)给分。然后计算每一评价指标的平均分数,如果不考虑专家的权威程度,则根据各评价指标的平均分数便可确定各指标的权重;如果考虑专家的权威程度,则应计算每一指标的加权平均分数,并以此确定各指标的权重。
例2-1 医学教育是卫生健康事业发展的重要基石,高质量医学人才是推进高质量卫生健康事业发展的重要保证。为推动高等医学教育高质量发展,需要制订临床教学基地评审标准。遵循科学性、导向性、可操作性等原则,建立普通高等医学教育临床教学基地评审标准,包含7个一级指标,选定10个专家对评审标准指标体系进行权重评估,各级评价指标见表2-1,各评价指标得分见表2-2。
如不考虑各专家权威程度,则各评价指标的权重比例为:
,经归一化处理后,权重分配为
W
1
∶
W
2
∶
W
3
∶
W
4
∶
W
5
∶
W
6
∶
W
7
=0.12∶0.15∶0.19∶0.15∶0.13∶0.14∶0.12。
如果考虑各专家的权威程度,则应计算另一个指标:各专家权威程度系数。
专家的权威程度一般由两个因素决定,一个是专家水平及其打分的判断依据,用 A i 表示;另一个是专家对问题的熟悉程度,用 A s 表示。专家权威程度以自我评估为主,有时也可相互评估。自我评估时,应填写判断依据及其影响程度表和对问题熟悉程度表(表2-3、表2-4)。
表2-1 各级评价指标
* 教学地位指教学医院对临床教学的重视程度
表2-2 各一级评价指标得分
表2-3 专家判断依据及其影响程度
表2-4 专家对问题的熟悉程度系数
然后分别据表2-3和表2-4求出某专家的判断系数 A i 与熟悉程度系数 A s ,则某专家权威程度系数为:
A a 求出后,把它作为权重,对各评价指标的评分值进行加权平均,即可得到加权后的权重分配。
设上面讨论的问题主要涉及普通高等医学教育临床教学基地方面的问题,某专家填表结果如表2-3和表2-4中“*”所示,则该专家:
A i =0.30+0.40+0.05+0.05=0.80
A s =0.70
A a =(0.80+0.70) / 2=0.75
并按此法分别求得其他9位专家的 A a 为:0.85,0.95,0.80,0.85,0.95,0.85,0.85,0.80,0.80,那么加权后的权重分配为:
,经归一化处理后,权重分配为:
W 1 ∶ W 2 ∶ W 3 ∶ W 4 ∶ W 5 ∶ W 6 ∶ W 7 =0.12∶0.15∶0.19∶0.15∶0.13∶0.14∶0.12
3)专家意见协调系数:设参与权重评估的专家数为
n
,待评估指标数为
m
,则反映
n
个专家对全部
m
个指标权重评估的协调程度(或一致程度)的指标称为协调系数,以
ω
表示。首先根据专家评分对各指标评分编秩(
R
ij
),并计算各指标秩和(
T
i
),然后再计算各指标的平均秩和(
),根据各指标的离均差平方和求出一致性系数。现以上题为例,说明其计算方法(表2-5)。
①按专家对各指标评分排秩,遇相等评分时,取平均等级,并按指标计算秩和,然后再计算各指标的平均秩和:
式中 T i 为第 i 个评价指标之秩和; R ij 为第 j 个专家对第 i 个指标的评分等级。
表2-5 专家协调系数计算表
式中
为各指标平均秩。
本例教学地位指标秩和为:
,余类推。
各指标平均秩和为:
②计算协调系数:
式中
当有相同秩次时,要对 ω 进行校正
式 t k 为相同秩次的个数。
协调系数在0~1之间取值,越接近1,表示所有专家对全部指标评分的协调程度较好,反之,则意味着专家们协调程度较差,说明专家之间对各评价指标相对重要性的认识存在较大的不一致性。当然,我们希望协调系数越大越好,这说明各评价指标的权重估计较为稳定可靠。本例,
(2)成对比较法:专家组根据评价目的,将每一评价指标分别与其他评价指标成对比较,其中较重要的记1分,较不重要的记0分;在建立成对比较矩阵的基础上,建立评价指标权重矩阵,以确定权重。
例2-2 拟选用5个指标对某医疗仪器进行质量综合评价,试确定各指标的权重。
首先将各指标进行一一对比打分,并列出成对比较矩阵,如表2-6所示。
表2-6 成对比较判断矩阵
表2-6的最左边纵向列出的指标称为列指标,表的最上边横向列出的指标为行指标。当专家组认为列指标优先于行指标时,相应格子中斜线的上半部记1,下半部记0,反则反之。显然,当列指标与行指标系同一指标时,相应格子的斜线上下不作任何标记。对于本例,经专家组比较后确认: B 比 A 重要, A 得0分, B 得1分; A 比 E 重要, A 得1分, E 得0分;……所有各种组合的成对比较结果见表2-6,并累积各评价指标总分,见表2-6最右边一栏。
为确定各评价指标的权重,必须建立如表2-7所示的权重矩阵。该表中,首先按得分高低排序;而后由专家组确定各评价指标间的相对重要程度,如 D 为 E 的1.2倍, A 为 D 的1.5倍, C 为 A 的1.5倍, B 为 C 的1.2倍等,如表中第(3)栏所示;然后计算各指标的初始权重,令得分最低指标 E 的初始权为1.0,再结合第(3)栏数据求出各指标的初始权重。例如 D 的初始权重为1.0×1.20=1.20, A 的初始权重为1.20×1.50=1.80,……,为计算方便,最后将各指标的初始权重进行归一化处理,便得到各指标的权重分配,如第(5)栏所示。
表2-7 用成对比较法确定各指标权重
(3)Saaty权重法:系Saaty在层次分析法中提出的权重计算方法。其主要步骤如下。
1)将评价指标进行对比打分,评分标准见表2-8。
表2-8 目标树图各层次评分标准 *
* 目标树是按照树形结构对评价目的进行组织的方法,它把不同的评价指标均归类到更高层次的评价指标之下。通过可视化的方式和分支层次来表示指标之间的逻辑关联
2)根据各指标对比打分值,建立判断矩阵。例如:拟据医疗工作、护理工作、膳食供应三个评价指标评价医院工作质量,试用Saaty法估计各指标的权重分配,见表2-9。矩阵中的各数值代表行指标与各列指标相比较时的相对重要程度,例如第一行第二列元素为3,表示医疗工作(行指标)之重要性略大于护理工作(列指标);第二行第一列元素则为第一行第二列元素的倒数,表示护理工作(行指标)的重要性略次于医疗工作(列指标),依此类推。
表2-9 第一个子目标分层成对比较判断优选矩
3)求判断矩阵的最大特征,根据 λ max 及其相应的特征向量 W max , W max 中的各分量即各指标的权重。
实际计算时,先用近似解法求各指标的权重:
式中
表示第
i
个指标的权重;
a
i
l
,
a
i
2
,…,
a
im
分别表示判断矩阵中第
i
行各元素;
m
表示评价指标个数。本例:
经归一化处理后:
可得到权重向量为:
W
1
=0.637 0,
W
2
=0.258 3,
W
3
=0.104 7,即权重分配为:医疗工作:护理工作:膳食供应=0.637 0∶0.258 3∶0.104 7。
亦有学者提出计算各指标权重更简便的方法,见表2-10。
表2-10 各指标权重计算
4)用一致性指标
CI
检验该项目的相对优先顺序有无逻辑混乱,一般认为,当
时,可能无逻辑混乱,即计算得的各项权重可以接受。其中:
当判断矩阵阶数>2时,用同阶平均随机一致性指标(random consistency index,RI)对
CI
进行修正,计算随机一致性率(consistent ratio,CR):
。
表2-11为3~9阶判断矩阵对应的 RI 的理论值。当随机一致性比率 CR 小于0.10时,通常认为判断矩阵具有满意的一致性,否则就需要调整判断矩阵,再次进行检验,直到通过一致性检验。
表2-11 3~9阶平均随机一致性指标 RI 的取值
本例
λ 1 =(1×0.637 0+3×0.258 3+5×0.104 7)/0.637 0=3.024
λ 2 =(1/3×0.637 0+1×0.258 3+3×0.104 7)/0.258 3=3.016
λ 3 =(1/5×0.637 0+1/3×0.258 3+1×0.104 7)/0.104 7=3.074
λ max =(3.024+3.016+3.074)/3=3.038
CI =(3.038-3)/(3-1)=0.019<0.10
CR =0.019/0.58=0.032 8<0.10
认为各项权重判断无逻辑错误,可以接受。
(4)关于组合权重问题:当评价指标可分层时,即某项或某几项评价指标可再分为次级评价指标时,则次级评价指标的权重既应考虑其本身在所有次级评价指标中的权重分配,又要考虑其高层评价指标在所有评价指标中的权重分配,即所谓组合权重。本文介绍以下两种求法:
1)代数和法:仍以医疗仪器质量评估为例说明。设前述五个评价指标又可分为三个次级评价指标,即装置A、装置B和装置C,试计算次级指标的组合权重。
①用成对比较法确定评价指标及次级评价指标的权重分配,见表2-12。
②计算各次级指标的组合权重,见表2-12最下面一行(合计)。
表2-12 组合权重计算
例如:装置A的组合权重=0.18×0.4+0.32×0.6+0.28×0.3+0.12×0.20+0.1×0.1=0.382。
2)乘积法:Saaty在层次分析法中提出了计算各层评价指标组合权重的方法。例如,拟对某市6所综合医院进行质量评估,用Saaty法求得各层次评价指标权重及最后评价指标的组合权重,如图2-1所示。对“医疗工作”而言,最后一层评价指标的组合权重等于各层指标权重的连乘积。例如,有效率的权重=医疗工作权重×医疗质量权重×疗效权重=0.637 0×0.539 6×0.667 0=0.229 3。
用某些统计方法进行资料分析时,可得到有关因素权重分配的信息,例如在多元回归分析及逐步回归分析中,各自变量的标准化偏回归系数值,即可视为各指标权重分配的依据;此外,如计数资料判别分析中的指数,计量资料判别分析中各因子的贡献率,主成分分析中得到的因子载荷和贡献率等,都可为确定指标权重提供必要的信息;某些特定的统计方法,例如去某死因后期望寿命的增量, PYLL 计算中各年龄组尚可生存年数等,都可为各死因的相对重要性提供有关权重分配的信息;还可根据专业需要,自行设计权重计算的公式。例如拟选用 DO 、 BOD 、 COD 、酚、 CN 五项指标进行水污染程度综合评价,考虑到各单项指标在总体污染中的作用,对于不同用途的水,应有不同侧重,因而对各单项指标应给予一定的权重。某单位采用根据分指标超标情况进行加权的方法,其计算公式为:
式中: C i 为 i 种污染物在水中的浓度; S i 为 i 种污染物对于某种用途水的浓度标准值; W i 为该污染物,或该项评价指标在综合评价中的权重。
由于 DO 指标与其他指标相反,其值愈大说明水质愈好,故计算权重时取其倒数。为了评价的方便,最后将各指标的权重值进行归一化处理。
图2-1 乘积法求各层次评价指标的组合权重
综合评价或多目标决策问题中,评价指标可分为高优指标、低优指标和中优指标。顾名思义,指标值越大越好的指标称为高优指标或正指标,例如收益率、治愈率、有效率等。相反,指标值越小越好的指标称为低优指标或负指标,例如死亡率、误诊率、人均诊疗费用等。而处于一定范围或特定值时达到最优的指标称为中优指标或适度指标,例如某些临床指标处于医学参考值范围内时为正常值,超出该范围则可能为异常值;又如人口数、平均病床使用率、门诊医师每小时工作量、试卷难度、照明强度等,不应过大或过小,而应趋于一个适度点。如果忽略中优指标,将其作为高优或低优指标处理,则会降低排序结果的可靠性和科学性。本节介绍几种中优指标转化为高优指标并进行无量纲化处理的方法。
由于不同评价指标的属性和量纲不一致,按照评价模型和特定权重进行排序之前,必须对各评价指标进行转化,以消除不同量纲、数量级和属性类型对排序结果的影响,包括评价指标的同趋势化和无量纲化。同趋势化是指将所有评价指标的属性转化为一致的方向,通常的做法是将低优指标和中优指标转化为高优指标。无量纲化是指将各评价指标的测量值转化为同一区间的数值,例如[-1,1],以消除量纲和数量级对评价结果的影响。中优指标常见的转化方法包括线性函数法、绝对距离法、隶属函数法和插值法等,研究者可根据决策指标的具体特征选择不同方法。
构建一个分段线性函数,当测量值处于一个适度区间内时(如医学参考值范围),将这些测量值全部判定为正常,并取值为0,即与最优方案的距离为0。若测量值超出参考范围,则计算该值与参考值范围边界的距离,见公式(2-16)。式中, X ij 为第 i 个评价对象的第 j 个指标值, R upper 和 R lower 分别表示该指标参考值范围的上限和下限。由于 d ij 均为正值,因此无量纲化方法可采用公式(2-17),由 Z ij 构成无量纲化矩阵。该转化方法为线性,因此适用于正态分布的指标。显然,该方法首先将中优指标转化为低优指标 d ij ,再将其转化为高优指标 Z ij 并进行无量纲化处理。
如果不考虑参考值范围内外的差别,则可计算每一个测量值与适度值的绝对距离,并取倒数,见公式(2-18)。式中,
X
ij
为初始值,
为同趋势化值,
μ
为适度值或测量值的均数,
a
是一常数,可避免出现分母为0的情形。也可使用本书第五章公式(5-2)的方法对中优指标进行转换。无量纲化方法采用向量规范化法,见公式(2-19)。该方法适合具有单个适度值而无确切参考范围的指标。
隶属函数是模糊推论模型中的一个概念。经典集合论认为,论域U中的每一个元素 X ,是否从属于子集A,都可用特征函数{0,1}表示,即0表示 X 不属于集合A,1则表示属于A。但模糊数学理论则认为, X 可以同时属于和不属于模糊子集A,其隶属于A的程度用 μ ( X )表示,称为A的隶属函数,值域为[0,1]的连续区间, μ ( X i )则是元素 x i 属于模糊子集A的隶属度。
以一个简单的例子说明隶属函数的概念:现有同一班级3门考试科目的平均成绩构成集合U={95,80,65}。“考试难度的合理性”是一个模糊概念,此处我们将模糊子集A定义为“考试难度合理”。此时要判定一门考试的难度是否合理,可构造一个隶属函数 μ ( x ),将平均分转化为该函数值域范围[0,1]内的一个值。假设转化后这3门考试隶属于模糊子集A的程度分别为0.5、0.9和0.5,即3门考试难度合理的程度是不同的。均分为80的科目考试合理性最高,而另外2门考试难度的合理性相对较低(一门过于简单,另一门则过难)。
在综合评价的TOPSIS法当中,可将模糊子集A视为“最佳方案集”或“理想状态集”,评价对象的某指标值接近正理想解的程度,就是它对子集A的隶属度。处理中优指标时,可构建一个隶属函数,将测量值转化为隶属度。公式(2-20)是隶属函数模型的一个简单例子,是对数函数和极差无量纲化法的结合。 X max 和 X min 分别表示测量值中的最大值和最小值, X opt 是适度值。 k 为一常数,用于调节隶属函数的值域,可令 X i = X opt , f ( X i )=1来反推 k 值。隶属函数的构造方法并不唯一,研究者可根据实际情况修改函数。
插值法是离散函数逼近的方法,原理是在离散数据的基础上补插形成连续函数,使得这条连续函数通过给定的离散数据点。设 f ( X )是一个表达式未知的函数,并已知 f ( X )在区间[ a , b ]上的 n +1个互异点 X 0 , X 1 , X 2 ,…, X n 处的函数值分别为 f ( X 0 ), f ( X 1 ), f ( X 2 ),…, f ( X n )。现构建一个函数 p ( X ),使 f ( X k )= p ( X k ),在一定取值区间内利用 p ( X )近似表示 f ( X )。
函数 f ( X )关于节点 X 0 , X k 的一阶均差,记为 f ( X 0 , X k ):
一阶均差 f ( X 0 , X k )和 f ( X 0 , X 1 )的均差则称为函数 f ( X )关于节点 X 0 , X 1 , X k 的二阶均差,记为 f ( X 0 , X 1 , X k ):
类似地, f ( X )关于 k +1个节点的 k 阶均差为:
特别地,对于三个互异的插值点,即适度点和参考范围的上下限,其插值见公式(2-24)。适度值(参考值范围均数或中位数)所对应的函数值记为 f ( X 0 ),参考值范围上下限所对应的函数值记为 f ( X 1 )和 f ( X 2 ),通常 f ( X 1 )= f ( X 2 ),以[ X 0 , f ( X 0 )],[ X 1 , f ( X 1 )]和[ X 2 , f ( X 2 )]三个点作为插值点,利用牛顿插值法公式获得函数。
例2-3 在某次调查中,研究者抽取了海南省10家三级甲等医院,进行“绿色医院”的综合评价。评价模型中,病床使用率和病房夜间照明强度属于中优指标,其原始数据见表2-13。试用上述方法对其进行同趋势化和无量纲化处理。
表2-13 “绿色医院”综合评价模型中的中优指标
根据文献和国家标准,病床使用率具有一个适度范围,即85%~93%,而病房照度是一个适度值,即100lx。在本例中,我们采用线性函数法和牛顿插值法对病床使用率进行转化,并采用绝对距离法和隶属函数法对病房照度值进行转化,并统一转化为高优指标,具体如下。
病床使用率适度范围的上下限分别为 R upper =93%, R lower =85%,代入公式(2-16)得下式
将初始值依次代入,得到原值与适度范围上限或下限的距离,即 d ij (低优),再代入公式(2-17)得到无量纲化值 Z ij (高优),见表2-13。
例如医院A, X ij =1.227,大于适度范围的上限,因此:
以三个点进行插值时,将得到一个二次函数。为使函数在当前取值范围内的值域介于[0,1]之间,病床使用率取适度范围中位数89%时,令函数值为1;病床使用率为85%和93%时,令函数值为0.99,因此3个插值点[ X 0 , f ( X 0 )],[ X 1 , f ( X 1 )],[ X 2 , f ( X 2 )]的取值分别为[0.89,1],[0.85,0.99],[0.93,0.99]。将插值点代入公式(2-24)后得到下式:
再将初始值依次代入该式,可直接得到高优的无量纲化值 f ( X ),见表2-14。
表2-14 病床使用率的同趋势化及无量纲化结果
根据公式(2-18),取病房照明强度的适度值 μ =100,常数 a =0得到下式,将初始值代入后得到绝对距离的倒数,即 X ij (高优),再代入公式(2-19)得到无量纲化值 Z ij (高优),见表2-15。
例如,对于医院A,首先进行同趋势化
然后进行无量纲化
表2-15 病房夜间照明强度的同趋势化及无量纲化结果
将病房照明强度的适度值 X i =100, f (100)=1,测量值中的最大与最小值 X min =8.68, X max =342.99代入公式(2-20),计算得到参数 k 1 和 k 2 。
将 k 1 和 k 2 回代入公式(2-20),得到下式。再将初始值依次代入下式,直接得到无量纲化值,即表2-14中的 f ( X i )。
由以上结果可知,线性函数法和倒数法计算方法简单,适用于测量值为正态分布的指标,但灵活性相对较差,无量纲化后的数值也略为保守。插值法和隶属函数法灵活性较强,可根据实际情况对函数进行修改,同趋势化和无量纲化过程可一步完成,且结果更能体现数据间的差异,但函数的构建具有一定的主观性。
(胡明 沈敏学 孙平)