综合评价中数据标准化的原理研究*

2015-03-09 11:13孙红卫吕春燕祁爱琴曹国华韩春蕾

中国卫生统计 2015年2期

孙红卫吕春燕祁爱琴曹国华韩春蕾

综合评价中数据标准化的原理研究*

孙红卫1吕春燕2祁爱琴1曹国华1韩春蕾1

数据的标准化是很多多元统计方法必要的前期工作，如综合评价、聚类分析、主成分与因子分析、meta分析等。特别在综合评价中，数据标准化的方法很多，用不同的标准化方法得到不同的综合评价结果，从而影响了对实际问题合理客观地认识和判断。从根源上解决多种标准化方法带来的结论不一致问题，就需要认识标准化方法的本质，明确标准化的目的，讨论标准化法必须满足的性质，在此基础上，来探讨标准化方法的选择原则。

综合评价中数据标准化的目的

本文认为，标准化是原指标的一种变换，变换后是相对于某个参照点（可能是均值，最大值、最小值、理想点等）的相对位置，此相对位置尽量保持原变量的序关系不变、差异比不变、缩放不变等性质。理想的标准化法还必须保证，不同指标间参照点的等价性和变化范围的等价性。

下面的讨论都在这个基本模型下。设有n个评价单位，p个指标，第i个评价单位的第j个指标取值为xij。为了讨论的方便，本文假设所有指标都正向化，所有指标都为正值。

综合评价中数据标准化应该满足的性质

1.指标内部的要求

（1）序关系不变性。即若xaj＞xbj，则f（xaj）＞f（xbj）。（2）缩放无关性。即满足f（cx）＝f（x），c≠0。对原始数据进行缩小和放大变换不会影响标准化的结果。（3）差异比不变性。即满足如果秩转换法，能满足序关系不变，但是不能满足差异比不变性。因为秩转换法损失掉了差异测量的信息。

2.指标间的要求

（1）参照点的等价性。

由于标准化变换之后是相对位置，此相对位置都是以某个点为参照点的。理想的标准化法，要保持标准化后的相对位置等价，那首先不同指标的参照点应该是等价的。即门诊量的平均数代表了这些评价单位的平均水平，那么感染率的平均数也应该代表评价单位的平均水平。

（2）变化尺度的等价性。

除了参照点的等价性以外，还需要变化尺度的等价性。在z-score处理法中，不同指标间的变化一个标准差是等价的，而极值处理法中，变化一个极差是等价的。线性比例法，认为在均数的尺度上改变的范围相等则认为是等价的，向量规范法认为在平方和开方的尺度上变化的范围相等则认为是等价的，功效系数法认为不同指标的满意值与不满意值之差的变化范围是等价的。

3.等价性要求与评价结论不一致问题

指标间的等价性要求，可以得知不同的标准化方法，其背后的假定是不同的，而这些等价性往往不能互相推导。z-score法和线性比例法，都假定了不同指标间均数的等价性，可以证明：当且仅当满足各个指标的变异系数相等时，这两个标准化法对于变化范围的等价性假定相同，从而这两种标准化法的结果是相同的（证明略）。但是要保证所有评价指标的变异系数都相等，是不可能的，所以，如果用z-score法是合适的，则用线性比例法就是不合适的，反之亦然。

不同的标准化法假定了不同的等价性，而且实际资料中不同的假定之间往往不可能同时成立，所以标准化后得到的“相对位置”的含义是不同的，自然会影响到综合评价的结论会不一致。所以，由数据的标准化法带来的综合评价结论不一致问题是必然的。其实很多统计方法对实际问题建模时，往往会存在多个合适的模型，而且结论也不完全一致。之所以综合评价结果的“不一致”问题受到很多关注，是因为结果的“唯一性”才能体现结果的公正性，所以对唯一性的要求才很强烈。虽然主观来判定指标之间的等价性较困难，但是理清楚综合评价结论不一致问题的根源，有利于选择方法时作出合理地判断。

影响标准化选择的因素

1.是否选择以离散程度作为变化尺度

标准化方法根据变化尺度的不同可以分为两大类，一类是以每个指标的离散程度作为尺度，包括z-score法（以标准差为尺度），中位数法（以四分位数间距为尺度），极值法（以极差为尺度）。用这些方法标准化后，各个指标的离散程度都是相同的。也就是说，这些标准化方法完全消除了原指标离散程度的信息。

另外一类则不以每个指标的离散程度为尺度，比如线性比例法（以均数为尺度，或以标准值为尺度），比重法（是以平方和开方为尺度）。用这些方法标准化后，各个指标的离散程度往往不同。其中，如果第j个指标以线性比例法（以均数为尺度），则标准化后离散程度为即该指标的变异系数。如果是线性比例法（以标准值为尺度），标准化后离散程度为sj／stdj，其中stdj为标准值，如果是向量规范法，则为也就是说，这些标准化法保留了部分原指标离散程度的信息。

如果指标的变异系数相差太大的话，则两大类标准化法标准化后的结果会很不一致。因为这时候线性比例法或向量规范法，相当于给予不同指标的权重差别太大。这时候倾向于用z-score法，中位数法或极值法。如果指标的变异系数相差不大，则两大类标准化后的结果会接近。

2.数据的分布对标准化结果的影响

在决定了是否以离散程度为尺度之后，就要在每一类中选择哪一种标准化法，比如选择以离散程度作为尺度，是选用z-score法（认为标准差在不同指标间是等价的），还是用极值法（认为极差在不同指标间是等价的）。同理，如果想保留原指标离散程度的信息，是选用线性比例法（认为均数在不同指标间是等价的），还是向量规范法（认为平方和开方在不同指标间是等价的）。

表1 不同指标间的等价性假定以及标准化后的离散程度是否相同*

赋权重和合成方法背后的等价性假定。

1.赋权重对标准化法的要求

综合评价的第二步是赋权重，其实所赋权重可以归到标准化里面，比如z-score法，第i个指标的权重wi，乘以标准化值也即加权重后变化尺度的等价性变成si／wi与sj／wj等价。

下面讨论合成方法对标准化法影响，为了讨论的方便，先假设所有指标的权重都为1。

2.合成方法对标准化法的要求

对标准化值进行合成，本质上是不同指标的标准值是可以互相替代、互相补偿的。即在第i个指标上落后一段差距，可以通过第j个指标领先一段差距作为补偿。

（1）线性和法

以正己烷作为3种合成麝香标准溶液溶剂，分别配成质量浓度为1~5000 ng·L-1的混合标准溶液。先采用全扫描模式（Full-scan）对化合物进行定性，根据标液中各物质的出峰时间和特征离子（表2），再采用选择性离子扫描模式（SIM）对目标分析物进行定量。采用内标标准曲线法得到3条标准曲线的方程和相关系数。引入检出限对目标分析物的检测质量进行评测，信噪比系数取3。同时，取3种已知浓度的目标物溶液，采用与样品测定一样的实验方法进行预处理和 GC/MS分析，以实验结果的平均值与已知浓度的比值作为本次实验方法的回收率。计算结果如表2所示。

（2）理想点法（距离）

五、实证研究

以某医院从2000年到2006年的医疗质量综合评价为例［2］，来探讨各种标准化法的性质。该医院从2000年到2006年的指标实见表2。

表2 某医院2000－2006年各项指标值

负向指标取其相反数进行正向化。采用的方法有：z-score法，中位数法，极值法，线性比例法1（均数），线性比例法2（标准值），比重法。

表3 不同标准化法的排序结果

从上面可以看出，同一类方法的结果是相近的，特别第1类中的三种方法z-score法，中位数法和极值法，三个标准化法的结果是相同的。线性比例法（均数）、线性比例法（标准值）和比重法，三个标准化法的结果是相近的。但是这两类方法的结果之间却相差很大。

特别是对2005年的评价，第1类方法（以离散程度为尺度）都认为2005年的综合评价值为第7位，而第2类方法（不以离散程度为尺度）的排序则认为是第1位。原因就在于2005年处于落后的几个指标变异系数都较小，而处于领先的几个指标变异系数都较大，如果用线性比例法，对变异系数大的指标，由于保留变异系数大小的信息，相当于加大了这些指标的权重，所以2005年的综合评价值会最高。但是z-score法等去除了离散程度的信息，由于2005年多个指标处于落后状态，特别是权重大比较的几个指标处于落后状态，则最后的综合评价值就会比较低。

从变异系数来看，13个指标的变异系数相差太大，最小的为手术前后诊断符合率0.0008，最大的为手术并发症发生率1.3586，差别为1698倍。如果采用不去除离散程度的标准化方法，则变异系数较大的指标会起太大的作用，变异系数较小的指标所起的作用会微乎其微。所以对这个问题，建议用以离散程度作为尺度的标准化方法。

标准化方法选择的原则

1.是否以离散程度作为尺度

以上理论和实证研究可以看出，标准化方法最重要的是选择是否以离散程度作为尺度，当指标间的离散程度相差很大时，两大类标准化法的结果会差异很大。建议是，当指标的变异系数差别不大时，可以采用线性比例法、比重法等不以离散程度为尺度的标准化方法，部分保留原来离散程度的信息。而如果指标的变异系数差别很大时，建议采用z-score法、中位数法、极值法等以离散程度为尺度的标准化法。

2.根据数据分布特点来选择

如果数据分布呈偏态或出现极端值的情况，zscore法和极值法往往会变动很大，因为此时均数、标准差和极值会因极端值变动很大，而中位数和四分位数间距受极端值的影响较小，是在这种情况下推荐的方法。

线性比例法（标准值）是以标准值为尺度，极端值改变不会影响到标准值，所以极端值对它的影响会较小。而线性比例法（均数）、比重法（平方和开方）中的变化尺度是均数的平方和开方，受极端值的影响比较大。功效系数法是以满意值与不满意值的差为尺度，也不会因为极端值而改变。

3.等价性理论与简单性原则

依照以上原则，仍然还有多个标准化方法可以选择，且结果会有差异。前面本文指出，由于不同的标准化法假定了不同的等价性，而真实情况符合哪种等价性不得而知，所以综合评价的结论不一致问题是必然存在的。等价性假定理论，可以让应用者理解多种评价结果不一致的情况，能够明白不一致的根源，从而可以凭借经验来判定哪种等价性假定更符合实际情况。

如果存在满意值或不满意值，比如三甲医院的指标参考值（病床周转次数≥19次／年，药品收入占总收入比例≤45%等），可以作为一个参照点，因为它代表了三甲医院的最低要求，可以认为是不同指标间等价的。如果不存在这样的参考值，采用均数和中位数作为参照点就要好于极值，因为极值在不同指标间等价的可能性要小于均数和中位数在指标间等价的可能性。

标准化法的选择，我们只探讨了线性标准化法的情况，没有讨论非线性标准化法，其中理想点法（距离）类似于非线性标准化之后再线性合成。从上面的讨论可以看出，越复杂的标准化方法或合成方法，不同指标间的等价性越难把握，就越无法判定这种方法的合理性。本文认为，依据等价性理论，应该尽量选取简单的方法，这样对这些方法背后的等价性假定非常明确，能够针对实际当中出现的情况选用合适的综合评价方法。

1.郭亚军，易平涛.线性无量纲化方法的性质分析.统计研究，2008，25（2）：93-100.

2.马先莹，孙红卫，祁英华.某医院2000-2006年医疗质量的综合评价.中国医院统计，2007，14（2）：139-141.

3.李光，吴祈宗.基于结论一致的综合评价数据标准化研究.数学的实践与认识，2011，3：72-77.

4.张罗漫，黄丽娟，贺佳，等.综合评价中指标值标准化方法的探讨.中国卫生统计，1995，12（1）：1-4.

（责任编辑：郭海强）

山东省统计科研重点课题（KT11088）

1.滨州医学院公共卫生与管理学院（264003）

2.枣庄科技职业学院（277500）