综合评价方法中的最优无量纲化模型研究

2024-03-26 03:13李兴奇高晓红
统计与决策 2024年5期
关键词:纲化区分度无量

李兴奇,高晓红

(楚雄师范学院a.管理与经济学院;b.数学与计算机科学学院,云南 楚雄 675000)

0 引言

由于不同指标的单位、数量级和趋势不同,因此在综合评价时需对指标进行无量纲化处理。现有的综合评价方法和无量纲化方法众多,但经不同无量纲化方法处理后的综合评价结果不同,如何针对不同评价方法来选择或构建最优无量纲化模型是解决综合评价过程中无量纲化方法选择盲目性问题的重要途径。目前有很多学者对无量纲化方法的选择进行了研究,例如:郭亚军和易平涛(2008)[1]基于单调性、差异不变性等6 条性质进行无量纲化方法选择;易平涛等(2014)[2]通过无量纲化结果的波动性进行方法选择;李玲玉等(2016)[3]根据变异性、差异性和稳定性进行方法选择;李兴奇和高晓红(2021)[4]根据分布不变性、变异不变性和效率最优性进行方法选择,发现线性无量纲化方法不改变数据的分布特征,伸缩法不改变数据的分布特征和变异特征;郭亚军等(2011)[5]根据拉开评价结果的档次来进行方法选择;高晓红和李兴奇(2020,2022)[6,7]根据第一主成分贡献率和信息损失大小来选择主成分分析法中的无量纲化方法,并进一步根据拟合优度来选择多元线性回归模型中的无量纲化方法。容易发现,现有关于无量纲化方法选择的研究较多,但关于最优无量纲化模型构建的研究甚少,并且无量纲化选择的标准不一,其盲目性问题依然存在。基于此,本文首先对综合评价结果的优良性进行度量;其次,构建无量纲化方法有效性的统计检验方法;最后,以无量纲化方法有效为约束条件分别构建稳定性最高、区分度最高以及两者均最高的最优无量纲化模型,并通过数值模拟实验来求解模型。

1 综合评价方法

现有的综合评价方法众多,有标准差法、变异系数法、熵权法、相关系数法、主成分分析法等。不同综合评价方法的赋权机理不同,所得的综合评价结果也不同。假设n项指标构成一个综合评价指标体系X=(X1,X2,…,Xj,…,Xn) ,每项指标拥有m个样本观测值,即Xj=(x1j,x2j,…,xmj)T,其均值为,指标体系X经无量纲化处理后的结果为Y=(Y1,Y2,…,Yn),Yj=(y1j,y2j,…,ymj)T,其均值为,各指标权重为w=(w1,w2,…,wn)T,综合评价结果为Z=(z1,z2,…,zm)T,其中Z=Yw。

1.1 标准差法

标准差法是基于评价指标的标准差大小来确定权重的,标准差越大的指标其数值波动越大,指标内包含的差异信息也越丰富,因此应被赋予较大的权重。假设第j项指标的标准差为Sj,j=1,2,…,n,归一化得到第j项指标的权重为

1.2 变异系数法

与标准差法类似,变异系数法也是根据指标的差异信息大小来确定权重,但变异系数法中改用变异系数来度量指标内的差异信息,更能真实反映指标内数值的差异信息大小。假设第j项指标的变异系数为因变异系数可正可负,为保证指标的权重为正数,故对变异系数的绝对值进行归一化得到第j项指标的权重为

1.3 熵权法

熵权法是根据指标的熵值大小来确定权重,熵值越大表明指标内的差异越小,应被赋予较小的权重,熵值越小表明指标内的差异越大,应被赋予较大的权重。假设第j项指标的信息熵为,其中,k=1 lnm,,则第j项指标的权重为

1.4 相关系数法

相关系数法是根据指标间的相关性来确定权重,若某项指标与其余指标的相关性越大,则其被替代的可能性就越大,应被赋予较小的权重。偏相关系数能在控制其余指标的情况下单独反映任意两项指标相关性的大小,更能真实反映指标间的替代关系。假设rkj为简单相关系数矩阵的逆矩阵中第k行、第j列的元素,则第j项指标与其余指标的偏相关性大小为,权重为wj=因指标被替代的程度只与相关性的大小有关,与方向无关,故对偏相关系数取绝对值。

1.5 主成分分析法

主成分分析法是根据最大特征值所对应的特征向量来确定权重,假设指标间协方差矩阵的特征值为λ1,λ2,…,λn,最大特征值λ1所对应的特征向量为α1=(a11,a21,…,an1)T,则各指标的权重为

1.6 因子分析法

因子分析与主成分分析类似,均属于统计降维方法,适用于指标间存在强相关或多重共线性的情况,不同之处在于,因子分析是用几个潜在的、不可观测的公因子来线性表示原始变量,主成分分析则是将原始指标线性组合成一个综合指标。因子分析的前提是各指标间存在一定的线性相关关系,如果原始指标的相关性较弱则很难找到潜在的公因子,其效用不佳。在运用因子分析法时,首先,计算变量间的相关系数矩阵,求解初等载荷矩阵;然后,提取适当数量的公因子,对因子进行旋转,计算因子得分和贡献率;最后,根据各因子贡献率在累计贡献率中所占的比重来确定指标权重。

2 综合评价结果的稳定性

综合评价是一个复杂的多环节系统,任意环节的变化都可能对综合评价结果带来影响。由于不同的评价指标和模型代表了不同的评价目的和机理,因评价指标或模型变化而导致评价结果不同属于合理现象,但当综合评价指标体系和模型一定时,因样本局部变动、单位变化或数据处理方式不同而导致综合评价结果产生逆序属于不合理现象。因此,将样本局部变动、单位变化和无量纲化方法不同而导致综合评价结果发生的波动性大小称为综合评价结果的稳定性,计算公式为:

其中,σs2为整个评价系统的方差,其值越小时综合评价结果的稳定性越高;σij为指标i与指标j的协方差。

3 综合评价结果的区分度

传统的区分度主要用于度量试卷能有效分辨出不同水平学生的能力,其未能反映任意两个评价值之间的可区分性大小。基于此,根据任意两个评价值间的可区分性来构建新的区分度函数。

其中,D表示综合评价值的区分度。在计算区分度时,首先,将综合评价值Z=(z1,z2,…,zm)T按从小到大的顺序排列得到;然后,计算任意两个相邻评价值间的差距表示两个相邻评价值间的区分度,用表示最大值与最小值之间的区分度;最后,将与ln加总表示总的区分度,除以m可消除评价值数量对结果的影响。

4 无量纲化的有效性检验

H0:μ1=μ2=…=μn。无量纲化后各指标间不存在量纲差异,方法有效。

H1:μ1,μ2,…,μn不全相等。无量纲化后各指标间存在量纲差异,方法无效。

构造检验统计量。根据统计学原理,分别用组间均方MSA与组内均方MSE来度量指标间的量级差异大小和指标内的数值差异大小,构造检验统计量为:

统计量F服从自由度为n-1 和mn-n的F分布。当F>Fα(n-1,mn-n)时,应拒绝原假设,表明无量纲化方法无效;当F≤Fα(n-1,mn-n)时,不能拒绝原假设,表明无量纲化方法有效。

5 综合评价方法中的最优无量纲化模型构建

5.1 稳定性最高的最优无量纲化模型

现有关于无量纲化方法选择的研究较多,有关最优无量纲化模型构建的研究较少。故以综合评价的稳定性为目标函数,以无量纲化有效为主要约束条件构建以下模型:

其中,F<Fα表示方法有效,-max(xj)≤aj≤max(xj)和表示平移尺度和伸缩尺度可在较大范围内取值。通过该模型可求解出稳定性最高时的最优平移尺度和伸缩尺度。

5.2 区分度最高的最优无量纲化模型

以区分度最大为目标函数,以无量纲化有效为主要约束条件可构建以下最优化模型:

5.3 稳定性和区分度均最高的最优无量纲化模型

稳定性和区分度作为两种不同的评价标准,仅考虑其中一个达到最优有时未能满足实际需求,所以需要构建一种能让稳定性和区分度同时达到最优的无量纲化模型。以系统方差与区分度函数之差最小作为目标函数,以无量纲化有效为主要约束条件,构建以下模型:

5.4 小平移尺度约束下的最优无量纲化模型

模型(4)至模型(6)中的平移尺度均设定了较大的取值范围,可保证模型有最优解。但对指标进行大范围的平移会改变指标的变异特征,造成原始信息的损失[4],所以为尽可能减小指标内变异信息的损失,将模型(4)至模型(6)中的平移尺度约束改为aj∈U( 0,δ),即在零附近取值,分别得到小平移尺度模型(7)至模型(9)。

稳定性最高的小平移尺度模型:

区分度最高的小平移尺度模型:

稳定性和区分度均最高的小平移尺度模型:

6 仿真模拟实验

现有关于无量纲化方法的研究大多是基于个案来说明某种方法的合理性,但随着大数据技术的发展,指标体系越来越复杂,个案型的研究结论难以进行推广,故通过数值模拟实验展开研究。用MATLAB 软件产生6组方差相同、均值各异的正态分布随机数,每组随机数包含5000 个样本,记作N(50,102),N(100,102),N(500,102) ,N(1000,102) ,N(3000,102) ,N(5000,102) ,相当于利用6 项指标对5000 个对象进行综合评价,各指标间存在明显的量纲差异。

6.1 大平移尺度约束下的最优无量纲化模型求解

根据以上随机数据,分别用模型(4)至模型(6)求解6 种综合评价方法所对应的最优平移尺度和伸缩尺度,并进行比较分析,结果如表1所示。

表1 大平移尺度下各综合评价方法的最优无量纲化模型计算结果

从表1可看出,通过最优化模型可求解出不同综合评价方法中的最优无量纲化结果,且最优无量纲化结果随综合评价方法、目标函数和约束条件的变化而变化。

从最优平移尺度看:当稳定性最高时,各综合评价方法中第一项和第六项指标的平移尺度均小于零,说明取值最小和最大的指标需向右平移;当区分度最高时,各综合评价方法中均满足第五项和第六项指标的平移尺度小于零,其余的大于零,表明取值较大的指标需向右平移,取值较小的指标需向左平移。从绝对值大小来看,各综合评价方法均满足 |a1|> |a2|> |a3|> |a4|> |a5|> |a6|,表明取值越小的指标平移尺度越大;当稳定性和区分度均最高时,各综合评价方法均满足第一项和第六项指标的平移尺度小于零,其余的均大于零。

从最优伸缩尺度看:当稳定性最高时,各综合评价方法均满足k6>k5>k4>k3>k1>k2;当区分度最高时,各综合评价方法均满足k6>k5>k4>k3>k2>k1;当稳定性和区分度均最高时,各综合评价方法均满足k6>k5>k4>k3>k1>k2。综合分析后发现,取值越大的指标其压缩比例越大。

从目标函数值看,在相同的约束条件下各综合评价方法所能达到的最优目标不同。当稳定性最高时,各综合评价方法的稳定性大小关系为相关系数法>因子分析法>变异系数法>标准差法>熵权法>主成分分析法;当区分度最高时,各综合评价方法的区分度大小关系为相关系数法<因子分析法<标准差法<变异系数法<熵权法<主成分分析法;当稳定性和区分度均最高时,排序情况与区分度最高时相同。

从检验统计量来看,在0.05 的显著性水平下,通过MATLAB软件计算出其分位数约为2.214。当稳定性最高时,所有综合评价方法的检验统计量都小于0.05 分位数,说明相应的无量纲化方法均有效;当区分度最高时,各综合评价方法的检验统计量都略高于0.05 分位数,说明相应的无量纲化方法没有完全消除指标间的量纲差异,现实中受数据复杂性和多样性的影响,难以完全消除指标间的量纲差异,此时可适当放松条件,当检验统计量略高于其分位数时可认为无量纲化方法弱有效;当稳定性和区分度均最高时,除熵权法外,其余综合评价方法的检验统计量都小于0.05 分位数,而熵权法的检验统计量为3.115,大于0.05 分位数,表明熵权法无效,其余方法有效。

6.2 小平移尺度约束下的最优无量纲化模型求解

分别用模型(7)至模型(9)来求解6 种综合评价方法的最优无量纲化,结果如表2 所示。

表2 小平移尺度下各综合评价方法的最优无量纲化模型计算结果

从表2 可看出,在小平移尺度约束下,最优平移尺度及伸缩尺度因综合评价方法和目标函数的不同而不同,表明在使用无量纲方法时,应充分考虑其与评价方法和目标函数的适用性。从平移尺度看,通过模型(7)至模型(9)求解出的平移尺度都非常小,等于或约等于零,这避免或减少了指标内变异信息的损失。从伸缩尺度看,同一项指标在不同目标函数及不同评价方法中的最优平移尺度相差不大,都约等于指标的均值,这说明当平移尺度较小时,在均值附近对指标进行压缩可提升无量纲化的效果。从目标函数值看,各综合评价方法的目标大小排序均为相关系数法<标准差法<变异系数法<熵权法<因子分析法<主成分分析法,说明相关系数法的稳定性最高、区分度最低,主成分分析法的稳定性最低、区分度最高。从检验统计量看,标准差法、变异系数法、熵权法、相关系数法中的最优无量纲化方法均有效,主成分分析法和因子分析法中的最优无量纲化方法弱有效。比较表1和表2发现,各评价方法的最优无量纲化结果会随约束条件的变化而变化。

通过比较表1和表2发现,当约束条件发生变化时,各综合评价方法的最优平移尺度和伸缩尺度、目标函数值、检验统计量也随之改变。与大平移尺度相比,小平移尺度下各类综合评价方法中目标函数所能达到的最优解有所下降,说明模型(7)至模型(9)不仅可以保护指标内的变异信息,还可使目标函数所能达到的最优解尽可能理想。

7 结论

本文通过理论分析和仿真模拟实验分别针对6 种综合评价方法构建3类最优无量纲化模型,对模型进行不断优化,输出相应结果,并进行深入对比分析后发现:

(1)综合评价方法、目标函数和约束条件不同时所对应的最优无量纲化结果不同。综合评价过程中应充分考虑评价方法、目标函数、约束条件等因素来构建最优无量纲化模型。

(2)最优无量纲化模型构建与无量纲化方法选择不同。无量纲化方法选择只能从已有方法中选择较为适合的方法,其受现有方法的影响,而最优无量纲化模型可以针对特定的综合评价方法来寻找全局范围内的最优无量纲化方法,其不受现有方法的影响,还可以根据实际需求来设定目标函数和约束条件,降低了综合评价过程中无量纲化方法选择的盲目性,提高了综合评价结果的可信度。

(3)利用稳定性函数和区分度函数可以科学度量综合评价结果的稳定性和区分度,进而判别综合评价结果的优良;利用无量纲化的有效性检验方法可以准确判断无量纲化是否有效消除了指标间的量纲差异,进而构建最优的无量纲化模型。

猜你喜欢
纲化区分度无量
无量纲化方法选择及最优无量纲化方法构建
乌雷:无量之物
刘少白
浅谈试卷分析常用的几个参数及其应用
图形推理测量指标相关性考察*
论书绝句·评谢无量(1884—1964)
炳灵寺第70 窟无量寿经变辨识
线性无量纲化方法比较研究
浅观一道题的“区分度”
无量纲化方法的选取原则