基于秩和检验及非参数Bootstrap法的多指标统计综合评价模型

2018-11-02 02:27晏榆洋

四川文理学院学报 2018年5期

晏榆洋

(广安职业技术学院经济管理学院，四川广安638000)

1 引言

近四十年综合评价技术飞速发展，人们开始从众多决策科学、系统科学中去寻找科学的综合评价思想与方法.针对多指标问题，多元回归与逐步回归法、指标聚类法、逐个指标两两假设检验等统计性质的指标筛选法被不断的运用；如层次分析法(AHP)、DEA方法、灰色系统理论(GS)、模糊数学(FUZZY)、人工神经网络技术(ANN)等不断被运用到各类评价模型中去.

一方面，上述评价方法或多或少夹带着人们自身的主观评价意识，如层次分析法(AHP)方法中的成对比较阵的构建，模糊数学(FUZZY)方法中的模糊评判矩阵的构建，当决策者的判断过多的受主观偏好的影响，而产生某种客观规律的歪曲时，层次分析法(AHP)和模糊数学(FUZZY)的评价结果显然不理想.

另一方面，上述评价方法的使用范围太过单一，如灰色系统理论(GS)要求样本数据具有时间序列特性，只能评价待评对象的相对优劣，而不能反映绝对的水平，不适合用于对多个评价对象的研究.人工神经网络评价法(ANN)需要大量的训练样本，而且评价算法十分复杂，精度不高，应用范围十分有限.

本文从统计学出发，基于秩和检验及非参数Bootstrap法构建统计综合评价模型，对评价对象实现定量分析.

2 模型准备

对评价对象的多个指标数据进行收集和预处理.首先对多组指标数据进行归一化处理，然后乘以100，得分越高则对评价对象的评价越好.如此得到多组百分制的数据方便理解和缩小误差.不妨以三组指标数据为例：

指标1：记为

A={x1,x2…,xm},0xi100,i=1,2,…,m

指标2：记为

B={y1,y2,…,yn},0yi100,i=1,2,…,n

指标3：记为

C={z1,z2,…,zn},0zi100,i=1,2,…,n

3 基于秩和检验的一致性分析

考虑到多组指标数据对评价对象的影响有强弱之分，对于影响较弱的指标不应纳入统计综合评价模型进行分析，甚至部分指标与评价对象不相关，因此有必要先分析多组指标数据的一致性.不妨采用秩和检验分析A、B、C三组样本数据是否来自于同一统计总体，对于来自不同统计总体的那组数据可以认为是无效的.[1]

对于A、B、C三组样本数据的一致性检验，不妨设A、B、C三组样本数据分别来自统计总体X、Y、Z，采用两两比较的方式进行秩和检验，此处以A、B两组样本数据的一致性检验为例：

原假设H0：X和Y来自同一总体备择假设H1：X和Y来自不同总体

(1)将A、B两组样本数据重新组合为样本W，并将样本W中的数据从小到大排序构造次序统计量：

w1w2w3…wm+n

(2)次序统计量W的足标即为A、B两组样本数据所对应的秩，如：xi=wj，则记r(xi)=j，表示xi在样本W中的秩，若存在几个样本数据相同的情况，则记它们的秩为所对应次序统计量W的足标的平均值，记两组样本数据A、B的秩和分别为：

(3)若H0为真，则有A、B两组样本数据来自同一个统计总体，那么样本A中的各元素的秩应该是随机分散的从1～m+n中选出，因此检验统计量R1的值不应过大或过小.[2]

当m10,n10时，在显著水平α下，有检验标准：

P(RL

其中RL和RU分别是秩和检验在显著水平α下的临界值,可根据m、n的值查秩和检验表得到.[3]若根据样本数据A、B得到检验统计量R1∈(RL,RU)，则接受原假设H0，认为A、B两组样本数据的评价结果具有一致性，否则拒绝原假设H0，认为A、B两组样本数据的评价结果不具有一致性.

当m>10,n>10时，由中心极限定理，[4]检验统计量R1近似服从正态分布，其均值和方差分别为：

其中，若样本W中存在k个秩相同的组，如有ti个样本数据的秩都为ri，则

将均值和方差修正为：

P(-uα/2

其中-uα/2和uα/2分别是标准正态分布在显著水平α下的双边检验的临界值，由标准正态分布表得到.[5]若根据样本数据A、B得到检验统计量R1∈(RL,RU)，则接受原假设H0，认为A、B两组样本数据的评价结果具有一致性，否则拒绝原假设H0，认为A、B两组样本数据的评价结果不具有一致性.

4 基于非参数Bootstrap法的统计综合评价模型

为实现对评价对象的有效评价，常采用均值法，即对多组指标数据进行加权平均计算评价对象的最终得分.由于评价对象由多个指标共同影响，难免所得的某些指标数据属于小样本，直接加权平均不能准确的描述评价对象在该项指标的得分，误差较大；并且多组指标数据的权重系数的确定夹带着人为的主观因素，缺乏科学依据.因此不妨采用非参数Bootstrap法估计多组指标数据的均值分布，并根据均值分布的方差确定各组指标数据的权重，实现对评价对象的有效评价.

4.1 非参数Bootstrap法样本均值的分布估计

(3)重复上述步骤,得到N个Bootstrap样本，即B=1，2…,N，一般N=1000；

4.2 基于非参数Bootstrap法的统计综合评价

(1)三组指标数据均通过秩和检验，则三组指标数据都应作为有效值，纳入评价对象的统计综合评价体系，即

(2)三组指标数据只有i,j两组通过秩和检验，则未通过秩和检验的指标数据应不纳入评价对象的统计综合评价体系，即

μ=μi(σi=min{σ1,σ2,σ3})

5 仿真示例

某高校要对某教师的课堂教学质量进行定量分析.针对高校评教问题，国内外的高校先后经历了由督导专家评教为主体向学生评教为主体的转变，学生评教与专家评教相结合的二元评教体系.

然而学生评教的客观性、公正性欠缺，专家评教的偶然性难以避免，导致“专家—学生”二元评教体系主观性太强.因此针对该问题，不妨从教师的课堂教学出发，引入学生的考试成绩，建立“专家—学生—成绩”三元评教体系，在两两比较检验三组数据评教结果的一致性的基础下，采用非参数Bootstrap法的多指标统计综合评价模型对该教师的课堂教学进行综合评价.

(1)评价指标数据的收集：现有10名督导专家和20名学生对该教师的课堂教学评分数据如表1、表2所示，且该20名学生的考试成绩如表3所示：

表1 督导专家评分

表2 学生评分

表3 学生成绩评分

(2)考虑到专家评分分和学生评分的主观性较强，学生考试成绩也有虚假的可能，在对教师甲的课堂教学质量进行模型评价时，有必要先分析三组评分数据的一致性，对不满足一致性检验的指标数据，应不纳入该教师的课堂教学评价体系.采用两两比较的方式对“专家—学生—成绩”三组评分数据进行秩和检验，其秩和检验结果如下表：

表4 秩和检验统计表

当置信水平时α=0.05，原假设H0的接受域为[-1.96，1.96]，由表4可知，督导专家评分与学生成绩通过秩和检验，而专家评分与学生评分、学生评分与学生成绩两项未通过秩和检验，说明学生评分对该教师的课堂教学无显著影响，因此学生评分不应纳入该教师教学质量评价体系.

(3)考虑到专家、学生人数有限，所得的评分数据属于小样本，直接加权平均不能准确的描述该教师的课堂教学质量，误差较大；并且三组评分数据的权重系数的确定缺乏科学依据，因此采用非参数Bootstrap法对两组样本数据的均值进行分布估计，参数估计结果如下表：

表5 非参数Bootstrap法参数估计

(4)由样本均值估计的方差确定其权重系数，建立基于秩和检验的非参数Bootstrap统计综合评价模型，得到该教师的综合评分为：

结论

基于秩和检验及非参数Bootstrap法的多指标统计综合评价模型，针对多指标的小样本评价问题具有很好的稳定性和可操作性.

相对于传统的单项评价模型，秩和检验多组指标数据的一致性，对不通过秩和检验的指标不纳入综合评价体系，一定程度上消除了不相关指标对评价结果的影响；因收集的各项数据有限，并且数据本身也难免出现较大差异，采用非参数Bootstrap法对样本数据均值分布进行估计，消除了小样本事件对评价结果的影响；相对于带有人为主观因素的层次分析法(AHP)、模糊数学(FUZZY)，非参数Bootstrap法的定量分析使统计综合评价结果更具说服力.