一种基于变精度粗糙集的多指标综合评价方法

2010-05-18 08:03
统计与决策 2010年9期
关键词:变权粗糙集指标体系

施 钰

(南京大学 商学院,南京 210046)

0 引言

综合评价方法是通过一定的数学模型将多个评价指标值“合成”为一个整体性的综合评价值,主要和常用的方法有专家评价法、层次分析法、主成分分析法、人工神经网络法、数据包络分析法、灰色关联度法、模糊综合评价法、熵值法等。在多指标综合评价研究中,研究者主要研究点集中在以下两个方面:一方面是综合评价指标体系的构建。由于复杂系统的综合评价问题涉及的因素多,其评价过程中常包含着许多不确定性、随机性和主观性。因此构造科学合理的评价指标体系成为做出科学合理公正的综合评价的关键。另一方面则是指标权重的确定问题。如何确定指标的权重,以及对各个指标赋权的合理与否,都直接关系到分析结论的可靠性和公平性。由于以上两个主观随意性,再加上不同的对比标准、不同的汇总方法,使得不同的研究分析人员对同一评价内容、同一评价总体所得的结果就会不同。好的综合评价方法应该在满足规定质量的前提下,尽量降低评价成本和缩短评价时间,具有很强的应用价值。本文通过建立创新人才培养教学质量评价指标体系,采用变精度粗糙集的多指标综合评价方法对教学质量进行评价,可以客观真实地反映出教师的总体绩效情况,可以用来分析失效数据,并且为进一步的问题解决提供依据。

1 基于变精度粗糙集多指标综合评价方法

1.1 研究假设

多种综合评价方法结论非一致性的研究基于以下基本假设:

假设1 漂移性假设。对同一对象运用多种不同方法分别进行评价时客观上存在着结论的漂移性问题,即评价结论与客观实际存在一定差异,同时不同方法所得结论之间也存在差异。

假设2 相容性假设。不同的评价方法对不同的待评价问题适用程度是有差异的,有些可能是根本不适用的。对某特定待评价问题而言,不适用的方法称为不相容方法,适用的方法称为相容的方法。

假设3 可比性假设。不同方法的评价结论是以同性质(或可转化为同性质)的指标来表示的。一般而言不同方法对一组待评价对象如果其评价结论能以评价值表现或直接以排序形式给出,其结论通过一定的数学变换(如归一化等)均可使之具有可比性。

1.2 变精度粗糙集理论

变精度粗糙集(Variable Precision Rough Set,VPRS)模型是Pawlak粗糙集(Rough Set,RS)模型的扩充,它是在基本粗糙集模型的基础上引入了(参数)β,即允许一定程度的错误分类存在[3,4]。这一方面完善了近似空间的概念,另一方面也有利于用粗糙集理论从认为不相关的数据中发现相关数据。当β=0时,Pawlak粗糙集模型是变精度粗糙集模型的一个特例。

定义1 设X,Y表示有限论域U的非空子集,定义相对错误分类率为:

相对错误分类率表示将集合X中的元素分到集合Y中所产生的错误分类的比例。

定义2 在基本RS模型中,是严格按照等价类来分类的,是“包含”或“不包含”的关系。设X,Y表示有限论域U的非空子集合,如果对于∀x∈S,有x∈Y,则称Y包含X,记为Y⊇X,而在变精度粗糙集模型中,引入多包含关系,定义为:Y⊇β⇔c(X,Y)≤β,“多数”要求X和Y中的公共元素的数目大于X中元素数目的50%。

定义3 类似于基本RS模型,可以定义近似空间上关于分类误差β的粗糙上、下近似集合等相关概念。设(U,R)为近似空间,其中U为非空有限集合,R是U上的一个等价关系,U/R={E1,E2,…,En}表示 R 产生的等价类。 对于 X⊆U,定义 X 的 β 下近似为:X=∪{E∈U/R|c(E,X)≤β},其中X也称为 β 正区域,记为 posrβ(X)。

定义4 VPRS模型中分类能力的刻画

β越大,相对精度将越大。

设S=(U,R,V,f)是一个信息系统,C∪D=R分别为条件属性和决策属性。定义β的依赖性为:

它描述了系统对执行具有分类误差β的对象分类质量性能的好坏。

定义5 条件属性集C关于决策属性集D的β约简是C 的一个子集 red(C,D,β),且满足:

②从red(C,D,β)中去掉任何一个属性,都将使①不成立。

1.3 多指标综合评价步骤

(1)建立评价指标体系。本文依照指标因素全面、不重复、具有操作性和可比性的原则,根据实际评价情况,建立评价指标体系。

(2)构造决策表。将数据按照样本、条件属性值、决策属性值组成一张与原始数据表对应的二维表格。

(3)连续属性离散化。由于粗糙集理论只能处理离散数据,而通常得到的评价属性值是连续的,因此必先对连续属性离散化。考虑到基于自组织映射(SOM)神经网络的离散化方法较客观、可行,本文采用自组织映射(SOM)神经网络离散连续的评价属性值。

(4)确定变精度值。VPRS模型,在一定程度上消除了因专家评估的片面性带来的负面效应,但最终结果与β的取值密切相关。本文采用多次实验的方法来选择合适的β值。对训练样本多次实验,记录每次实验的β上、下近似集,并算出相应的β精度和β依赖性,若这两项指标满足要求,则在该β下作近似约简;否则重新选择β。

(5)属性约简。在保持决策表中条件属性与决策属性之间的依赖关系不发生变化的前提下,通过对决策表中所有可能影响因素的约简,消除决策表中冗余的或影响较小的因素,寻求影响评价结果的主要因素。根据VPRS模型的β近似约简原则,当去掉某一条件属性后,如果没有改变决策表的相容性和β依赖性,则该条件属性可以被省去,否则不能去掉。

(6)权重计算。在指标体系及各指标的合成规则一定的条件下,权重的合理性、准确性直接影响评价结果的客观性和可靠性,权重的分配是综合评价的关键。本文根据粗糙集理论中的属性重要度和知识依赖性的概念,完全根据所给数据计算指标权重。

(7)变权综合评价。在根据变精度粗糙集理论得出指标的权重之后,要结合指标的具体值进行综合评价。利用常权进行综合评价能够基本上反映各指标在评价时的相对重要性。但常权对各因素间的均衡反应迟钝,在评价中会产生一些不合理的现象。为了克服常权的缺点,本文采用在构造均衡函数的基础上,引入代表评判者性格的系数α,推出的具代表性的变权公式进行变权综合评价。

j为第j个指标的常权重,xj为第j个指标的评价值。α代表评价者的性格,一般来讲,评价者比较保守的情况下取α<0.5,即对诸因素的平衡问题考虑得很多;评价者较开朗的情况下取α>0.5,即比较能容忍某些方面的缺陷。为了如实、客观地反映被评价事物的实际情况,突出各指标间的均衡性,本文在综合各家之长的情况下,取α=0.5进行变权综合评价。

2 创新人才培养教学质量评价分析

2.1 建立创新人才培养教学质量评价指标体系

要综合评价创新人才培养教学质量,首先要确定适应创新人才培养的教学质量评价指标集。指标体系的构建应遵循以下两个原则:①科学有效性原则。评价的科学有效性应是评价赖以进行的基本要求。②可操作性原则。制订的指标体系既能对课堂教学质量进行度量,又便于在评价过程中操作实施。

在遵循以上两个原则的基础上,本文给出创新人才培养教学质量的评价指标体系,U由7个子要素集组成,即U={U1,U2,U3,U4,U5,U6,U7}={教学管理,教学态度,教学内容,教学实践,教学方法,教书育人,教学效果},如1表1所示。通过问卷调查法对500名在校大学生、100位任课教师以及50位教育专家就创新人才培养教学质量评估问题进行问卷调查,然后按7个一级指标和25个二级指标进行分类统计,随机取

表1 创新人才培养教学质量评价指标体系

其中200份作为训练样本,其余的作测试样本,由训练样本组成决策表。

2.2 综合评价

首先,对决策表中的数据进行归一化处理;然后利用SOM网络对其进行离散处理。根据实际情况,离散处理结果如表2所示,其中1表示合格、0表示不合格。

表2 离散决策表

分别取β=0、β=0.1、β=0.2求出相应的上、下β近似集,计算β的精度和β依赖性。当β=0时,即为基本粗糙集理论下的系统,得 α(C,0,D)=150/200=0.75,γ(C,D,0)=150/200=0.75;当 β=0.1 时:α (C,0.1,D)=168/200=0.84,γ (C,D,0)=168/200=0.84;当 β=0.2 时:α(C,0.2,D)=196/200=0.98,γ(C,D,0.2)=196/200=0.98;由此可见β取得适当的值时,系统的精度就能提高,条件属性与决策属性之间的依赖性也很强。从这两个指标在不同β下的差别,可以得出选取适当的β后,系统的分类能力有了显著的提高。同时也说明,利用基本RS模型简化的评价结果并不好(β=0.2),而采用VPRS模型却有效地提高了对数据不一致性的容忍度。本文取对决策表进行约简,按照变精度粗糙集模型的上下近似关系,对所有条件属性进行约简,得到条件属性约简集C'={U1,U3,U5,U7},去除多余的U2、U4和U6属性,这说明创新人才培养教学质量主要受指标U1、U3、U5、U7影响,教师在创新人才培养方面教学时要教学管理、教学内容,培养学生学习方法以及教学效果方面,U2、U4和U6属性是冗余的属性。根据变精度粗糙集中属性重要度和知识依赖性的概念,计算各个条件属性对决策属性的重要性,得到指标的权重 ωi分别为 0.279,0.21,0.25,0.268。 从指标权重计算的结果可以看出,指标U1、U7的权重较大,说明不断完善教学管理以及提高教学效果对教学质量影响偏大,这符合教育心理学关于创新人才培养的分析。

通过变精度粗糙集方法所确定的权重对于大多数因素均衡程度较好的情况是合理的,但对于指标均衡程度差的情况可能导致决策失误。创新人才培养教学质量综合评价,是对教师整体教学水平的评价,当某位教师的个别评价指标出现严重缺陷时,显然不能反映该教师教学质量的真实情况,因此需要考虑评价的均衡性。如在对某教师的教学质量综合评价中,根据变精度粗糙集理论所得的指标U1,U3,U5,U7定权分别为 0.279,0.21,0.25,0.268, 指标 U1,U3,U5,U7的评分分别为8.9,2,9.3,8.5,最后综合评价结果为7.8。但事实上当评价指标U3出现严重缺陷时,即该教师在注重教学内容的实践性,加强教学内容跨学科融合,注重教学内容的前瞻性,设计开放的教学内容,培养学生创新的意识方面非常差时,学生就无法抓住重点,思路清晰地学习,创新人才培养质量显然会受到很大影响,可这一点并没有在综合评价的结果中充分体现出来,取变权综合模式中α=0.5进行变权综合,利用变权求得各评价指标权重:

S=0.228×8.9+0.351×2+0.201×9.3+0.226×8.5=6.52

对以上的计算结果进行比较可以看出,变权综合评价方法比常权综合评价方法更能反映出指标U3出现严重缺陷对某教师创新人才培养质量综合评价结果的影响。根据基于变精度粗糙集理论对测试集进行变权综合评价。

测试集的评价结果表如表3所示。

表3 综合评价结果表

3 结论

创新人才培养教学质量评价指标体系涉及七个方面指标,能比较全面准确地反映教师绩效。采用变精度粗糙集的多指标综合评价方法,确定了不同的评价因素的权重,使得创新人才培养教学质量的评价结果更全面,更科学,而且此评价模型很容易在计算机上实现,该模型用于创新人才培养教学质量评价是有效的、可行的。这种综合评价方法,可以用来分析失效数据,并且为进一步的问题解决提供依据。

[1]张青.多指标综合评价失效因素分析及模型[J].统计与决策,2005.

[2]张卫华.多指标综合评价质量问题初探[J].统计与决策,2004,(12).

[3]王国胤.Rough理论与知识获取[M].西安:西安交通大学出版社,2001.

[4]张文修,吴伟志.粗糙集理论与方法[M].北京:科学出版社,2001.

[5]刘文奇.均衡函数及其在变权综合中的应用[J].系统工程理论与实践,1997,17(4).

[6]李德清,崔红梅,李洪兴.基于层次变权的多因素决策[J].系统工程学报,2005,20(3).

猜你喜欢
变权粗糙集指标体系
基于Pawlak粗糙集模型的集合运算关系
基于二进制链表的粗糙集属性约简
变权空间权重构造及空间效应分析
层次分析法在生态系统健康评价指标体系中的应用
供给侧改革指标体系初探
多粒化粗糙集性质的几个充分条件
基于变权的物流资源公平分配方法
双论域粗糙集在故障诊断中的应用
基于黄金分割法优选的中长期负荷变权组合预测
一种基于变权理论的船舶平衡方案生成方法研究