犹豫模糊信息约简方法在高校贫困生认定中的应用

2022-01-18 07:59
昆明冶金高等专科学校学报 2021年5期
关键词:模糊集约简指标体系

朱 丽

(江西农业大学计算机与信息工程学院,江西 南昌 330045)

0 引 言

高校贫困家庭学生资助问题直接关系到高等教育事业的持续、健康发展。学生贫困程度的认定是高校资助工作中的第一步,也是最关键的一步。关于如何科学地制定认定指标和确定贫困等级,大量教育教学专家和学者进行了广泛的研究,提供了各种测评体系和测评方法[1-4]。在家庭经济困难学生贫困程度的认定过程中,考虑到客观事物的复杂性以及人类思维的模糊性等因素影响,学校经常无法使用精确数对评测体系中的各项指标进行评价,此时用模糊数能更好地描述事物的本质。因此学者们将模糊分析方法广泛应用到贫困认定过程中,得到了大量的基于模糊数的测评方法[5-8]。

然而,在大学生贫困程度评测过程中,并不是所有指标都可以用一般的模糊数去量化,其中有的指标如果用一般的模糊数去量化可能会扭曲指标本身的主观性,从而导致结果的非真实性。Torra和Narukawa提出的犹豫模糊分析[9-10]是对一般模糊分析的改进,对于评测过程中很难用定量的数值表示的指标属性,语言犹豫模糊分析采用定性的自然语言形式的语言犹豫模糊集作为属性值,比传统的模糊分析在处理不确定性指标方面更具灵活性和实用性。另外,家庭经济困难不只是跟家庭的人均月收入等定量指标有关,也不仅仅与是否单亲或孤儿这种定性指标有关。学生所在家庭的贫困程度涉及到家庭本身和自然状况等多种定性和定量的原因。因此家庭经济困难学生认定指标体系中,各指标的属性值种类繁多,甚至还有学生未提供或缺失的信息。针对以上情况,本文构建了不完备语言犹豫模糊混合信息系统,合理解决了贫困认定指标的多样性和属性值的缺失性。

波兰学者Pawlak提出的粗糙集理论[11]是一种处理不确定性的数学理论。其主要思想是在保持分类能力不变的前提下,通过知识约简导出问题的决策规则。知识约简是粗糙集理论的核心内容之一,以二元关系为基础,而经典的二元关系是等价关系,后来为了满足现实问题的需要,被拓展至相似关系、容错关系、优势关系等[12-14]。在对高校学生进行贫困程度认定时,认定指标体系一般是根据现阶段社会经济发展情况和以往的资助经验等构建。然而这样构建的指标体系是否合理?能否真正反映学生的贫困程度?有没有多余的指标?为此本文基于粗糙集理论中的知识约简方法,在不完备语言犹豫模糊混合信息系统中,引入限制优势关系,利用分辨矩阵得到贫困认定指标体系的属性约简,使后续的贫困程度认定过程得到优化。

1 语言犹豫模糊集

决策专家在评价指标属性时会采用适当的语言评估标度,为了方便讨论,文献[15]引入了语言术语集S={s0,…,st-1}的概念,且满足:若α>β则sα>sβ,t是奇数。

通过将犹豫模糊集与语言术语集相结合,Meng等[16]给出了语言犹豫模糊集(LHFSs)的概念及2个语言犹豫模糊集之间的比较方法。

定义1[16]设S={s0,…,st-1}是语言术语集,t是奇数,称

LH={(sθ(i),lh(sθ(i)))|sθ(i)∈S}为一个语言犹豫模糊集,其中lh(sθ(i))={r1,r2,…,rmi}表示元素sθ(i)属于集合LH的所有可能的隶属度,r1,r2,…,rmi∈[0,1],用LHF表示所有语言犹豫模糊集的全体。

定义2[16]设LH={(sθ(i),lh(sθ(i)))|sθ(i)∈S}是语言犹豫模糊集, 记index(LH)={θ(i)|(sθ(i),lh(sθ(i)))∈LH,lh(sθ(i))≠{0}}, 称E(LH)=se(LH)为LH的期望函数,D(LH)=sv(LH)为LH的方差函数, 其中

且|lh(sθ(i))|和|index(LH)|分别为lh(sθ(i))与index(LH)的基数。

定义3[16]设LH1和LH2是2个语言犹豫模糊集,则LH1与LH2的大小关系为:

1)若E(LH1)

2)若E(LH1)=E(LH2),则

(i)当D(LH1)>D(LH2)时,称LH1

(ii)当D(LH1)=D(LH2)时,称LH1=LH2。

为了讨论方便,本文假设LH1≤LH2⟺LH1

2 不完备语言犹豫模糊混合信息系统

一个语言犹豫模糊混合信息系统可被定义为四元组(U,AT,V,f),非空对象集U={x1,x2,…,xn};AT=C∪{d}是非空属性集合,C={c1,c2,…,cm}是条件属性集,d为决策属性;V是属性值值域;f:U×AT→V是信息函数;记VC=∪Vcj,Vcj={f(xi,cj)|i=1,2,…,n},且Vcj⊆LHF∪R或f(xi,cj)为语言术语,f(xi,d)为语言术语,Vd={f(xi,d)|i=1,2,…,n},V=VC∪Vd。当部分对象的条件属性值未知时,该信息系统被称为不完备语言犹豫模糊混合信息系统,用“*”表示未知属性值。基于文[19]中提出的限制优势关系,根据贫困生认定的具体背景,给出不完备语言犹豫模糊混合信息系统的优势关系。

定义4设(U,C∪{d},V,f)为一不完备语言犹豫模糊混合信息系统,对任意的B⊆C,由B决定的限制优势关系为

由限制优势关系和限制优势类的定义,显然有如下性质。

性质1设(U,C∪{d},V,f)为一不完备语言犹豫模糊混合信息系统,若B⊆C,则:

2)对任意的x∈U,有dB(x)≤dC(x)。

定义5设(U,C∪{d},V,f)为一不完备语言犹豫模糊混合信息系统,若B⊆C满足:1)对任意的x∈U,dB(x)=dC(x);2)对任意的B′⊂B,存在x∈U,使得dB′(x)≠dC(x),则称B为(U,C∪{d},V,f)的一个约简。

定义6设(U,C∪{d},V,f)为一不完备语言犹豫模糊混合信息系统,记

证明1)“⟸”先证:对任意的x∈U,dB(x)=dC(x)。

再证:对任意的B′⊂B,存在x∈U,使得dB′(x)≠dC(x)。

3 贫困认定指标体系的建立

课题组首先随机抽取了××大学2017级本科生中50位贫困建档生,基于这50位建档生的具体情况,结合《教育部、财政部关于认真做好高等学校家庭经济困难学生认定工作的指导意见》,查阅的大量贫困生建档的相关资料和文献,以及咨询资助专家的意见,遵循全面、可行及定性和定量相结合的原则,初步确定了家庭经济困难学生建档的指标体系(图1)。

图1 家庭经济困难学生认定指标体系

家庭经济困难学生认定主要从7个方面进行考察:1)家庭完整情况。缺失家庭尤其是孤儿家庭的学生经济来源比较有限,学生个人的经济状况相比非缺失家庭一般更困难;2)家人及本人健康情况。一方面患病或残疾家庭成员的大额治疗费会造成家庭支出锐增;另一方面,患病或残疾会导致家庭成员的劳动能力下降,造成家庭收入锐减;3)家庭经济负担状况。包括家中年纪较大的老人赡养以及兄弟姐妹的教育费用支出,但是本文忽略了前者,因为老人赡养问题不只是学生的父母独自承担,还涉及到家里其他亲戚关系。只考虑其他兄弟姐妹接受非义务教育情况,有多个非义务教育子女的家庭开支会比较大,这类家庭比其他正常家庭更具有脆弱性;4)家庭经济状况,包括人均月收入和是否家住贫困边远地区,其中人均月收入直接体现家庭的经济现状,而家庭所在地虽然不能直接说明家庭的经济现状,但是对于家住经济水平相对落后的贫困边远地区的家庭来说,短期内提高经济收入的机会比较少,贫困状态很难改善;5)是否建档立卡户。建档立卡贫困户是精准扶贫的对象,说明该家庭一直以来的经济状况都不好;6)突发事件情况包括家庭变故和自然灾害。当家庭成员遭遇车祸、民事纠纷等事故或突然遭遇地震、洪涝等自然灾害时,都会使家庭收入减少,家庭负担加重。由于资助资源数量有限,在同样的家庭经济状况下,贫困生建档时应优先考虑思想品德良好、勤俭节约、没有不良嗜好的学生;7)在校的日常学习和生活状况可以反映学生的思想品德及消费观,所以评议组成员对学生平时表现的评价也是家庭经济困难学生认定时需要考虑的指标之一。

4 贫困认定指标体系的约简

下面将上文提出的不完备语言犹豫模糊混合信息系统的属性约简方法运用到实际问题中。以××大学2017级本科生中随机抽取的9位贫困建档生相对应的具体数据为例。首先建立不完备语言犹豫模糊混合信息系统(U,AT,V,f)。其中:

U={x1,x2,…,x9}是对象集,x1,x2,…,x9分别代表9位学生。

AT=C∪{d}是属性集,决策属性d是贫困等级,一般为甲、乙、丙3个等级。条件属性集C={c1,c2,…,c7}是贫困认定的7个指标属性。指标c1是家庭完整情况;指标c2是家人及本人健康情况;指标c3是其他兄弟姐妹接受非义务教育情况;指标c4是家庭经济状况;指标c5代表是否为建档立卡户;指标c6是突发事件状况;指标c7是评议组成员对学生平时表现的评价。

表1 不完备语言犹豫模糊混合信息系统

9位学生的具体数据构成的不完备语言犹豫模糊混合信息系统见表1。以第9位学生x9为例,f(x9,c1)=s0表示学生x9的家庭完整;f(x9,c2)=s2表示学生x9的家中有2人及以上患病或残疾;f(x9,c3)取*表示学生x9关于指标c3的属性值未提供或缺失;f(x9,c4)={(s1,0.6)}表示学生x9家住贫困边远地区,且家庭人均月收入>600元;f(x9,c5)=1表示学生x9家是建档立卡户;f(x9,c6)=s0表示学生x9家没有突发事件;f(x9,c7)={(s2,0.16),(s3,0.84)}表示评议组中16%的成员认为学生x9的思想品德和消费观良好,而84%的成员认为该学生的思想品德和消费观优。f(x9,d)=s1表示学校给学生x9认定的贫困等级为乙等。

由定义6得该信息系统的分辨矩阵如下所示:

5 结 语

本文运用犹豫模糊思想和粗糙集理论探讨高校经济困难学生的贫困程度认定问题,针对指标属性值的多样性、模糊性及缺失性等情况,将贫困认定指标体系构建成不完备语言犹豫模糊混合信息系统;在该信息系统中提出了限制优势关系的概念及相关性质,介绍了基于限制优势关系的知识约简方法,根据属性的分辨矩阵,得到贫困认定指标体系的属性约简。本文的优点是借助多种类型的指标属性值充分还原各个指标的本质特征,借助语言犹豫模糊集很好地体现了家庭经济状况的动态性以及学生平时的综合表现,真正做到“让数据说话”;通过知识约简剔除贫困认定体系中冗余的指标属性,提高贫困认定过程的可操作性,优化了后续的贫困等级认定。本文的不足之处是由于篇幅有限只讨论了指标属性的约简,然而在约简后的信息系统中如何进行贫困等级认定值得进一步探讨的。

猜你喜欢
模糊集约简指标体系
三支模糊集及其应用(I)
2022城市商业魅力指标体系
健康管理中心护理质量评价指标体系的构建
交通强国建设评价指标体系
加权犹豫模糊集的Lance距离测度及其应用
基于确定性因子的启发式属性值约简模型
面向连续参数的多粒度属性约简方法研究
基于差别矩阵的区间值决策系统β分布约简
基于犹豫度特征改进的新的直觉模糊相似度
一种基于orthopair模糊相似测度的多属性群决策方法