不完备信息系统的梯形模糊数三支决策模型

2018-01-02 06:51刘杰薛占熬

山西大学学报（自然科学版） 2017年4期

关键词：粗糙集决策者梯形

刘杰,薛占熬

(1.河南科技学院信息工程学院,新乡 453007;2.河南师范大学计算机与信息工程学院,新乡 453007)

不完备信息系统的梯形模糊数三支决策模型

刘杰1,薛占熬2*

(1.河南科技学院信息工程学院,新乡 453007;2.河南师范大学计算机与信息工程学院,新乡 453007)

在不完备信息系统中,结合Bayes决策过程,采用文献[3]中的改进的完备容差关系代替经典决策粗糙集模型中的等价关系,并将具有一般性和易运算的梯形模糊数引入到决策粗糙集中，提出一种基于不完备信息系统的梯形模糊数决策粗糙模型,给出该模型的三支决策的方法和规则提取,并分别讨论了悲观者和乐观者的不同决策规则。最后通过实例来阐明该模型的应用过程。

不完备信息系统;完备容差关系;三支决策;梯形模糊数

0 引言

在现实生活中,由于数据测量的误差、数据获取的限制等因素,使得在知识获取时面临的往往是不完备信息系统[1](Incomplete Information Systems,IIS)。不完备信息有两种语义解释:一种是遗漏语义,即认为未知值暂时不能得到,但以后总是可以得到的。目前许多学者在相似关系[2]、限制容差关系[3]、完备容差关系[4-5]等方面的研究均是基于遗漏语义。另一种是缺席语义,即未知值不可能再得到。

三支决策理论[6]是Yao于2010年提出的一种用来处理不确定性决策的粒计算方法,并引起了广泛的关注。目前针对三支决策的研究分为三大类:一是对三支决策理论模型的扩展[7-9],二是对三支决策属性约简等方法论的研究[10],三是三支决策在医学、信息、管理等领域的应用[11]。该理论的核心问题之一即风险代价的确定。在已有的研究中损失函数大都由专家提供,考虑到人们在实际决策过程中损失函数有可能是遗漏的。针对不完备信息系统,对决策粗糙集模型做进一步的扩展是很有必要的。Liu[12]和张鑫等[13]将不完备信息应用到区间决策粗糙集中;李亚鸽等[14]针对区间内取值机会均等对最终结果造成过大的误差这一问题,进而采用三角模糊数来代替区间数,提出了在不完备信息系统中损失函数为三角模糊的决策粗糙集模型,该模型是基于划分粒度过细的相似关系,它能将比较相似的划分至不同的相似类中,从而影响最后决策的结果。况且三角模糊数作为模糊数的一种也具有一定的局限性。在此基础上,结合梯形模糊数较三角模糊数具有一般性、灵活性和易于运算等特点,将损失函数设为梯形模糊数,又考虑到改进的完备容差关系进行划分更合理,故本文提出了一种基于改进的完备容差关系的梯形模糊数决策粗糙集及其三支决策规则。首先,分析相似关系的局限性,说明采用改进完备容差关系的原因。其次,考虑用梯形模糊数来表示决策粗糙集中损失函数,使损失函数更具一般性。再次,提出一种基于不完备信息系统的梯形模糊数决策粗糙集模型,给出了该模型的三支决策规则和方法。最后通过实例来阐明该模型的应用过程。该研究是对三支决策模型做了进一步的拓展,对处理不完备信息系统具有一定的实际意义。

1 基础知识

1.1 不完备信息系统

定义2[3]设不完备信息系统IIS=(U,A,V,f),对象xi的完备度γ(xi)=|P(xi)|/|A|,式中:P(xi)={a∈A|a(xi)≠*},|·|表示集合“·”的基数,则整个信息系统S的完备度为:

定义3[3]给定不完备信息系统IIS=(U,A,V,f),则改进的完备容差关系定义为:

NS(x,y)={(x,y)∈U×U|∀a∈A,(a(x)=a(y))∨ (a(x)=*)∨(a(y)=*),

其中:P(xi)={a∈A|a(xi)≠*}。

定义4[3]给定不完备信息系统IIS=(U,A,V,f),对象x的改进完备容差类INS(x)定义为:

INS(x)={y|y∈U,NS(x,y)}∪{x}.

(1)

例如对象x=(2,*,*,*,1)与对象y=(2,3,4,3,2),其中属性2,3,4中值域分别为{0,2,3},{1,2,3,4},{1,3,4}。这两个对象采用相似关系是可区分的,但实际上这两个对象相似的可能性较大。若采用文献[3]中的基于改进的完备容差关系,这两个对象是不可区分的,这符合我们的要求。故本文采用改进的完备容差关系,对不完备信息系统的三支决策模型进行研究。

1.2 梯形模糊数

若模糊集定义在实数R上,则模糊集的隶属函数称为模糊分布。在模糊数学中,常见的模糊分布有三角形模糊分布、梯形模糊分布、正态模糊分布等。区间值和三角形模糊分布是梯形模糊分布的特例,本文主要介绍梯形模糊数。

定义5[15]设论域U上的模糊数为M,如果M的隶属函数μM:U→[0,1] 表示为:

(2)

其中实数a,b,c,d满足0≤a≤b≤c≤d且不同时满足a=b=c=d, 将梯形模糊数记为:M=(a,b,c,d).

特别地,若a

对于任意两个梯形模糊数M1=(r1,r2,r3,r4),M2=(s1,s2,s3,s4)。其运算规则如下:

①M1+M2=(r1+s1,r2+s2,r3+s3,r4+s4);

②M1-M2=(r1-s1,r2-s2,r3-s3,r4-s4);

③M1×M2=(r1s1,r2s2,r3s3,r4s4);

④M1/M2=(r1/s1,r2/s2,r3/s3,r4/s4)。

2 基于不完备信息系统的梯形模糊数决策粗糙集模型

一般地,对于给定的对象x,令τ(x)为一个决策规则,它是到决策行动集A的一个映射函数(τ(x)∈A),则决策规则τ(x)下的期望总体风险为:

(3)

对于每个对象x,可以根据式(3)计算条件风险,从中选出条件风险最小的决策行为作为最佳行动方案。

表1 不同状态下对应的梯形模糊数损失值Table 1 Trapezoidal fuzzy numbers loss values of different states

由于在实际情况中风险函数往往满足:

aPP≤aBP

aNN≤aBN

(4)

根据贝叶斯决策中最小风险原则,得到如下3条决策规则。

接受规则(P):

若R(aP|INS(x))≤R(aB|INS(x))和R(aP|INS(x))≤R(aN|INS(x)),则x∈POS(X)。

延迟规则(B):

若R(aB|INS(x))≤R(aP|INS(x))和R(aB|INS(x))≤R(aN|INS(x)),则x∈BND(X)。

拒绝规则(N):

若R(aN|INS(x))≤R(aP|INS(x))和R(aN|INS(x))≤R(aB|INS(x)),则x∈NEG(X)。

(5)

上式中:σ是决策者的风险偏好指数,反映出决策者的乐观程度。在式(5)中σ值越大意味着决策者越乐观,即悲观决策者会高估损失值,而乐观决策者则会低估损失值。特别地,当σ=0和σ=1时,ω(a)的值分别代表了悲观决策者和乐观决策者的观点。

本文选取整数值排序方法来研究三角模糊数决策粗糙集。基于式(5)各期望损失值可分别计算得到:

其中,

故得到如下3条决策规则:

接受规则(P1):

若ω(R(aP|INS(x)))≤ω(R(aB|INS(x)))和ω(R(aP|INS(x)))≤ω(R(aN|INS(x))),则x∈POS(X)。

延迟规则(B1):

若ω(R(aB|INS(x)))≤ω(R(aP|INS(x)))和ω(R(aB|INS(x)))≤ω(R(aN|INS(x))),则x∈BNG(X)。

拒绝规则(N1):

若ω(R(aN|INS(x)))≤ω(R(aP|INS(x)))和ω(R(aN|INS(x)))≤ω(R(aB|INS(x))),则x∈NEG(X)。

接受规则(P2):

延迟规则(B2):

拒绝规则(N2):

令:

规则(P2)-(N2)可重写为:

特别地,当σ=0即悲观决策者的阈值表达式为:

当σ=1即乐观决策者的阈值表达式为:

决策规则(P3)、(B3)、(N3)可重写为:

3 实例

医学流感诊断决策表IIS=(U,A,V,f),U={x1,x2,x3,x4,x5,x6,x7,x8,x9,x10,x11}为病人编号,条件属性集C={a1,a2,a3,a4}表示病人的4种症状:发烧、咳嗽、肌肉痛、头疼。决策属性集D={X,-X},其中X表示病人得流感,-X表示病人未得流感。病人的实际情况含有遗漏值,具体症状表现如表2所示。

在表2中,根据医生的经验,集合为X={x3,x5,x6,x7,x8,x9}时,这些患者得流感的概率相对较高。

且对各个属性所对应值的大小有如下定义:

发烧a1:1代表高,2代表较高,3代表正常。

咳嗽a2:1代表是,2代表否。

表2 病人症状表现Table 2 Status of the symptom patients

肌肉痛a3:1代表很严重,2代表有点严重,3代表不严重。

头疼a4:1代表是,2代表否。

其中*代表缺失值。

根据定义[3]和定义[4]可得:

INS(x1)={x1},INS(x2)={x2,x8},INS(x3)={x3,x7,x10},INS(x4)={x4,x5,x11},

INS(x5)={x4,x5,x11},INS(x6)={x6,x7,x10},INS(x7)={x6,x7,x9,x10,x11},INS(x8)={x8,x10},

INS(x9)={x6,x7,x9,x10},INS(x10)={x3,x6,x7,x8,x9,x10},INS(x11)={x4,x5,x7,x11}。

P(X|INS(x1))=0,P(X|INS(x2))=0.5,P(X|INS(x3))=0.667,P(X|INS(x4))=0.333,

P(X|INS(x5))=0.333,P(X|INS(x6))=0.667,P(X|INS(x7))=0.4,P(X|INS(x8))=1,

P(X|INS(x9))=0.5,P(X|INS(x10))=0.667,P(X|INS(x11))=0.5.

设损失函数的梯形分布满足:

特别地,当σ=0即悲观决策者的阈值表达式为:

≈0.72

特别地,当σ=1即乐观决策者的阈值表达式为:

=0.609

POS(X)={x8},NEG(X)={x1},BND(X)={x2,x3,x4,x5,x6,x7,x9,x10,x11}.

POS(X)={x3,x6,x8,x10},NEG(X)={x1},BND(X)={x2,x4,x5,x7,x9,x11}.

4 结束语

本文在不完备信息系统中,从决策粗糙集出发,利用梯形模糊数来设定损失函数,采用一种已有的改进完备容差关系来代替相似关系进行分类。然后,结合Bayes决策过程,在不完备信息系统中应用梯形模糊数决策粗糙集模型,提出了一种基于不完备信息系统的梯形模糊数的决策粗糙集模型。最后,给出了该模型的三支决策规则和方法,应用实例说明决策过程,并对该模型进行了分析。本研究为在不完备信息系统中的三支决策理论模型拓展提供了一种方法。

[1] Kryszkeiwicz M.Rough Set Approach to Incomplete Information Systems[J].InformationScience,1998,112(1):39-49.

[2] Stefamowski J,Tsoukeas A.On the Extension of Rough Sets under Incomplete Information[J].InternationalJournalofIntelligentSystem,2000,16(1):29-38.

[3] 王国胤.Rough集理论在不完备信息系统中的扩充[J].计算机研究与发展,2002,39(10):1238-1243.

[4] 盛立,杨慧中.基于完备容差关系的扩充粗糙集模型[J].控制与决策,2008,23(3):258-262.DOI:10.13195/j.cd.2008.03.20.shengl.022.

[5] 马希骜,王国胤,张清华,等.基于改进的完备容差关系的扩充粗糙集模型[J].计算机应用,2010,30(7):1873-1882.

[6] Yao Yiyu.Three-way Decisions with Probabilistic Rough Sets[J].InformationSciences,2010,180(3):341-353.

[7] Greco S,Matarazzo B,Slowinski R.Parameterized Rough Set Model Using Rough Membership and Bayesian Confirmation Measure[J].InternationalJournalofApproximateReasoning,2008,49:285-300.

[8] 薛占熬,刘杰,薛天宇,等.基于覆盖的Sugeno测度粗糙集模型及其三支决策[J].计算机科学,2016,43(3):285-290.

[9] 史进玲,张全友,杜根远.基于风险最小化的多粒度三支决策模型[J].河南师范大学学报(自然科学版),2017,45(2):102-107.DOI:10.16366/j.cnki.1000-2367.2017.02.019.

[10] 王宇,杨志荣,杨习贝.决策粗糙集属性约简: 一种局部视角方法[J].南京理工大学学报,2016,40(4):444-449.DOI:10.14177/j.cnki.32-1397n.2016.40.04.011.

[11] 朱艳辉,田海龙,刘璟,等.基于三支决策的新闻情感关键句识别方法[J].山西大学学报(自然科学版),2015,38(4):595-560.

[12] Liu Dun,Liang Decui,Wang Changchun.A Novel Three-way Decision Model based on Incomplete Information System[J].Knowledge-basedSystems,2015,91:32-45.

[13] 张鑫,李续武,路艳丽,等.基于不完备区间值信息系统的决策粗糙集[J].计算机应用研究,2017,34(1):110-122.

[14] 李亚鸽,杨宏志,徐久成.基于不完备信息系统的三角模糊数决策粗糙集[J].智能系统学报,2016,11(4):449-458.DOI:10.11992/tis.201606016.

[15] 衷锦仪,叶东毅.基于模糊数风险最小化的拓展决策粗糙集模型[J].计算机科学,2014,41(3):50-54.

TrapezoidalFuzzyNumberThree-wayDecisionModelforIncompleteInformationSystems

LIU Jie1,XUE Zhanao2*

(1.DepartmentofInformationEngineering,HenanInstituteofScienceandTechnology,Xinxiang453007,China;2.CollegeofComputerandInformationEngineering,HenanNormalUniversity,Xinxiang453007,China)

In the incomplete information systems, combined with the Bayes decision theory, this paper used the complete tolerance relation improved in literature [3] to replace the equivalence relation of classical decision rough sets, and introduced the generalized and easily calculated trapezoidal fuzzy numbers to the decision rough sets. Based on the incomplete information systems, a trapezoidal fuzzy number decision-theoretic rough set model was proposed.And the three-way decision rules were then presented, and the different decision rules for the pessimists and optimists were discussed, respectively. Finally, an example was given to illustrate the application process of the proposed model.

incomplete information systems;complete tolerance relation;three-way decision;trapezoidal fuzzy number

10.13451/j.cnki.shanxi.univ(nat.sci.).2017.04.004

2017-06-05；

2017-08-09

国家自然科学基金(61273018)；新乡市重点科技攻关计划项目(ZG14020)

刘杰(1989-)，女，助教，研究方向为粗糙集和三支决策基本理论。

*通信作者：薛占熬(XUE Zhanao)，E-mail：xuezhanao@163.com

TP 181

0253-2395(2017)04-0683-07