基于知识粒度的在用HFC抗燃性能指标约简研究*

2020-07-31 02:27余良武刘东风张文群房友龙
关键词:约简粒度信息系统

余良武 刘东风 张文群 房友龙

(海军工程大学动力工程学院1) 武汉 430033) (海军工程大学青岛油液检测分析中心2) 青岛 266012)

0 引 言

水-乙二醇抗燃液压液是一种具有防火抗燃性能液压液,通常简称为HFC[1].HFC大多工作在接近明火或高温物体的场合,保持足够的抗燃性至关重要,抗燃性能是其最重要的设计功能之一[2].在使用过程中由于水分含量变化、油液氧化和可燃物污染等因素的影响,HFC的抗燃性能会发生变化,因此在日常管理过程中需要对HFC的抗燃性能进行监测,并根据监测结果采取相应的维护措施.

文献[3]规定HFC的抗燃性能测试包括三个指标,分别为歧管燃烧特性、喷射燃烧特性,以及芯式燃烧特性.另外,水基抗燃液压液的抗燃性能主要依靠高含水量来维持,水分含量能够一定程度反映HFC的抗燃性能,因此HFC的抗燃性能可以利用歧管燃烧特性、喷射燃烧特性、芯式燃烧特性和水分含量四个指标来衡量.如果同时对这四个指标实施监测,工作量较大,测量成本也较高.在对抗燃性能监测精度要求不是特别高时,为了降低测量工作量和成本可进行指标约简,在保持知识库分类能力大致不变的前提下减少指标数量[4].

目前常用的指标约简算法可分为统计学方法和粗糙集理论两类,统计学方法主要包括主成分分析法、因子分析法、极小方差广义法、极大不相关法、灰色关联分析法等[5].常用的基于粗糙集理论的启发式指标约简算法主要有基于差别矩阵的指标约简算法和基于信息熵的指标约简算法[6-7],这两种算法一般多用于决策系统的指标约简,不能适用于缺少决策指标的信息系统,而在用HFC的抗燃性能指标体系正是一个信息系统,决策指标是我们需要得到的抗燃性能状态.本文研究了一种基于知识粒度的指标约简算法,该算法可用于信息系统的指标约简,并将其应用于在用HFC抗燃性能指标约简.

1 基于知识粒度的信息系统指标约简算法研究

1.1 相关定义和定理研究

定义2知识表达系统S=(U,A,V,f).其中:A=C∪D,C为条件指标集,D为决策指标集,若D=∅,则称S为信息系统,若D≠∅则称S为决策系统.

定义3知识表达系统S=(U,A,V,f),对于任意给定的指标集P⊆A,称IND(P)为P对应的不可分辨关系,且有:

IND(P)={(x,y)∈U×U:

∀p∈P,f(x,p)=f(y,p)}

(1)

P对应的所有等价类划分的集合记为U/IND(P).

由式(1)中可知,IND(P)为依靠指标集P无法区分的对象的集合,不可分辨关系可将论域U划分为不相交的等价类即知识颗粒(knowledge granule),颗粒内部的不同对象是不可分辨的,而颗粒间的不同对象是可分辨的.

定义4信息系统S=(U,C),P⊆C,对于指标p0∈P,如果有IND(P-{p0})=IND(P),则称指标p0是多余的或非必要的,反之则称指标p0是必要的.

定义5信息系统S=(U,C),P⊆C,若所有的p∈P都是必要的,称P是独立的,反之则称P是依赖的.

定义6信息系统S=(U,C),P⊆C,P中所有必要指标的集合称为P的核,记作Core(P).

定义7信息系统S=(U,C),Q⊆P⊆C,若Q是独立的,且有IND(P)=IND(Q),则称Q是P的约简.

需要说明的是指标集的约简并不是唯一的.

定义8信息系统S=(U,C),P⊆C,U/IND(P)={X1,X2,…,Xm},称GK(P)为P的知识粒度(knowledge granulation),且有:

(2)

式中:|U|和|Xi|分别为论域和等价划分Xi中对象的个数.

定义9信息系统S=(U,C),P⊆C,p0∈P,称sigP-{p0}(p0)为指标集P中指标p0的重要度(significance degree),且有:

sigP-{p0}(p0)=GK(P-{p0})-GK(P)(3)

根据定义9,指标集中某指标的重要度定义为去除该指标后知识粒度的变化量.结合定义4可知,指标是必要的充要条件是sigP-{p0}(p0)>0.

定理1信息系统S=(U,C),P⊆C,Core(P)={p∈P|sigP-{p}(p)>0}.

定理1给出了一种求指标集核的标准方法.

定义10信息系统S=(U,C),P⊆C,q∈C-P,称sigP+{q}(q)为指标q相对于指标集P的重要度,且有:

sigP+{q}(q)=GK(P)-GK(P∪{q})

(4)

根据定义10,某指标相对于指标集的重要度定义为增加该指标后知识粒度的变化量.sigP+{q}(q)越大说明指标q对指标集P分类能力的提升越显著.

定理2信息系统S=(U,C),Q⊆P⊆C,若∀q∈Q,都有sigQ-{q}(q)>0,且GK(Q)=GK(P),则Q为P的一个约简[8].

1.2 基于知识粒度的指标约简算法步骤

基于上述定义和定理可以导出一种启发式指标约简算法,根据定理1求指标核,以核为起点,以指标重要度sigP+{q}(q)为启发,选择具有最大的重要度的指标依次加入核中,最终得到最小约简.具体算法步骤和描述如下所示.

基于知识粒度的信息系统指标约简算法:

输入 信息系统S=(U,C),P⊆C.其中:U为论域,C为条件指标集,P为条件指标集的子集.

输出 指标集P的约简Q.

步骤1计算指标集P的知识粒度GK(P).

步骤2求指标集P的核Core(P).计算P中各指标pi的重要度sigP-{pi}(pi),i=1,2,Λ,|P|,当sigP-{pi}(pi)>0时,将pi纳入核中,即Core(P)={p∈P|sigP-{p}(p)>0}.若GK(Core(P))=GK(P),则算法终止,输出Q=Core(P),否则转向步骤3.

步骤3令Q=Core(P),以指标重要度为启发信息,向Core(P)中逐个添加指标.

1) 对于∀c∈P-Q,计算其相对于指标集Q的重要度sigQ+{c}(c);

3) 计算Q的知识粒度,若GK(Q)=GK(P),则算法终止,输出约简Q.否则返回(1).

2 实例分析

2.1 实验和数据

从某型船舶不同设备中取得10个在用HFC油样,使用电量法测量其水分含量,分别测定喷射燃烧特性、芯式燃烧持久性和歧管燃烧特性.其中歧管燃烧特性的结果报告是离散的状态描述性指标,包括三个状态:①在歧管上燃烧,滴下后仍燃烧;②在歧管上燃烧,滴下后不燃烧;③在歧管上不燃烧,滴下后也不燃烧.剩下的水分含量(%)、喷射燃烧时间(s)和芯式燃烧时间(s)均为连续指标.粗糙集理论一般只能直接处理离散化数据,这也是粗糙集理论的一个缺点[9].因此,需要将连续指标离散化,离散化不可避免会造成信息丢失,但是只要控制得当还是被认为可接受的.本文采用等宽离散化方法,对于喷射燃烧特性,界定燃烧时间小于15 s时为“优秀”,大于15 s、小于30 s时为“合格”,大于30 s时为不合格.对于芯式燃烧持久性,界定最大平均燃烧时间小于30 s时为“优秀”,大于30 s、小于60 s时为“合格”,大于60 s时为不合格.对于水分含量,界定小于35%时为“偏低”,大于35%、小于40%时为正常,大于40%时为偏高.经离散化处理后,抗燃性能测试数据统计见表1.

表1 抗燃性能测试数据

2.2 基于知识粒度的在用HFC抗燃性能指标约简

以水分含量、喷射燃烧特性、芯式燃烧持久性、歧管燃烧特性为条件指标集P,10个在用HFC油样为论域U,按照上节所研究的基于知识粒度的指标约简算法计算约简集Q.

条件指标集P对U的划分.

U/IND(P)={(1,4,9),(2,10),

(3,7),(5),(6,8)}

(5)

计算P的知识粒度.

GK(P)=11/50

(6)

计算P中各指标的重要度.

sigp-p1(p1)=GK(P-p1)-GK(P)=3/25>0

(7)

sigp-p2(p2)=GK(P-p2)-GK(P)=0(8)

sigp-p3(p3)=GK(P-p3)-GK(P)=0(9)

sigp-p4(p4)=GK(P-p4)-GK(P)=0

(10)

所以有:

Core(P)={p1}={水分含量}

(11)

令:

Q=Core(P)={水分含量}

(12)

计算剩余各指标相对于Q的重要度.

sigQ+p2(p2)=GK(Q)-GK(Q+p2)=4/25

(13)

sigQ+p3(p3)=GK(Q)-GK(Q+p3)=3/25

(14)

sigQ+p4(p4)=GK(Q)-GK(Q+p4)=4/25

(15)

比较各指标相对于Q的重要度.

sigQ+p2(p2)=sigQ+p4(p4)>sigQ+p3(p3)(16)

所以可选择喷射燃烧特性或歧管燃烧特性加入Q中,若令Q=Q+p2={水分含量,喷射燃烧特性},则有:

GK(Q)=GK(P)=11/50

(17)

所以{水分含量,喷射燃烧特性}为P的约简.

若令Q=Q+p4={水分含量,歧管燃烧特性},则有:

GK(Q)=GK(P)=11/50

(18)

所以{水分含量,歧管燃烧特性}也为P的约简.

由此可知,通过测量水分含量和喷射燃烧特性或水分含量和歧管燃烧特性2个指标即可反映HFC的抗燃性能,且实现的分类能力和同时测量4个指标是相同的.从测量区分度上进一步考虑,歧管燃烧特性只有3个状态结果,区分度较差,比较而言喷射燃烧特性测试结果为连续的时间变量,区分度良好,因此可选择Q为{水分含量,喷射燃烧特性}.

3 结 束 语

研究了一种基于知识粒度的指标约简算法,介绍了相关定义、定理和具体的计算步骤,该算法能够适用于缺少决策指标的信息系统.利用基于知识粒度的指标约简算法进行抗燃性能下属指标集的约简,将水分含量、喷射燃烧特性、芯式燃烧持久性、歧管燃烧特性4个指标约简为水分含量和喷射燃烧特性2个指标,在保持知识库分类能力大致不变的前提下很大程度上减少了指标监测的工作量和成本.

猜你喜欢
约简粒度信息系统
粉末粒度对纯Re坯显微组织与力学性能的影响
动态更新属性值变化时的最优粒度
基于排队论的信息系统装备维修保障效能分析
基于并行构件技术的医疗信息系统的设计与实现
带权决策表的变精度约简算法
面向特定类的三支概率属性约简算法
直觉模糊序决策系统的部分一致约简*
基于区块链的通航维护信息系统研究
广义不完备多粒度标记决策系统的粒度选择
近似边界精度信息熵的属性约简