粗糙集理论条件属性重要性的确定

2021-03-11 09:39丽江师范高等专科学校教师教育学院何天荣
数学大世界 2021年2期
关键词:约简流感体温

丽江师范高等专科学校教师教育学院 何天荣

一、涉及的基本概念

1.抽象知识和知识库

二、例谈知识约简的方法

不必要的知识(条件属性)对决策是没有任何参考价值的。以下通过某些病人的决策表来阐述知识约简的具体过程。

注:知识约简只需考虑条件属性,不需要考虑决策属性,为了节省篇幅,例1、例2 共用一个知识表达系统,所以本例的表格中也列出了决策属性。

例1:表1 是某些病人的决策表。

表1

U 是集合{m1,m2,m3,m4,m5,m6,m7,m8},C={头痛,肌肉痛,体温},设S=(U,A,V,f)为一知识表达系统,A 是属性集,即C ∪D,C ∩D 非空,C 表示条件属性集,D 表示决策属性集。我们称具有条件属性以及决策属性的知识表达系统为决策表。

设C1={头痛},C2={肌肉痛},C3={体温},则:

U/C1={{m1,m2,m3},{m4,m5,m6,m7,m8}},

U/C2={{m1,m2,m3,m4,m6,m8},{m5,m7}},

U/C3={{m1,m4},{m2,m5,m7},{m3,m6,m8}},

U/indC={{m1},{m2},{m3},{m4},{m5,m7},{m6,m8}},

因为U/ind(C-{c1})={{m1,m4},{m2},{m5,m7},{m3,m6,m8}}≠U/indC,所以条件属性C1在属性集C 中是必要的,即在诊断病人是否为流感时,{头痛}是必要考虑的症状。

因为U/ind(C-{c2})={{m1},{m2},{m3},{m4},{m5,m7},{m6,m8}}=U/indC,所以条件属性C2在属性集C 中是必要的,即在诊断病人是否为流感时,{肌肉痛}是不必要考虑的症状。

同理,U/ind(C-{c3})={{m1,m2,m3},{m4,m6,m8},{m5,m7}}≠U/indC,故条件属性C3在属性集C 中是必要的,即在诊断病人是否为流感时,{体温}是必要考虑的症状。

所以{C2,C3}是条件属性集C 的约简,得出的结论是,在考虑病人是否得流感时,{头痛}和{体温}是有必要参考的症状,而肌肉痛是没有参考价值的,即肌肉痛不痛与是否得流感没有逻辑关系。

三、条件属性重要性的确定

在决策表中,对于决策属性而言,不同的条件属性的重要性不是完全相同的,例如, 当由临床症状描述病人的情况时,有的条件属性(症状)对于诊断病人的病症具有更重要的意义。

为了找出某些条件属性的重要性,具体的处理方法是从表格中剔除某些属性,再来考查该属性的分类会如何变化,如果去掉该属性,分类变化较大,则说明这个条件属性的重要性高,反之,则说明该条件属性的重要性低。以下通过医生诊断病情的实例(决策表见例1)来说明确定条件属性重要性的具体过程。

综合以上计算的数据,得到的结论是,在决策表表1 中,在判断病人是否得流感的诊断中条件属性的重要性为:{体温}最重要,其次是{头痛},{肌肉痛}不重要,没有参考价值。

本文通过具体实例阐述了条件属性的约简方法及条件属性重要性的确定,对医生诊断病人的症状有一定的参考价值。

猜你喜欢
约简流感体温
体温低或许寿命长
流感大作战
基于确定性因子的启发式属性值约简模型
面向连续参数的多粒度属性约简方法研究
基于差别矩阵的区间值决策系统β分布约简
哪些因素影响体温
小心,流感来了
体温值为何有时会忽然升高?
近似边界精度信息熵的属性约简
小心!流感来了