面向案例消耗推理的应急物资预测

2021-11-26 07:22王庆荣马辰坤
计算机工程与应用 2021年22期
关键词:案例库消耗物资

王庆荣,马辰坤

兰州交通大学 电子与信息工程学院,兰州730070

近年来,频繁的自然灾害给人们的生活带来了巨大的损失。据国际紧急事件数据库(Emergency Events Database,EM-DAT)的国际灾害数据库(International Disaster Database)不完全统计,1994—2013 年,全球地震灾害致死人口占所有因灾死亡人口的55%,约75万人,超过洪涝、飓风、旱灾、火山喷发、火灾、地质灾害等其他灾害致死人口总和,地震灾害造成的经济损失占所有自然灾害经济损失的31%,达到7 870亿美元[1]。虽然人们无法控制灾害的发生,但通过采取有效有力的防灾救灾措施,可以在一定程度上降低自然灾害的损失[2]。因此,如何快速、精确、合理地预测出地震事件发生后应急救援物资的需求量,是当前社会的热点问题。

郭子雪等[3]针对应急物资影响因素的特点,构建确定应急物资需求量的多元模糊回归预测模型;Spencer等[4]采用时间序列模型对灾区物资进行预测;Mohammadi等[5]利用混合智能算法及径向基神经网络相结合的方法,对震后应急物资需求进行预测;胡忠君等[6]采用两步法,建立基于改进GM(1,1)受灾人口数量的应急物资动态需求预测模型进行预测;程琼琼[7]运用BP神经网络的方法来进行预测;朱昌峰等[8]通过引入区间数的概念,提出对案例属性间的相似度进行计算的应急物资预测方法;郭继东等[9]考虑灾区信息贫乏的特点,运用模糊案例推理的方法,建立震后物资需求预测模型。

上述文献从不同角度出发,针对应急物资预测问题进行研究,主要分为三类:第一类,数学算法拟合模型,对物资趋势进行预测;第二类,基于历史数据和智能算法构建模型,研究过去案例数据的特点;第三类,案例推理技术构建模型,对以往案例的解决方法进行研究。

然而上述研究尚有待完善之处:第一,没有考虑到物资需求预测往往需要前期数据的支撑,而灾害发生后,灾区难以及时与外界联系,搜集到的信息较贫乏,因此产生对突发性情况的适应度不足现象。第二,现有的能够获取的应急物资数据较少,用较少的物资历史数据构建的神经网络模型往往会造成预测精度不高的问题,也容易出现过度拟合现象。第一类方法不适应于物资的初期预测,第二类方法则要依赖于大量历史数据。因此鉴于我国应急事件的统计数据量有限的现状,面向案例推理方法对应急物资进行初期预测是目前较为有效且实用的方法。第三,案例推理方法存在一些尚未解决的问题。比如,案例检索时出现距离目标案例最近的案例是年代较久的源案例的情况,这种情况的出现是由于没有考虑到社会的进步对应急物资需求的影响,根据时间的发展,年代较久的源案例的处理方法将有可能不适合新问题的解决方案,并对新问题的合理解决形成一定的阻碍。

综上所述,本文考虑应急物资数据较贫乏且具有年代特征的特点,提出运用消耗策略的案例推理方法对应急物资进行需求预测。针对待完善的第一点,本文选择了震发初期较易获得的灾区属性作为案例属性;针对第二点,给出消耗区间参数来调节消耗能力,通过控制消耗区间参数来适应数据量少的应急数据特点;针对第三点,给出消耗参数对不同年代的案例权重进行消耗来适应数据具有年代特征的特点。本文方法降低物资损耗的同时,提高了预测的准确性,也为应急物资预测提供了新思路。

1 案例的推理及表示

1.1 案例的推理

1982年,案例推理技术首次由耶鲁大学教授Schank[10]提出,它是人工智能领域中基于知识问题求解的一种重要方法,其核心思想是模仿人类利用经验思考解决问题的过程。该方法将新问题当作目标案例,案例库中的问题当作源案例,在制定相关方案时,通过在案例库中检索与目标案例相似的源案例,重用或修正,从而得到新问题的解决方案,最后将案例信息保存到案例库中成为源案例。其一般原理如图1所示。

图1 CBR的一般原理Fig.1 General principles of CBR

1.2 地震案例的构建与表示

地震应急物资需求的确定往往和其涉及的众多特征属性有关,而一个地震案例的特征属性种类繁多,这些属性构成了整个案例,若干个属性值不同的案例的集合组成了案例库。在建立案例库时,需要把每一条案例的条件属性和解属性区分开,将物资量作为解属性,其他量作为案例构造的条件属性。初始案例库是以专家经验法、定性与定量相结合的分析法,以及根据类似地震案例,按照案例表示的规范性描述建立的案例库。

案例库的构建可以很好地把这些源案例中的特征属性组织整合起来。通过提取案例的公共特征属性,可以确定案例的核心概念。在选择特征属性指标时,特征属性指标要能够反映研究对象特点,且遵循相互独立的原则[11]。通过一系列研究,本文将在实例分析中抽取8个主要指标表征地震案例。

2 案例检索

案例检索是案例推理的第一步也是最重要的一步,在检索过程中,涉及两个问题:第一个是如何确定各特征属性的权重;第二个是各特征属性之间的相似性如何度量。然而大多相似性度量方法是采用基于距离的度量方法,即使权重确定很合理,但距离最近的案例不一定最相似[12],因此相似性度量是案例检索的算法核心[13],也是本文研究重点。

2.1 特征属性权重的确定

在进行案例推理时,需要确定各案例特征属性对于决策属性的重要程度,从而为每一个条件属性分配一个适当的权值[14]。文中采用粗糙集依赖度强化法[15],计算案例特征属性权重。该方法利用计算不同条件属性间的组合依赖度,再将组合依赖度分离而后合并于每个属性的方法,计算出各属性的依赖程度,如图2所示,从而得出特征属性在案例匹配中占有的权重。

图2 依赖度计算结构Fig.2 Dependency calculation structure

条件属性C对决策属性D的重要程度定义为:

其中,Ro表示属性C相对于属性D依赖程度,POSC(D)表示X的正域。

将Ro()C,D进行归一化处理可以得到条件属性C在决策表中的权重:

2.2 特征属性相似度确定

案例的总体相似度是通过计算目标案例与源案例的所有特征属性的相似度,再结合求出的特征属性权值,进行加权计算,得到总体相似度[16]。鉴于本研究数据指标的表征属性是数值变量,可以用数值精确表示,故采用海明距离方法计算局部相似度,如下所示:

目标案例与源案例的总体相似度计算如下:

其中,A0表示目标案例的特征属性值,Ai表示源案例的特征属性值,U0表示目标案例,Ui表示源案例,NC表示属性特征值的数量。

2.3 消耗策略的相似度计算

由于地震事件的发生会引起应急物资需求的激增,根据案例推理方法中各源案例的应急物资需求量,可以衡量出目标案例中的应急物资需求量,但由于衡量出的物资结果只能粗略地给出一个参考数值,使得数据结果存在一定的误差性。因此,针对应急物资数据的特点,本文提出消耗策略,作为案例之间相似度计算的新方法,以减小最终结果与实际值之间的误差。

将案例消耗策略应用到相似度计算中,对年代较久的老旧案例进行相似度弱化。随着时间的增长,使得各地方的人口密度、建筑面积等因素与以前不同。案例推理方法是依据目标案例的属性到案例库中计算与各源案例各属性间的相似度,综合得到相似度最高的源案例进行匹配。但由于地震事件的各特征属性与时间属性(即社会发展)关联密切,距目标案例发生时间越短的源案例,参照性就越强,距目标案例发生时间越长的源案例,参照性就越差。案例消耗策略的主要结构如图3所示。通过确定消耗参数与消耗函数对案例库中的老旧案例进行弱化,其中消耗函数决定了各案例之间消耗程度的差异性,消耗参数决定了案例消耗策略对案例整体的消耗能力。

图3 消耗策略的框架Fig.3 Framework for consumption strategy

(1)消耗函数确定

考虑不能简单地通过年份作为消耗策略的依据对案例进行消耗,本文拟采用案例发生年份的人均国民生产总值(GDP)作为代表,较好地评估源案例间的发展情况差异性。给出一条随着时间变化的消耗函数,根据目标案例的发生时间,结合距源案例发生的时间,逐步对年份间隔较远的源案例进行弱化,使其最久远的源案例被赋予较低的相似度。

本文采用1960—2018年的GDP作为消耗函数的拟合数据,通过实验测试给出拟合函数形式如下:

(2)消耗参数确定

消耗函数给出了消耗参数在每个时间段案例消耗的程度,而案例消耗参数决定了被消耗案例的相似度削弱程度,给出消耗参数确定式如下:

式中,xl为待预测案例,τ为消耗参数,θ为消耗区间参数。θ决定了τ对案例整体的消耗能力,取值范围为0到1,θ越大τ对案例整体的消耗能力越强,反之越弱。

(3)总体相似度计算

确定消耗参数后,结合上述的特征属性相似度,可以计算基于案例消耗的总体相似度,如下:

其中,Sc为案例之间的总体相似度。

3 案例重用与修正

设置阈值与筛选案例,满足如下条件:

则案例库中达到阈值δ的所有源案例被检索出来并取相似度最高的源案例重用。其中,0<δ≤1,δ的取值由历史经验或数据确定,δ越高则表明案例之间的匹配度越高。

当无法满足阈值条件时,则说明案例库中的源案例与目标案例差异过大,此时选择与当前目标案例最为相似的源案例作为参考,之后再给出一些调整与修正,以满足目标案例的要求,如下式所示:

其中,T0是目标案例中物资的需求量预测值,Ti是与目标案例最相似的源案例的物资实际需求量,Wi是与目标案例最相似的源案例中的受灾人数,W0是目标案例中的受灾人数。

4 案例推理模型

优化后的案例推理流程如图4所示,推理步骤如下:

图4 优化后的CBR流程Fig.4 Optimized CBR process

步骤1搜集地震案例,并提取案例特征属性。

步骤2根据案例特征属性,构建地震案例库。

步骤3基于粗糙集的属性依赖度,计算各属性在案例匹配中占有的权重。

步骤4根据消耗策略与海明距离,结合权重加权,求得目标案例与各源案例之间的总体相似度。

步骤5设定阈值,将满足条件的源案例进行重用,若不满足条件则根据式(9)分析修正,再加入案例库。

5 实例分析

本文以地震中所需的帐篷需求量为实例研究对象,采用消耗案例方法对物资需求量进行预测,并对精度进行测试与检验。实验数据来源于历年新闻报道、记载及其他论文已有数据等。

5.1 案例特征权重确定

统计以往地震案例的数据信息,如表1所示。设地震灾害源案例集中有15个源案例p1至p15,源案例的属性集为a1 至a9,其中a1 表示“受灾人数”,a2 表示“发生时间”,a3表示“房屋倒塌”,a4表示“里氏震级”,a5表示“震源深度”,a6 表示“人口密度”,a7 表示“烈度”,a8 表示“设防烈度”,a9表示“帐篷供应量”。

表1 地震案例信息表Table 1 Earthquake case information table

地震案例特征属性权重确定的决策表如表2 所示。决策表中a9为决策属性,a1至a8为条件属性。

表2 地震案例决策表Table 2 Earthquake case decision table

结合粗糙集属性依赖度计算方法,给出条件属性对决策属性的依赖度及归一化后的权重,如表3所示。

5.2 相似度计算

本文构建的案例库包含15个案例,选择2010年表3属性依赖度及属性权重以后的案例作为目标案例进行案例推理,将案例库中的案例作为目标案例推理时,将该案例从案例库中删除,相似度计算后再重新加入案例库。采用式(4)计算目标案例与源案例的相似度,结果如表4所示。

表3 属性依赖度及属性权重Table 3 Attribute dependence and attribute weight

表4 传统案例推理方法相似度表Table 4 Similarity table of traditional case-based reasoning methods

对消耗函数拟合后给出案例消耗策略的消耗函数参数取值,如表5所示。

表5 消耗函数参数取值Table 5 Consumption function parameter value

消耗函数确定后需要确定消耗参数的消耗能力。消耗参数的消耗能力取决于消耗区间参数,通过对比预测结果与实际结果确定不同消耗区间参数下的预测结果,如图5所示。

由表6 可知,当加入消耗策略后,消耗区间参数分别取0.1、0.2、0.3、0.4 时物资预测结果与实际供应结果误差较小,较为合理。结合图5的物资预测对比曲线可知,当消耗参数取0.1时,加入消耗策略的案例推理结果曲线与传统的案例推理结果曲线吻合度较高,与物资实际供应曲线偏差较大;当消耗参数取0.2、0.3、0.4 时,加入消耗策略的案例推理结果曲线较符合物资预测的实际供应曲线,但参数取0.2、0.3时误差较小且图像一致,故最终区间参数取0.2、0.3时较为合理。

图5 不同消耗区间参数CBR优化前后对比结果Fig.5 Comparison results of CBR with different consumption interval parameters before and after optimization

表6 平均相对误差表Table 6 Mean relative error table

对比案例库中的案例,计算各案例间的总体相似度,改进的案例推理相似度计算结果如表7所示。

5.3 确定最佳匹配源案例并预测

假设案例相似度阈值为0.6,从计算结果可以得出,满足条件的与目标案例10相似的案例有案例8、案例11、案例12、案例13、案例14。由于与案例11 的相似度最高,故案例11 为最佳匹配相似案例,对案例进行重用,即案例11是将要实施的物资预测方案。

由表7依次可知,与目标案例11最佳匹配的案例是案例13;与目标案例12最佳匹配的案例是案例14;与目标案例13 最佳匹配的案例是案例11;与目标案例14 最佳匹配的案例是案例8;与目标案例15最佳匹配的案例是案例9。由此,可以预测出目标案例的物资需求量。

表7 改进案例推理方法相似度表Table 7 Similarity table of improved case-based reasoning methods

为了验证本文方法的有效性,将K近邻方法案例推理、粗糙集案例推理和本文方法进行比较分析,不同检索方法的精确率如表8所示。

表8 不同检索方法的精确率Table 8 Accuracy of different retrieval methods %

上述结果表明,在应急物资预测中,相比于其他两种案例推理方法,本文方法的预测效果较好,精确度较高,为应急救援提供了一定的借鉴意义。

6 结束语

本文研究了地震环境下的应急物资预测方法,考虑应急物资数据特点,提出了一种基于消耗策略推理的方法。为了提高案例匹配的准确度,利用粗糙集计算属性权重值,使用消耗策略与海明距离来计算案例的总体相似度,一定程度上改善了由于案例老旧造成的预测物资数据与实际供给差异过大的现象。最后,结合实例说明了本文方法的有效性及合理性。

应急物资需求的预测是一个复杂的过程,本文提出的方法仅考虑了数值型一种相似度计算,在未来的研究中,需考虑多种类型的混合相似度或多场景的应急物资需求预测问题,以提高案例推理的准确性。

猜你喜欢
案例库消耗物资
玉钢烧结降低固体燃料消耗实践
心血管外科教学案例库的建设及应用研究
转炉炼钢降低钢铁料消耗的生产实践
国内首个海事司法案例库正式上线
降低钢铁料消耗的生产实践
基于实践应用的基坑工程设计案例库建设研究
被偷的救援物资
我们消耗很多能源
电力企业物资管理模式探讨
MTI朝鲜语同声传译教学案例库建设研究