基于决策树分类算法燃气管道隐患评估

2022-10-25 04:23于燕平袁理想孙俊芳
煤气与热力 2022年10期
关键词:燃气管特征参数漏气

王 勋, 乔 佳, 于燕平, 袁理想, 孙俊芳

(北京市燃气集团研究院,北京100011)

1 概述

城市燃气企业每年需投入资金对老化程度较高或发生事故频率较高的隐患管道进行技术改造。仅凭借管道服役年限及泄漏次数等因素判定是否需要改造不够科学,有部分管道开挖后发现并没有达到需要改造的程度,造成人力物力浪费,还可能使需进行改造的管道没有优先改造,留下安全隐患。因此有效评估燃气管道使用状态非常重要。

在天然气管道完整性管理过程中,对管道寿命预测及泄漏风险评估是两个重要研究内容。李增杰等人[1]提出基于BP神经网络模型的统计模型对城市燃气管道进行剩余寿命预测,用差值模型修正BP神经网络模型预测值;薛吉明等人[2]针对运行多年的输气管道出现防腐层龟裂、破损和剥离以及管道承压能力下降的状况,提出以多种检测方法为基础,采用相关理论和标准解决管道防腐层问题及对管道剩余寿命进行评估;罗富绪[3]论述了管道剩余使用寿命预测和评估的必要性,介绍国外对管道剩余使用寿命的预测方法和评估理论,提出应该把对管道剩余使用寿命的预测工作作为管道运行和技术维护管理系统的组成部分;庞洪晨等人[4]采用Modified B31G和Kastner评价方法计算了管道剩余强度,并进行了剩余寿命预测;朱晏萱[5]对Muhlbauer风险评价法在天然气埋地管道的评分应用进行了探讨;袁雄军等人[6]提出一种基于模糊逻辑系统的管道风险评估方法。以上研究均基于管道失效的相关因素,或赋予权重[7],或采用专家评分[8]方式得到评价结果,属于非监督学习建模过程。本文针对某企业燃气管道,以相关标准为指导,量化燃气管道相关参数,结合运营巡检数据及历史开挖管道技改等级实际评估结果,提出一种决策树分类监督学习模型,有效评估燃气管道使用状态,解决燃气管道技改大修资金重点使用问题。

2 数据准备

在城市燃气管道运营巡检抢修过程中,会记录大量燃气管道数据,如漏气点数量(自投运以来每年的漏气点数量之和)、漏气点间距(位于管道最两端漏气点的距离,单位为m)、投运时间(以年计)、管径、运行压力、长度(单位为km)、漏气点密度(漏气点数量与管道长度之比)、防腐层漏点数量、防腐层缺陷级别,其中防腐层缺陷级别来源于检测结果,其余特征参数来源于巡检数据。当只有1个漏气点时,漏气点间距为0。将这9个特征参数或其量化值作为模型的输入变量。对管径、运行压力、防腐层缺陷级别进行量化。管径量化:如果管道是单一管径,公称直径为a(单位为mm),则量化值为DNa;如果管道非单一管径,则量化为“多种管径”4个字。运行压力量化:如果管道是单一运行压力,则根据压力量化为以下文字:高压A、高压B、次高压A、次高压B、中压、低压;如果管道非单一运行压力,则量化为“多种压力”4个字。防腐层缺陷级别量化:参照CJJ 95—2013《城镇燃气埋地钢质管道腐蚀控制技术规程》表4.3.1进行,将防腐层缺陷级别量化为轻、中、重级别。

根据以往管道开挖后的实际评估和改造情况,将管道隐患评估等级分为立即整体改造、暂缓整体改造、局部换管、局部修补、加强运行和情况尚可6个等级,这6个等级作为模型的输出变量。对特征参数不全的管道信息予以剔除后,共收集到该企业历年技改大修中250条燃气管道的特征参数和隐患评估等级,部分管道的特征参数和隐患评估等级见表1。

表1 部分管道的特征参数和隐患评估等级

3 决策树分类技术介绍

决策树[9]分类技术在众多分类技术中占有重要地位,属于统计学分类范畴,是一种非规则的分类方法。决策树分类技术通过对已分类的样本集进行训练,学习归纳出分类函数,从而确定分类器。利用训练得到的分类器实现对未分类数据的分类。通过对比分析不同的分类算法,发现决策树分类算法的应用效果比神经网络分类算法和判定树分类算法好,特别是待分类数据量非常大时,决策树分类算法较其他分类算法准确率高。

决策树分类技术的原理是相似的输入特征得到相似的输出结果,决策树分类用于燃气管道隐患评估等级分类,可以理解为在类似的管材及外部环境条件下,管道运营状态类似,则管道隐患评估等级相同。即已知某些条件、状态下管道的隐患评估等级,对某管道进行隐患评估等级评定时,根据管道特征参数通过模型找到与它最相似的一类已知隐患评估等级的管道,便可知道被评定管道的隐患评估等级。

该企业完成了对历史技改管道特征参数及隐患评估等级实际评判结果等数据的积累,为建立模型奠定了数据基础。

4 决策树分类监督学习模型的建立及优化

建模采用Python语言编程,实现平台采用anaconda notebook,建模步骤如下。

① 输入上述输入变量和输出变量,其中输出变量为管道开挖后根据管道实际情况及企业业务需求对管道隐患的综合评估结果。数据整理为csv文件,并读入。

② 引入sklearn包中的tree模块。

③ 每条管道对应的9个特征参数和隐患评估等级作为1个样本,共250个样本。将250个样本按照7∶3分为训练集和测试集,训练集和测试集分别有175和75个样本。采用训练集训练模型,采用测试集评判模型效果。

④ 调用tree模块中的DecisionTreeClassifier对象建立决策树模型,主要参数设置见表2。

表2 主要参数设置

⑤ 模型评价。将测试集中的输入变量输入模型,得到输出变量,与测试集中的输出变量对比。评估正确的样本数除以参与评估的总样本数得到模型评价准确率(简称score得分)。某企业燃气管道的决策树模型score得分为0.8,说明模型效果较好。

⑥ ①~⑤步为单棵决策树的步骤。为进一步提高准确率,本文通过集成算法优化,采用随机森林[10]算法。随机森林是通过集成学习思想将多棵树集成的一种算法,它的基本单元是决策树。将250个样本按照7∶3的比例随机产生训练集和测试集N次,会得到N棵决策树,每棵决策树都是一个分类器。对于每1条管道,会得到N个管道隐患评估等级。本文N取100。随机森林集成了所有决策树的隐患评估等级,将最多的隐患评估等级判定为最终隐患评估等级。将250个样本随机抽取30%构成随机森林模型的测试集,对随机森林模型进行测试,效果良好。随机森林的score得分提高到0.9,模型效果较好。

5 结论

将管道的漏气点数量(自投运以来每年的漏气点数量之和)、漏气点间距(位于管道最两端漏气点的距离)、投运时间(以年计)、管径、运行压力、长度、漏气点密度(漏气点数量与管道长度之比)、防腐层漏点数量、防腐层缺陷级别9个特征参数或其量化值作为输入变量,将立即整体改造、暂缓整体改造、局部换管、局部修补、加强运行和情况尚可6个管道隐患评估等级作为输出变量,建立决策树、随机森林分类监督学习模型。该模型在某企业进行应用,效果良好。

猜你喜欢
燃气管特征参数漏气
基于视频图像序列的船用雷达目标检测和目标特征参数提取
气体绝缘金属封闭组合电器漏气缺陷及预防措施
燃气管网安全
汽车发动机漏气量分析及限值研究
柴油机漏气量试验研究
市政燃气管网设计和施工中的问题与对策
你可真淘气
城市燃气管道第三方破坏成因分析及预防措施
说话人识别特征参数MFCC的提取与分析
民用飞机预测与健康管理技术与系统特征参数研究