上海市道路旅客运输行业安全诊断研究

2022-09-07 02:43吕通通张奕菁
交通与港航 2022年4期
关键词:网络结构敏感度均值

杨 军,吕通通,张奕菁

1.上海市交通委员会,2.上海交通大学交通研究中心

0 引 言

“十四五”开局之年,全国综合交通体系逐步进入建管并重的发展阶段,对安全生产工作提出了更高要求。较航空、铁路、水路运输而言,道路运输行业安全生产形势最为严峻[1],京沪等特大城市问题尤其突出。近年上海市开展了道路运输重点行业安全诊断分析工作,行业数据不断完善。因此,利用基于大数据的智能分析方法构造可靠的诊断分析工具,进一步研究行业安全营运特性,对应对复杂运营安全风险,提高行业安全生产管理能力显得尤为重要。

本文根据上海市道路运输行业需求,重点关注道路旅客运输行业企业层面的安全运营诊断研究。近年相关定量研究较少:夏鸿文[2]采用AHP方法建立安全评价模型,评价了企业基础安全及企业事故风险。吴晶晶等[3]利用AHP方法建立省际道路客运生产安全风险评价模型,实现企业安全生产风险等级自动评价功能。赵炜华等[4]构建道路运输企业车辆行车风险水平评估模型,提出示例型行车风险动态控制措施。鲁光泉等[5]结合AHP和熵权法进行组合赋权建模,并评价了道路客运企业交通安全管理水平。朱文艳[6]使用G1开展安全评价,从人、车、管理3个角度建立了城市公交安全评价体系。周志强[7]依据客运企业的风险源辨识结果构建安全评价指标体系,并使用AHP法进行安全评价。上述研究多采用AHP法,其依赖权重打分,易出现主观误差等问题。通过G1法或组合赋权法虽解决了部分问题,但在处理高维样本因素耦合及不确定性问题分析上效果欠佳。据此,本文建立道路旅客运输行业安全指标体系,将影响因素划分为人员、车辆及设备、线路及环境、企业基本信息和企业安全管理5类指标。为降低主观偏差影响,结合专家知识融合及K2算法构造贝叶斯网络模型,就5类指标分别建立子模型,基于子模型分析结果筛选显著因素,构建跨指标安全诊断模型。以安全隐患数量、安全标准化建设程度、违法数量为研究目标,基于实际数据进行模型量化分析,为提升行业安全生产水平提供思路。

1 安全指标体系建立

安全诊断的前提和基础是分析研究诊断对象、确定安全指标体系,指标的质量直接关系到诊断结果的准确性[8]。本文依据《中华人民共和国安全生产法》、《交通运输部关于推进交通运输安全体系建设的意见》(交安监发〔2015〕20号)、《交通运输企业安全生产标准化建设基本规范》(JT/T 11807—2018)、《道路旅客运输企业安全管理规范》(交运发〔2018〕55号)等法律规范文件,以及对上海市道路旅客运输重点企业实地调研,通过辨识整理得到75类行业安全影响因素。

按照科学性、系统性、可操作性、目的性和持续改进的原则将75个因素划分为5类指标并编码,建立道路旅客运输行业安全指标体系(图1)。其中Pi表示人员指标第i个安全影响因素,依此类推。

图1 道路旅客运输行业安全指标体系

2 基于EKF-BN的模型构建

2.1 贝叶斯网络

贝叶斯网络(BN)是一种基于概率推理的有向无环图形化网络,由节点与连接节点的弧组成,运用条件概率表达变量间关系。由于能够有效处理变量多、不确定性强且存在交互作用的问题,被广泛应用于数学、计算机、生物医学等领域[9]。

BN依托贝叶斯定理表达变量间的关系。假设A为目标变量,Bi为第i个因素变量,i=1,2,…,n。P(Bi)为Bi的先验概率,且P(Bi)>0。P(A|Bi)为Bi发生的条件下A的条件概率。随着变量数据作为证据不断加入,利用式(1)计算可不断更新式中缺失概率信息的后验概率。

2.2 基于EKF-BN的网络结构学习

基于纯数据学习的贝叶斯网络结构学习由于搜索空间庞大而效率低下,且随着数据维度增加,基于复杂算法的网络结构学习又可能产生过拟合现象导致模型实用性降低[10]。

基于此,本文根据图分块思维[11],分别构建五类指标子模型,降低数据维度与节点数量。引入基于专家知识融合(EKF)的方法,根据实际调研获取的专家知识,利用证据推理(DS)方法进行融合,获取网络先验结构信息,再利用K2算法进行网络结构学习,将子模型分析结果应用于安全诊断模型建立过程,并完成模型建立。

2.2.1 利用EKF构造先验网络结构

先验网络结构指在网络结构学习前构造部分网络拓扑结构,对网络结构学习起到一定的引导、辅助作用,可以降低搜索空间。单纯利用专家知识构造网络结构可以解决效率低下的问题,但易受到专家主观因素影响。本文引入基于DS的专家知识融合(EKF)方法,结合上海市交通运输重点行业安全诊断分析工作中实地获取的专家意见,进行可信度分配和融合,构造先验网络结构序列。经过汉明距离测试,该方法优于传统K2算法[12]。

2.2.2 利用K2算法进行网络结构学习

EKF方法可确定部分先验网络,故选择K2算法进行网络构造。在事先合理确定因素节点序列的条件下,此算法可以快速识别网络结构。算法结合贝叶斯评分与贪婪搜索方法,学习数据集以构造网络,通过评分和迭代得到最优网络结构[13]。

算法执行使用式(3)的对数函数表达式以降低计算复杂度[13]。结合贪婪搜索算法,在确定部分先验网络结构的基础上递增Pa(xi),进而增加P(Bs,D)。当单个Pa(xi)增加不再引起P(Bs,D)增加,则递增过程停止,输出Bs。

3 实例研究

为了解决上海市道路运输行业与企业对安全管理的定量化指标及抓手的问题,本文参照《交通运输企业安全生产标准化建设评价管理办法》(交安监发〔2016〕133号)、《上海市交通行业安全生产事故隐患排查治理办法(试行)》(沪交行规〔2019〕3号),共设置4个目标变量(表1)。

表1 目标变量

3.1 数据来源及预处理

研究数据采集自上海市安全生产监督管理平台数据库,以及全市193家道路旅客运输和涉及相关业务的重点企业的网络问卷调查结果。共采集到数据193条,经数据清洗剔除重复性数据2条,缺失数据15条,无效数据4条,得到有效数据172条。

为满足贝叶斯网络结构学习要求,需要将数据中的连续变量离散化。以驾驶员平均驾龄(P11),车辆平均使用年限(V7),通勤通学包车线路数(L6),省际包车客运(B2),安全生产例会频率(S9)为例,部分预处理结果见表2。

表2 数据预处理结果

3.2 安全诊断模型构建

3.2.1 子模型构建

采用GeNIe软件实现模型可视化,该软件可有效进行基于背景知识的K2算法学习[14]。利用EKF结合K2算法对5类指标分别构造贝叶斯网络子模型(图2),图中实箭线为利用EKF方法构造的先验网络结构,虚箭线为经过K2算法学习得到的后验网络。

图2 子模型网络结构

分别计算每个子模型中各因素间影响力以及因素的敏感度数值并取均值,选取影响力或敏感度均值显著的影响因素(表3),表中括号内的因素为显著因素的强关联因素,在前表示子节点,在后为父节点。

表3 子模型因素筛选结果

3.2.2 安全诊断模型构建

利用子模型筛选的31个显著因素,重复上述建模方法得到安全诊断模型(图3),利用GeNIe软件自带交叉验证方法中的LOO(Leave one out)方式验证模型,得到模型命中率均值为0.745 64。

图3 安全诊断网络模型

利用受试者工作特征曲线(Receiver operat-ing characteristic curve,ROC)检验模型的泛化能力[15]。计算曲线右侧面积AUC(The area under the ROC curve),若AUC>0.5表示模型可行,数值越高模型泛化能力越好。经检验,4个目标变量AUC均值达到0.649 04,表明模型总体可行。

3.3 模型诊断结果分析

利用影响力及敏感度分析,分别诊断5类子模型的指标内各因素对系统安全性的影响情况,再进行跨指标安全诊断模型分析。影响力分析可判断节点之间的关系强度,影响力指数越高,两节点连接强度越强。敏感度分析可探知因素节点微小变化对目标节点的扰动大小。

3.3.1 人员层面

提取人员子模型敏感度分析结果并降序排列(表4),观察影响力均值>0.2的子父节点关系。得到影响安全性最大的3个因素分别是“驾驶员总人数”“专职安全生产管理人员数”“安全生产管理人员总人数”。进一步探究因素关系发现:“驾驶员总人数”“从业人员安全意识”对T4影响力指数均值分别为0.671和0.281;“公司员工总人数”对T3的指数均值为0.349;T1对“配备安全生产管理总人数”的指数均值为0.447。

表4 人员子模型敏感度分析结果

3.3.2 车辆及设备层面

同理提取车辆及设备子模型敏感度分析结果见表5,并观察影响力均值>0.2的子父节点关系。得到影响安全性最大的3个因素分别是“运营车辆平均技术等级”“实际运营车辆数”“目前实际拥有车辆总数”。观察因素影响力强度关系发现:“实际运营车辆平均技术等级”对T1、T2和T4均有强关联,指数均值分别为0.232、0.314和0.275;“实际运营车辆数”“安全设备维护保养及定期检测”对T4有较强关联,指数均值为0.263和0.215。

表5 车辆及设备子模型敏感度分析结果

3.3.3 线路及环境层面

同上(表6),得到影响安全性最大的3个因素分别是“配备乘务员的线路条数”“班车客运营运线路长度”“省际班线数”。影响力分析结果显示:“配备乘务员的线路条数”“选线考虑营运利润”对T2的影响较强,指数均值分别为0.354和0.247。

表6 线路及环境子模型敏感度分析结果

3.3.4 企业基本信息层面

同上(表7),得到影响安全性最大的3个因素分别是“省际包车客运”“年度诚信评价考核等级”和“年客运量”。影响力分析结果发现:开设“省际包车客运”对“年度诚信评价考核等级”影响最强,均值达到0.615;“年度诚信评价考核等级”对T2、T3的影响力指数均值分别达到0.256和0.472;“年实际运营收入”对T2的指数均值为0.211。

表7 企业基本信息子模型敏感度分析结果

3.3.5 企业安全管理层面

同上(表8),得到影响安全性最大的3个因素分别是“应急预案制定情况”“应急预案演练情况”“隐患排查频率”。影响力分析发现:“应急预案制定情况”对T1、T2和T3有强相关,指数均值分别为0.262、0.341和0.240;T1对“不同监管措施”指数均值为0.390,而“应急预案演练情况”对“不同监管措施”指数均值达到0.430;“安全生产自查情况”对“隐患排查频率”影响力较高,指数均值为0.299。

表8 企业安全管理子模型敏感度分析结果

3.3.6 跨指标安全诊断

结合敏感度及后验概率分析,以T1(一般安全隐患数量)的安全诊断为例进行跨指标的安全诊断。首先进行单个因素的敏感度分析,并作归一处理。提取对T1敏感度指数>0.1的因素为显著项,对应的归一化结果作为安全诊断的部分依据。再进行后验概率分析,利用GeNIe软件后验概率计算功能,通过设置显著因素中每个状态为“证据”(该状态绝对发生),可以得到受该状态影响下T1的概率变化情况,作归一处理后,结合敏感度分析结果即可诊断出单个状态对T1影响程度。对T1的跨指标安全诊断见表9。

表9 T1安全诊断结果

经过诊断,得到导致“一般安全隐患数量”上升的状态有“年度诚信评价考核等级”为“B级”,“应急预案制定情况”为“正在制定”,“应急预案演练情况”为“从未进行”,“隐患排查频率”为“每半年一次”。此外,观察分析结果发现:“年度诚信评价考核等级”中各单状态权重较高,对“一般安全隐患数量”表达出高敏感。“应急预案演练情况”为“一年两次及以上”对安全隐患提升也具有贡献,这可能是由于企业频繁进行演练导致其并没有从实质上提高从业人员的安全意识。保持“每周一次”的隐患排查频率较“每日一次”的频率,对降低“一般安全隐患数量”更有帮助。

4 总 结

本文将75个安全影响因素划分为5类指标。利用EKF-BN方法针对172条企业数据进行建模分析,尽可能全面地刻画道路旅客运输行业营运中安全影响因素间的耦合关系。分析结果显示,人员层面“驾驶员总人数”,车辆及设备层面“营运车辆平均技术等级”,线路及环境层面“配备乘务员的线路条数”,企业基本信息层面开设“省际包车客运”,企业安全管理层面“应急预案制定情况”在各子网系统中对系统安全性影响最大。进行跨指标因素单个状态的分析得到:导致一般安全隐患数量上升的企业,其状态特征为年度诚信评价考核等级被评为B级,未完成应急预案制定,从未进行应急预案演练及每半年进行一次隐患排查。针对道路旅客运输行业跨指标因素建立贝叶斯网络属于NP问题[11],本文建模方法可能忽视了一些跨指标间耦合关系,将在之后的研究中继续探索。其次,由于数据库不够完善,部分研究数据由问卷调研作为补充,可能存在一定主观偏差。

猜你喜欢
网络结构敏感度均值
假体周围感染联合诊断方法的初步探讨*
一种基于属性的两级敏感度计算模型
快递网络结构研究进展
基于AutoML的保护区物种识别①
均值—方差分析及CAPM模型的运用
均值—方差分析及CAPM模型的运用
浅谈均值不等式的应用
均值不等式的小应用
基于时效网络的空间信息网络结构脆弱性分析方法研究
基于互信息的贝叶斯网络结构学习