基于PCA-GA-BP神经网络的高校实验室安全风险评估

2022-03-23 06:43啜鹏杰王清清柳培忠陈建新林晖平黄富贵
实验室研究与探索 2022年1期
关键词:遗传算法神经网络实验室

啜鹏杰, 王清清, 柳培忠, 陈建新, 林晖平, 黄富贵

(1.华侨大学a.实验室与设备管理处,b.工学院,福建 泉州 362000;2.华侨大学保卫处,福建 厦门 361000)

0 引 言

近年来,我国科技实力和技术创新显著增强,科技创新水平加速挺进创新型国家前列。高校实验室不仅是师生开展教学、交流的场所,也是培养创新人才的摇篮、科技创新的基地和社会服务的重要窗口[1],然而,实验室的事故时有发生,对国家及人民的财产和生命健康造成了巨大的损失,俗话说:"安全在于提高警惕,事故出于麻痹大意”,如何避免这些悲剧的发生这一问题值得探讨思索和共同解决。

郭万喜等[2]对北京化工大学化学类实验室的危险程度及实验室管理状况进行了安全评价,并对该实验室的安全管理状态进行了等级的划分;万梅[3]基于层次分析与模糊数学原理相结合的评判方法,对该实验室进行安全等级评判,并使用欧几里得贴进度和择近原则对评判结果进行了验证;潘伟健等[4]对高校物理化学实验室存在的危险源进行识别,利用定性分析方法进行风险评价并确定风险等级。虽然有关高校实验室安全的研究逐渐增多,但利用主成分分析法(PCA)结合遗传算法(GA)和BP人工神经网络构建实验室安全风险评价模型的研究还较少。因此,本文利用层次分析法(AHP)建立实验室安全风险评价体系,通过PCA对评价指标的综合权重进行降维后构建GA-BP实验室安全风险评价模型,以期为实验室安全管理和风险评价提供理论基础和参考依据。

1 高校实验室安全现状

高校实验室不仅是创新人才培养、科研活动的开展及新技术开发活动的基地,也是高校实验教学、师生工作、学习的重要场所[5]。在科研项目增多、科研水平提高的背景下,实验室中易爆炸、腐蚀性、毒害等化学品种类也在不断增加,实验室安全环境变得越来越复杂,实验室安全事故频发[6]。如2015年4月,江苏某大学化工学院发生实验室爆炸事故,造成1名研究生死亡,4人受伤[7];2019年2月南京某大学实验室发生爆炸火灾事故[8];2018年12月,北京某大学实验室发生爆炸事故,造成3名学生死亡[9],以及2020年1月,某高校实验室发生通风橱起火事故,直接导致经济损失约1万元[10]。这些事故的发生不仅暴露了实验室安全管理制度不完善、安全防范意识淡薄、应急处置能力不强等问题,更重要的是导致人员伤亡和给国家财产造成了损失[6]。鉴于此,教育厅下发《教育部办公厅关于进一步加强高校教学实验室安全检查的通知》,要求各高校严查教学实验室安全管理体制机制建设与运行、开展教学实验室安全风险隐患排查和风险防范管控、加强教学实验室师生的安全教育、及时采购并配备护目镜等安全用具、提升教学实验室安全应急等能力。

高校实验室安全已引起各方广泛关注,刘义等[11]针对化工类实验室安全管理不到位、风险认识不足等问题,提出了该类实验室风险评价方法;韩佳彤[12]以层次分析法和集对分析法对化工类高校实验室进行了风险评价;吴立荣等[13]从安全规章制度、人的因素、仪器设备与化学品、管理与使用、应急管理5个方面建立了高校实验室安全评价指标体系。

2 高校实验室安全风险评价体系的构建

2.1 评价指标体系的构建原则

风险评价是指在风险识别及预判和基础上,运用科学的手段和方法综合考量风险发生的概率、损失程度及其他因素,从而得出系统发生风险的概率及可能性,并判定风险等级,依此决定是否采取控制措施,以及将该风险控制到哪种程度[14]。因此,构建指标体系应遵循科学性、系统性和启发性等原则,以确保评价指标的可靠性、合理性、完整性和代表性。

2.2 评价指标体系构建

当前我国对实验室安全风险评价指标体系的研究已经取得一定的成果。刘音等[15]从安全操作规程、仪器设备管理、用电负荷、人员管理、安全教育5个方面建立了电子实验室风险评价体系;林其彪等[16]从安全控制、费用控制、进度控制和质量控制等4个模块出发,构建高校实验室安全管理评估指标体系;高惠玲等[17]构建了一种基于危险源辨识进行实验室分类、基于风险评价划分实验室级别、依据管理措施及成效开展达标验收的"三位一体"的新型实验室管理模式。本文参考《中国实验室评价体系》,并结合专家的意见,采用Delphi方法从安全制度管理、实验室安全管理和组织管理3个方面构建实验室安全风险综合评价体系,如图1所示。

图1 实验室安全评价体系

3 安全风险评价指标权重的确定

(1)判断矩阵的构建:对同一层次的各指标进行两两比较,并运用9标度法(见表1)构造模糊判断矩阵:

表1 1-9标度表

(2)矩阵归一化处理:

(3)计算最大特征值λmax及其特征向量

(4)根据式(2)、(3)进行一致性检验(CR<0.1)

(5)将特征向量转换成主成分:

(6)将特征向量转化的主成分,并计算主成分累计贡献率

本研究对1级指标、2级指标和3级指标利用AHP法分别分配了一次权重,而后将2次权重相乘得出每个具体指标的最终权重,将所得数据整理后得25个指标的最终权重值(见表2)。

表2 实验室安全风险评价指标体系

4 GA-BP神经网络

4.1 主成分分析法的基本原理

主成分分析(principal component analysis,PCA)是在灰色关联分析的基础上,通过降低数据维数,排除相互重叠的信息后,将多个指标转化为少数几个不相关的综合指标的一种多元统计分析方法[18-19]。在实际应用中关于某个问题的信息是包含在由不同属性的数据组成的数据阵中的,从线性代数角度来看,就是把原来变量的协方差矩阵通转化为对角矩阵,然后提取少数几个可以代表原始变量信息的因子,实现多维变量到低维变量的计算统计[20-21]。从信息论的角度看,PCA方法主要通过降维来揭示数据阵的主要结构,然后提出关于该数据阵所提供信息的合理解释,回答要分析的问题[22]。PCA主要计算过程如图2所示。

图2 主成分分析流程图

4.2 BP神经网络

BP神经网络是1种多层前馈神经网络,主要包括信号前向传递和误差反向传播[23],一般由输入层、隐含层和输出层构成。BP神经网络算法是整个学习过程中,不断将期望输出与网络输出进行对比得出误差值,将误差值反向传播,逐层修改其连接权值和节点阈值,直至网络输出误差值达到预设的误差范围或者达到设定的学习次数为止,然后输出结果[24]。

4.3 遗传算法优化BP神经网络

遗传算法(Genetic Algorithm,GA)是模拟达尔文生物进化论中自然选择和遗传学机理的一种可以避免训练陷入局部极值现象出现的计算模型[25]。遗传算法主要包括编码、选择、交叉及变异4个部分,具体过程如图3所示。

图3 遗传算法流程图

4.4 GA-BP神经网络模型中参数的确定

使用spss 26.0对样本数据进行PCA分析,结果见表3。由表可知,前6个主成分的方差累积贡献率已大于≥90.00%(95.18%),这说明前6种主成分已基本包含能够反映样本整体的大部分信息,可以替代原始数据进行建模分析。实验室安全等级分为1~4级,则对应输出层神经元个数为4个,经过多次实验发现其隐含层神经元个数为11时实验室安全等级评价的BP神经网络的稳定性最佳。利用Matlab 2019b构建如图4所示的BP神经网络结构模型,并对数据进行自主训练与学习,获得最佳参数后结束训练[26]。参数设置:隐含层的激活函数为tansig,训练函数采用traingdm,输出层的传递函数选择purelin,最大训练次数设定2 000,期望误差值为1.00×10-4,遗传算法的种群数设定为60.00,终止代数为100.00,使用选择函数、交叉函数和变异函数分别选择normGeomSelect、arithXover和nonUnifMutation。

表3 主成分分析

图4 PCA-GA-BP流程图

4.5 模型训练

构建实验室风险评价指数矩阵,横向代表严重性等级,纵向代表可能性等级,如表4所示。根据评分大小判断风险评价等级(见表5),其中1级为不可接受的风险(1~5),需要立即采取整改措施;2级为严重风险(6~9);3级为轻度风险(10~17);4级为可接受的风险(18~20)[15]。

表4 风险评价指数矩阵

表5 风险等级表

5 实例应用

以华侨大学2020年86间理化实验室安全检查结果为例(见表6),选取前70组进行测试,后16组进行预测和验证,结果如表7所示。

表6 训练样本

表7 测试样本

为了判断PCA-GA-BP模型对实验室风险等级判定结果的准确性,本文分别使用BP神经网络、GA-BP网络模型、PCA-BP网络模型和PCA-GA-BP网络模型运行15次,并对其平均耗时进行分析,结果如图5所示。由图可知,相比其他模型,PCA-GA-BP网络模型的运行时间较短,收敛速度快,且运行时间的变化较平稳,这说明该网络模型能够一定程度的避免BP人工网络陷入局部极小值,且模型的稳定性和适应度更好。

图5 测试时间曲线图

该模型的准确率和相对误差分析结果如图6所示。由图可知,PCA-GA-BP网络模型预测结果不仅准确率较高,且准确率的波动幅度比其他几种模型小,其最小相对误差为0.05%,最大误差1.21%;BP人工网络模型预测结果的最大误差为4.75%,最小相对误差较PCA-GA-BP网络模型高了0.22%;GA-BP和PCABP网络模型的最大和最小相对误差分别为2.06%和0.24、3.62%和0.68,这说明PCA-GA-BP网络模型的预测输出值比其他几种模型的预测输出值更接近期望输出装值,有更高的稳定性和准确性。由此可知,主成分分析、遗传算法与BP神经网络结合可提高网络识别的精准度,加快网络收敛的速度,有较高的稳定性、广泛性和实用性,因此利用APC-GA-BP网络构建的实验室安全风险评估模型对实验室安全风险的级别评估具有一定的可靠性和适用性。

图6 准确率和测试相对误差柱状图

6 结 语

(1)通过利用主成分分析法对评价指标的综合权重进行降维处理后,提高了网络模型的分类能力,缩短了该模型的运行时间。

(2)本文提出的PCA-GA-BP网络模型与标准BP网络模型、PCA-BP网络模型、GA-BP网络模型相比,有更高的精准度、收敛性和适用性,不仅可为华侨大学实验室安全风险评价提供算法支撑,也可为今后其他高校实验室的安全管理、隐患跟踪提供提论基础。

猜你喜欢
遗传算法神经网络实验室
基于递归模糊神经网络的风电平滑控制策略
基于遗传算法的高精度事故重建与损伤分析
神经网络抑制无线通信干扰探究
电竞实验室
电竞实验室
电竞实验室
基于神经网络的中小学生情感分析
基于遗传算法的智能交通灯控制研究
电竞实验室
一种基于遗传算法的聚类分析方法在DNA序列比较中的应用