基于文本挖掘的制造业企业安全管理因素研究

2024-04-11 12:48李鑫李晓非
中国管理信息化 2024年1期
关键词:文本挖掘复杂网络安全管理

李鑫 李晓非

[摘 要]本文以机械伤害事故为例,以2010—2022年制造业安全事故报告为素材,运用文本挖掘方法确定安全事故的主要类型,通过度中心性、紧密中心性、介数中心性分析,明确与主要安全事故相关的安全管理因素,并在此基础上提出对策建议,为目前制造业企业安全管理提供理论基础。

[关键词]安全管理;机械伤害事故;文本挖掘;复杂网络

0     引 言

制造业发展水平是国家工业化程度主要标志之一,2022年我国制造业增加值已经达到33.5万亿元[1],未来制造业将朝着规模更大、实力更强的方向发展。制造业行业生产环节复杂且往往会使用大型机械设备,安全管理措施未落实易发生伤亡事故,安全生产事故种类繁多,主要包括机械伤害事故、火灾事故、化学品泄漏事故等,如何有效预防安全生产事故已经成为制造业企业发展面临的重要问题之一。

目前对于安全管理的研究主要集中在煤矿[2]、建筑[3]、铁路[4]、船运[5]、电力[6]、采油[7]等领域,对于制造业研究较少。刘全龙等以机械伤害事故报告为样本,采用HFACS模型、ANP等方法,对机械伤害事故影响因素进行了探讨[8]。刘浩浩等采用事故案例总结、专家访谈、粗糙集评价等方法对造成机械风险因素进行梳理和评价[9]。现有学者对于机械伤害事故的类型、特征进行了较为清晰的描述,并对造成事故的影响因素进行提取和归类,但对于具体事故和事故影响因素缺乏深入的研究。

鉴于此,本文以制造业中的典型事故机械伤害为例,以2010—2022年制造业安全事故报告为素材,采用文本挖掘技術与复杂网络理论相结合的方法,系统分析造成事故的影响因素并针对性地提出安全管理建议,以期为我国制造业企业的安全事故预防提供理论基础。

1     研究设计

首先,通过对制造业机械伤害事故的文本分析,确定主要事故类型及与之相关的事故影响因素,并通过Wordcloud工具进行可视化呈现;其次,通过复杂网络分析技术确定各类型事故的主要影响因素。

2     主要事故类型及事故影响因素的确定

2.1   文本语料库的构建

事故发生后,企业和有关部门会对事故过程、损失、伤亡以及导致事故原因进行详细的调查,并形成调查报告,采用事故调查报告作为文本分析的对象能够较为完备地反映事故信息。安全管理网是一家以宣传安全生产为主的垂直门户网站,该网站共有包括安全管理、安全技术、事故报告、法律标准等各类数据数十万条,其所公布的事故报告内容丰富且时效性强,已被广泛应用于事故文本挖掘领域[10-11]。手工收集2010—2022年安全管理网公布的制造业事故报告,去除信息公布不全的报告后,共得到245份事故案例,涵盖纺织业、金属制品业、汽车制造业、资源加工工业等主要制造行业,整理筛选制造业安全事故案例得出机械伤害是影响整个制造业安全生产的主要事故类型。

2.2   关键词的提取与可视化

通过构建停用词、专业词及归并词词库对数据进行预处理,并借助Jieba分词工具对文本进行初步分析,共挖掘出1 348个关键词,根据现有文献将关键词按照事故类型、事故影响因素进行分类合并。选取累计占比70%的事故——“机械绞绕”“车辆伤害”“起重伤害”和“高处坠落”作为主要机械伤害事故类型。通过使用Python的Wordcloud库构建关键词词云图如图2所示。其中,文字的大小表示关键词出现频率多少,文字越大,该关键词出现频率越高。

3     机械伤害事故影响因素网络分析

3.1   事故影响因素网络构建

根据关键词提取的结果,利用复杂网络分析软件gephi绘制机械伤害事故影响因素网络图如图2所示。事故网络图表明:机械绞绕、车辆伤害、起重伤害、高处坠落、未断电停机等事故影响因素节点较大;其中机械绞绕与未断电停机、缺乏安全装置以及机器高速运转等事故影响因素关系紧密。

3.2   事故影响因素中心性分析

网络分析中节点的重要程度通常由度中心性Di、紧密中心性Ci和介数中心性Bi表征。

Di表示节点i与其他节点相连的数量[12]。

(1)

式中:n为节点总数;γij=1表示节点i与j相连接,γij=0表示节点i与j不相连。

Ci为节点i到其余节点的连接程度。

(2)

式中dij为节点i到j的最短距离。

Bi为经过节点i的节点l~m(l≠m)最短路径数量与节点l~m(l≠m)最短路径数量的比例,用来刻画节点在网络中的影响程度。

(3)

式中:εlm(i)为节点l~m最短路径经过节点i的数量;εlm是节点l~m最短路径的数量。

利用公式(1)~(3)计算主要机械伤害事故和事故影响因素的Di、Ci、Bi,其结果如表1、表2所示。计算结果表明:缺乏安全装置、未断电停机、未进行安全检查、身体越线、安全装置存在缺陷、技能不熟、冒险进入危险区域在Di、Ci、Bi中排名均靠前,是机械伤害事故的关键影响因素。

以主要事故为中心节点,计算其网络总度(该节点网络中其他节点的连边总数),并以70%作为临界点判断各事故的主要事故影响因素,具体计算结果如下:

(1)机械绞绕。累计网络总度的70%以上节点共11个,按出现频率依次为未断电停机、缺乏安全装置、身体越线、机器高速运转、冒险进入危险区域、未进行安全检查、安全装置存在缺陷、技能不熟、忽视安全、机器意外启动、身体失衡,其事故影响因素集合可表示为:SM1={F2,F1,F4,F8,F7,F3,F5,F6,F20,F12,21}。

(2)车辆伤害。累计网络总度的70%以上节点共11个,按出现频率依次为未断电停机、缺乏安全装置、身体越线、现场缺乏沟通、独自作业、冒险进入危险区域、技能不熟、存在视线盲区、车辆意外启动、未进行安全检查、机器高速运转,其事故影响因素集合可表示为:SM2={F2,F1,F4,F16,F17,F7,F6,F23,F28,F3,F8}。

(3)起重伤害。累计网络总度的70%以上节点共8个,按出现频率依次为缺乏安全装置、身体越线、未进行安全检查、技能不熟、未断电停机、冒险进入危险区域、無证上岗、机器设备存在缺陷,其事故影响因素集合可表示为:SM3={F1,F4,F3,F6,F2,F7,F13,F9}。

(4)高处坠落。累计网络总度的70%以上节点共7个,按出现频率依次为缺乏安全装置、未断电停机、未进行安全检查、身体越线、安全装置存在缺陷、护具穿戴不规范、物体滑落,其事故影响因素集合可表示为:SM4={F1,F2,F3,F4,F5,F15,F29}。

各主要事故网络总度的计算结果表明F1(缺乏安全装置)、F2(未断电停机)、F3(未进行安全检查)、F4(身体越线)为四种事故类型的共同事故影响因素。

其中。F12(机器意外启动)、F20(忽视安全)、F21(身体失衡)为机械绞绕特有事故影响因素;F16(现场缺乏沟通)、F17(独自作业)、F23(存在视线盲区)、F28(车辆意外启动)为车辆伤害特有事故影响因素;F9(机器设备存在缺陷)、F13(无证上岗)为起重伤害特有事故影响因素;F15(护具穿戴不规范)、F29(物体滑落)为高处坠落特有事故影响因素。

由各主要事故影响因素分析可知,导致机械伤害事故的原因主要由两部分构成,一是人员违章操作,如护具穿戴不规范、身体越线、无证上岗、独自作业等;

二是安全设施配备和管理的不足,如缺乏安全装置、安全装置存在缺陷以及未进行安全检查等。因此,企业一方面要加大安全管理培训和奖惩力度,着力塑造员工安全操作的行为;另一方面,还应该加大安全设施购置和维护投入力度,保证安全设施的有效性。

4     结 论

收集2010—2022年制造行业发生的245起以机械伤害事故为主的事故报告进行文本挖掘与复杂网络分析,得到结论如下:

(1)“机械绞绕”“车辆伤害”“起重伤害”和“高处坠落”为制造业机械伤害事故的主要类型。

(2)“机械绞绕”是制造业机械伤害事故的主要类型,未断电停机是造成该事故的主要原因,因此在检修作业中必须严格执行断电操作制度,现场要设置专人监护。在机械断电后,要确认惯性运转彻底消除才可进行作业。

(3)缺乏安全装置、未断电停机、未进行安全检查、身体越线、安全装置存在缺陷、技能不熟等8个因素是造成制造业机械伤害事故的主要事故影响因素,企业应从加大安全管理和安全设施投入力度,从“人员”和“设施”的角度防止机械伤害事故的发生,以确保制造业行业的可持续发展。

主要参考文献

[1]国家统计局.中华人民共和国2022年国民经济和社会发展统计公报[Z]. 2022.

[2]夏伟.基于信息化技术的煤矿安全生产管理长效机制建设研究[J].中国管理信息化,2020,23(8):89-90.

[3]李珏,王幼芳.基于文本挖掘的建筑施工高处坠落事故致因网络分析[J].安全与环境学报,2020(4):1284-1290.

[4]李珊.道路交通事故救援现场风险及安全管理策略探究[J].中国管理信息化,2023,26(2):199-202.

[5]黄常海,高德毅,胡甚平,等.基于Apriori算法的船舶交通事故关联规则分析[J].上海海事大学学报,2014,35(3):18- 22.

[6]张苏,刘晓露,聂晓琴,等.电力人身伤亡事故致因网络的构建与分析[J/OL].安全与环境学报:1-8[2024-01-17].

[7]吕冯君,贾素芳,兰进.油气钻井施工作业安全策略研究[J].中国管理信息化,2023,26(6):121-123.

[8]刘全龙,彭雨蒙,赵盼,等.基于HFACS模型的制造企业机械伤害事故致因分析[J].中国安全科学学报,2023,33(3):51-59.

[9]刘浩浩,李洁,徐亦陈.基于粗糙集的起重机械安全风险评价[J].土木工程与管理学报,2017,34(5):154-158.

[10]陈志远,王铁骊.基于文本挖掘和复杂网络的事故致因重要度评估方法:以房屋市政较大以上事故为例[J].中国安全生产科学技术,2022,18(4):224-230.

[11]张春颜,姜伟.重特大生产安全事故的归因与政策工具选择:基于88起事故调查报告的文本分析[J].中国应急管理科学,2021(10):28-36.

[12]郑彬彬,冯婷婷,王佳贺,等.基于文本挖掘的城镇燃气事故致因及关联分析[J].中国安全科学学报,2023,33(7):190-195.

[收稿日期]2023-07-18

[作者简介]李晓非(1978— ),男,吉林延吉人,副教授,博士,主要研究方向:安全管理。

猜你喜欢
文本挖掘复杂网络安全管理
数据挖掘技术在电站设备故障分析中的应用
基于图熵聚类的重叠社区发现算法
基于LDA模型的95598热点业务工单挖掘分析
从《远程教育》35年载文看远程教育研究趋势
基于复杂网络理论的通用机场保障网络研究
论加强建筑施工安全管理的措施
浅谈现代汽车检测技术与安全管理
城市群复合交通网络复杂性实证研究
慧眼识璞玉,妙手炼浑金