风险评估在中国的研究进展及热点分析30年中文核心期刊文献计量分析
——基于近

2021-09-26 02:38韩心星
科学技术与工程 2021年25期
关键词:发文次数聚类

韩心星

(清华大学工程物理系公共安全研究院,北京 100084)

改革开放以来,中国在政治、经济、文化、科技等方面皆取得举世瞩目的成就。各行各业都取得高速发展,在取得辉煌成绩的同时也带来一系列的风险和挑战,例如自然灾害、事故灾难、环境污染、信息泄露、食品安全、健康风险等一系列问题,所以有必要对这些行业领域的风险进行评估,进而采取防范措施,减少损失。关于风险评估,相关中国学者已做了大量的研究工作[1-7],吴建蓉等[1]综合考虑地形、气象、覆冰等因素,基于进化策略-投影寻踪算法对输电线路的覆冰灾害进行风险评估。Meng等[2]提出了一种动态定量风险评估的综合方法,即利用决策试验与评价实验室——贝叶斯网络对系统脆弱性进行评估,并预测油气泄漏事故的发生概率。王飞等[3]结合蒙特卡罗随机模拟和三角模糊数理论,建立了地震次生火灾潜在风险评估的随机模拟-三角模糊理论耦合模型。杨磊等[4]以船舶溢油为例,基于溢油量和所在水域的水文条件,采用二维水流模型及油粒子模型对水环境的污染进行风险评估。许钦百等[5]通过密码学理论研究了私密信息安全风险评估方法,并通过实验验证了该方法的准确性和合理性。Han等[6]针对食品检测数据的高度复杂性和时间特性,提出了一种基于灰色关联分析的隐马尔可夫模型来动态评估食品质量安全风险。Chen等[7]为了揭示隧道施工扬尘的健康风险特征,提高工人的职业健康水平,结合隧道施工特点,建立了基于现场测量的健康风险评价体系。

上述研究工作为各领域的风险管控提供了良好支撑,但目前风险评估在中国的研究重点主要集中在某特定领域的风险评估,关于风险评估在中国的整体研究趋势分析及研究热点尚不是很明确,在该方面的研究较少。故现基于EndNote软件和VOSviewer软件,对中国近30年关于风险评估的大量文献进行文献计量分析,得出风险评估的发展历程、高发文量期刊、高被引文献、研究重点及研究热点等,为相关学者的下一步研究工作提供参考和借鉴。

1 分析方法

以CNKI中国知网期刊数据库为数据源,采用高级检索的检索方式(主题“风险评估”并且篇关摘“风险评估”)进行检索。起始检索时间为1990年,截至2020年7月10日,共检索出11 865篇核心期刊文献,去除无作者、无年份、重复及与研究主题无直接关系等不符合要求的文献,最终得到有效核心期刊文献11 184篇。

在实际分析过程中,首先从知网导出EndNote能够识别的txt格式文件,由于文献数目较多,可以分批导出;接着将文件修改成ris格式,并运用Python编程将ris格式文件中的关键词加上前缀;最后运用VOSviewer软件进行聚类分析和可视化展示。

2 分析结果

2.1 发表时间及数量分析

基于EndNote软件分析发现,关于风险评估的核心期刊文献最早发表于1992年,做出近30年关于风险评估的核心期刊发文量随年份变化的趋势图如图1所示。

由图1可知,2002年之前,研究风险评估的文献数呈现缓慢波动式增长,增长曲线较为平稳,整体发文量不高,2002年的年发文量才69篇,可以认为是风险评估在中国的初始平稳发展阶段。从2003年开始,文献数量快速增加。仅2003—2004年,年发文量就增加63篇。2003—2009年,增长速率曲线波动上升,文献呈现快速增长趋势,从2003年的92篇增长到2009年的510篇,这一阶段可以认为是风险评估在中国的快速发展阶段。从2010年开始,发文量整体呈现上升趋势,只在2017年发文数量有较大降低,到2018年又有较大回升。在2020年,发文量锐减,这是因为文献目前只检索到2020年7月初,不能代表全年的发文量,可以不纳入分析范畴。综合2010—2019年的发展趋势看,文献数量整体呈现上升趋势,增长速率呈现下降趋势,此阶段可以认为是风险评估在中国的缓慢发展阶段。

图1 近30年发文量随年份变化趋势图Fig.1 Trend chart of the number of published papers with years in recent 30 years

2.2 发表期刊分析

基于EndNote软件分析,11 184篇文献发表在1 526种期刊上,发文量前30位的期刊名称及文献数量如表1所示。由表1可知,《财会通讯》的发文量最多,为139篇。其次分别为《中国安全科学学报》(118篇),《自然灾害学报》(117篇),《安全与环境学报》(110篇),其余期刊的发文量皆小于100篇。排名前30的期刊共发文2 372篇,占所有期刊总发文量的21.21%。且发文量20篇以上的期刊共130种,占所有期刊数的8.52%。但这130种期刊共发表文献5 361篇,占所有发文量的47.93%,这说明发文量较多的期刊数量虽然不多,但总发文量较大,可以为相关学者的学习及投稿提供参考。

表1 发文量排名前30的核心期刊Table 1 Top 30 core journals with published papers

2.3 高被引文献分析

在一定程度上,文献的被引次数可以用来衡量文献的质量和影响力。对检索到的11 184篇文献的被引次数进行统计,得到被引次数排名前30的文献情况如表2所示。

由表2可知,在被引次数排名前30的文献中,发表于1990—2000年的文献有3篇,发表于2001—2010年的文献有20篇,发表于2011—2020年的文献有7篇,高被引文献主要集中发表在2001—2010年。

分析被引次数排名前30的文献及其期刊发现,《财经研究》《自然灾害学报》各发表3篇,《环境科学》《中国软科学》《中央财经大学学报》《地理学报》各发表2篇,其他期刊各1篇。金融及自然灾害领域的杂志发表关于风险评估的高被引文献数量较多。

排名前30的高被引文献中,被引次数超过500次以上的共有5篇,其中被引次数最多的文章是2000年发表在《会计研究》上的“企业内部控制理论的发展与启示”,该文被引2 376次,远远超过其他文章的被引次数,其影响力较大,认为企业的内部控制深受企业内外部环境影响,需要对企业自身的优、劣势以及外界的机会和威胁进行全面的风险评估,加强企业内部控制效果[8]。被引次数排名第2位的文章是1999年发表在《系统工程理论与实践》上的“基于神经网络技术的商业银行信用风险评估”,该文被引856次,研究认为神经网络技术在商业银行信用风险评估中比传统的判别分析法具有更高的预测精度和更强的鲁棒性[9]。被引次数排名第3位的文章是2004年发表在《通信学报》上的“信息安全风险评估综述”,该文被引743次,主要分析了信息安全风险评估的内容、现状、模型、标准、方法、过程等,并指出需要解决的问题以及对发展前景进行了展望[10]。被引次数排名第4位的文章是2008年发表在《岩石力学与工程学报》上的“中国地下工程安全风险管理的现状、问题及相关建议”,该文被引542次,主要论述了我国地下工程安全风险管理的现状及存在的问题,并提出相关建议[11]。被引次数排名第5位的文章是2007年发表在《财经研究》上的“内部控制与企业价值研究——来自沪深两市A股的经验分析”,分析了我国上市公司的内部控制对企业价值产生显著的促进作用,而风险评估是内部控制的五大要素之一[12]。关于风险评估,被引次数排名前5位的文章主要涉及企业内部控制风险,金融风险、信息安全风险、工程建设风险等主题。综合分析被引次数前30位的文章发现,其中涉及金融风险有10篇,涉及自然灾害风险有6篇,涉及电力系统风险、信息安全风险各有3篇,涉及工程建设风险、企业内部控制风险各有2篇,涉及生态环境风险、健康风险、供应链风险、突发公共事件风险各有1篇,这说明金融风险与自然灾害风险是风险评估中的重要主题。

表2 被引次数排名前30的文献Table 2 Top 30 cited literatures

2.4 关键词聚类分析

一篇文献的关键词在一定程度上反映了该文献的研究重点,共有22 289个关键词,出现频次排名前30位的关键词如表3所示。从表3中可以看出,风险评估作为本次研究的中心词汇,其频次达到了4 384次,远远超过其他关键词的出现频次。出现频次大于100次的关键词仅有14个,占所有关键词的0.06%。出现频次大于10次的关键词有489个,占所有关键词的2.19%。出现频次仅1次或2次的关键词共有19 586个,占所有关键词的87.87%,综上分析可知,关于风险评估的文献研究的内容相对广泛。

采用VOSviewer软件将出现频次大于25次的关键词进行聚类分析,主要关键词聚类分析图如图2所示,在聚类分析图中,同一聚类的关键词的颜色相同,其权重(此处为关键词出现的频次)越大,关键词标签形状与字体就越大。关键词标签之间间距越小,其联系就越密切。

共142个关键词聚为9类,第1个聚类涉及健康风险、健康风险评估、职业健康、重金属、生态风险评估、生态风险、农药残留、沉积物、多环芳烃、暴露评估等28个关键词,说明该主题主要关注生态与健康方面的风险评估。第2个聚类涉及信用风险、信用风险评估、商业银行、风险投资、信息安全、信息系统、层次分析法、BP神经网络、模糊综合评价、评估模型等28个关键词,该主题主要关注金融风险和信息安全风险评估。第3个聚类涉及风险、评估、模型、灾害、风险区划、气象灾害、洪涝灾害、地质灾害、干旱、易损性等19个关键词,该主题主要关注自然灾害方面的风险评估。第4个聚类涉及危险性评估、危险因素、老年人、骨质疏松、跌倒、心血管疾病、静脉血栓栓塞症、监管等18个关键词,该主题主要关注健康风险评估。第5个聚类主要涉及企业、企业管理、内部控制、内部审计、内部控制制度、审计风险、财务风险、资产评估、风险识别、风险控制等16个关键词,该主题主要关注企业内部控制风险。第6个聚类主要涉及社会稳定风险评估、社会风险、环境风险、环境风险评估、风险管理、风险因素、指标体系、风险等级、德尔菲法等14个关键词,该主题主要关注社会稳定与环境风险评估。第7个聚类主要涉及电力系统、电力市场、输电线路、连锁故障、配电网、可靠性、风险评估、风险预警等10个关键词,该主题主要涉及电力系统风险评估。第8个聚类主要涉及食品安全、不确定性、脆弱性、自然灾害、气候变化、风险分析等8个关键词,该主题主要关注自然灾害和食品安全风险评估。第9个聚类只有1个关键词,为社会稳定,关注的是社会稳定风险。经过分析发现,以上9个聚类研究内容存在交叉重叠,将其进行归纳合并,得出风险评估在中国的研究主题主要包含生态环境风险、健康风险、金融风险、信息安全风险、自然灾害风险、企业内部控制风险、社会稳定风险、电力系统风险、食品安全风险。

表3 出现频次排名前30的关键词Table 3 Top 30 keywords in frequency

2.5 新兴主题研究

采用VOSviewer将出现频次大于25次的关键词生成可视化时间网络图如图3所示。在可视化时间网络图中,关键词的不同颜色表示其出现的平均年份,关键词的颜色越接近黄色,其年份就越近,越能反映近年新兴的研究主题。由图3可知,近年出现的高频关键词主要为大数据、抗生素、污染特征、职业健康、静脉血栓栓塞症5个,说明大数据技术、生态环境风险与健康风险是近几年的研究热点。近年来随着社会信息化程度的提高及大数据时代的来临,大数据技术作为一门新兴技术,越来越多地应用到各领域的风险评估当中,其发挥的作用越来越显著[13-14]。抗生素在治疗细菌感染或抑制致病微生物感染方面起到重要作用,但大量使用就会给生态环境造成污染[15-17]。近年来,国家虽然采取相关管控措施,但抗生素过度使用情况依然存在[18]。不仅如此,随着电子产品的快速更新换代、化工业的高速发展、煤和石油的大量开采和燃烧、汽车尾气的大量排放等,产生的重金属[19-20]、多环芳烃[21-22]、全氟化合物[23]等也给生态环境造成污染,给人类健康造成潜在的风险和危害。同时铅酸蓄电池生产行业[24]、制鞋业[25]、煤炭产业[26]、涉苯作业[27]、涉甲醇作业[28]等也带来很多职业健康问题。另外,近年来人口结构老龄化、恶性肿瘤与心血管疾病发病率迅速上升等一系列问题,使得血栓栓塞性疾病的防治和处理逐渐引起关注和重视[29],其中静脉血栓栓塞症已成为患者非预期死亡的重要原因[30]。且目前关于新冠肺炎疫情,虽然中国抗“疫”成果突出,但全球范围内疫情形势依然十分严峻,新冠肺炎等传染病的风险评估和防治也是科研工作者的研究重心。故大数据技术、生态环境风险及健康风险越来越受到人们的重视和关注。

3 讨论

基于近30年检索到的11 184篇中文核心期刊文献,对文献发表时间及数量的分析可以了解到中国关于风险评估的研究所经历的各个发展阶段;对发表期刊的研究可以了解到高发文量的期刊;对高被引文献的研究可以了解到被引次数较多、影响力较大的文献发表的期刊及其主要的研究主题;对文献进行关键词聚类分析,可以了解近30年风险评估在中国的研究主题;对新兴主题的研究可以了解几年的研究热点和关注点。为从事风险评估的研究人员提供了参考和借鉴。

图3 主要关键词可视化时间网络图Fig.3 Visualization time network diagram of main keywords

但在本次研究过程中也存在一些不足,只是针对近30年的中文核心期刊进行分析,忽略了非核心期刊文献及一些中国学者在外文发表的文献。另外知网期刊数据库在不断地更新,关于风险评估的期刊发文数、文献的被引次数等也会发生变化。在后续的风险评估研究过程中,需要了解并关注该类问题。

4 结论

(1)关于风险评估,2002年以前发文量不高,2003—2009年的发文量呈现快速增长趋势,2010年后呈现缓慢增长趋势。

(2)发文量较多的期刊数虽然不多,但总发文量较大,可以为相关学者的学习及投稿提供参考。

(3)高被引文献主要集中发表在2001—2010年,且高被引文献主要涉及金融和自然灾害风险。

(4)风险评估在中国的研究主题主要包含生态环境风险、健康风险、金融风险、信息安全风险、自然灾害风险、企业内部控制风险、社会稳定风险、电力系统风险、食品安全风险。

(5)大数据技术、生态环境风险与健康风险是近几年的研究热点。

猜你喜欢
发文次数聚类
2020年,我国汽车召回次数同比减少10.8%,召回数量同比增长3.9%
最后才吃梨
俄罗斯是全球阅兵次数最多的国家吗?
10条具体举措! 山东发文做好返乡留乡农民工就地就近就业
面向WSN的聚类头选举与维护协议的研究综述
改进K均值聚类算法
基于Spark平台的K-means聚类算法改进及并行化实现
基于加权模糊聚类的不平衡数据分类方法