基于科学知识图谱的我国雾霾与健康关联可视化研究

2019-04-18 07:44崔悦焦杰周西姬
智富时代 2019年2期
关键词:知识图谱健康雾霾

崔悦 焦杰 周西姬

【摘 要】雾霾严重影响人们身体健康,防治雾霾迫在眉睫。在此背景下,本文以CNKI数据库为数据来源,通过专业检索得到2008-2017年有关“雾霾与健康”这一主题的文献,共计1702条记录,将得到的数据运用可视化分析软件CiteSpace分别对作者、机构和关键词绘制相应知识图谱并进行分析,以梳理近10年来雾霾与健康领域的重要研究力量和热点问题。研究发现:(1)作者发文频次普遍不高,产量高、影响力大的作者较为匮乏,作者之间合作趋势不明显,研究机构多为高校、环境科学研究所和疾病预防控制中心,主要集中在我国雾霾较为严重的地区,各机构间尚未形成良好的合作机制;(2)结合关键词聚类图谱,可进一步将雾霾与健康关联的研究分为雾霾与空气、雾霾主要成分和雾霾对健康的影响三大方面,并可看出,文献倾向于从雾霾的成分入手,侧重于对健康风险的评估;(3)对雾霾与健康关联的研究具有地域性特点,即雾霾影响较为严重的地区往往成为雾霾与健康领域研究的热门地区。

【关键词】知识图谱;CiteSpace;雾霾;健康;可视化

一、引言

雾霾问题虽由来已久,然直到2013年“雾霾”才正式进入中国公众的视野,成为2013年的年度关键词,并在此后成为公众持续关注的焦点。雾霾是雾和霾的合称,是大气污染现象的一种,是水汽凝结物和微粒悬浮所形成的大气浑浊现象,其中PM2.5是其“主要元凶”,而雾霾产生的主要原因是人类活动等人为因素,是牺牲环境发展经济的后果[1]。

雾霾造成的损失不容小觑。郑易生等人(1999)以1995年价为基准,计算得出由中国环境污染造成的经济损失为1875亿元,占当年GNP的3.27%[2]。曹彩虹、韩立岩(2015)以北京为例,研究发现雾霾造成的健康损失呈逐年上升趋势,且健康总成本的增长率远超同期该地区GDP的增长率[3]。陈仁杰等人(2010)通过分析认为PM10浓度越高,城市人数越多, 由健康造成的经济损失越大[4]。由此可以发现雾霾的影响主要包括两个方面:一方面是雾霾对健康的影响,另一方面是雾霾对经济的影响。以下我们重点针对雾霾对健康影响这一方面进行探讨。

2015年中国网民科普搜索需求行为分析报告显示,在中国网民科普搜索热词Top10中,健康与医疗主题词汇占八成[5]。这反映了人们对健康的重视,也为开展雾霾研究提供了现实依据。对于雾霾和健康的关联性,许多学者进行了研究,结果均显示雾霾对健康具有负面影响。具体有以下几个方面的研究:

(1)雾霾与死亡率。学者们普遍认为雾霾浓度越高,发病率或死亡率越高。曲卫华,颜志军(2015)指出工业烟尘排放量越多,人口死亡率越高[6]。刘帅、宋国君(2017)发现PM2.5日平均浓度上升10μg/m3,人群死亡率较基期水平上升0.37%[7]。谢鹏等人(2010)对2006年珠江三角洲地区大气污染物浓度进行观测,得出PM10、PM2.5、SO2、NO2、O3浓度增加10μg/m3,人群总死亡率分别增加0.38%、0.40%、1.02%、1.19%和0.2%的结论[8]。谢元博等人(2014)对2013年1月北京市雾霾重污染事件进行的研究表明,短期高浓度PM2.5污染对人群健康风险较高,可诱发呼吸系统疾病、心血管疾病甚至早逝[9]。

(2)雾霾与社会群体。不少研究发现雾霾的影响还存在着群体差异。苗艳青、陈文晶(2010)发现PM10对健康具有损害作用,并且这种损害仅作用于社会较低层次的群体[10]。郭文伯等人(2015)认为不同社会群体出行的空气污染暴露度存在差异,如中收入者大于低收入者和高收入者[11]。傅崇辉等人(2014)认为PM2.5对弱势群体的健康影响较大[12]。而向华丽等人(2015)从职业的角度研究发现PM10对隧道工人的健康影响较大[13]。

(3)雾霾与支付意愿。杨继东、章逸然(2014)研究发现居民平均每年愿意支付1144元来降低1μg/m3的NO2,但仍远低于发达国家的支付水平[14]。蔡春光、郑晓瑛(2007)调查北京市发现居民愿为改善空气污染状况的支付意愿为652.327元/年[15]。彭希哲、田文华(2003)的研究表明上海地区居民愿为空气污染造成的疾病损失承担的支付意愿总计为51.66亿元,是1999年GDP的1.28%[16]。

此外,有些研究发现不同颗粒物粒径和不同季节的颗粒物对健康的影响程度不同[17,18];有些研究则探讨发现PM2.5中的重金属对人体具有较大的危害,且对不同个体的影响存在差异[19,20]。除上述所说的雾霾影响的群体差异,还有研究发现雾霾污染造成的健康负担存在地区差异[21]。

综合上文,可以发现:(1)有关雾霾与健康关联的文献大多采用定量分析的方法,可以较客观准确地表明雾霾与健康的关联;(2)它们所使用的方法及工具各不相同,缺乏一个统一的标准,并且研究视角各异,研究各有侧重且较为分散,缺乏一个较为全面综合的研究。华裔陈超美及其团队开发的CiteSpace是一款在科学文献中识别与可视化新趋势与新动态的信息可视化软件[22]。它作为一种用图形展示知识关联性的可视化分析软件正渗透着各个领域。雾霾与科学知识图谱都为当前热门话题,两者的结合研究分析是更好解决雾霾问题的必然趋势。目前国内学者已经进行了雾霾与经济关联的知识图谱分析[23],但缺乏我国雾霾与健康主题的知识图谱分析;考虑到人们对图表的敏感性强于对文字等符号这一特点,本研究采用基于CiteSpace的科学知识图谱可视化分析的研究方法,对雾霾与健康关联的研究文献进行梳理,以厘清雾霾与健康的关系及基本情况,为雾霾研究提供資料参考,这也是本文关于雾霾风险研究的一大创新点。

二、数据来源与研究方法

(一)数据来源

本文数据均来源于中国知网(CNKI)数据库,作者于2019年2月17日以“SU=(雾霾+PM2.5+PM10+颗粒物+霾+灰霾+阴霾+烟雾+大气污染+空气污染)AND SU=(健康+疾病+死亡率+发病率+患病率)”为检索表达式、2008年至2017年为文献时间范围进行检索,共得到1702条文献数据。

(二)研究方法

基于信息计量和可视化技术,本文采用知识图谱可视化分析的方法,运用CiteSpace进行数据处理,旨在探究近十年雾霾与健康关联的主要研究内容及发展趋势。在根据上文的条件检索后,将文献导出为Refworks格式。然后将CNKI文献数据格式转换为符合CiteSpace V. 5.3.R4分析要求的数据格式。在软件上进行相关参数的设置后,利用CiteSpace绘制作者、机构和关键词聚类图谱并进行分析。

三、结果分析与讨论

(一)作者分析

发文量是学者在其研究领域贡献值大小的体现,往往与学者的研究深度和科学素养成正相关。本文在用CiteSpace对有关中国雾霾与健康领域的作者分析时,将“节点类型”设为“作者”,数据抽取对象为前50名,得到我国雾霾与健康关联研究作者图谱(如图1),只截取集中作者区域,较为边缘、作者发表量较低的未予以呈现。在知识图谱中,节点的大小表示词频的大小,节点之间的连线表示作者、机构间的合作关系。根据名字显示的大小可知李新伟、孙庆华、陈晓东等人在我国雾霾与健康关联研究领域发文量较多,贡献较大。

由图可知,最高产作者为李新伟(6篇),最低产作者为王情(3篇),可见雾霾与健康领域内的作者发文量较为均衡,这反映了雾霾对人体健康的影响并未被学者忽视;由节点连线可看出,中国雾霾与健康领域涌现出了很多合作团体,其中绝大多数合作团体为4人及以上规模,影响力较大的是孙庆华、洪新如、宋岩峰、郑玲这一团队;从发文作者单位来看,作者多为国内高校学者,说明国内高校是中国雾霾研究与防治工作的中坚力量;另外这些作者大多生活在雾霾多发地区,这也是雾霾引起健康问题的严峻形势所要求的。

(二)机构分析

机构与作者作为不同的主体,都充当着研究力量的重要角色,其研究的成果是衡量其贡献值的直接标准。运用CiteSpace对文献来源的机构进行可视化分析时,将“节点类型”设为“机构”,绘制出2008-2017年间我国雾霾与健康关联研究机构图谱。如图2所示,图谱共有112个研究机构(图中仅显示发表频次大于4的研究机构,即19个研究机构),其中各研究机构间共有44次合作,整体网络的密度为0.0071。

根据图谱,可得出以下结论:(1)高校、各环境科学研究所和疾病预防控制中心是雾霾风险研究的主要机构,如北京大学公共卫生学院、中国环境科学研究院、中国疾病预防控制中心,其中环境机构和疾病预防控制机构是相关责任机构;(2)图中节点间连线较少,这说明机构间联系较少、尚未形成良好的合作机制,因此有关研究机构间的合作有待进一步加强;(3)图谱显示该领域内没有形成较大形式的聚集点,表明研究力量较为分散,尚未形成核心的研究机构;(4)该领域的研究机构主要集中在我国较发达且正面临雾霾危机的地区,如京津冀地区。一方面是因为经济越发达意味着更多地牺牲了环境,也即意味着雾霾所引发的健康问题的凸显;另一方面雾霾严峻的形势对人体健康提出了挑战,这一现实问题亟需解决,由此引发该地区相关机构的研究。可以预测,该地区雾霾问题越凸显,则此地区雾霾与健康主题的研究越多。

(三)关键词分析

关键词作为一篇文献的高度凝练,可以较为明确地传达文章的主题、思想、方法等,也可以反映该类型或主题文献研究的热点内容及方向。因此本文运用关键词来确定雾霾与健康领域的研究热点。运用CiteSpace进行关键词聚类分析,在参数设置时,将“节点类型”设为“关键词”,在生成关键词共现图谱后,对生成的关键词图谱进行聚类处理,形成关键词聚类图谱(如图3)。另外通过对关键词词频进行统计,得到2008-2017年雾霾与健康关联文献研究的高频关键词表,如表1。

由表1可看出2008-2017年有关雾霾与健康关联的文献中高词频有“空气污染”、“PM2.5”、“大气污染”、“颗粒物”、“雾霾”、“呼吸性疾病”、“PM”、“儿童”和“慢性阻塞性肺疾病”等,这些词大致可分为两大类:一是雾霾主要成分;二是雾霾引发的具体疾病及其影响的人群。

由图3可知,聚类将2008-2017年有关雾霾与健康关联的研究归纳为九大类,分别是:大气污染、空气质量、PM2.5、肺肿瘤、分析测试、雾霾、脑血管病、癌症发病率和健康发展。这与上述关键词类型基本相似,涉及雾霾成分和危害、雾霾对健康的影响。但软件进行的聚类并不能概括此领域的所有主题,可能存在忽视出现次数较少或影响力不显著的关键词等问题,因此在这里我们主要把握出现次数较多或影响较显著的关键词。

(四)简要讨论

结合上文,在聚类的基础上,我们可将雾霾与健康关联研究的热点内容进一步归纳为三大类,分别为:(1)雾霾与空气;(2)雾霾主要成分;(3)雾霾对健康的影响。以下将进一步对这三大热点内容进行简要讨论。

(1)雾霾与空气。在雾霾与健康关联领域涉及雾霾与空气的主要原因是:①雾霾是一种大气污染现象,人们最直观地认识雾霾是它在空气中的状态,即灰蒙蒙、低能见度;②雾霾存在于空气中的这一状态为雾霾对健康造成影响提供了有利条件,即雾霾对健康的影响主要是通过空气的介质作用而引发的。从具体文献来看,对雾霾与健康关系的研究具有地域性特点,它们侧重于对某个地区或城市进行探讨,很少有以全国雾霾及其引发的大气问题为对象进行探讨的。虽然雾霾具有扩散性的特点,但其爆发的集中区域与外缘区域难免存在较大差异,因此研究的严谨性会驱使该领域的研究具有地域性特点。

(2)雾霾主要成分。雾霾的爆發对社会的生产与生活都产生了较为严重的影响,造成了巨大经济损失,对社会的健康发展起着制约作用。这就不得不对其进行治理,而要治理首先需要认识并明确雾霾,这在雾霾对健康影响这一领域也不例外。许多研究把雾霾成分作为切入点来研究雾霾与健康问题,这体现了追根溯源的思想,进一步明确了雾霾的元凶是“细颗粒物”,也即近年来的热点词汇“PM2.5”,PM2.5由于具有一定的毒性而对人体具有危害,因此细颗粒物或PM2.5也理所当然地成为了该领域研究的一大热点。

(3)雾霾对健康的影响。这是检索到的文献所共同研究的问题,也是该领域的一大热点。这里所说的雾霾对健康的影响主要是指雾霾所引发的疾病,并且这些疾病大多属于呼吸性疾病,另外呼吸疾病还可引发其他疾病,如上述聚类中的脑血管病,此外还有一些精神疾病,如持续性的雾霾天气会引发抑郁症。雾霾对健康的影响还体现在它会提高人口的死亡率,这也是雾霾引发强烈关注的原因之一。在上述高频关键词中还涉及“儿童”一词,这主要反映儿童是雾霾天气的易感人群,老人同儿童一样,其健康也易受到雾霾天氣的威胁。另外从关键词统计来看,对雾霾与健康关联研究的文献倾向于对雾霾健康风险进行评估。

四、结论与展望

本文利用可视化工具CiteSpace对雾霾与健康关联进行了分析,为这一领域的可视化研究提供了参考,这是本文的一大创新点。与其它研究雾霾与健康的文献不同的是,本文在该领域文献的基础上进行,并运用CiteSpace整合其他文献,对文献的作者、机构和关键词绘制知识图谱并进行分析。结合上文,得出以下结论:

(1)研究力量。在研究作者方面,李新伟的贡献较突出,由孙庆华、洪新如、宋岩峰、郑玲组成的研究团队合作较显著。但总体来看,该领域作者发文量普遍不高,合作较少,尚未形成集聚效应;在研究机构方面,高校、各环境科学研究所和疾病预防控制中心是雾霾风险研究的主要机构,各机构间联系较少、尚未形成良好的合作机制,其合作有待进一步加强。

(2)研究热点。结合关键词及其聚类图谱,可看出雾霾为一种大气污染现象,主要成分及元凶是PM2.5,其引发的疾病大多为呼吸性疾病,并可诱发其他疾病,甚至致死。由此可将我国雾霾与健康关联研究的热点进一步归纳为三个方面,即雾霾与空气、雾霾主要成分和雾霾对健康的影响。从中可看出,文献倾向从雾霾的成分入手,侧重对健康风险的评估。

(3)对雾霾与健康关系的研究具有地域性特点。雾霾影响较严重的地区往往成为雾霾与健康领域研究的热门地区,如京津冀地区,这体现了雾霾与健康研究具有现实意义。

本文也存在许多不足。首先,从文献选取范围看,本文仅针对国内研究成果进行分析,未结合国外研究成果;其次,从数据选取看,数据库只选取了CNKI,未结合国内其他数据库文献,因此存在数据源不全等问题;最后,从研究内容看,由于文献仅来源于CNKI,而CNKI里的引文数据并不完整,所以在CiteSpace里只能进行作者、机构和关键词三个功能的分析,对于CiteSpace的经典功能“共被引”并未涉及;从得出的结论看,由于这些结论主要依靠主观分析与归纳,具有一定的主观性,可能与实际情况存在一定偏差。这些不足也正是本研究未来需要努力的方向。

【参考文献】

[1]王旭光.雾霾治理与经济发展探究[J].经济视角(下旬刊),2013(08):24-25.

[2]郑易生,阎林,钱薏红.90年代中期中国环境污染经济损失估算[J].管理世界,1999(02):189-197+207.

[3]曹彩虹,韩立岩.雾霾带来的社会健康成本估算[J].统计研究,2015,32(07):19-23.

[4]陈仁杰,陈秉衡,阚海东.我国113个城市大气颗粒物污染的健康经济学评价[J].中国环境科学,2010,30(03):410-415.

[5]2015中国网民科普搜索需求行为分析报告[J].科技导报,2016,34(12):29-33.

[6]曲卫华,颜志军.环境污染、经济增长与医疗卫生服务对公共健康的影响分析——基于中国省际面板数据的研究[J].中国管理科学,2015,23(07):166-176.

[7]刘帅,宋国君.PM_(2.5)日平均浓度与死亡率“剂量-反应”关系meta分析[J].中国公共卫生,2017,33(01):14-17.

[8]谢鹏,刘晓云,刘兆荣,李湉湉,钟流举,向运荣.珠江三角洲地区大气污染对人群健康的影响[J].中国环境科学,2010,30(07):997-1003.

[9]谢元博,陈娟,李巍.雾霾重污染期间北京居民对高浓度PM_(2.5)持续暴露的健康风险及其损害价值评估[J].环境科学,2014,35(01):1-8.

[10]苗艳青,陈文晶.空气污染和健康需求:Grossan模型的应用[J].世界经济,2010,33(06):140-160.

[11]郭文伯,张艳,柴彦威.城市居民出行的空气污染暴露测度及其影响机制——北京市郊区社区的案例分析[J].地理研究,2015,34(07):1310-1318.

[12]傅崇辉,王文军,汤健,曾序春,冯瑶.PM2.5健康风险的空间人口分布研究——以深圳为例[J].中国软科学,2014(09):78-91.

[13]向华丽,杨俊,仇珍珍,雷万雄,曾婷婷,兰志财.隧道工人的PM_(10)职业暴露特征调查分析及其健康风险评价[J].环境科学,2015,36(08):2768-2774.

[14]杨继东,章逸然.空气污染的定价:基于幸福感数据的分析[J].世界经济,2014,37(12):162-188.

[15]蔡春光,郑晓瑛.北京市空气污染健康损失的支付意愿研究[J].经济科学,2007(01):107-115.

[16]彭希哲,田文华.上海市空气污染疾病经济损失的意愿支付研究[J].世界经济文汇,2003(02):32-44.

[17]陶燕,刘亚梦,米生权,郭勇涛.大气细颗粒物的污染特征及对人体健康的影响[J].环境科学学报,2014,34(03):592-597.

[18]杨维,赵文吉,宫兆宁,赵文慧,唐涛.北京城区可吸入颗粒物分布与呼吸系统疾病相关分析[J].环境科学,2013,34(01):237-243.

[19]胡子梅,王军,陶征楷,陈振楼.上海市PM_(2.5)重金属污染水平与健康风险评价[J].环境科学学报,2013,33(12):3399-3406.

[20]李丽娟,温彦平,彭林,白慧玲,刘凤娴,史美鲜.太原市采暖季PM_(2.5)中元素特征及重金属健康风险评价[J].环境科学,2014,35(12):4431-4438.

[21]祁毓,卢洪友.污染、健康与不平等——跨越“环境健康贫困”陷阱[J].管理世界,2015(09):32-51.

[22]ChenC.CiteSpaceII:Detecting and visualizing emerging trends and transient patterns in scientific literature. Journal of the American Society for Information Science and Technology, 2006, 57(3):359 -377.

[23]程胜义.国外雾霾污染与经济增长关联性研究——基于CiteSpace科学知识图谱[J].科技广场,2017(04):145-151.

猜你喜欢
知识图谱健康雾霾
可以消除雾霾的新型无人机
从《ET&S》与《电化教育研究》对比分析中管窥教育技术发展
从雾霾中突围
雾霾的中医认识及其防治
雾霾下的清晰