基于CiteSpace的草地生态系统研究现状分析

2019-08-12 06:05杨睿哲孙小妹李金霞刘君娣陈兰兰
科技与创新 2019年13期
关键词:图谱聚类草地

杨睿哲,孙小妹,李金霞,刘君娣,陈兰兰

基于CiteSpace的草地生态系统研究现状分析

杨睿哲,孙小妹,李金霞,刘君娣,陈兰兰

(甘肃农业大学 资源与环境学院,甘肃 兰州 730070)

以中国知网(CNKI)中检索到的1986—2019年的2 593篇草地生态系统相关文献为研究样本,运用CiteSpace作为信息可视化工具,从历年发文量、关键词共现网络、突现分析、作者和科研机构分布等角度展开信息可视化分析。结果表明,草地生态系统发文量从1998年开始逐年增多,研究主要围绕生物多样性、群落结构、丰富度、生物量等热点进行;氮素添加、氮沉降、地上生物量、功能多样性研究从2013年开始爆发式增长;研究作者及机构主要以兰州大学的杜国祯团队为主。对草地生态系统的研究现状进行了分析,以期为研究者把握该领域研究的热点和发展趋势提供依据。

草地生态系统;CiteSpace;可视化分析;知识图谱

从陆地生态系统来看,草地生态系统是其中一个重要部分,具备防风固沙、调节气候、净化空气、保持水土、涵养水源等生态功能。从世界范围来看,草原总面积达到了2.4×107km2左右,约相当于陆地总面积的17%,在国土面积中的比例为41.7%,大多分布于北方的半干旱以及干旱地区,维持着约8亿人的生计[1]。中国大部分草地作为天然放牧场利用,所以草原不仅仅是陆地生态系统中的主要类型,作为放牧畜牧业基地也是极为重要的。近年来由于人类过度使用草地,草地生态系统已经出现了包括自然灾害频繁发生、生产力逐渐下降以及水土严重流失等在内的诸多问题,致使其出现退化以及失衡现象[2]。因此,草地生态系统越来越受到研究者们的关注,发表的相关文献也越来越多。

知识图谱可利用数据分析的挖掘、图表的整理,通过可视化工具动态展现知识发展过程,所以从新兴交叉学科来看,知识图谱起到了越来越重要的作用[3]。CiteSpace可视化分析软件由可视化方法、文献计量分析以及数据挖掘算法组合而成[4],相较于其他可视化软件而言,此软件更为清晰,从知识结构内找寻关键词以及重要趋势也会更容易[5]。

本文借助该软件分析了草地生态系统的研究热点与趋势,以期对研究者们把握该领域的发展趋势及其研究热点提供理论依据。

1 资料方法

1.1 文献数据来源及筛选

本论文搜索来源为中国知网,即CNKI。该数据库收录的文献涉猎多个学科领域,如自然科学、人文社科以及工程技术等,其出版的新文献在中国年均出版文献总量中的比例达到了80%左右,作为中国文献数据库在世界范围内有着最大的规模。这一数据库不单单提供书目访问信息,同时涉及已经公开发表的论文的相关引文信息,而且还可让政治、科技、文化、经济以及文化等各方面的研究成果及其发展动态得到全面而又集中反映,对于文献计量学调查而言,充当着理想数据来源的角色[6]。此次以关键词搜索策略搜索“草地生态系统”“氮”,时间范围选择1986—2019-03,进行模糊匹配检测,共搜索到3 025篇相关文献。为了消除其中“噪声”干扰影响,通过人工筛选删除会议报告、个人学术成果介绍、无作者、期刊会议征稿等各类无效论文,得到2 593篇文献。

1.2 研究方法

借助CiteSpace软件(该软件是由美国Drexel大学陈超美教授应用Java语言开发的一款用于计量和分析文献数据的信息可视化软件)针对收集得来的数据展开动态、多元而又分时的可视化分析。这一软件绘制而来的图谱可以在一幅引文网络图谱内使知识领域如何演变得到较为集中的体现,还可在图谱内自动标识充当知识基础角色的引文节点文献以及通过共引聚类反应而来的研究前沿[7]。与其他可视化工具相比,CiteSpace软件提高了可视化分析功能清晰度和解释性[4]。

本文以CiteSpace V对检索的文献进行发文量统计、关键词共现、关键词频率统计、关键词聚类、突现词分析等来分析草地生态系统的动态和趋势。发文量指站在宏观的立场上对某研究领域如何变化与如何发展进行观察并作出评价,属于重要指标之一,是从直观层面上对文献详细情况进行观察的重要途径之一[3]。从关键词共现网络分析图来看,圆圈大小代表文献引用频次,圆圈越大表明被引用次数越高[8]。关键词可以反映研究成果的主要内容和结果,是对文献整体内容的概括与总结[9]。突现词指文献中骤增的关键术语,可以将某段时间内频次变化率高的词从大量的主题词中探测出来[10]。中心性是测度节点在网络中重要性的一个指标。中心性越高,则节点越重要[7]。CiteSpace中使用此指标来发现和衡量节点对象的重要性,并在年轮图最外圈用紫色圈对该类节点标记。

2 结果

2.1 关于草地生态系统历年来发文量分析

按照文献发表于哪一年,本文统计分析了已经纳入数据库内的文献共计2 593篇的发表时间的具体分布详情,分析结果如图1所示。从图1不难发现,1986—1997年这12年间与草地生态系统相关的研究还很少,最多的一年才发表了8篇文章。但从1998—2018年,发文量开始快速增长,每年相关文献发表均大于40篇,其中2011年达到了259篇。近两年的发文量均在100篇以上,这说明草地生态系统的研究越来越受到研究者们的关注,成为当前的研究热点。

图1 草地生态系统研究文献发表时间分布

2.2 研究热点分析

由于选择的文献数量较多,时间跨度较长,为了清晰地显示当前关于草地生态系统的研究热点以及研究方向的联系强度,设置“时间分区”为2年,出现频率大于等于4,演算阈值(Top% per slice)为默认的50。剪切方式运用Pathfinder、Pruning sliced networks和Pruning the merged network三种方法,并且将表达一致的关键词合并,得到关键词共现网络图谱,如图2所示。图2中共有67个节点、67条连接,网络密度(density)为0.031 2,这反映出中国草地生态系统的研究已经形成了较为完备的体系。根据图2可知,在草地生态系统研究中,主要研究的是生物多样性、群落结构、丰富度、生物量等指标;主要研究区域是青藏高原的高寒草甸区,该区域的草地生态系统较脆弱且难以恢复。从图2中可以看出,研究者们主要从土壤理化性质、海拔梯度、区系分析等自然因素以及刈割、氮沉降和施肥等人为因素来探究可能造成该区域草地生态脆弱的原因。

关键词频率如表1所示,代表了在某个时间段关键词出现的次数,可以根据频数的大小了解某个时间段的研究热点。中心性可以判断节点的重要性,中心度大于等于0.1表明该关键词在网络中具有枢纽性的作用。由此可见,频数和中心性具有一定的相关性,关键词频数越高中心性也越强。根据表1,在频数前20的关键词内,“生物量”“丰富度”“群落结构”“高寒草甸”“生物多样性”“海拔梯度”“保护”等在共线网络中发挥了很好的枢纽作用。

图2 草地生态系统文献关键词共现网络图谱

表1 草地生态系统关键词频数表(仅列频次前20个)

序号频数中心性关键词时间 11 9030.5生物多样性1986年 24340.59群落结构1998年 3981.17丰富度2000年 4840.16区系分析2002年 5830.11物种多样性指数1998年 6800植物多样性2002年 7670.86高寒草甸2004年 8600.26保护2002年 9570.11土壤环境因子2008年 10560.16生产力2002年 11490.16均匀度指数1998年 12480.06演替1988年 13470氮沉降2010年 14460.81生物量2008年 15460.06分布格局2004年 16420.11群落2004年 17280.35海拔梯度2004年 18270.11青藏高原2007年 19270干扰2000年 20270.11苔藓植物2006年

前17位文献突现词如图3所示。通过突现词知识图谱,可以了解不同历史阶段草地生态系统的侧重点。图3显示共有17个突现词,1986—2001年,草地生态系统研究领域多限于“演替”“均匀度指数”“物种多样性指数”等相关内容;2002—2013年,涌现出“保护”“β多样性”“海拔高度”“群落”等突现词;2013—2019年,出现“氮素添加”“地上生物量”“功能多样性”“重要值”等突现词,成为当前的研究热点。

有研究显示,在全球气候变化、人类活动扩张以及啮齿动物啃食等多重因素的影响之下,在输出草产品以及畜产品的同时草地生态系统已经消耗了越来越多的土壤营养物质,导致草地出现了或多或少的退化[11-12]。草地退化会带来生产力下降、土壤肥力下滑、营养元素失调以及物种多样性消退等多方面的问题[13]。如果未能有效补充,则草地土壤在养分供给方面的能力将会持续下滑[14]。所以,如何通过施氮以及施氮量对各类生物量的影响,改变草地生态系统现状,是当前主要研究发展趋势,这与图3的结果是一致的。

图3 前17位文献突现词

2.3 关键词聚类分析结果分析

聚类的现实意义是把网络划分为多个相互之间不会出现重合的子群,可对这一研究领域相关的热点话题展开探究,这里的研究热点指的是一定时间内大量的存在内在联系的一系列文献探究话题[15]。此外,这一词条在某一特定类别有较高的出现频率,但在其他类别内出现频次相对较低时,其和这一类别就存在较大的互信息[16]。通过CiteSpace的cluster功能,对关键词运用“K-均值算法”进行聚类分析。从聚类评价可以看出,模块性(Modularity)=0.778 2,平均轮廓值(Mean Silhouette)=0.597 5(值通常在[0,1]内,>0.3表明得来的社团结构相对较为显著,平均轮廓值在0.5以上,聚类一般认为是合理的[7]),因此,聚类被认为是合理的。聚类命名以#为标识,且以关键词为代表该聚类。

草地生态系统研究领域关键词聚类图谱如图4所示。从图4可以看到,关于草地生态系统的热点研究主题主要为“苔藓植物”“均匀度”“群落”“施氮”“生物量”“优势种”“海拔梯度”。其中,第一位的是“#0 苔藓植物”,则说明在关键词中,“苔藓植物”的权值是最大的。但通过二次检索和分析,该聚类涉及较广范围,常出现在“生物多样性”“群落结构”“丰富度”中,说明多数研究中,苔藓植物是必不可少的研究对象,是草地生态系统中重要的一部分。

2.4 作者共现分析结果

对于一篇论文来说,论文作者是主导者,在某研究领域中充当主体地位,学术观点就是以之为思想源泉,其研究情况及和其他作者间存在的合著关系对于研究趋势的导向、研究整体脉络走向等起到了非常关键的作用[5]。利用Citespace V针对作者进行合作网络分析,作者的名字以及节点越大,则说明该作者发表的文章和引用率越高,在该领域的影响力

就越强。不同作者节点之间有连接,则代表具有合作关系,连线越宽,就说明联系越紧密。

图4 草地生态系统研究领域关键词聚类图谱

图5显示名字的节点是发文量3篇以上的作者,共有194人,发文量较高的作者有杜国祯、王刚、方精云、姚小兰等,其中稳定合作最多的研究团队是杜国祯团队,在草地生态系统中贡献力度最大。总的来说,研究团队本身比较多,团队和团队之间很少合作,但是从一个团队来看,其内部的合作会比较密切。草地生态系统研究作者分布如图5所示。

图5 草地生态系统研究作者分布

2.5 科研单位共现分析结果

对于论文作者所在机构而言,科学研究是以之为主要组织形式的,大多聚焦在学术研究机构。从某个领域来看,其高产作者或者是核心作者所属机构表征的是其核心机构,提出的观点或者是研究成果往往是比较权威的,是研究人员需要着重关注的对象[5]。本研究总共纳入的文献数为2 593篇,针对其作者所属机构展开了可视化分析,借助Citespace V软件编制出了研究机构共现图谱,详细结果如图6所示,该图显示出了频次不少于4的研究机构。由图6可知,兰州大学生命科学学院、兰州大学草地农业科技学院、中国科学院及其研究所、四川农业大学林学院、甘肃农业大学草业学院、西北农林科技大学林学院是在草地生态系统领域发表较多文献的机构。结合图5分析,兰州大学生命科学学院和兰州大学草地农业科技学院则分别以杜国祯和王刚为核心作者,中国科学院则以方精云为核心作者,四川农业大学则以姚小兰为核心作者进行相关研究。图6网络密度只有0.016 8,说明各研究机构之间合作不够紧密,而且合作的机构也具有明显的地理分布性,主要是西北及青藏高原区为主研究机构之间的合作,如图6所示的兰州大学、西北农林科技大学、甘肃农业大学、中国科学院高原生物研究所以及中国科学院寒区旱区环境与工程研究所等研究机构。结合图2可知,当前草地生态系统的研究区域为西北干旱半干旱草地区以及青藏高原区的高原草原地区。

图6 草地生态系统研究机构分布

3 讨论

3.1 热点与趋势

在热点关键词的推导过程中,关键词的中心性以及出现频次属于一项重要指标,对于整个网络而言,高中心性关键词会有非常深刻的转折意义[17]。结合上述分析结果和中国的地理气候区位来看,未来的草地生态系统的研究地区依然以西北以及青藏高原区为主,研究内容主要以生物多样性、丰富度、群落结构或更为微观的角度进行讨论。

3.2 不足和展望

本文用到的数据来源为中国知网,且国内各期刊的质量水平不一,数据不具有极高的代表性。在设定Citespace V工具图谱的时候,选择阈值会带有一定的主观性,会极大地影响到“关键词共现知识图谱的边缘散点”[18]。在今后的研究中应当结合其他数据来源,例如ISI Web of Knowledge核心数据库,更加全面地了解草地生态系统的研究概况与发展趋势。此外,还可和其他可视化软件结合在一起,使用更为多元化的研究法,站在各大视角上对隐藏于数据内的信息进行更为深入的挖掘,如VOS viewer,互相验证以确保得到更为可靠的结果。

中国草地生态系统的研究人员和机构虽多,但是相互合作的强度还不是很高,基本是以研究团队为单元进行研究且地域性研究较为明显。未来中国应该加强团队和机构的合作研究,同时对不同类型草原生态系统也应进行深入研究,这样可以弥补互相之间不足,可以更加全面地了解草地生态系统的现状,有利于取得更大的进步。

[1]董斅晓,薄元超,孙建平,等.农牧交错带半干旱草地生态系统CO2交换对短期不同水平氮添加的响应[J].草业学报,2019,28(5):163-170.

[2]朱金濛.草地生态系统生物和功能多样性及其优化管理[J].现代农业研究,2019(1):63-64.

[3]王亚敏,彭蝶飞,胡大胜,等.基于CiteSpace的国内旅游气候舒适度研究现状分析[J].安徽农学通报,2019,25(8):133-140.

[4]CHEN C.Searching for intellectual turning points:progressive knowledge domain visualization[J].Proc Natl Acad Sci USA,2004,101(Suppl 1):5303-5310.

[5]CHEN C.CiteSpace II:Detecting and visualizing emerging trends and transient patterns in scientific literature[J].Journal of the Association for Information Science & Technology,2014,57(3):359-377.

[6]韩玺,史昱天.四种国内情报学核心期刊的国际影响力对比研究——基于Web of Science数据库的统计分析[J].情报杂志,2017,36(7):143,144-148.

[7]陈悦,陈超美,刘则渊,等.CiteSpace知识图谱的方法论功能[J].科学学研究,2015,33(2):242.

[8]刘淑婷.基于CiteSpace的中国大学生心理研究的前沿演变和热点领域[J].教育探索,2017,33(9):60-63.

[9]汪园,王学东,李金鑫.基于文献计量的中国区块链研究的知识网络与结构分析[J].现代情报,2018,38(1):147-153.

[10]张露,张俊飚,童庆蒙,等.农业碳排放研究进展:基于CiteSpace的文献计量分析[J].科技管理研究,2015,35(21):219-223

[11]ZHANG X H,LIU H Y,XING Z S.Challenges and solutions for sustainable land use in Ruoergai-the highest altitude peatland in Qinghai-tibetan plateau,China[J].Energy Procedia,2011(5):1019-1025.

[12]XIONG D,SHI P,SUN Y,et al.Effects of grazing exclusion on plant productivity and soil carbon,nitrogen storage in alpine meadows in northern Tibet,China[J].Chinese Geographical Science,2014,24(4):488-498.

[13]奇立敏,宝音陶格涛,李雅茹,等.切根方式和氮素添加对退化羊草草地改良效果分析[J].中国草地学报,2017,39(4):67-71.

[14]QI L M,TAOGETAO B Y,LI Y R,et al.Improving effects of root cutting ways and nitrogen additions on degraded leymus chinensis grassland in inner mongolia[J].Chinese Journal of Grassland,2017(4):69-73.

[15]侯剑华,陈悦,王贤文.基于信息可视化的组织行为领域前沿演进分析[J].情报学报,2009(3):422-430.

[16]石晶晶,薄荣强,胡元会,等.基于CiteSpace的中医导引术相关研究的可视化分析[J].中国医药导报,2018,39(22):94.

[17]胡昌盛,陈丽萍,张彩霞,等.基于CiteSpace文献计量可视化软件探讨国内糖尿病中医护理研究趋势[J].广州中医药大学学报,2019,36(5):752-757.

[18]李文杰.中国老年人长期照护研究热点与趋势——基于Citespace的可视化分析[J].武汉理工大学学报(社会科学版),2017,30(2):81-87.

S812

A

10.15913/j.cnki.kjycx.2019.13.005

2095-6835(2019)13-0010-04

〔编辑:张思楠〕

猜你喜欢
图谱聚类草地
一种傅里叶域海量数据高速谱聚类方法
基于图对比注意力网络的知识图谱补全
基于知识图谱的k-modes文本聚类研究
一种改进K-means聚类的近邻传播最大最小距离算法
基于模糊聚类和支持向量回归的成绩预测
Laughing song
图表
草地
主动对接你思维的知识图谱
一片草地的述说