科技创新的研究热点与前沿:基于CiteSpace 的文献计量分析

2021-03-25 07:46段宝娜
濮阳职业技术学院学报 2021年2期
关键词:发文图谱节点

段宝娜

(郑州财税金融职业学院,河南 郑州 450048)

科技创新的研究正处于蓬勃发展时期,该主题的研究涉及多个学科,近年来科技创新研究的发展趋势如何,主要集中在哪些方面,研究的重点又是什么? 为了解近些年科技创新领域的研究概况,本文选取2010-2020 年CNKI 数据库中科技创新相关文献为研究样本,借助可视化软件CiteSpace[1](68),运用文献计量方法和知识图谱对其进行统计分析,旨在客观真实反映科技创新领域的研究现状、研究脉络和前沿热点,为相关领域的未来研究提供指导性的方向和建议。

一、研究方法与数据

(一)数据来源与处理

本文数据来自CNKI 数据库(截止至2020 年12月1 日),在数据库中选择中文核心期刊,以“科技创新”为主题进行高级检索,检索时间设定为2010 年1 月至2020 年11 月,经过数据清洗,剔除相关度不大的以及与检索主题不符的科研文献,最后筛选出有效数据1714 篇作为样本文献。

由于CiteSpace 软件无法识别从知网中直接下载的文献格式, 需将文件格式从CSSCI 转化为WOS, 再导入软件进行分析。 具体操作流程为:首先, 从数据库中下载数据保存为Refworks 格式,包含题名、作者、关键词、研究机构、发表年份、期刊等数据信息。 其次,转换数据,利用CiteSpace 软件data-import/export 功能进行数据格式转换。最后,分析数据,对转换后的、软件可识别可读取的数据格式进行可视化分析。

(二)研究方法

首先使用Excel 软件对2010—2020 年科技创新领域的核心文献进行统计分析, 展现该领域相关研究文献发表数量随时间的变化趋势。 然后借助可视化分析工具CiteSpace 软件,基于寻径网络算法和共引分析理论[2](12),运用文献计量学与科学知识图谱可视化相结合的研究方法, 对搜集的样本文献进行分析, 通过绘制可视化知识图谱获得该领域的研究机构、合作作者及关键词等信息,探讨科技创新领域的研究现状、研究热点和前沿动态等。 其中,在使用CiteSpace 软件进行计量分析设置相关参数时,时间跨度设置为2010-2020 年, 时间切片设为1 年,每个时间切片内的阈值设置为Top50, 即以每个时间切片出现频次前50 的关键词参与生成图谱,节点类型分别选择作者、机构和关键词。 经调试,选择最小生成树(Minimum Spanning Tree)和修剪切片网络(Pruning Slicenetworks) 对形成的网络进行修剪,去掉不重要的节点和连线, 使得网络中重要的节点和连线更加清晰,便于对网络图谱进行解读。

二、研究现状分析

为客观认识国内科技创新的研究历程, 运用CiteSpace 软件绘制样本文献的可视化图谱,包括作者共现、机构共现、关键词共现等,通过对图谱信息进行解读, 以便更好地了解科技创新研究的整体分布情况、发展动态、研究热点和前沿等问题。

(一)年度发文量统计

科学文献的数量是衡量科学知识的重要尺度之一, 对2010 年—2020 年这一时间段内的科技创新核心文献的发文量进行分析, 在一定程度上能反映该学科领域的理论水平和发展速度[3](144)。

图1 科技创新研究中文核心论文年度发表情况

对所选时间段内每年的发文量进行统计整理,直观展示了科技创新领域年发文量情况, 结果如图1 所示,横坐标代表年份,纵坐标代表发文量。由图1可知,2010-2012 年的发文量呈现第一次增长,2012-2018 年的发文量呈递减趋势,2018-2020 年的发文量呈现第二次增长。其中,2012 年、2013 年和2020 年的发文量较多(2020 年文献下载截止于12月份),在2012 年达到顶峰,其余年份虽有波动但幅度不大,除2018 年外,发文量基本稳定在每年130篇以上, 意味着近十一年来科技创新相关研究已然成为学术界比较关注的研究热点之一。

(二)研究机构分析

绘制机构合作图谱, 有助于了解科技创新领域研究机构的科研能力,知晓机构间的合作关系,进而追踪和挖掘该领域研究能力较强的科研单位和科研团队。 对机构合作进行分析, 节点类型选择“institution”,设置阈值,运行CiteSpace 软件即可生成相应的可视化知识图谱,如图2 所示,限于篇幅,仅保留图谱主要部分。 Q 值为0.938 大于0.3,说明该聚类结构显著,S 值为0.968 大于0.7,意味着聚类是令人信服的。

机构合作网络图谱中,节点数代表机构数,节点大小表示机构发文量, 之间的连线反映合作关系的强度。 该机构网络知识图谱的网络节点数为152,连线数为38,说明所收集的1714 篇文献中共涉及152个机构,一共构成38 个合作网络。 科技创新的研究机构比较多,并且有进一步增加的趋势,但是各结构之间的边线较少,网络整体密度也只有0.0018,说明研究机构间缺乏横向联系,合作关系不是很理想,可能会导致同一问题的重复研究, 同时也不利于科技创新研究的深入发展。

图2 机构合作网络图谱

在合作机构中分别以河海大学、北京工业大学、哈尔滨工程大学、 太原理工大学等为中心形成较为集中的合作网络关系, 说明这些机构在合作团内占据核心位置,对合作机构团的发展起着重要作用[4](58)。但是合作团间的关系还不是很稳定, 比如以北京工业大学为中心的合作团, 清华大学公共管理学院只有一条连线与大的模块相连接, 如果缺少北京工业大学这一节点,将会面临脱团现象,与此类似的还有太原理工学院。 虽然机构间建立了一定程度的合作关系,但很容易解体,在未来,加强各机构间的合作程度,是提升科技创新研究的重要举措之一。

表1 机构发文量统计表

对科研机构发文量进行整合,结果如表1 所示。从表中数据可以看出, 科技创新研究的主要力量是高校和科研院所, 其中发文量最多的机构是河海大学商学院,其发文量是23 篇,具有较强的科研能力,产生了大量的科研成果。 其次是北京工业大学经济与管理学院、哈尔滨工程大学经济管理学院、太原理工大学经济管理学院,发文量均大于10 篇。 其余机构的发文量均低于10 篇。 由此可见,科技创新研究机构间的发文量差距较大,科研能力发展不均衡,今后各研究结构应加强合作,推动科技创新研究发展。

(三)作者共现分析

为探究科技创新科研领域学者间的合作关系以及具有学术影响力的作者情况, 对该领域的发文作者进行作者共现分析,运行CiteSpace 软件,节点类型选择“Author”,得到作者合作网络知识图谱,如图3 所示。 Q 值为0.9816 大于0.3,说明该网络聚类结构显著,S 值为0.9804 大于0.5, 意味着该聚类是令人信服的。

作者合作网络图谱中,节点N=141,连线E=85,即共有85 个作者之间存在合作关系。节点大小表示作者的发文量,节点间的连线反映合作关系强度。图谱中节点较多但分散,节点连线数量较少,说明学者在学术和科研上的交流不够紧密, 大部分学者是以个人或小团体进行研究, 没有形成具有权威性的大型组织。 通过分析合作作者的研究机构和研究领域发现,同一机构的学者合作广泛存在,跨机构跨学科间的合作则相对较少。

由于作者数量多,在此进一步统计、选择发文量较多的作者进行分析。整理结果如表2 所示,从高产作者发文数量统计数据来看, 发文量最多的是张永安, 十一年期间在科技创新领域共发表12 篇文章;其次是杨武、张玉喜、冯锋。

图3 作者合作网络知识图谱

结合图谱和列表信息可以看出, 以张永安为中心的合作网络影响力较大,合作网络节点最多,发文量第七的王艳妮和发文量第九的耿喆均在该合作网络中,且张永安团队各年份的颜色均有体现,说明该团队每年均有关于科技创新的研究, 研究具有延续性。科技创新研究的学者数量较多,各作者的发文量相对于总体占比都很小, 多数作者是以独立的形式发表研究成果, 节点的边线较少, 网络密度也只有0.0086,说明作者在该领域做研究较为分散,交流与合作不够密切,在未来,要争取合作共赢。

表2 高产作者发文数量统计表

三、研究热点与前沿分析

(一)研究热点分析

关键词共现分析用于挖掘学科领域的研究热点,体现学术界高度关注的焦点所在。本文先对关键词图谱中聚类内容进行归纳, 再结合关键词的中心性和频次了解科技创新研究的主要内容和热点主题。

首先,对关键词进行共现分析,运行CiteSpace软件,节点类型选择“Keyword”,以关键词作为聚类标签,绘制关键词共现知识图谱,如图4 所示。 平均轮廓Q 值为0.8313 大于0.3, 意味着划分出来的结构是显著的,聚类同质性好。S 值为0.9474 大于0.7,说明聚类结果是高度可信的。

关键词共现网络图谱中,包含463 个网络节点,878 条连线, 说明该图谱中的节点较多且分布相对集中, 关键词间的关联度较强。 网络密度只有0.0049,反映了科技创新领域的研究内容丰富,但不够深入。每一个节点代表一个关键词,节点向外延伸的不同颜色与该关键词所在年份的颜色相对应,圆圈的半径与关键词出现的次数成正比。 从关键词共现图谱可以看出, 科技创新在科研领域具有一定的延续性,是学术界一直关注的焦点。 科技创新能力、创新效率已然成为学者们研究的热点和重点。

其次,在关键词共现网络的基础上,对科技创新研究文献关键词的中心性和频次进行统计, 得到表3。 词频体现研究热度,中心性测度关键词在网络结构中的重要程度。由表中数据发现,科技创新能力的频次最高(113 次),说明学术界对该主题有较高的关注度且研究成果较多, 科技创新效率具有较高的中心度但频次较低(中心性0.36,频次39),意味着该主题在科技创新领域较为重要但关注度较低,该主题是科技创新研究的基础性焦点内容, 但截至目前研究尚不完善,缺乏进一步的分析探索。

图4 关键词共现图谱

表3 中心性较大的高频关键词

(二)前沿分析

新主题的突现代表了领域的研究前沿, 因此利用关键词突现检测功能检测某段时间内变化大的关键词, 可以探索该领域研究的新趋势。 运行CiteSpace 软件的“burstness”功能绘制科技创新突发词图谱,如图5 所示,发现突发性关键词27 个,选择“Sortbythe Beginning Yearof Burst”排序。其中,Strength代表突现度,红色区域代表关键词突变性的时间段。根据关键词突发性的集中程度发现, 科技创新领域研究的前沿主题主要分布在区域科技创新政策、随机前沿分析、科技创新效率等方面。

图5 关键词突现图谱(按突发开始年排序)

从关键词的突发性来看, 关于科技创新的相关研究具有很长的延续性,从2010 年至今该领域的研究逐步深入,研究热点主要由关注农业科技创新、地方高校、科技创新体系、区域创新能力转化为区域创新政策、随机前沿分析、科技创新效率等方面,而且关于区域科技创新能力及效率的评价和实证分析方法也是当前研究热点和研究趋势。

四、总结

本文基于可视化软件Cite Space 对2010 年至今CNKI 收录的1714 篇科技创新研究文献的年发文量、研究机构、合作作者、研究热点和前沿进行分析,得出如下结论:(1)从年发文量来看,科技创新研究领域总体上呈现增长的态势,处于稳步发展之中,随着研究的深入,可能迎来新的文献增长期。(2)在国内高产作者方面, 作者共现图谱的节点分布较为分散,合作程度较低,学者间的交流有待加强。(3)研究机构方面,研究机构众多,产出能力不均衡,研究的主要力量集中在高校和科研院所, 但尚未形成具有影响力的研究机构, 各研究机构之间缺乏深度合作,处于较封闭状态,可能导致研究的重复性,也不利于研究的长远发展。 (4)关键词共现方面,研究内容丰富,研究热点主要集中在科技创新能力、科技创新效率、实证分析方法几个方面,开始出现学科的交叉研究。 但研究密度较低,研究的关键词众多,但中心度不高。总体而言,国内对科技创新的研究发展速度较快,但研究的系统性和深入性不足[5](164)。 (5)从研究前沿来看,2010 年至今科技创新领域研究前沿主要集中在区域创新政策、随机前沿分析、科技创新效率几个方面。 这些主题值得学者们关注并加大研究力度。

因此,在今后的研究中,要注重挖掘深层次的科技创新资源, 延伸研究深度, 提高整体研究的系统性。同时要扩大区域间的合作,加强学者与研究机构间的合作,善于融合不同的理论,形成新的研究成果。

猜你喜欢
发文图谱节点
七部门联合发文 进一步完善和落实积极生育支持措施
基于图对比注意力网络的知识图谱补全
基于图连通支配集的子图匹配优化算法
一种基于链路稳定性的最小MPR选择算法
结合概率路由的机会网络自私节点检测算法
基于点权的混合K-shell关键节点识别方法
图表
校园拾趣
爷孙趣事
以牙还牙