基于CiteSpace的突破性创新知识图谱研究*
——以1991—2018年WoS和CSSCI数据为例

2020-10-26 06:39刘国巍程圣洁
桂林航天工业学院学报 2020年3期
关键词:突破性热点聚类

刘国巍 程圣洁

1 桂林航天工业学院 产学研协同创新与创业研究中心,广西 桂林 541004; 2 电子科技大学 经济与管理学院,四川 成都 611731

“突破性创新”是根据熊·彼特的“创造性破坏”理论发展而来的,其概念由Chritensen于2003年在突破性技术的基础上正式提出[1],指技术、服务、商业模式经过市场或技术、方法的不连续性变化而发生了生产效率的跃进式提升,并引起能够颠覆主流市场印象的革命[2-7]。有学者认为,突破性创新对原有市场或技术的破坏引导着新市场的开辟,冲击着原有行业的竞争态势,机遇往往在此时随之出现,故突破性创新能够帮助发展中国家和部分企业从根本上撼动其他国家或企业的垄断地位,从而实现经济的腾飞(付玉秀和张洪石,2004)[8]。因此,我国作为发展中国家,针对“突破性创新”这一新兴领域的研究将具有重要价值及意义。

目前,对“突破性创新”相关文献进行综述撰写的国内学者,其研究焦点多汇聚于厘清突破性创新的概念,分析突破性创新的特征及演化路径[9-11]。此外,还有一些研究者运用各种实证案例来剖析突破性创新的产生动因及作用机理[12-14],或是从行业的角度分析突破性创新的必要性[15],较少有学者通过科学计量的手段对未来的“突破性创新”热点研究领域进行分析。

科学计量作为一种定量的文献数据分析方法,较定性分析而言更不易受主观意志的影响,具有更高的可信度。同时,陈傲和柳卸林(2011)认为被引科学知识结构的变化是创新的一个重要指标[16]。因此,本文将通过科学计量的方式,即运用CiteSpace这一科学计量工具,从“突破性创新”相关文献共被引网络中挖掘出这些被引科学知识之间的联系与规律,探究“突破性创新”的知识基础、研究前沿、热点及趋势,为“突破性创新”领域的后续研究提供数据及理论方面的支持。

1 研究方法与数据获取

1.1 研究方法

CiteSpace全称为Citation Space,由美国德雷赛尔大学的陈超美教授研发,是一款主要用于分析共被引文献之间的分布、关系与潜在信息的信息可视化科学计量软件。CiteSpace可以将经过计算分析后得到的数据信息用可视化的图案进行呈现,以便让使用者更快地在目标研究领域内进行定量或定性的研究,获知领域内各知识之间的关系及规律[17]。它的主要运用范围有:对文献作者合作网络、机构合作关系、研究前沿、研究热点和研究趋势进行计算及共现分析工作。使用者可以使用中文文献数据网站,如中国知网CNKI、CSSCI作为数据源,也可以使用外文文献数据网站,如Web of Science(WoS)的文献数据[18],在此次研究中,本文选择了1991年至2018年中CSSCI与WoS中的相关论文作为这次分析的数据来源。

1.2 数据获取

研究初始阶段,本文以“突破性创新”为关键词进行中文文献部分的研究,在CSSCI数据库获取149篇相关论文,通过图1可以发现1999年至2006年相关文献数量在缓慢增长,2006年之后发文量出现较大波动(拟合指数R2=0.473 6),说明突破性创新相关课题的研究仍在发展初期阶段,故没有趋于稳定。外文文献则来自WS核心数据库,数据采集以breakthrough innovation(突破性创新)、radical innovation(突破性创新)、disruptive technology(颠覆性技术)、radical technology(突破性技术)、creative destruction(创造性破坏)、technological breakthrough(技术突破)、significant technological change(重大技术变革)、discontinuous innovation(不连续性创新)为关键词,共收集6 776篇相关文献(如图2所示)。1991年至2004年期间,基于WoS的“突破性创新”文献数量较为平稳,2004年之后呈稳定增长趋势(拟合指数R2=0.782 7)。

图1 CSSCI文献数量

图2 WoS文献数量

2 结果分析

2.1 科学领域结构

科学领域结构包括了“突破性创新”相关课题的学科领域、研究者研究方向之间的联系和各机构间的合作关系,是“突破性创新”研究体系架构的表现。通过对CSSCI和WoS核心数据库中相关文献数据的统计,本文得出医学和工程学以及自然科学(包括化学、物理学、生物学、数学)等理工类学科领域出现突破性创新次数较多(如图3)。其中,医学在所有学科领域结构中占比最大,达到17%,说明该领域出现颠覆行业认知,推动社会发展的创新技术概率较大。

图3 学科领域结构

本文基于CSSCI中文数据库,运用CiteSpace软件中的Cited Author及Institution节点,生成了如图4 (a)所示的科研人员合作网络图及如图4 (b)所示的研究机构合作网络图。由图可知国内作者节点分布十分松散,各作者之间联系并不紧密,合作次数较少,并不能形成较完整的合作网络。各大研究机构之间无连线,合作不紧密。

图4 CSSCI合作网络

同理对WoS核心数据库数据进行分析,获取了WoS科研人员合作网络图(图5 (a))和WoS研究机构合作网络图(图5 (b)),并经整理得到前十位研究者的简介及节点统计数据(如表1)及前十位机构节点统计数据。WoS的网络图显示作者多为中国籍或是华裔,节点较CSSCI而言紧密了很多,并明显分为四个合作群,分别为:以ShiQing Zhou、NaiYun Gao为中心的合作群;以Hui Zhang、Yan Wang为中心的合作群;以Jun Ma为中心的合作群以及以Qian Sui、ZhaoFu Qiu、ShuGuang Lu为中心的合作群。其中ShiQing Zhou、NaiYun Gao与同济大学环境科学与工程学院有密切联系,Qian Sui、ZhaoFu Qiu、ShuGuang Lu则都来自华东理工大学资源与环境工程学院。通过表1,发现突破性创新相关研究学者多研究资源与环境方向(前10名作者中有8名来自资源与环境学院),研究者所属机构主要分布在上海(华东理工大学、同济大学)、南京(南京农业大学)等华东地区。

与CSSCI相比,WoS科研机构之间的合作联系也加强了许多,主要分为两个集群:以Univ Oxford 牛津大学、Univ Cambridge剑桥大学、Univ Manchester曼彻斯特大学等英国机构为中心的国外机构,和以中国科学院大学、清华大学、同济大学等机构为中心的国内科研机构。国外机构节点更多,节点之间联系更紧密,说明较多国外机构进行突破性创新领域的研究,且各机构间合作频繁;而国内机构节点数量少,共现节点普遍偏大,说明突破性创新在国内是新兴研究领域,中国科学院大学、哈尔滨工业大学与清华大学等国内机构近年对突破性创新的关注度高。

图5 WoS合作网络

表1 WoS部分(前十)作者节点统计数据

2.2 知识基础与研究前沿

“突破性创新”相关论文的文献共被引网络构成了该领域的知识基础。单个知识基础点累积成知识面后则形成了研究领域,故对热点知识基础进一步聚类分析并命名,就得到“突破性创新”的研究前沿。基于CiteSpace的Cited Reference节点及聚类功能,本文对“突破性创新”相关的CSSCI及WoS文献进行了共被引关系的深度挖掘,得到了如图6所示的“突破性创新”知识基础与研究前沿聚类网络图(由于版面受限,故过滤了连通度过低的聚类结果,并导致聚类结果不连续)。

图6 “突破性创新”知识基础与研究前沿聚类网络图

通过CiteSpace软件LLR算法的计算,得到聚类后的“突破性创新”知识基础与研究前沿图谱Modularity Q值等于0.786 1,大于0.3,展现出其较为显著的网络社团结构及聚类结果的合理性;网络密度为0.007 3,表明部分知识基础节点分布离中心区域过远,影响了整体密度;Mean Sihouette值等于0.372,小于0.5,说明网络同质性较低,通过进一步对Summary of Clusters进行分析,发现由于聚类数量过多(共计154个聚类)且有96个聚类内部成员过少,使Sihouette值为0,从而影响了网络整体的同质性。

经过分析整理,本文得到了连通度最高且同质性合理的13个聚类结果,并以此作为“突破性创新”的研究前沿领域(如表2所示),其中前11类,即#0 Radical innovation(激进创新)、#2 Sustainable development(可持续发展)、#3 Market-based breakthrough innovation(基于市场的突破性创新)、#4 Biotechnology industry(生物技术产业)、#6 Open innovation(开放创新)、#7 Harnessing tacit knowledge(利用隐性知识)、#9 Strategic mapping(战略映射)、#10 Private sector(私营部门)、#11 Kidney cancer(肾癌)、#12 Developing electric vehicle(开发电动汽车)、#15 Labour market relationship(劳动力市场关系)有突出的聚类特征,文献规模大于10;后两类,即#18 Integrated scenario analysis(集成情景分析)、#24 Startups attractiveness(初创企业的吸引力)聚类特征较不明显。

表2 聚类总结表 (采用LLR算法,Show the Largest Connected Component Only)

经过归纳总结,本文将上述13个聚类总结为以下概念模型(图7)。

图7 研究前沿概念模型

2.3 研究热点与研究趋势

2.3.1 研究热点

学者们各自研究的领域出现高度重合的部分即为研究热点。通过CiteSpace软件中的Keywords节点,可以得到“突破性创新”相关文献关键词共现图谱,并从关键词聚类中反映出高度重合的研究领域,从而得出“突破性创新”的研究热点。对CSSCI样本数据与WoS数据共同进行分析,并通过LLR聚类算法,本文得到了如图8所示的“突破性创新”主题共现网络和主题共现网络聚类图。

图8 主题共现网络

由图7可知,“突破性创新”主题共现网络结构复杂,节点分布无显著特征。所得主题聚类共有6个,分别是:#0 new product development(新产品开发)、#1 kidney cancer(肾癌)、#2 aqueous solution(水溶液)、#3 antioxidant activity(抗氧化活性)、#4 political economy(政治经济)、#5 shared vision(共同愿景)、#6 human breast cancer cell(人类乳腺癌细胞)。结合CiteSpace中的Summary Table及聚类信息汇总表,本文得到了频次最高的25个核心热点并对它们进行归纳,如表3所示。

利用CiteSpace的“Timezone”功能可生成突破性创新相关文献关键词共现时区视图(见图9),通过时区图可以清晰地看到“突破性创新”领域的知识演进过程,时区中的连线说明了研究的传承情况。对节点大、共现度强的关键词进行整理(见图10(a)、(b)),本文得出突破性创新的研究热点主要分为两个阶段:第一、以innovation(创新)、performance(性能)、technology(技术)等关键词为主的宏观层面的突破性创新阶段(1994年—2005年);第二、以degradation(降解)、aqueous solution(水溶液)等关键词为主的微观层面的突破性创新阶段(2005—至今),印证了上文突破性研究热点分类的合理性。

图9 关键词共现时区

2.3.2 研究趋势

基于研究热点的结果对关键词进行突变检测,并结合突破性创新相关文献关键词共现时区图中的热点关键词的演变,得出“突破性创新”的最新研究趋势。运用CiteSpace“Burstness”功能对相关关键词进行突现性探测运算,当α1/α0=1.1、γ[0,1]=0.7,其他参数取默认值时,得到突现强度最大的25个关键词信息表(表4)。为获得最新的研究趋势,本文对突现时间发生在“突破性创新”热点演变第二阶段(2005年—至今)的关键词进行重点分析。

表3 研究热点汇总表

表4 突现强度最大的25个关键词信息表

由表4可以得出自2005年开始,突现性较强的关键词有LLR算法下属于aqueous solution(水溶液)聚类的technological change(技术变革)、属于antioxidant activity(抗氧化活性)聚类的antioxidant activity(抗氧化活性)、属于political economy(政治经济)聚类的technology(技术)及LSI算法下属于impact(影响)聚类的climate change(气候变化)。在25个高突现值的关键词中,同属于antioxidant activity(抗氧化活性)聚类的capacity(能力)和antioxidant activity(抗氧化活性)的突现时段均为2010年至2018年,说明这两个主题的突现可能仍在发生,研究者们将重点研究抗氧化活性等医学领域内的相关课题。此外,通过对“水溶液”聚类的进一步研究,我们发现该聚类下还包含了photocatalytic degradation(光催化降解)、organic contaminant(有机污染物)等聚类中心度较高,且与环保密切相关的词汇。同时,“政治经济”聚类下,除技术外还存在着economic growth(经济增长)、south Korea(韩国)、financial liberalization(金融自由化)等聚类中心关键词。因此,本文综合上述聚类数据,总结得出突破性创新领域未来研究趋势如下:①生物技术在环保领域中的突破性创新研究;②医药领域中抗氧化活性相关的突破性技术或应用创新研究;③金融自由化等政治经济因素对韩国企业产生突破性创新的影响;④气候变化对能源环境等领域内突破性创新的出现频率的影响。

3 结论

为完善“突破性创新”这一新兴研究领域的研究体系,本文运用CiteSpace软件,对中外共计6 925篇相关文献进行了计量分析,梳理并总结了“突破性创新”的研究领域结构、研究前沿、热点及研究趋势,得出以下结论:

(1)科学领域结构方面,突破性创新在医学和工程学以及自然科学等理工类学科领域内出现次数较多。国外在“突破性创新”领域内的研究对比尚未形成较完整的合作研究网络的国内而言更为成熟,且相关课题学者多为研究资源与环境方向的中国籍或华裔人士。

(2)知识基础与研究前沿方面,“突破性创新”的研究模型为金字塔状,主要包括基础、方法、技术、应用这四个层面。在基础层面的支持下,企业可以通过方法创新技术,并将技术投入最终的应用层面,其中可持续发展思想贯穿了整个突破性创新过程。

(3)研究热点与研究趋势方面,突破性创新的研究热点主要分为宏、微观两个阶段,其未来的新兴研究趋势主要集中在能源环境、医药等需要生化技术的领域,具体为生物技术在环保领域中的突破性创新研究;医药领域中抗氧化活性相关的突破性技术或应用创新研究;气候变化对能源环境等领域内突破性创新的出现频率的影响以及金融自由化等政治经济因素对韩国企业产生突破性创新的影响。

猜你喜欢
突破性热点聚类
特别策划《突破性创新与突破性创新设计研究综述》
“双超”油菜新品种选育取得突破性进展
热点
基于K-means聚类的车-地无线通信场强研究
热点
结合热点做演讲
基于高斯混合聚类的阵列干涉SAR三维成像
新形势下湖北省体育产业突破性发展思考
基于Spark平台的K-means聚类算法改进及并行化实现
基于改进的遗传算法的模糊聚类算法