档案学界国际论文影响力的因素分析
——基于SSCI数据库2005-2014年数据

2016-11-09 08:20周莉莉柳美君
山西档案 2016年5期
关键词:影响力多元化论文

文/周莉莉 柳美君

档案学界国际论文影响力的因素分析
——基于SSCI数据库2005-2014年数据

文/周莉莉 柳美君

文章基于SSCI数据库2005-2014年的档案学界国际论文数据,运用零膨胀负二项回归模型对论文研究机构多元化与论文的主题热度对论文影响力的影响进行了研究。实证结果表明:(1)国际档案学界论文的研究机构多元化程度与论文影响力呈倒U形关系,首先两者呈正相关,当研究机构多元化程度到达某一临界点时,论文影响力达到峰值,此后,研究机构多元化程度与论文影响力呈负相关;(2)档案学国际论文的主题热度与论文影响力呈负相关,基金数对机构多元化与论文影响力的倒U型关系有正向的调节效应。基于以上结论,本文提出了相关政策建议。

引文分析;论文影响力;档案学

2005至2014年是互联网技术迅速发展的十年,全球性的信息和信息技术革命使现代科学研究从传统、封闭的孤立系统逐渐迈向新的学科发展态势,对于本身属于信息科学范畴的档案学来说冲击尤为明显。在全球信息化的背景下,信息技术发展状况、机构学术合作情况、学者学术合作意识等均有了新的变化,这样的变化也促使国际档案学界的研究进展呈现了新的态势,其研究主客体有了新的发展,同时国际档案学界学术论文的影响力也将受到这些因素的影响。深入分析档案学界国际论文影响力的影响因素,对于提高档案学界国际论文影响力,促进学科内的知识流动,扩大学科影响力有着重要意义,同时有利于中国档案学界学者创造出高质量的国际论文。

为探究相关问题,本文进行了深入研究。在数据来源方面,本文借鉴林强等学者的检索方法[1],在SSCI期刊数据库中,以“Archives”为主题,以2005至2014年为时间区间,选择“Article”和“Proceeding paper”的文章类型,共得到3701条题录 。在研究方法方面,首先,本文基于SSCI数据库2005-2014年的档案学界国际论文数据,从研究主体的相关数据中选择论文的研究机构数来代表机构合作多元化,从研究客体的相关数据中选择论文关键词的平均频次代表主题热度,借鉴HIRSCH J E的研究选择论文频次代表论文影响力[2];然后,通过零膨胀负二项回归模型对论文机构合作多元化与主题热度对论文影响力的影响进行了研究,揭示了论文机构合作多元化与主题热度对于论文影响力的影响;最后,本文基于结论提出了建议。

一、研究现状

目前,国内外已有一定数量的探讨不同学科领域内论文被引频次的影响因素研究。基于不同的学科和不同的数据,学者对于影响论文影响力的因素的探讨有不同的结论,潜在的影响因素还有待发现,且由于方法的局限目前的大部分研究结论仅为简单的线性关系。Lutz Bornmann基于化学研究领域的数据,考察了除论文质量以外对论文被引频次具有影响作用的因素,他发现参考文献、期刊的语种、作者的声誉等对于论文的被引频次具有一定影响。同时他还发现作者的数量与论文被引的频次没有关系。[3]Jabbour, CJC以巴西可持续发展领域的研究者为例,通过问卷调查,发现作者、研究网络的声誉、文章的质量以及可获得性等因素与论文的被引频次有关。Vanclay, JK等以南十字星大学的环境科学与管理学院的教职工的论文为例,认为杂志影响因子、文章长度及类型、杂志自引与被引频次有关。[4]Tai-Quan Peng等学者以互联网研究为例,认为杂志的影响因子是影响论文被引次数的最关键因素。[5]还有学者发现被引次数的提高大于论文发表的数量的增长。[6]李江等学者以WOS和Scopus数据库中的中英双语杂志为例,对这些杂志中的中英论文的被引次数影响因素进行了探讨,他认为与英文论文相比,中文论文在引用上没有偏见,同时还发现了在Scopus数据库中存在着一个被其他中文论文引用的中文论文团体,但这种团体不存在于WOS数据库中[7]。

二、实证过程

(一)变量描述

本文所用数据来源于Web of Science数据库中的SSCI数据库,主要探究机构合作与研究热点对论文影响力的影响。在被解释变量方面,本文参考了Adams、Roberts 等人的研究,采用文章被引用次数来衡量论文的影响力[8,9]。在主解释变量方面,本文借鉴了Adams等人的方法,采用论文的机构数作为衡量论文合作的指标[8]。另一方面,本文采用每篇文章的关键词的平均频次代表关键词的热度,计算方式如公式1,以此来衡量该文章的主题热度。

公式1

其中Keywordij为第i篇文章的第j个关键词的总计出现频次,Ni为第i篇文章的关键词个数。

在控制变量选择方面,本文分别选取期刊的语种、参考文献数等作为控制变量。Bornmann等人的研究发现,期刊的语种对被引频次有着一定的影响。[3]Didegah & Thelwall等人发现,参考文献数对论文的被引频次有着至关重要的作用。[10]此外论文的发表时滞与现今时间差越长,论文的被引频次可能会越高。Vanclay等人发现文章的长度即页码数对论文被引频次也有一定的影响。[4]论文的关键词数量在一定意义上代表了论文研究的多元化程度,多元化程度越高、跨学科领域越广,被阅览的次数也越多,因此,关键词数量可能对论文的被引次数有一定影响。论文出版商所在地也可能会对论文的被引频次产生一定的影响,处于发达国家的期刊、杂志的影响力可能会更强。因此,本文选取参考文献数、关键词数、论文发表时滞、文章页码数、语种、论文出版商所在地和论文发表年份作为控制变量,见表1。

表1 变量定义

(二)回归模型选择

由于本文的因变量被引频次为含有较多0值的离散变量,所以选择零膨胀负二项分布模型进行回归。由于本文的被解释变量为论文被引频次,为计数型变量,一般不采用OLS进行回归。对此,Huasman等人建议使用Poisson回归[11,12],后续学者又将Poisson回归应用于专利[13,14]和媒体报道数[15]等研究中。然而由于Poisson回归要求变量的均值与标准差相等,但是在实际生活中,这样的要求很难实现,因此后续学者针对均值与标准差不相等的被解释变量拓展为负二项回归[16]。在回归中,某些离散型变量含有较多的0值,此时可采用零膨胀负二项回归[17]。由于本文中的被解释变量均值与标准差分别为4.391与13.190,二者相差较大,此外本文的被解释变量被引次数的分布如图1所示,可看出含有较多个0值,因此本文采用零膨胀负二项分布回归模型。

图1 被引频次变量分布图

Stata回归统计量表明本文更适合采用零膨胀负二项分布回归。Stata软件提供相应的统计量来检验采用的模型是否合理。在选择Poisson分布回归与负二项回归,使用Stata进行负二项回归时会产生α值,当α值不为0时则代表数据更适合负二项回归[18]。在选择零膨胀模型与负二项模型时,Stata在回归结果中能够产生vuong检验值,当vuong值显著大于0时即可采用零膨胀负二项分布[18]。在本文的回归结果中,α值均显著不为0,并且vuong值显著大于0,因此本文采用零膨胀负二项分布回归。

(三)研究假设

假设1:机构合作数与论文被引频次存在倒U型关系。多数学者曾经就科研合作对论文被引频次的影响进行研究,多数学者发现机构合作数对论文被引频次存在显著的正向关系[10,19-21],然而当合作机构增多时,机构的交流难度可能会增加,因此有可能当合作机构增多时,论文的被引频次会下降,因此本文提出假设1。为了验证假设1,本文在多元回归模型中,主要采用一次项公式2与加入二次项的公式3来检验主解释变量(Independence,本文和主要为Organization与Keyword Frequency)与被解释变量Citation的关系。

公式2

公式3

假设2:论文主题热度与论文被引频次存在倒U型关系。论文关键词出现频次越高,论文的研究领域越可能为研究的热点,而处于研究热点中的文章的关注度可能也较高,被浏览的次数可能会增加,因此被引次数也可能会越多。但是,当论文的主题热度过高时,由于研究的论文较多,可能导致平均被关注次数下降,被引频次降低。由此本文提出了假设2。为了验证假设2,本文采用公式4与公式5。

蒲琳大学毕业典礼上,张盈盈一袭玫红旗袍出席,一路吸睛无数,浮夸得正符合他们将毕业浮躁、不甘寂寞又骄傲的心。

公式4

公式5

假设3:论文的基金数对以上的U型曲线存在负向的调节效应。基金主要赞助高水平或创新性的研究,如国内的基金评审,往往资助创新性较强或社会价值较大的研究,因此论文的基金数在一定程度上代表了论文的质量,拥有较多的基金资助的文章的被引频次可能也越高。当论文拥有基金资助时可能会减弱机构合作数与主题热度对论文被引频次的负面影响,因此本文提出假设3。为了探索论文受资助的基金个数对以上关系的调节作用,本文引入基金与主解释变量的交叉项(如公式6)。当存在二次项时,本文借鉴祖伟等人的研究方法[22],选取二次项与基金的交叉项来探究这种调节作用,如公式7所示(Independence代表自变量Organization或Citation Frequency)。

公式6

公式7

(四)描述性统计

本文描述性统计结果如表2所示,从表中可看出,论文的篇均被引次数为4.391,标准差为13.19,这说明不同论文间的差异较大。篇均机构合作数为2.3个,且与机构合作数为正相关,说明机构合作数越多论文的被引次数越高。篇均关键词频次为7.778次,且被引次数与关键词频次为负相关,说明论文的主题热度并不能够促进论文被引频次的增加。篇均基金数为0.25个,说明含有基金的文章较少。同时被引次数与基金数成正相关,说明拥有基金越多的文章的被引频次也越高。

表2 描述性统计结果与相关系数矩阵

从表中也可看出,其他控制变量与被引频次均有着较为显著的关系。被引频次与参考文献数、发表时滞、是否为英文文章呈显著正相关,与关键词数量和论文页码数呈显著负相关。这种情况说明本文选取的控制变量具有一定的合理性。

在相关系数矩阵中,两两相关系数最大为 0.428,多数变量间相关系数小于0.15,相关性较低,因此可看出多重共线性的可能性较低。

由于相关系数矩阵仅为变量间两两相关的结果,并未考虑其他变量影响的结果,因此有必要在后续多元回归模型中进行进一步探讨。

三、实证结果及检验

(一)结果分析

本文的零膨胀负二项回归结果如表3所示,其中Model1全部为控制变量,Mode2增加了基金数Fund的调节变量,Model3与Model7分别增加了论文机构数Organization与论文关键词平均频次Keyword Frequency,Model4与Model8分别在Model3与Model7上增加了基金数、一次项与基金数Fund的交叉项,Model5与Model9分别在Model3与Model7上增加了二次项,Model6与Model10则分别在Model5与Model9增加了基金数、二次项与基金数的交叉项。在回归模型中,Model1-10对应的最大VIF值为6,小于10,因此并不存在多重共线性。在回归结果中,α值均显著不为0,说明选择负二项分布是合理的,同时Voung统计量均为大于1的正值,说明选择零膨胀负二项分布是合理的。此外,回归中卡方检验p值均为0,说明整体回归系数对被引频次的解释性是显著的。

首先,被引频次与合作机构数间呈倒U型关系。在回归结果的Model3与Model5中可以看出,被引频次与合作机构数的二次项呈显著性的负相关,与一次项呈显著性的正相关,说明被引频次与合作机构数间存在显著的倒U型曲线关系,因此证明原假设1成立。这种情况说明,在达到某一均衡值之前,合作机构数的增加有利于增加论文的被引次数,而当超过这一均衡值后,合作机构数的增加会导致论文被引频次的减少。这可能是由于当机构增加时,机构合作可以为论文带来更多的视角以及创新性;而当合作机构数过度增多时,由于合作机构间的协调难度增加,导致论文的被引频次下降。

其次,被引频次与主题热度呈负相关。在回归结果中,由Model7与Model9可以看出,主题热度与被引频次间呈显著的负相关,并且不存在U型关系,这说明主题热度的增加会导致论文被引频次的减少,因此原假设2不成立。这可能是由于当主题热度上升时,研究该主题的文章增多,研究也更偏向于专业化,后继学者的研究也更加偏向专业化,因此参考其他方向的论文可能较少,进而导致论文被引频次的下降。也可能是由于文章较多,后继学者在研究中并不能够引用全部的论文,导致论文被引频次的下降。

图2 基金对被引频次与合作机构数间倒U型的调节效应

在控制变量方面,可以看出参考文献Refer的系数均显著为正,说明参考文献数量越多,文献的被引频次越高。这与Dedegah的研究结果一致[10],说明作者引用参考文献数越多时,论文的质量越好。发表时滞的系数均显著为正,说明论文发表时间越长文献的被引频次越高。而在文章长度方面,页码数的系数均显著为负,说明文章长度的增加会降低文章的被引频次,这与Vanclay 的研究结果也一致[4]。在语种方面,是否为英文论文的系数显著为正,说明英文语种的论文较非英文语种的文章更易获得更高的被引频次,这与Bornmann 等人的研究结果一致[3]。

此外在虚拟控制变量方面,可以看出地域Region的回归系数均较为显著,说明出版商所在地与论文被引频次也有着较为显著的关系。在年份方面,所有年份虚拟变量均为显著,说明年份效应也较为明显。(见表3)

(二)稳健性检验

为了进一步验证研究结论的可靠性,本文将WOS核心集被引频次更换为论文在WOS核心、BCI 和CSCD数据库中合计被引频次,实证结果如表4和图3所示。由表4可以看出,研究结论与原回归基本一致,说明本文的研究具有可靠性。

表3 回归结果统计表

表4 稳健性检验结果

图3 稳健性检验调节效应图

四、结论及建议

首先,本文基于SSCI数据库2005-2014年的档案学界国际论文数据,从研究主体的相关数据中选择论文的研究机构数来代表机构合作多元化,从研究客体的相关数据中选择论文关键词的平均频次代表主题热度,选择论文被引频次代表论文影响力;然后,通过零膨胀负二项回归模型对论文机构合作多元化与主题热度对论文影响力的影响进行了研究,揭示了论文机构合作多元化与主题热度对于论文影响力的影响;最后,基于上述结论提出建议。

通过对数据进行分析,本文得出了以下结论:(1)国际档案学研究的论文机构多元化与论文影响力呈倒U型关系,即从0开始国际档案研究机构多元化程度与论文影响力正相关,当研究机构多元化程度到达某一临界点时,论文影响力达到峰值,此后,研究机构多元化程度与论文影响力成负相关。(2)国际档案学研究的论文主题热度与论文影响力成负相关。(3)基金数对机构多元化与论文影响力的倒U型关系有正向的调节效应。

基于以上结论,本文从研究合作、研究主题两个方面提出建议:(1)本文认为,档案学界的科技工作者在进行机构合作时,要客观看待合作多元化,在适度提倡合作多元化的同时,还要避免合作机构过多而导致的交流成本上升、合作效率下降、多方知识融合难度变大,从而导致论文影响力下降等问题。(2)科技工作者在进行研究选题时,不要过度追逐热门主题,而应选择近期较为活跃的研究前沿。(3)与无基金支持的论文相比,对有基金支持的论文,机构多元化对于论文影响力的影响程度更大,为了提升效率,有基金支持的论文应相对减少论文合作多元化程度。

本文的研究结论,在理论和实践方面都具有一定的创新性。在理论上,本文发现了论文的主题热度与论文影响力成负相关,机构多元化与论文影响力呈倒U形关系,这与已有的其他学科领域的相关研究的简单的线性关系结论有较大差异,说明了其他学科领域关于论文影响力的结论不适用于档案学界国际论文;在实践上,本文的结论也否定了目前学术界在国际论文的发表中过于强调机构间的合作发文,以及过度追逐对热门主题进行研究的现象。

当然,由于数据和方法的局限,本文也存在一些不足。在数据检索方式上,本文虽然借鉴了其他作者的常用方法,并以“Archives”为主题,避免检索到大量无关数据,但对于含有与档案学领域相关的其他术语,如“file”、“record”等的论文未能全部涵盖。同时,本文尽管借鉴了常用的合作多元化变量定义方法,且以合作多元化为论文关注点,但在合作模式的详细划分方面还有一定的欠缺。

[1]林强.我国档案学研究现状的可视化分析[J].档案学通讯,2012,(2):17-20.

[2]Hirsch J E.An index to quantify an individual's scientific research output[J].Proceedings of the National academy of Sciences of the United States of America,2005,102(46):16569-16572.

[3]Bornmann L,Schier H,Marx W,etc.What factors determine citation counts of publications in chemistry besides their quality?[J].Journal of Informetrics,2012,6(1):11-18.

[4]Vanclay J K.Factors affecting citation rates in environmental science[J].Journal of Informetrics,2013,7(2):265-271.

[5]Peng T Q,Zhu J J.Where you publish matters most:A multilevel analysis of factors affecting citations of internet studies[J].Journal of the American Society for Information Science and Technology,2012,63(9):1789-1803.

[6]Erfanmanesh M A,Didegah F,Omidvar S.Research productivity and impact of Library and Information Science in the Web of Science[J].Malaysian Journal of Library & Information Science,2010,15(3):85-95.

[7]Li J,Qiao L,Li W,etc.Chinese-language articles are not biased in citations:Evidences from Chinese-English bilingual journals in Scopus and Web of Science[J].Journal of Informetrics,2014,8(4):912-916.

[8]Adams J,Gurney K,Marshall S.Patterns of international collaboration for the UK and leading partners[J].Report commissioned by the UK Office of Science and Innovation,Evidence Ltd,2007.

[9]Roberts G G.International Partnerships of Research Excellence:UK-USA Academic Collaboration[M].University of Oxford,Wolfson College,2006.

[10]Didegah F,Thelwall M.Determinants of research citation impact in nanoscience and nanotechnology[J].Journal of the American Society for Information Science and Technology,2013,64(5):1055-1064.

[11]Hausman J A,Hall B H,Griliches Z.Econometric Models for Count Data with an Application to the Patents-R&D Relationship[J].Zvi Griliches,1984.

[12]Glaser B G,Strauss A L.The discovery of grounded theory:Strategies for qualitative research[M].Transaction Publishers,2009.

[13]Lerner J.The new new financial thing:The origins of financial innovations[J].Journal Of Financial Economics,2006,79(2):223-255.

[14]Lerner J,Sorensen M,Stroemberg P.Private Equity and Long-Run Investment:The Case of Innovation[J].J.Financ.,2011,66(2):445-477.

[15]Core J E,Guay W,Larcker D F.The power of the pen and executive compensation[J].Journal Of Financial Economics,2008,88(1):1-25.

[16]Greene W.Econometric Analysis[M].Fifth ed.Upper Saddle River:Pretice-Hall,2003.

[17]Greene W H.Accounting for excess zeros and sample selection in Poisson and negative binomial regression models[J].1994.

[18]陈强.高级计量经济学及stata应用[M].北京:高等教育出版社,2010.

[19]Narin F,Whitlow E S.Measurement of scientific cooperation and coauthorship in CEC-related areas of science[M].Commission of the European Communities Directorate-General Telecommunications,Information Industries and Innovation,1991.

[20]Gazni A,Didegah F.Investigating different types of research collaboration and citation impact:A case study of Harvard University’s publications[J].Scientometrics,2011,87(2):251-265.

[21]Sooryamoorthy R.Do types of collaboration change citation? Collaboration and citation patterns of South African science publications[J].Scientometrics,2009,81(1):177-193.

[22]祖伟,龙立荣,赵海霞.绩效工资强度对员工薪酬满意度影响的实证研究 [J].管理学报,2010,7(9):1321-1328.

G250.252

A

1005-9652(2016)05-0018-08

(责任编辑:魏登云)

周莉莉,四川大学公共管理学院,研究方向:电子文件管理与电子政务;柳美君,香港大学教育学院,研究方向:信息计量。

猜你喜欢
影响力多元化论文
德国:加快推进能源多元化
巧用“多元化”,赋能“双减”作业
天才影响力
满足多元化、高品质出行
黄艳:最深远的影响力
3.15消协三十年十大影响力事件
传媒不可估量的影响力
下期论文摘要预登
下期论文摘要预登
下期论文摘要预登