睡美人文献与昙花一现文献的识别与特征比较*

2022-12-26 03:16高健航高继平师丽娟
情报杂志 2022年12期
关键词:睡美人专利论文

高健航 高继平 师丽娟

(1.中国农业大学情报研究中心 北京 100083;2.中国科学技术信息研究所 北京 100038)

0 引 言

一篇论文的学术影响可以通过被引频次为计量指标进行定量测度[1-2]。20世纪60年代,科研人员发现,在高被引论文中,有一部分在发表之初并未得到学界认可,但在发表多年之后由于某些原因被引数量激增。最典型的例子莫过于孟德尔于1866年所做的豌豆杂交育种实验[3],实验结果发布35年之后才逐渐被科学界认可并最终成为遗传学理论经典。起初,学者将这种现象称之为“阻滞发现”[4]、“早期发现”[5]、“迟滞承认”[6]。2004年,荷兰计量学家Van Raan将这种现象冠以童话般的名字“睡美人”[7]。与迟滞承认的睡美人现象相反,有些论文在发表之初即得到学界认可并出现较高被引频次,但持续时间很短便被遗忘,这种现象被称之为“流星”[8]或“昙花一现”[9]。目前,国内外对于上述两种现象的研究主要聚焦于文献产生原因及识别方法。

a.产生原因:从影响力维度来看,作者及期刊的知名度会在一定程度上影响学者对该篇论文的关注程度[4, 6],青年科学家由于在学界知名度不高,其学术成果被忽视的现象屡见不鲜;同时,期刊水平高低也会影响论文的受关注程度。从内容维度来看,睡美人文献多包含超前的学术思想或与当下研究范式不符而遭到学术共同体抵制,从而产生了睡美人文献。Campanario调查发现[10],有19位诺奖得主的研究成果曾遭遇学术共同体抵制、24位诺奖得主曾遭遇期刊审稿人抵制。除上述原因之外,期刊的可获得性、论文撰写语言的通用性,均影响论文的受认可程度,也是睡美人文献产生的可能原因。昙花一现文献则主要是由技术更替[11]、研究主题转移[12]等造成的。相对人文社会科学领域,工程技术领域所使用技术频繁更替,容易产生昙花一现文献;另一方面,当研究问题被解决或研究主题过时后,学术界也会将注意力转向新的方向。此外,论文的外在属性(比如,一流期刊还是非一流期刊)也可能会影响到昙花一现文献的产生[12]。

b.识别方法:现有研究主要聚焦在引文曲线拟合法、参数主观赋值法和无参数客观识别法。①在引文曲线拟合法方面,Avramescu在1979年提出5种引文曲线并对论文被引频次变化的现象进行了解释[13]。此后,李江采用曲线拟合法构建341位诺奖得主的引文分析框架[14],提出两种规则引文曲线与三种不规则引文曲线。曲线拟合法通过引文曲线的变化来揭示文献的引文变化特征,从而识别不同类型文献,计算方法简单,但需要人工观察每一条曲线,在数据量过大时,费时费力。②参数主观赋值法主要以Van Raan的三指标识别法[7]、Costas的四分位数分布统计法[9]及张家榕等的引文角β测量法[15]为代表。参数主观赋值法的优点在于操作简单且易于理解,但人为主观设定阈值缺乏一定的科学依据。此外,参数主观赋值法忽视不同学科间差异,使用相同阈值测算不同学科有失偏颇。③无参数客观识别法的代表性方法主要包括被引速率指标[16]、B指数[17]、SBc指数[18]及Bcp指数[19-21]等,该识别方法有效避免人为设定阈值的主观因素影响,同时兼顾不同学科间的差异,识别精准度得到明显提高,但公式计算过于复杂,对不同类型的文献区分并不明显。

在睡美人文献与昙花一现文献的相关研究中,从多维视角比较两类文献基本特征进而探究文献产生原因的研究还鲜有涉及。为此,本文在识别睡美人文献与昙花一现文献基础上,拟从期刊与作者、引文与自引,以及施引文献三个视角系统分析与解读两类文献的异同,进而探究两类文献产生的深层次差异。

1 睡美人文献与昙花一现文献的识别

1.1 数据采集

本文首先遴选《新英格兰医学杂志》(NEJM,NewEnglandJournalofMedicine)、《柳叶刀》(Lancet)和《英国医学杂志》(BMJ,BritishMedicalJournal)三种学术界公认的医学名刊中的高被引论文;之后计算每篇论文Bcp指数并结合四分位数识别标准,识别睡美人文献与昙花一现文献。数据来源于Web of Science(WoS)核心合集(检索日期2021年12月29日),检索表达式为“SO= (New England Journal of Medicine OR Lancet OR British Medical Journal)”。

①原始文献集。以1970年以来发表的论文为基础数据,为保证论文至少有10年的引文窗口期,将论文发表时间限定在1970—2010年,文献类型限定“Article”,共计获得原始文献114 761篇。

②引文数据集。通过WoS的引文报告功能获取①中每篇论文自发表以来到2020年各年份被引频次及总被引频次(引文截止时间为2020年12月31日),得到有效数据9 783 120条,即引文数据集。

③高被引论文集。NEJM、Lancet和BMJ三种期刊5年影响因子分别为74.699、60.39、30.313,平均每年每篇论文被引频次约为55次。在此基础上,本文参考吉林大学李贺等人的高被引论文识别方法[22],根据期刊5年影响因子及10年引文窗口期,选择②引文数据集中总被引频次大于等于530次的论文作为高被引论文集,共计3 927篇。

1.2 识别方法

1.2.1无参数指标Bcp指数

无参数指标通过综合考虑文献的相关引文数据对文献类型进行客观识别,常见识别指标包括B指数、SBc指数、Bcp指数等。通过对不同识别方法优劣的比较分析,本文选取识别优势相对显著的无参数指标Bcp 指数对样本数据进行文献类型识别。

图1 Bcp指数示意图[20-21]

Bcp指数由杜建于2017年提出[19],如图1所示,该方法采用论文年度累计被引频次百分比进行文献识别。以横坐标t表示论文发表时长,纵坐标为论文年度累计被引频次百分比,上方曲线代表“睡美人”引文曲线,下方曲线代表“昙花一现”引文曲线。文献发表年累计被引频次百分比点为(0,c0),引文窗口结束年累计被引次数百分比点为(tm,1),参考线l为纵坐标c0与ctm两点间连线,ct为论文发表第t年的累计被引频次百分比,lt为论文年龄t在参考线上对应的值,对于任意t

(1)

其中:d(t)为论文累计引文曲线到参考线l的距离,该距离最大时的时间分别定义为唤醒年(记作tw)与下降年(记作tf),d(t)计算公式如下:

(2)

Bcp 指数最大优势在于唤醒年和下降年基于论文整个引文区间进行计算,唤醒年并不是年引用次数最少的,下降年也不是年引用次数最多的。同时Bcp值取决于累积引文曲线形状并不依赖论文总被引次数,值越大,睡美人文献特征越明显,反之,昙花一现文献特征较为显著。此外,Bcp指数可应用于不同学科文献的识别。

1.2.2参数识别指标

现有无参数指标均以计算指数大小为主要目的,并不能给出确切的标准来界定是否为睡美人文献[22]。因此,本文采用无参数指标Bcp与参数指标相结合方法,给定阈值来进一步识别睡美人文献与昙花一现文献。

参数识别指标采用Costas提出的四分位数识别标准,该方法对文献引文窗口期的选择同Bcp指数相同,均考虑了文献的整个引文时间窗口。基本思路为:首先计算每篇文献在出版后获得50%累计引用频次所需时间,并将其定义为“年50% ”;其次,统计论文数据集中同年发表的所有文献及这些文献达到各自总被引频次50%时所需时间,并从小到大依次排序,将排序列表中文献分为前25%和后75%两部分;前25%文献达到总被引频次50%时所需时间的最大值,用P25来表示,后75%的文献达到总被引频次的50%时所需时间的最小值用P75表示;最后,定义文献类型标准如下:

a.昙花一现:论文“年50%”值小于该领域的P25值(< P25)。

b.延迟文档:论文“年50%”的值大于该领域的P75值(> P75)。

c.经典文献:论文“年50%”的值在P25和该领域的P75值之间(≥P25和≤P75)。

本文在测度3 927篇文献Bcp指数基础上,结合四分位数进行二次识别,保证无参数指标识别范围涵盖全面的同时,能够有效划分出经典型、“睡美人”型及“昙花一现”型三类不同类型文献。

1.3 睡美人文献与昙花一现文献分布

以3 927篇高被引文献为基础数据,测度所有文献Bcp值,数值范围为[-17.856,13.072]。结合四分位数识别标准,识别昙花一现与睡美人文献。通过计算,共有670篇文献满足睡美人文献标准,Bcp取值在[-2.627,13.072]之间,占论文总数17.06%;有734篇满足昙花一现文献标准,Bcp值取[-17.856,2.856],占论文总数18.69%。经典文献2 523篇,占比近64.25%。三种类型文献识别结果如图2所示。

图2 高被引文献Bcp值分布图

观察图2不难发现,综合四分位标准识别出的睡美人文献Bcp值多数为正,昙花一现文献Bcp值除5篇外均为负值,识别结果与Bcp指数识别标准相符合。经典文献Bcp值多为负数,相较于延迟承认,经典文献更偏向具有及时承认的特征。

分析670篇睡美人文献及734篇昙花一现文献发现,睡美人文献自1970—2003年发文数量呈上升趋势,并于2003年达发文量峰值共计39篇,此后发文量逐年走低。昙花一现文献自1970—2006年发文量逐年上升,2006年发文量达峰值共计41篇。截止到本世纪初,两类文献发文量的增多与医学领域的快速发展不无关系,但两类文献呈现其特征均需要一定的时间,这也是二者发文量在后期变低原因所在。

统计两类文献发文所属国别,睡美人文献中美国发文371篇排名第1、英国第2(180篇),二者遥遥领先于排名第3的加拿大(69篇)和第4名荷兰(32篇)。中国(10篇)位居第14位,其中中国香港地区6篇、中国大陆发文4篇。昙花一现文献中,美国以474篇位居发文数量榜首,英国148篇处于第2位,其后分别为加拿大、德国、荷兰等国家。中国(16篇)位列第18名,其中中国香港地区发文11篇,中国大陆发文5篇。

从所属机构来看,发表睡美人文献数量排名前3的机构分别为哈佛大学医学院、布列根和妇女医院(哈佛医学院教学附属医院)和多伦多大学。产出昙花一现文献数量排名前3的机构分别为哈佛大学医学院、加利福尼亚大学及布列根和妇女医院。可见,哈佛大学医学院无论在睡美人文献产出还是昙花一现文献产出方面均处于首位。

在文献受项目资助方面,两类文献中多数获得美国卫生部(United States Department of Health and Human Services,HHS)和美国国立卫生研究院(National Institutes of Health,NIH)的资助。无论是睡美人文献或昙花一现文献均是领域内高被引论文,后续研究中,学者可重点关注上述机构资助项目产出的研究成果。

2 代表性睡美人文献与昙花一现文献的特征比较

文献特征包括内容特征与外部特征两部分,分别用来直接或间接揭示文献的内涵与外在属性。作为科学研究成果的书面表达形式,文献中的标题、摘要、关键词、正文中的词、短语、句子和段落都是为表达文献的研究内容服务的[23],具体体现了研究内容中的学科类别、主题内容、基本观点、学术倾向[24];表征文献外部特征的通常包括发表时间、期刊、国别、机构、作者、基金资助等。本研究分别选取用以表征文献内外特征的期刊、作者、参考文献、引文及研究领域等对睡美人文献与昙花一现文献加以比较分析。

表1列举了睡美人文献和昙花一现文献特征明显的10篇代表性文献。

表1 睡美人文献与昙花一现文献基本信息比较

2.1 期刊与作者分析

从期刊维度来看,表1中的10篇“昙花一现”型文献,有7篇来源于Lancet,3篇来源于NEJM。论文集中所识别出的734篇“昙花一现”型文献中,233篇来源于Lancet,493篇来源于NEJM,仅有8篇来源于影响因子相对较低的BMJ。可以看出,“昙花一现”型论文绝大多数(近98.9%)来源于影响因子较高的Lancet与NEJM期刊。相比较而言,睡美人文献来源分布较为平均。表1中10篇文献有5篇来源于NEJM,3篇来源于Lancet,2篇来源于BMJ。而在所识别出的670篇睡美人文献中,240篇来源于Lancet,87篇来源于BMJ,343篇来源于NEJM。由此可见,相较于睡美人文献,“昙花一现”型论文更多发表于高影响因子期刊,因为影响因子较高的期刊可提升学术界对论文的关注度及认可度。

从作者维度来看,由于缺乏论文通信作者出生信息,参考Bayer等对科技人员职业年龄判定标准[25],将本研究中的通信作者从事首份科技工作年龄按30岁计算。对表1中睡美人文献通信作者发表该篇论文生理年龄统计后发现,有8人位于30~40岁、2人位于40~50岁之间。“昙花一现”型文献作者,5人位于30~40岁,5人位于40~50岁。总体来看,两类文献作者40岁以下的青年学者占大多数,昙花一现文献作者年龄略显偏大。

将生理年龄超过40岁的通信作者定义为年长学者,结合作者履历信息分析发现:年长学者均为该领域权威人士,具有较多代表作品。如T3“昙花一现”型文献通信作者Williams发表该篇论文年纪介于40~50岁之间,截止到1977年共发表文献194篇,论文研究领域主要分布在免疫学、生物学、神经科学等领域;T5昙花一现文献通信作者Carlson发表该篇文献年龄为50岁左右,截止到1972年共发表文献147篇,主要分布于医学、生物化学、遗传学及药理学等多个领域,是领域内享有盛誉的学者。由此表明,作者知名度可一定程度带动论文的关注程度,有较高声誉的作者在论文发表后更容易被学界所认可。

同时,相较于昙花一现文献,笔者观察到表1中睡美人文献合作者数量更少。昙花一现文献作者数量2~9人,篇均作者5.6人;睡美人文献作者数量1~7人,篇均作者3人。可见论文作者人数多少也是其受关注度的重要原因之一。通过查阅两类文献作者机构分布,10篇睡美人文献作者中,9篇论文所属作者均来自于单一机构,10篇“昙花一现”型论文作者有7篇来自于单一机构,机构数量并未有明显差异。可见作者所属机构数量的多少并未影响论文的关注程度,且两类文献的作者所属机构数量均偏少,并未像常规认知中机构所属越多传播效应越广。

综上所述,基于期刊层面,期刊影响因子的大小对期刊内论文的关注度有较为直接的影响,同行学者会更多关注于影响因子较高的期刊所刊载的文献,高影响因子期刊可对其刊载的论文影响力的传播产生正向推动作用。基于作者层面,知名学者产出的科研成果更易得到同行业的认可。此外,一篇文献作者数量越多对文献的传播产生积极影响越大,但作者所属机构的数量对传播力度影响却并不显著。

2.2 引文与自引分析

论文的参考文献可以反应已有的研究成果对作者研究的启发及认知影响,参考文献数量的多少一定程度上可以体现作者论文新颖度的高低[26]。对比分析两类文献参考文献数量发现,10篇睡美人文献中最多引用34篇,最少为零引用,篇均引用17.3篇;10篇“昙花一现”型文献最多引用57篇文献,最少引用7篇,篇均引用29.2篇,可见睡美人文献原创性更高,具有更多较新的研究观点。比对两类文献页数,睡美人文献篇均4.6页,昙花一现论文篇均4.8页,考虑到论文页数对参考文献数量影响,计算页平均引用参考文献数量,睡美人文献每页平均引用参考文献3.8篇,昙花一现文献每页平均引用参考文献6.1篇,再次证明睡美人具有更多原创观点的正确性。

论文的自引频次一定程度上也会影响论文的受关注程度。10篇睡美人文献篇均自引14.4次,昙花一现文献篇均自引38次。考虑到昙花一现文献作者数量较多,进一步计算每位作者平均自引频次发现:10篇睡美人文献共30位作者,每位作者篇均自引4.8次;10篇昙花一现文献作者共56位,每位作者篇均自引6.8次。通过查看作者自引情况,笔者发现,昙花一现文献作者自引多发生在论文发表后的2~5年,分别选取两类文献自引频次最高的两篇文章,以T2昙花一现文献和S10睡美人文献为例进行比较。

图3 昙花一现论文(入藏号:MEDINE:4137918)

图4 睡美人论文(入藏号:MEDINE:4136544)

如图3所示,该篇昙花一现文献发表于1974年10月,6位作者自引频次达68次。根据Bcp指数计算下降年方法,该篇文献从发表到下降年跨度13年,在这13年间自引59次,占总自引频次86.8%,总被引频次6.8%。1981年自引10次达到峰值,被引频次也于同年达到峰值98次。计算自引频次与被引频次间Pearson相关系数值为0.895,相关性极强。表明作者自引次数的增多可以在一定程度上带动被引频次的增长。图4所示睡美人文献发表于1974年7月,两位作者共自引41次,睡眠期25年中共自引21次,占总自引频次51.2%,表明作者在发表该篇文献后仍然从事相关主题的研究,但文献发表后的几年中年自引频次一直未超过3次,亦即作者的自引对于文献的传播并未起到较强的推动作用。

总体来看,作者对自身最新研究成果的大量自引,对其论文影响力的提升起到了正向推动作用。这样使得文章在发表初年便可达到较高的被引频次,极大程度避免文章成为睡美人文献或经典文献。睡美人文献多出自于自主性研究,虽蕴藏高质量的学术价值,但由于缺少关注度或作者本身宣传力度不够,导致研究成果发表之初不被广泛接受。

2.3 施引文献分析

睡美人文献多包含颠覆性的观点或技术上的创新,其施引文献又具有何种特点?睡美人沉睡期对其引用的论文就睡美人文献所表达的观点持何种态度?此类文献又是否具有睡美人的特征?而昙花一现文献自发表年到下降年期间,其施引文献又具有何种特性?对原昙花一现文献引文分布有何影响?从专利对两类文献的引用来看,睡美人文献和昙花一现文献技术影响力大小及技术持久力又具有何种差异呢?

2.3.1论文引用分析

选取表1中S1睡美人文献为研究数据,该篇论文总被引1 567次,1971年发表,2005年唤醒。1 567篇施引文献的被引频次在[0,2177]之间,其中不乏多篇高被引论文。本文选取被引频次排名TOP10%共计156篇文献视作对“睡美人”S1产生最大影响的施引文献。测度156篇文献发现,这些高影响力施引文献多数发表于1996年之后,主要集中发表于2002—2015年,与S1文献的唤醒期基本重合。通过对156篇施引论文进行Bcp求值并结合四分位识别法及论文总被引频次进行限制,经专家确认筛选出1篇具有“睡美人”特征的文献Theconceptsandprinciplesofequityandhealth。此篇文献发表于1992年,沉睡17年后于2009年被唤醒,Bcp值6.98,截止到2020年末总计被引733次,该论文对S1中所持观点持赞成态度。此篇文献与S1睡美人文献共被引8次,其中有1篇发表于两篇文献沉睡期,剩余7篇发表于两篇文献唤醒之后。

选取表1中T1昙花一现文献为研究数据,该篇论文总被引625次, 1971年发表,下降年为1984年,自发文到下降年期间论文共被引556次,施引文献的被引频次在[0,466]之间。选取被引频次排名TOP10%共计62篇文献视作对“昙花一现”T1产生最大影响的施引文献。对62篇文献统计后发现,这些高影响力的施引文献主要集中发表于1973—1976年间,而这个时间段恰好为“昙花一现”T1被引频次最高的时间段。对62篇文献进行Bcp求值并结合四分位数筛选,发现筛选出的论文均具有“昙花一现”特征并且多篇施引文献同T1存在共被引现象。本文选取两篇共被引频次较高的论文为分析对象。第一篇文献发表于1976年JournalofExperimentalMedicine期刊,被引292次,Bcp值-15.49,截止T1下降年之前与其共被引34次,对T1所写内容持赞成态度。第二篇文献发表于1974年Lancet期刊,被引329次,Bcp值-15.40,截止T1下降年之前与其共被引25次,对T1所含观点同样表示支持。两本期刊5年影响因子分别为11.743和60.39,均为领域内高影响力期刊。

以上研究表明,睡美人文献沉睡期间的引文同样也会有睡美人特征,这样原睡美人文献觉醒的同时也可以激发施引文献中睡美人文献的觉醒。文献引用的过程都是在前人知识的基础上知识进化的过程,是知识的选择、遗传和变异的过程[27]。因此,在睡美人文献识别基础上,未来研究可以进一步深入探讨沉睡期间施引文献的特征,发现睡美人文献的延伸价值,甚至也可以分析施引文献中高被引文献对睡美人文献觉醒的帮助。对于昙花一现文献而言,其施引文献多数与原昙花一现文献具有共被引现象,且施引文献类型也多数为昙花一现文献。发表在高影响力期刊的施引文献对原昙花一现文献的“宣传”会起到积极作用,可有效扩大原昙花一现文献的影响范围并帮助其在发表之初就获得较高被引频次。

2.3.2专利引用分析

专利对非专利引文(Non-Patent References,NPR)的引用能够反映基础研究与技术创新之间的相互关联,显示具体科学知识向不同技术领域的知识扩散轨迹,从而揭示科学知识与技术知识之间的关系。在Lens数据库中逐篇检索表1中论文的专利引用情况,共有S2、S3、S4等7篇睡美人文献被专利所引用。其中,S9文献共被专利引用40次,引用频次最高。而10篇昙花一现文献仅有1篇被专利引用。引用S9睡美人文献的40项专利中有36项专利具有同族专利,其中最大的专利族有61项复杂同族专利(US 8921344);引用“昙花一现”型T9文献的19项专利均具有同族专利,且最大的专利族有48项复杂同族专利(US 4690937)。已有研究认为,同族专利数量及专利族大小可以有效反应某项专利的技术价值和经济价值[28],可见,睡美人文献虽具有更强的技术影响力,但某些昙花一现文献也同样具备技术特性。

为探求技术层面对论文被引频次的影响因素,选择睡美人文献中被专利引用最多3篇文献S4、S9、S10为分析对象,昙花一现文献T9为分析对象。本文定义专利申请年为专利对两类文献产生影响的开始时间,并以专利被引频次作为对专利质量评价的量化指标。分析发现,3篇睡美人文献的施引专利中被引频次最高的专利申请均位于论文唤醒年之前,被引频次较高的专利申请多数集中于睡美人文献唤醒前10年至唤醒后2年,而这期间正是睡美人文献被引频次陡增的主要时期;T9昙花一现文献的施引专利被引频次排名前10位的专利中有8项专利申请年份位于论文发表5年内,可见技术层面的影响对昙花一现文献早期被引频次的增长存在一定的关联。进一步探究上述被专利引用的4篇文献近十年的专利引用情况发现,引用睡美人文献的91项专利中有66项为近十年内申请,占比72.5%,引用昙花一现文献的19项专利有89.5%集中在论文发表后5年之内,近十年申请占比为零。

专利作为技术信息有效载体,与科学文献具有同等重要的学术价值。专利的引用无疑会带动同行业学者对NPR引文的关注,进而对两类文献的被引频次起到促进作用。此外,从科学知识与技术知识间的流动性来看,相较于昙花一现文献,睡美人文献可以更好体现科学与技术间的互动,同时睡美人文献在技术价值方面也具有更强的影响力与持久力,对技术创新贡献度优于昙花一现文献。

2.4 研究领域分析

为了探索研究主题关注度对论文引用的影响,笔者截取Bcp最大值和最小值所对应的文献,通过与学科领域专家共同研读论文标题及摘要内容,提取相关主题词。之后检索获得该主题的研究领域,藉此研判领域研究进展与文献引用数量间关系。

S1睡美人文献,由Hart发表于1971年,研究主题为逆向照顾法则(Inverse care law)。Hart为英国著名的国民卫生服务(医疗保健)领域专家,被誉为世界初级卫生保健理论专家之一,开创了以医疗实践为主(Pruerice-based research)的研究,在高血压与流行病领域建树颇多,也是著名的作家、政治评论员与社会倡导者[29-31]。逆向照顾法则1971年由Hart首先提出,该理论认为:越是需要医疗照顾及社会关怀的人,其可得到的资源反而越少。也就是说,获得良好医疗保健的机会与目标人群的需要成反比[31]。在巿场机制下,该法则暴露出的情形将更为彻底。论文发表后的近20年,并未引起学界太多关注,直至2005年论文被唤醒。2019年新冠疫情的爆发,该篇论文引发学术界更广泛的讨论,逆向照顾法则正在成为有关医疗不平等争议的核心议题。在WoS核心合集中通过高级检索,输入表达式TS=(inverse care* AND law*),时间限制在1971—2020年,共计得文献444篇。如图5所示,在1990年之前,该研究方向一直处于不温不火状态,1990年之后该领域关注度有所提升,领域内发文数量开始增加,同时也带动了睡美人文献被引频次的上升;2005年后,领域发文数量涨势显著,被引频次带动效应尤为明显。计算该领域的发文量和睡美人被引频次间的Pearson相关系数值为0.921,相关性极强。由此看来,研究领域关注度的增加有利于促使睡美人文献的唤醒。

图5 典型睡美人文献(J.T. Hart,1971)

T1昙花一现文献,由Barnes等发表于1971年,研究主题为胸腺依赖淋巴细胞 ( T淋巴细胞,简称T细胞 ) 对自身免疫功能的影响。20世纪60年代,现代免疫学取得重大突破,医学界证实了胸腺为中枢性免疫器官,发现了胸腺和胸腺依赖淋巴细胞的免疫功能,开创了细胞免疫研究的新途径[32]。60年代中期,学界对T细胞和B细胞在免疫过程中相互影响与相互制约机制的研究开始兴起[33]。进入70年代,以T细胞为中心的免疫生物学研究成为该时期免疫学研究最活跃的领域之一[34],学界对于T细胞的发生、分化及功能研究,以及对T细胞抗原识别受体等方面的研究均取得较大发展[35]。在WoS中输入表达式TS=(lymphocytes* AND immunity*),时间限制在1971—2020年,共计得到文献30 434篇。如图6所示,在文章发表后几年中,文章的被引频次均高于该领域的论文发文数,学界对研究领域的关注与“昙花一现”型文献被引频次并未有直接关系。但笔者观察到,由于论文发表后前几年被引数量高于该领域发文数量,说明该篇文献被其他研究领域所大量引用,产生跨研究领域的影响。究其原因,发现随着对免疫机制的深入了解,20世纪70年代,单克隆抗体杂交瘤技术、高效免疫抑制剂的开发与应用等技术相继取得突破,进一步完善了现代免疫治疗体系。尤其是单克隆抗体和分子生物学抗体的应用,促进学界从基因、分子、细胞及整体不同层次上来深入研究免疫细胞生命活动规律与机制。值得关注的是,该领域在1991年关注度激增,共发表文章446篇,较前一年多出390篇,涉及主题领域由免疫学、普通内科、医学实验技术、微生物学、公共环境与职业健康等为数不多领域开始向肿瘤科、传染病、细胞生物学、分子生物学、外科手术、病理学、病毒学、药理学、兽医学、寄生虫学、营养学、临床神经学等领域拓展。但“昙花一现”型文献并未因此增加引用,反而逐年走低。由此说明,因缺乏足够新颖、创新的研究内容,“昙花一现”型文献并没有在多年之后被再次发掘,而是随着新理论、新方法的不断产生逐渐被学术界所遗忘。

图6 典型昙花一现文献(R.D.Barnes,1971)

以上分析表明,文献所属研究领域的关注度对该篇文献被引频次的增长有着带动作用。就睡美人文献而言,研究领域关注度的提高可以有效扩大睡美人文献在该领域的影响力进而促进“睡美人”的提前觉醒。而昙花一现文献则不然,文献影响力的大小与研究领域关注度的高低并无明显关系,并且通过上文研究所述,昙花一现文献在发表之初便得到高度认可,极有可能因为其内容的影响范围涉及多学科、多领域而得到广泛关注。

3 总结与启示

本文通过对三大医学期刊1970—2010年间论文数据进行统计,依据无参数 Bcp 指数的计算和参数四分位识别标准,识别出三大期刊高被引文献中的睡美人文献和昙花一现文献作为研究样本,并从中筛选出代表性睡美人文献与昙花一现文献,从期刊、作者与引文三个维度进行两类不同文献的基本特征比较以探究两类文献的深层次异同。

a.通过不同维度对两类文献的分析,作者发现:相较于睡美人文献,“昙花一现”型文献更多发表于高影响因子期刊,作者数量也相对较多;两类文献的通信作者年龄多介于30~40之间,其中昙花一现文献作者整体年龄偏大;睡美人文献引用的参考论文数量更少,且论文中多包含原创性、新颖性观点。此外,作者对论文的自引可以提高该篇论文的宣传力度,但睡美人文献显然不善于“营销”,自引数量较少。通过对研究领域主题与论文被引量间相关性分析,发现领域关注度的提高可以带动“睡美人”的提早觉醒。同时笔者发现,昙花一现文献也可能是因为跨领域研究,从而导致其发表初就有较高的被引频次。

b.通过研究典型睡美人文献与其沉睡期间的引文关联性发现,睡美人文献沉睡期间的施引文献同样会出现“睡美人”特征。此类文献对原睡美人文献所持观点持支持态度,这样原睡美人文献的觉醒会在一定程度上带动施引文献中具有“睡美人”特征文献的觉醒。另外,若施引文献中睡美人文献的觉醒要早于原睡美人文献,是否会带动原来睡美人文献的觉醒还需要后续进一步论证。探索昙花一现文献与其施引文献间的关系发现,二者间多具有共被引现象发生,且共被引频次较高的施引文献多发表于高影响力期刊,这对昙花一现早期被引频次的增多起到正向推动作用。

c.文献引用作为知识流动的一种重要方式,是知识选择、遗传和变异的过程,不仅扩大了知识融合,更为知识增值与技术创新提供了条件。随着科学与技术之间知识流动愈发的频繁,专利对科学文献的引用一定程度上反映了基础研究对技术创新的贡献大小。施引文献分析表明,两类文献均具有技术价值,但睡美人文献所包含的技术价值更容易得到专利的引用,同时也更具有持久性,在科学与技术的互动中,睡美人文献总体表现更胜一筹,对技术创新贡献更大。

d.就研究主题受关注程度对论文引用的影响而言,文献内容所涉及研究领域的关注度对两类文献被引频次的增长带动作用差异显著。以睡美人文献来看,本研究领域关注度的提高可以有效扩大睡美人文献在该领域的影响力进而促进“睡美人”的觉醒。而昙花一现文献则不然,文献影响力的大小与本研究领域关注度的高低并无明显关系,并且通过上文研究所述,昙花一现文献在发表之初便得到高度认可,极有可能因为其内容的影响范围涉及多学科、多领域而得到广泛关注。

关于睡美人文献觉醒原因,本文仅探讨其所属研究领域关注度提高所引发的觉醒。技术“王子”(专利)对两类文献的影响研究目前国内较少涉及,专利引用可以很好地体现科学与技术间的互动,这也是本领域下一步研究重点关注的方向。除上述考量之外,近些年替代计量学的兴起,网络对于文章的传播度的影响也是重要因素之一。笔者通过查询文章在PlumX度量中的网络影响发现,睡美人文献在网络上点赞数及提到频率远大于昙花一现文献,可见睡美人文献中的研究价值持久性较长。但考虑本文识别出的睡美人文献和昙花一现文献发表年较早,网络普及度并不普遍,日后研究睡美人文献的觉醒和昙花一现文献发表后前几年被引数量的激增,网络上的影响同样是一个值得考虑的因素。

猜你喜欢
睡美人专利论文
水中睡美人
专利
专利文摘
下期论文摘要预登
下期论文摘要预登
下期论文摘要预登
2013年5—12月最佳论文
《睡美人怕什么》等
睡美人(中)