基于WoS分析的信息行为研究现状与趋势

2020-07-09 03:40王知津李圆方李巧英吴东颖陈芊颖韩峰
现代情报 2020年7期
关键词:聚类信息研究

王知津 李圆方 李巧英 吴东颖 陈芊颖 韩峰

摘 要:[目的/意义]了解国际信息行为研究现状,预测国际信息行为研究的未来趋势。[方法/过程]作者采用Citespace V分析软件,以Web of Science核心合集数据库为数据源,1 929篇期刊论文为样本,对论文的发表时间、作者、机构、国家、期刊的分布特征以及关键词共现、聚类和突现词进行分析。[结果/结论]研究重点大致分为3个阶段,体现了从一般研究到具体应用,从实践探索到理论深化的逻辑演化,同时,既有前后衔接的持续研究,又有扩大范围的拓展研究。关键词聚类大体上归纳为六大方面,最新的研究趋势是与环境保护的联系越来越紧密。较早出现的突现词持续时间较长,而较晚出现的持续时间较短,并且这些突现词之间的联系比较紧密,共同成为各个时间段的研究热点,形成了“传统—用户—深化—拓展”的比较完整的演化过程,同时,最后出现的突现词至今研究热度不减,成为研究前沿和未来趋势。

关键词:信息行为;国际研究;现状与趋势;关键词聚类;关键词共现;突现词

DOI:10.3969/j.issn.1008-0821.2020.07.016

〔中图分类号〕G202 〔文献标识码〕A 〔文章编号〕1008-0821(2020)07-0152-15

Research on the Status and Trends of Information

Behavior Based on WoS Analysis

Wang Zhijin1 Li Yuanfang1* Li Qiaoying1 Wu Dongying2 Chen Qianying1 Han Feng1

(1.Business School,Nankai University,Tianjin 300071,China;

2.Jilin Province Library,Changchun 130028,China)

Abstract:[Purpose/Significance]The purpose of this article is to understand the current status of international information behavior research,and to ptedict the future trend of international information behaviour research.[Method/Process]The authors  used the Web of Science core collection database as a data source and 1929 journal papers as a sample by the Citespace V software.The distribution characteristics of paper publication time,authors,institutions,countries or regions,journals,and keyword co-occurrence,clustering,and burst words were analyzed.[Result/Conclusion]The research focus was roughly divided into three stages,which embodied the logical evolution from general research to specific applications,and from practical exploration to theoretical deepening.At the same time,there were both continuous research before and after,and expanded research to the scope.Keyword clustering can be summarized into six major areas.The latest research trend was that the relationship with environmental protection was getting closer and closer.The earlier burst words had a longer duration,while the later burst words appeared shorter duration.The connections between the burst words were relatively close,and they have together become research hotspots in various time stages,and formed a relatively complete evolutionary process of“tradition-user-deepening-expansion”.Last burst words has not been diminished to date,and will become research hotspots and future trends.

Key words:information behavior;international studies;status and trends;keywords clustering;keywords co-occurrence;burst terms

信息行為研究一直受到专家学者的关注。Wilson T D认为,信息行为是指“参与所有与信息资源和信息渠道有关的人类活动,包括主动和被动的信息搜索和使用。”以及“基于信息资源和信息渠道人类行为的总和。”[1]信息行为最早源于图书馆学与文献学。自1948年英国皇家学会召开科学信息会议以来,信息行为研究开始兴起。随着互联网的普及和信息爆炸式增长,信息行为涉及用户生活的方方面面,信息行为的研究重点开始转向以满足用户个性化需求为目标。

在网络环境.,信息活动成为人们日常生活中不可缺少的重要组成部分。信息用户的角色也更加多样化,不仅是信息的“消费者”和“获取者”,同时也是“创作者”和“传播者”。同时,信息行为在政治、商业和医学等领域的研究也在同步进行。随着信息行为研究的深入,不仅受到图书馆学、情报学、医学和计算机科学等学科的关注,更渗透到政治学、心理学和传播学等多个领域。呈现出多学科融合以及理论与实际相结合的发展态势。

本文以Web of Science(以.称WoS)核心合集数据库为数据源,利用Citespace V软件和文献计量学方法,对信息行为研究论文的分布特征、关键词共现、关键词聚类以及突现词进行分析,描绘和呈现信息行为的研究现状、趋势和特点。

1 数据源与数据清洗

1.1 数据来源

本文所使用数据全部来源于WoS核心合集数据库,选取以信息行为为主题的期刊论文作为文献计量的分析对象。以主题(Topic)作为检索字段,检索式有6个,分别为TS=(“Information Behavior”OR“Information Behaviour”);TS=(“Information Seeking Behavior”OR“Information Seeking Behaviour”);TS=(“Information Searching Behavior”OR“Information Searching Behaviour”);TS=(“Information Search Behavior”OR“Information Search Behaviour”);TS=(“Information Retrieval Behavior”OR“Information Retrieval Behaviour”);TS=(“Information Foraging Behavior”OR“Information Foraging Behaviour”),共包含12個检索词组,文章类型为Article,语言为English,论文发表时间截至2019年12月31日,总共得到2 117篇文章,并.载为全记录纯文本格式。

1.2 数据清洗

由于检出的文献种类繁多,虽然采用精确检索,但仍有部分检索结果与本文所需要的文献无关。为此,通过浏览文章的题目、摘要和关键词,将无关文献剔除。主要的剔除类别如.:

1)篇名、摘要和关键词中均未出现上述12个检索词组中的任何一个,此类文章共12篇。

2)篇名、摘要和关键词中虽然出现了12个检索词组中的任何一个,但文章的内容与信息行为相关性较小或不相关,文章主旨并不针对信息行为。例如,主旨是“媒体供应、观众需求和美国新闻消费的地理分布”或者“投资者的财务知识和风险承担的相互作用”或者“怀孕后的再生表现”等,与信息行为的关系不大,此类文章共157篇。

3)非研究型论文。本文的目标文献类型为研究论文,与此不同的文章,如书评、书本节选等,虽然其内容是有关信息行为的语意,但不是研究型论文,对本文的研究主题无参考意义,此类文章共19篇。

经过清洗,最后共剔除188篇文章,剩余的1 929篇文献进入本研究范围。经整理发现,这些论文的发表年限为1998-2019年,故本文重点关注1998-2019年的期刊论文,并对这1 929篇期刊论文进行计量分析。

2 分布特征分析

2.1 时间分布

论文发表的时间分布可以反映研究主题的发展脉络和未来趋势,将纳入分析范围的1 929篇文章按照发表时间绘制成柱状图,如图1所示,可以直观地反映信息行为研究在1998-2019年的动态变化。

由图1可见,1998-2019年,国际上有关信息行为的研究论文数量总体上呈上升趋势。根据发文的数量和变化规律,可大致分为3个阶段:第一阶段为1998-2006年,论文发表数量每年平均在50篇以.,没有明显起伏,信息行为研究仅为少数学者关注,并未引起广泛重视,呈现较低的关注水平。

图1 信息行为研究论文的时间分布

第二阶段为2007-2013年,论文发表数量较第一阶段有大幅提升并且不断攀升,特别是2007年、2008年这两年,几乎成倍增长,信息行为研究受到更多学者的关注。第三阶段为2014-2019年,每年发文量趋于稳定,仅有小幅升落,表明信息行为研究已经日趋成熟,从前一阶段的热点关注,逐渐回归平静,向理性研究稳定发展。预计2020年还将保持稳定发展态势。

2.2 作者分布

对在1 929篇文章中署名的全部作者进行统计,共得到4 425位作者,其中发文量5篇及以上的作者共17人,如表1所示。

由发文作者共现图谱可以识别出某一研究领域的核心作者及合作关系。使用Citespace对WoS核心合集中信息行为研究论文的发文作者进行共现分析(如图2所示),得到192个节点、147条连线的作者共现图谱。

由表1、图2可知,高产作者关注的研究领域有所重叠,主要研究方向为信息行为、图书馆学、情报学、数字图书馆、数字健康,作者群较分散,但也形成了一些作者群。例如,DAVID NICHOLAS、HAMID R JAMALI和PAUL HUNTINGTON形成的作者群,主要研究数字图书馆;STEPHANN MAKRI和ANN BLANDFORD等形成的作者群,主要数字健康信息行为;中国学者吴丹(DAN WU)出现在高产作者中,研究的主要领域是情报学。

2.3 国家分布

发文国家分布如表2所示,由表2可知国际上信息行为研究的地域特点:美国是信息行为研究成果最多的国家,发文量678篇,而中国、英国、澳大利亚、加拿大等国家也是发文大国。总结发现,信息行为研究较多的国家大部分属于发达国家,发展中国家较少,但中国、南非和伊朗除外。这表明,发达国家信息化水平比较高,在完善信息行为方面的相关支持较多,这为信息行为研究提供了有利背景和必要条件。

为了从时间上反映发文国家的变化特点,采用Citespace V绘制发文国家的知识图谱,生成国家合作网络时区图,即共现图谱(如图3所示)。由图3可知,高产国家最早的发文时间,美国和英格兰出现最早,随后是加拿大和苏格兰。表示美国的圆圈最大,说明发文量最多,英国紧随其后。美国、英国、澳大利亚这些高产国家之间连线较多,说明他们不仅发表论文数量较多,而且形成了较强的合作网络。从2004年起,发文国家明显增多,信息行为研究引起全球学者的关注,开始出现了中国、南非、韩国等国家。

2.4 机构分析

在所选1 929篇研究论文的发表机构中,发文15篇及以上的机构共15个,占总量的17.26%(如表3所示),主要分布在美国、英国、加拿大、芬兰等国家,这些机构多数为综合性研究型大学且具有较大的国际影响力。

排名前3名的机构依次是谢菲尔德大学、伦敦大学学院和比勒陀利亚大学。他们都属于学术研究综合性较强且国际影响力靠前的大学,在计算机科学、信息学、医学、生命科学、法学、教育学、社会与人文科学等学科优势较明显,这些都为信息行为研究创造了很好的条件。

从发文机构合作网络可以看出机构间的科研实力对比,也能看出机构间的交流情况。由图4可见,谢菲尔德大学、多伦多大学、西安大略大学、伊利诺伊大学、纽约州立大学布法罗分校、比勒陀利亚大学等位于网络连线的主要通道上,表明这些机构处于信息行为研究领域关键位置,并且相互合作较为密切;反之,罗格斯大学、昆士兰大学等机构虽发文量较高,但合作相对较少,较为边缘化。节点的颜色深浅表示不同年份[2],伦敦大学学院、西安大略大学、华盛顿大学的节点颜色较深,表明信息行为研究的起步较早;而坦佩雷大学、比勒陀利亚大学、昆士兰大学颜色较浅,为后起新秀,起步较晚。

2.5 期刊分布

分别统计1998-2019年各期刊的载文数量,从各期刊的载文量可以发现,这1 929篇文章刊载在511种期刊上,载文10篇及以上的期刊有31种,载文总量为1 143篇。这就是说,59.25%(1 143/1 929)的文章刊载在6.07%(31/511)的期刊上,这表明信息行为研究的载文期刊相对集中。此外,还可看出,发文期刊大部分为图书馆学、情报学、计算机信息系统、卫生保健与服务、信息等类别的学术期刊,体现了信息行为研究的多学科性和交叉性。

3 关键词共现分析

关键词共现分析可以发现一个领域的研究热点、子领域及其关系和领域知识结构。本文利用Citespace V软件对信息行为研究的1 929篇文章进行关键词共现分析,形成了高频关键词表(如表5所示)和关键词共现图谱(如图5所示)。

图5的构建过程是,首先设置时间段为1998-2019年,时间切片为1年,即将1998-2019年时间区间按照1年为1个阶段进行切割。经过反复试验,将阈值设定为(2,2,20);(3,3,20);(2,2,20),阈值中分别代表关键词出现频次、关键词共被引频次和关键词共被引系数,按照前中后3个时区分别设定,其余由线性内插值来决定。

Citespace使用模块值(Q值)和平均轮廓值(S值)2个指标衡量网络的聚类结构是否显著和聚类的清晰度。当Q值在0~1之间,且Q>0.3时,划分出来的聚类结构是显著的。当Q值在0.4~0.8之间时,聚类效果比较好。S值在-1~1之间,当S值在0.7时,说明得到了可信的聚类,越接近1越能显示出不同的主题聚类[3]。图5的Q值为0.6698,S值为0.7116,表示得到的关键词聚类图谱比较理想且具有较高的可信度。

共现网络中的节点为关键词,其大小代表出现频次,频次的高低反映了研究者对此关键词的关注度。最大的节点是信息行为(Information Seeking Behavior),但由于本文的研究内容即为信息行为,为了更清晰地观察其他关键词,故将该节点隐藏。较为明显的节点是“互联网”“护理”“沟通”“图书馆”“科学”“健康信息”“生活”“学生”和“读写能力”等。

中心度是衡量关键词在共现图谱中重要性和影响力的重要指标。中心度越高,表示该关键词受到的关注越多、越重要,反之就越少,越不重要。利用Citespace软件,可以借助中介中心度识别共现网络中的拐点。本文对各个时期中心度较高的关键词进行排序,得出不同时期关键词的走向(如表6所示)。

结合2.1节对信息行为研究阶段的划分,进一步分析可见:

1)探索发展阶段(1998-2006年)。信息行为研究论文处于起步阶段,研究主题大多围绕不同工作场景或者生活情景中的用户信息行为展开,根据不同用户的信息需求、偏好和经验出现了不同的信息行为。工作场景出现了“决策制定”“系统”“设计”和“癌症”等;生活情景出现了“经验”“观点”“认知”和“选择”等,它们都具有较大的中心度。

即使在探索阶段,中心度较高的关键词也存在着演化过程:也就是说,前期的关键词大多都比较一般或空泛,如“知识”“偏好”“经验”“支持”和“认知”等;后期的关键词比较具体,如“癌症”“健康”“病患”“图书馆”和“数字图书馆”等。究其原因,在前期,信息行为的概念刚刚提出和兴起,人们大都在比较浅的层次上进行探讨,而到了后期,研究逐渐深入,开始关注和转向比较具体的信息行为研究,主要集中在不同群体针对不同信息需求产生的信息行为。同时,从趋势上看,图书馆和健康信息行为还将成为该领域的研究热点,并为信息行为的后续研究提供了基础。

2)理论深化阶段(2007-2013年)。信息行为研究发展迅速,产生了更多的研究主题。除了前一阶段图书馆与健康信息行为主题得到进一步深化外,还出现了“大学”“消费者”“信息素养”“社会网络”“干预”等中心度较大的关键词,研究的深度和广度有了拓展。理论的深化主要表现在有关信息行为的研究逐渐转向信息行为产生的原因及影响因素,并扩展到心理学和社会学等领域。Albright K S提出信息行为的心理动力学视角理论,考慮潜意识对用户信息行为的影响[4];Al-Muomen N等提出影响学生信息搜寻行为的重要因素与图书馆意识、信息素养、组织和环境问题等因素相关[5]。

3)持续平稳阶段(2014年至今)。没有出现中心度较大的关键词。虽然此阶段关键词中心度和频次均为较低水平,但关键词共现网络除了“电子健康素养”在健康信息行为研究方向上有所深入之外,又出现了“谷歌”“维基百科”“现象论”等关键词。其中,以谷歌和维基百科为代表的网络信息源受到了信息行为研究的重视。Van Velsen L等提出维基百科是规模沙门氏菌爆发期间的公众知识和预防行为中一个潜在的重要信息来源[6]。而作为主观唯心主义学说的现象论出现在信息行为研究中,表明国际上正在把信息行为研究上升到哲学层面,只关注现象本身而不重视行为主体,这是值得我国信息行为研究注意的。

通过关键词共现分析可以看出,信息行为研究经历了探索发展、理论深化和持续平稳3个阶段,从一般研究到具体应用,从实践探索到理论深化,这完全符合了人们对信息行为研究的认识过程,既有持续研究,又有拓展研究。例如,“健康、病患、癌症—护理、消费者健康信息—电子健康素养”贯穿了3个阶段,而“用户学习、偏好、经验、认知、观点、选择—信息素养、社会网络—健康信息素养、现象论”体现了3个阶段的层次递进。同时,从整体来看,信息行为研究依然围绕着研究对象的工作、生活而展开,但是研究正从表面的行为现象总结开始转向背后的影响因素以及心理学和社会学范畴,呈现多学科融合的特点。

4 关键词聚类分析

关键词聚类是“利用大量文献中共同出现的关键词对有效地反映文本关键词之间的关联强度,以结构体的方式有效地展现关键词之间的关联”[7]。“是在共词分析的基础上,以共词出现的频率为分析对象,利用聚类的统计学方法,把众多分析对象之间错综复杂的共词网状关系简化为数目相对较少的若干类群之间的关系并直观地表示出来的聚类的过程”[8]。利用Citespace的关键词聚类功能,对信息行为研究的关键词进行聚类分析,生成关键词聚类知识图谱(如图6所示)。

由图6可见,按照各个聚类包含的节点数由多到少排序,筛选出节点数在50及以上的聚类,从#0~#15共生成16个聚类。聚类的颜色代表聚类的兴起时间,即聚类颜色越深,形成时间越早;反之,颜色越浅,聚类形成的时间越近。从CitespaceV导出各个聚类的详细信息,列出聚类内的主要高频关键词,如表7所示。其中,标签词就是代表每个聚类的关键词,平均轮廓值是评价图谱网络结构和聚类清晰度的依据,平均轮廓值在0.5以上时,聚类一般认为是合理的。

根据图6和表7可见,聚类出现的时间点主要集中在2011年、2012年、2013年,轮廓值越接近于1,说明独立性越强。将这些聚类进行大致分类汇总,可以发现研究热点主要集中在医疗健康、政治应用、知识学习、信息检索技术、图书馆和环境保护共6个方面:

1)医疗健康:包括聚类#1营养信息、#10健康查询、#14在线医疗、#15健康知识4个聚类。

聚类#1营养信息,轮廓值0.719,57个节点。关键词主要包括“健康食品”“网上购物”“健康饮食”等。研究重点主要是平衡膳食、营养搭配、日常保健等。聚类#10健康查询,轮廓值0.837,38个节点。关键词主要包括“健康指标”“同类疾病监测”“流感人群”等。研究重点是疾病的检测、医疗健康知识的普及治疗、药物不良反应、预防与保健知识及其它治疗方法等。聚类#14在线医疗,轮廓值0.848,30个节点。关键词主要包括“虚拟医患关系”“健康相关信息搜索”等。研究重点是实现线上看病医疗,线上线.相结合,缓解线.压力。例如,Tsai等人提出远程医疗可以发展创新医疗保健服务,提高医疗质量和效率[9]。聚类#15健康知识,轮廓值0.818,29个节点。关键词主要包括“患者护理决策”“糖尿病患者”“慢性疾病”“自我照顾活动”“健康质量”等。研究重点是健康知识的学习与普及,包括保健、预防、诊疗、恢复全维度的知识。Yardi等人发现几乎所有的父母都会在网上搜索关于孩子健康状况的信息[10]。

以上4个聚类都涉及医疗健康,而医疗健康一直是信息行为研究的重要内容之一。在健康信息查询方面,Manafo E等发现加拿大多伦多的老年人具有寻找营养和健康信息的能力和经验[11],而Morgan A J等研究了人口统计学差异对糖尿病患者在线搜索健康信息的动机和能力的影响[12]。这表明,通过增强健康信息意识,提升健康知识查询能力,可以进行疾病防治和初步诊断。特别是通过在线医疗,可以在网上直接获取来自专业医生的有效信息,信息来源更加专业、可靠。同时,随着相关移动医疗信息设备的快速发展,作为新兴的医疗健康信息服务与管理模式,电子健康已经渗入人们生活的各个方面。

2)政治应用:包括聚类#3政党政治、#7组织变革。聚类#3政党政治,轮廓值0.793,44个节点。关键词主要包括“政府资讯网”“民主选择”“在线宣传工具”“投票行为”等。研究重点是政府政务公开,即可以通过政府网站获取政务信息,反过来,政府也可以通过网络舆情平台收集社会舆情、倾听民意。通过此种方式可以进一步提高政府政务处理效率、推动政府决策规范化。聚类#7组织变革,轮廓值0.866,39个节点。关键词主要包括“决策风格”“政治进程”“党派力量”“政治传播”等。研究重点是国际上各政党在选举过程中,各方力量利用Facebook等线上传播渠道进行政治宣传,形成政治舆论,从而获取政治利益。在公民对政治环境的信息寻求行为原因方面,Carnahan D等的研究发现,在政治上处于弱势地位的公民具有特定的认知和情感需求,这可能使他们对逆态度信息具有独特的协调性[13]。而Baxter G等对包括互联网在内的不同信息来源对选民的影响进行了研究[14]。

政治应用之所以成为信息行为研究的重要内容,其原因在于选举已经成为西方政治生活中的常态,通过互联网开展选举活动受到廣泛关注,进而重视研究选举过程中的信息行为。对于我国来说,政治应用方面的信息行为研究应当侧重于政府信息公开、政府网站建设以及网络舆情分析等主题。

3)知识学习:包括聚类#0专题知识、#2学习风格、#4自发任务、#5非公开比率。聚类#0专题知识,轮廓值0.745,58个节点。关键词主要包括“健康资讯”“网上健康资讯搜集行为”“用户信息搜索满足”“数字鸿沟”等。研究重点与医疗健康的相关聚类有所交叉,但范围更广泛,覆盖了广义信息需求的解决。聚类#2学习风格,轮廓值0.803,57个节点。关键词主要包括“获得研究知识”“深度学习者”“学生需求”“维基百科”“学生”等。研究重点是深度学习、深入挖掘,获取的信息也更加具有深度和专业性。聚类#4自发任务,轮廓值0.856,41个节点。关键词主要包括“教职工”“Web培训”“中国企业”“寻求行为”“决策支持”等。研究重点不仅限于学生群体的知识学习,更涉及教职工、企业员工等社會群体的培训上,提高目标群体的信息素养,有助于企业利用公开信息进行决策。聚类#5非公开比率,轮廓值为0.816,41个节点。关键词主要包括“谷歌学术”“非人为来源”“咨询信息”等。

以上4个聚类的研究重点有所交叉,但各个聚类中的内容又有所不同。研究重点主要是信息来源的非公开性,同时,在信息行为获取过程中,个人隐私保护也是研究重点之一。针对知识学习方面的信息行为,Shultz G V等提出,在缺乏明确指导的情况.,学生不能表现出信息素养技能的发展,因此,在使用基于问题的学习时,学生需要练习信息素养技能[15]。而Hughes H为支持信息素养的发展,提出了一个在线信息学习使用的模型,将行为、认知和情感反应与文化和语言的影响结合在一个行动研究框架中,体现了信息使用和学习之间的协同作用[16]。研究知识学习方面的信息行为是国内外的共同特征,并且显得日益重要,这将成为未来研究的趋势。

4)信息检索技术:包括聚类#6支持服务、#8采购策略、#13信息检索。聚类#6支持服务,轮廓值0.772,40个节点。关键词主要包括“数据服务”“健康信息工具”“组织管理”“生物学角度”“心理视角”等。研究重点是信息检索技术在医疗中的应用、互联网作为健康信息工具的作用。#8采购策略,轮廓值为0.865,39个节点。关键词主要包括“可测量行为”“浏览视频采集”“相同浏览模式”“采购行为”等。研究重点是信息检索技术在社会商业环境中的应用,通过用户浏览过的界面,预测用户喜好,推荐心仪产品,提高产品成交量。#13信息检索系统,轮廓值0.932,32个节点。关键词主要包括认知水平不同、用户界面概念、维基百科等。研究重点是根据不同用户的习惯提供不同的交互界面、信息推荐以及为用户提高检索效率。de Bellis E等提出大规模定制界面与文化信息处理的匹配理论会带来消费者在使用界面时的主观体验的轻松[17]。

在信息行为研究领域,信息检索技术与系统一直是传统的重要研究内容,国际上持续关注这个方面并不奇怪。Shiri A A等提出信息检索系统的用户界面在帮助用户搜索、浏览和检索与他们的需要相关的信息方面起着重要的作用,并提供了同义词词典集成为检索辅助工具[18]。此外,利用技术手段描绘用户画像,如虚拟人像的自动生成等,也必然成为信息行为研究的重点。

5)图书馆:包括聚类#12公共图书馆、#9教育程度。#12公共图书馆,轮廓值0.839,34个节点。关键词主要包括“信息学培训”“图书馆员”“技术使用”“区域差异”等。研究重点是图书馆提高读者的信息素养。Kalugho B A通过调查肯尼亚国家图书馆服务在提供信息方面的作用,得出建议公共图书馆以青少年友善计划/服务为目标、提供信息素养培养、加强网上信息服务、提供非书籍资料及提供小组讨论空间的结论[19]。#9教育程度,轮廓值0.815,38个节点。关键词主要包括“认知结构”“电子资源生产者”“技术图书馆”“电子资源用户”等。研究重点是远程图书馆服务和电子图书馆的使用等。

图书馆是信息行为研究的传统领域,在大数据时代,面对理念、技术的不断创新,图书馆和图书馆员在不断转型中得到发展。正如Fourie I提出的,“呼吁图书馆走向绿色,从信息行为的角度来吸引21世纪图书馆员的兴趣”[20]。图书馆服务如何创新,从而促进用户对信息的有效利用仍是摆在我们面前的重要研究课题。

6)环境保护:只有1个聚类#11环境保护协议,轮廓值0.946,34个节点。关键词主要包括“森林政策”“季节预报”“恶劣天气”“旅游部门利益相关者”等。研究重点是旅游者信息搜索行为和各种旅游APP,以便满足用户各阶段的旅行需求,提供不同的产品和服务。Kah J等提出,在旅行中使用导航的旅行者更有可能参与计划外的活动,增加计划外的旅行支出。目的地营销人员可以与旅游技术提供商合作,为游客提供更好的旅游体验,为旅游业创造更多的旅游收入[21]。一个新的研究重点是公众自测环境信息行为,这在一定程度上拓宽了公众获得环境信息的途径,既可保护公民自身的权益,也可保护自然环境的可持续发展。

通过关键词聚类分析可以发现,20年来,信息行为研究主要集中在医疗健康、政治应用、知识学习、信息检索技术、图书馆和环境保护六大方面,各个方面既有少量交叉,又有显著不同。医疗健康始终体现了信息行为与医疗卫生的融合,特别关注保健信息的获取与利用,包括营养信息和健康信息的查询、健康知识的获取以及在线医疗等。政治应用反映了信息行为研究不仅体现在政府的日常工作(电子政务),更是被视为影响政治竞选的重要因素之一。知识学习方面的信息行为研究体现在重视作为信息获取与利用重要能力的信息素养的培养上,而且信息素养的培养对象不仅限于学生,也延伸到教职工、企业员工。信息检索技术与信息行为具有非常紧密的联系,也是信息行为与计算机的高度融合,更是信息行为研究的永恒课题。信息行为与图书馆是另一个高度关联的领域,一直是信息行为研究的热门话题,也是经久不息的研究领域。最新的发展趋势是信息行为与环境保护的联系越来越紧密,而国际上主要反映在旅游业的信息行为,这对于我们具有较大启发性和借鉴性。

5 突现关键词分析

“突现”,是指一个变量的值在短期内有非常大的波动。突现关键词分析有助于鉴定出某一段时期内最突出的文献知识,即“文献信息的挖掘与文献知识扩散、文献知识吸收和文献知识扫描的发展进程”[22],发现研究前沿问题。根据Citespace软件的算法,将突现词出现的时间排序得到图7。

图7显示算法给出的突现强度最高的17个关键词,按照它们出现的先后顺序排列。Year代表统计起始年;Strength代表突现词的突现强度,数值越大,表明其在一个时期内突发的可信度就越高,以此来显示该领域的研究热点;Begin代表该词最早出现的时间;End代表该词最晚出现的时间。由图7可知:

1)1999年前,信息行为研究还处于初期摸索时期。如前所述,这个阶段信息行为研究的文章每年只發表10余篇,数量较少,所以这个阶段信息行为研究没有出现明显的突现词,也就是说,还没有形成研究热点。

2)1999-2006年,信息行为研究快速发展。随着互联网的普及,上网用户人数激增,网络信息行为开始成为人类行为中的重要社会现象之一,越来越多的学者开始关注信息行为的相关研究。相应地,这个阶段形成了较多的突现词,并可大致分为3批。第一批突现词出现于1999-2000年,终止于2010-2011年,包括“系统”“需求”“搜寻”“检索”,信息行为研究还处于以系统为中心的早期探索阶段,所以这些词都是较早出现的研究热点。第二批突现词出现于2002年,终止于2010-2012年,包括“设计”“信息检索”“科学”“用户”,信息行为研究开始进入以用户为中心的中期阶段,于是,这些词成为研究热点。第三批突现词出现于2003-2006年,终止于2010-2012年,包括了较多的突现词,如“万维网”“模式”“内容”“科学家”“护理”“生活”“电子期刊”,信息行为研究进入深化阶段,这些词成为研究热点。

以上3批突现词的终止时间比较接近,因此可以看成是同一阶段。从信息行为研究快速发展时期的突现词来看,随着信息用户网络获取与利用越来越方便,研究热点经历了“传统—用户—深化”的演化过程,学术界开始关注信息活动中用户行为各个方面的问题,这完全符合人们的认识规律,从深化的角度看,也为信息行为的拓展研究奠定了基础。

3)2016-2017年,信息行为研究进入成熟拓展阶段,突现词出现于2016-2017年,至今尚未终止,包括“社交媒体”和“信任”。这两个词之所以成为研究热点,社交媒体的进一步扩展是其演化的直接动因。

随着社交网站的出现,社交网络中的信息行为开始受到专家学者们的关注。人们通过社交媒体中的收集、收藏、保存和分享信息的行为,满足个人的信息需求。Shehata A M K发现大部分社会科学和人文学者使用社交媒体作为从事学术交流实践的渠道,并交流他们的研究成果[23]。当前,社交媒体已经渗透到社会的方方面面,成为人们日常生活的重要组成部分,无论是工作还是学习,所有的信息行为都可以与社交媒体相关联,所以对社交媒体的研究尤为重要。可见,社交媒体已成为信息行为研究的前沿和趋势。同时,还存在社交媒体用户信息过载的现象,从而引起了对相应问题的研究,也成为研究热点之一。

信任作为社会学中的一种依赖关系,人们通常通过信任来判断一件事情是否可行。用户对信息媒体、娱乐媒体的信任可影响信息使用行为和看法;健康信息信任度也会影响患者搜寻健康信息行为[24]。信任对不同类型信息行为的影响,不同环境.信任对信息行为的影响等,都成为了信任对信息行为影响的研究热点与趋势。Li J等对社交媒体健康信息搜索和共享的影响因素进行了分析,了解到叙述的连贯性和叙述包对不同社会经济地位人群信息采纳意愿的影响[25]。Mothe J等也提出了维基百科是否应该被视为可信的来源的质疑[26]。这表明,由于社交媒体上的信息鱼龙混杂,辨别真实可靠的信息、剔除虚假无用的信息的依据之一又与人们对信息平台的信任息息相关。

社交媒体和信任成为突现词表明,信息行为研究在经历了“传统—用户—深化”的演化过程之后,又延伸到拓展,从而形成了“传统—用户—深化—拓展”的完整演化过程,这是人们的认识水平继续提升和深化的必然结果。研究热点发展变化的脉络比较清晰。

从突现词分析结果来看,在本文样本数据的时间范围内,共形成17个突现词,1999年前,由于研究成果较少,未能出现突现词;从1999年开始出现突现词,经过细分,突现词可以分为3批,其终止时间大致相同,都在2010-2012年,所以它们属于同一阶段,共15个突现词。这说明信息行为研究发展迅速,已经形成规模,标志着信息行为研究处于鼎盛时期,但每一批突现词都有各自的特征。2016-2017年出现的2个突现词至今仍在持续,尚未终止。这说明社交媒体和信任将继续成为未来几年的研究热点。

6 结 论

本文运用文献计量学方法,以1998-2019年WoS核心合集数据库中信息行为研究的期刊论文作为数据源,借助可视化软件Citespace V,对信息行为研究的分布特征、研究热点和趋势等进行可视化分析和客观描述。研究发现和结论如.:

1)期刊论文分布特征。①时间分布:国际上有关信息行为的研究大致可分为3个阶段:第一阶段(1998-2006年),论文数量每年平均在50篇以.,虽然整体呈增长态势,但信息行为研究并没有引起广泛关注;第二阶段(2007-2013年),发文量不断攀升,几乎成倍增长,受到了更多学者的关注;第三阶段,2014年以来,每年发文量趋于稳定,有小幅度的升落,表明信息行为研究已经日趋成熟。②作者分布:发文5篇及以上的作者共有17人,高产作者关注的领域整体上较为分散,也有重叠部分,研究方向主要为信息行为、图书馆学、情报学、数字图书馆、数字健康。③国家分布:发表论文数排在前列的国家为美国、英国、南非、荷兰、澳大利亚、加拿大、中国,并形成了较强的合作网络。④机构分布:发表论文数较多的机构为谢菲尔德大学、伦敦大学学院和比勒陀利亚大学,伦敦大学学院、西安大略大学、华盛顿大学信息行为研究的起步较早,坦佩雷大学、比勒陀利亚大学、昆士兰大学起步较晚。⑤期刊分布:发表信息行为研究的期刊所属领域相对集中,主要研究方向为图书馆学、情报学、医学、管理学等,还涉及计算机信息系统、卫生保健与服务等领域,说明信息行为研究具有多学科性和交叉性。

2)通过关键词共现分析发现,信息行为的研究重点总体上分成3个阶段:第一阶段(1998-2006年),主题大多围绕不同工作场景或者生活情景中的用户信息行为展开,侧重于不同用户为解决工作、生活中的问题而进行的搜索行为。在这个阶段,中心度较高的关键词存在一定的演化过程,即前期的关键词大多都比较一般或空泛,而后期的关键词则比较具体、明确。其原因在于,信息行为的概念在前期刚刚被提出来,人们大都在比较浅的层次上进行探讨,而到了后期,研究逐渐深入,开始关注和转向比较具体的、明确的信息行为研究,主要集中在不同群体针对不同信息需求产生的信息行为。并且从趋势上看,图书馆和健康信息行为将成为该领域的研究热点。第二阶段(2007-2013年),信息行为研究发展迅速,产生了更多的研究主题,在第一阶段的基础上,研究的深度和广度有了拓展。中心度较高的关键词逐渐转向信息行为产生的原因及影响因素,并扩展到心理学和社会学等领域,注重理论研究成为这个阶段特点。第三阶段(2014年至今),这个阶段关键词的中心度水平较低,没有形成中心度较大的关键词,但在关键词共现网络中,在健康信息行为研究方向上得到了进一步的深入,并且还出现了网络信息源等关键词,这表明,信息源开始受到信息行为研究的重视。与此同时,从哲学层面研究信息行为成为一个新的研究方向。由此可见,信息行为研究的3个阶段体现了从一般研究到具体应用、从实践探索到理论深化的逻辑演化,这与人们对信息行为研究的认识过程是一致的。此外,既有前后衔接的持续研究,又有扩大范围的拓展研究,充分体现了阶段性和层次性的递进关系。

3)通过关键词聚类分析发现,信息行为研究内容的聚类先后出现在2007-2015,并可以归纳成医疗健康、政治应用、知识学习、信息检索技术、图书馆和环境保护六大方面。这六大方面既有少量交叉,又有显著不同。其中,医疗健康始终体现了信息行为与医疗卫生的高度,并且特别关注保健信息的获取与利用以及在线医疗等。政治应用反映了信息行为研究不仅反映在政府的日常工作上,更被视为影响政治竞选的重要因素。在知识学习方面,特别重视作为信息获取与利用重要能力的信息素养的培养上,而且信息素养的培养对象不仅限于学生,也延伸到教职工、企业员工。信息检索技术历来与信息行为具有非常紧密的联系,更是信息行为的持续研究课题。图书馆也是与信息行为高度关联的领域,从来都是信息行为研究的热门话题,当然也是未来研究的持续领域。信息行为研究最新发展趋势是与环境保护的联系越来越紧密,这在国际上主要体现在旅游业的信息行为,但我国在这方面却重视不够。

4)通过突现关键词分析发现,信息行为研究共有17个突现词,最早出现于1999年。其中,前15个突现词持续时间较为相同,即虽然开始不同,但结束时间大体相同。这表明,一方面,较早出现的持续时间较长,而较晚出现的持续时间较短;另一方面,这些突现词之间的联系比较紧密,共同成为一段时间的研究热点。同时,这些突现词也体现了信息行为研究热点的“传统—用户—深化”演化过程,逐渐关注信息活动中用户行为的各个方面,这完全符合人们的认识规律。最后出现的两个突现词是“社交媒体”和“信任”,至今研究热度不减,成为信息行为研究的前沿和未来趋势。突现词“社交媒体”和“信任”的出现表明,信息行为的研究热点在经历了“传统—用户—深化”的演化过程之后,如今又延伸到拓展,形成了“传统—用户—深化—拓展”的比较完整的演化过程,这是人们的认识水平不断提升和深化的必然结果。

参考文献

[1]Wilson T D.Human Information Behavior[J].Informing Science,2000,3(2):49-56.

[2]刘光阳.CiteSpace国内应用的传播轨迹——基于2006-2015年跨库数据的统计与可视化分析[J].图书情报知识,2017,(2):60-74.

[3]陈悦,陈超美,刘则渊,等.CiteSpace知识图谱的方法论功能[J].科学学研究,2015,33(2):242-253.

[4]Albright K S.Psychodynamic Perspectives in Information Behaviour[J].Information Research,2011,16(1):95-116.

[5]Al-Muomen N,Morris A,Maynard S.Modelling Information-seeking Behaviour of Graduate Students at Kuwait University[J].Journal of Documentation,2012,68(4):430-459

[6]van Velsen L,Beaujean D J M A,van Gemert-Pijnen J E W C,et al.Public Knowledge and Preventive Behavior During a Large-scale Salmonella Outbreak:Results from an Online Survey in the Netherlands[J].BMC Public Health,2014,(14).

[7]馮璐,冷伏海.共词分析方法理论进展[J].中国图书馆学报,2006,(2):88-92.

[8]钟伟金,李佳,杨兴菊.共词分析法研究(三)——共词聚类分析法的原理与特点[J].情报杂志,2008,(7):120-122.

[9]Tsai J M,Cheng M J,Tsai H H,et al.Acceptance and Resistance of Telehealth:The Perspective of Dual-factor Concepts in Technology Adoption[J].International Journal of Information Management,2019,49(3):34-44

[10]Yardi S,Caldwell P H Y,Barnes E H,et al.Determining Parents Patterns of Behaviour When Searching for Online Information on Their Childs Health[J].Journal of Paediatrics and Child Health,2018,54(11):1246-1254.

[11]Manafo E,Wong S.Exploring Older Adults Health Information Seeking Behaviors[J].Journal of Nutrition Education and Behavior,2012,44(1):85-89.

[12]Morgan A J,Trauth E M.Socio-economic Influences on Health Information Searching in the USA:The Case of Diabetes[J].Information Technology & People,2013,26(4):324-346.

[13]Carnahan D,Garrett R K,Lynch E K.Candidate Vulnerability and Exposure to Counterattitudinal Information:Evidence from Two US Presidential Elections[J].Human Communication Research,2016,42(4):577-598.

[14]Baxter G,Marcella R,Chapman D,et al.Voters Information Behaviour When Using Political Actors Web Sites During the 2011 Scottish Parliament Election Campaign[J].Aslib Proceedings:New Information Perspectives,2013,65(5).

[15]Shultz G V,Li Y.Student Development of Information Literacy Skills during Problem-Based Organic Chemistry Laboratory Experiments[J].Journal of Chemical Education,2016,93(3),413-422.

[16]Hughes H.Responses and Influences:A Model of Online Information Use for Learning[J].Information Research,2006,12(1):904-918.

[17]de Bellis E,Hildebrand C,Ito K,et al.Personalizing the Customization Experience:A Matching Theory of Mass Customization Interfaces and Cultural Information Processing[J].Journal of Marketing Research,2019,56(6):1050-1065.

[18]Shiri A A,Revie C,Chowdhury G.Thesaurus-enhanced Search Interfaces[J].Journal of Information Science,2002,28(2):111-122.

[19]Kalugho B A.The Role of the Kenya National Library Service in the Provision of Information for Youth Empowerment in Nairobi County,Kenya[J].Journal of Librarianship & Information Science,2018,50(1):88-102.

[20]Fourie I.A Call for Libraries to Go Green:An Information Behaviour Perspective to Draw Interest from Twenty-first Century Librarians[J].Library Hi Tech,2012,30(3):428-435.

[21]Kah J A,Lee S H.Beyond Adoption of Travel Technology:Its Application to Unplanned Travel Behaviors[J].Journal of Travel & Tourism Marketing,2014,31(6):667-680..

[22]程結晶,丁慢慢,朱彦君.国外信息管理领域知识流的新兴趋势及可视化分析[J].现代情报,2017,37(4):170-177.

[23]Shehata A M K.Exploring the Scholarly Communication Styles of Arab Social Science and Humanities Scholars[J].Learned Publishing,2019,32(4):304-311.

[24]贾学义.信任对信息行为的影响研究述论——基于Web of Science核心集[J].宁夏大学学报:人文社会科学版,2018,40(Z1):138-144.

[25]Li J,Tang J,Liu X,et al.How Do Users Adopt Health Information from Social Media?The Narrative Paradigm Perspective[J].Health Information Management Journal,2019,48(3):116-126.

[26]Mothe J,Sahut G.How Trust in Wikipedia Evolves:A Survey of Students Aged 11 to 25[J].Information Research,2018,23(1):783.

(责任编辑:郭沫含)

猜你喜欢
聚类信息研究
FMS与YBT相关性的实证研究
辽代千人邑研究述论
视错觉在平面设计中的应用与研究
EMA伺服控制系统研究
基于DBSACN聚类算法的XML文档聚类
基于高斯混合聚类的阵列干涉SAR三维成像
一种层次初始的聚类个数自适应的聚类方法研究
自适应确定K-means算法的聚类数:以遥感图像聚类为例