记忆与语言研究发展动向:基于《记忆与语言杂志》的文献计量分析

2024-01-02 14:30林雨萌郑清颖梁君英
应用心理学 2023年6期
关键词:词组语料库心理学

林雨萌 郑清颖 梁君英

(浙江大学外国语学院,杭州 310058)

1 引言

作为认知科学的一个分支,语言心理学探究人们如何理解、产出并习得语言(Carroll,1986)。随着语言学、心理学、认知科学、计算科学等学科的发展,语言心理学的研究领域不断拓宽,研究焦点不断变化。探索语言心理学领域发展动向对深入了解该学科的演变历程、把握该领域未来发展方向具有重要意义。

文献计量学的概念最早由Alan Pritchard(1969:348)提出,即“将数学和统计学的研究方法应用到文献体系的研究”,旨在探讨科学技术的特征和规律。文献计量分析从多角度考察文献特征(例如:话题、区域、作者、引用率等),有利于把握学术领域的主要研究问题和发展趋势。目前,文献计量分析方法广泛应用于自然科学和社会科学的研究中(Moiwo &Tao,2013;Liu,Xu,&Li,2015;Lei &Liu,2019;刘燊,甘烨彤,2021;龙飞腾等,2023;Richtig et al.,2023),语言心理学领域的研究相对较少,并且主要来自学者的总结性描述,缺乏实证数据的支撑。因此,采用文献计量方法更加科学全面地考察该领域的发展变化十分必要。

文献计量学研究普遍借助语料库分析工具(Chen &Liu,2014;Lin &Liu,2017;曹贤才等,2022;Yan &Zhang,2023),通过提取关键词来获取研究内容的详细信息,弥补了文献引文分析的不足(Zhang,2019)。根据关键词频数统计结果,可以发现该领域的热点话题、概念和学科发展趋势(Callon et al.,1983)。近年来,有学者将共现网络方法引入文献计量研究,从整体的视角探索领域内的研究发展情况(Lin &Liu,2017;贾海波,梁君英,杨持光,沈模卫,2019;杨美玲,翟舒怡,梁君英,沈模卫,2022;Wu,Goh,&Mai,2023)。共现网络可以清楚呈现该领域的知识结构,帮助读者厘清研究重点(Li et al.,2016)。因此,本文借助语料库分析工具和共现网络可视化工具,收集了《记忆与语言杂志》自创刊以来36 年间(1985—2020)的文献,以考察记忆与语言研究的发展趋势。

《记忆与语言杂志》由爱思唯尔出版集团于1985 年创办,旨在探讨记忆、语言理解与产出以及认知过程相关的科学问题和理论。该刊注重学科交叉,以较高的科学性、创新性和前沿性为特点,享誉国际语言心理学界。自1985 年创刊以来,《记忆与语言杂志》的影响因子连续上升,最新影响因子为4.521,是语言心理学领域的旗舰刊物。鉴于该期刊的权威性、影响力和研究领域的集中性,笔者以其发表的学术论文为研究对象,以期科学全面地考察国际记忆与语言研究领域的发展历程和研究话题的变化趋势。

2 研究方法

2.1 语料库构建

语料源于1985—2020 年《记忆与语言杂志》发表的研究文献,总计92 卷。首先,笔者从Scopus 数据库收集全部文献并导出题目、摘要、关键词和发表年份信息。其次,为确保元数据的准确性,通过文献信息的人工检查,去除文献类型不是研究论文(research articles)的文献数据,最终形成包含2047 篇文献元数据的语料库。图1 显示了1985—2020 年间该期刊的发文数量分布。1985—1996 年间,研究论文数量基本稳定在每年30~45 篇。从1997 年开始,论文数量开始增加,除个别年份论文数量很高外,其余基本稳定在每年55~70 篇。

图1 1985—2020 年《记忆与语言期刊》发表的论文数量分布

2.2 基于语料库的高频词组提取

笔者将语料库分为题目语料库和摘要语料库。题目语料库由2047 个研究论文题目组成;摘要语料库由2045 篇摘要组成(其中两篇论文未提供摘要)。为探究国际记忆与语言研究发展趋势,我们将摘要语料库分成三个阶段:第一阶段(1985—2000),共661 篇;第二阶段(2001—2010),共672 篇;第三阶段(2011—2020),共712篇。借助AntConc(Anthony,2020)软件,分别提取题目语料库、摘要语料库和不同阶段摘要语料库中的高频词组,并按降序排列。

2.3 共现网络可视化分析

为了更清晰地捕捉研究话题的历时发展特征,进一步获取知识结构信息,笔者采用共现网络可视化分析工具Gephi(Bastian et al.,2009)来考察三个时期的摘要高频词组网络特征。Gephi 的模块化功能将网络分成不同的区块。相同区块的节点联系密切,不同区块的节点联系较稀疏(Blondel et al.,2008)。因此,模块化可以反映记忆与语言领域不同话题的分类情况。

3 结果与讨论

3.1 国际记忆与语言研究36 年来的主要研究范畴

3.1.1 论文题目库中的高频词组

从题目语料库中提取前30 个高频词组(见图2),可以发现,大多数高频词组都和语言与记忆有关,高度符合期刊关注的焦点。记忆高频词组包括working memory(工作记忆)、recognition memory(再认记忆)、short-term memory(短时记忆)、false memories(错误记忆)、false recognition(错误再认)、free recall(自由回忆)、memory capacity(记忆容量)、episodic memory(情景记忆)、long-term memory(长期记忆)和memory retrieval(记忆检索),说明国际语言心理学领域关注多种记忆类型和记忆研究范式,记忆是语言心理学研究的重要话题。

图2 1985—2020 年论文题目高频词组频次分布

与语言相关的高频词组主要涵盖词汇维度,如word recognition(词语识别)、visual word(视觉词汇)、spoken word(听觉词汇)、lexical access(词汇通达)、lexical decision(词汇判断)、word frequency(词频)以及句子维度,如sentence processing(句子加工)、syntactic priming(句法启动)和structural priming(结构启动)。高频词组speech production(口语产出)、context effects(情境效应)、second language(第二语言)、judgments of learning(学习判断)、speech error(言语失误)、individual difference(个体差异)涉及了语言理解、产出与习得的相关话题。其余高频词组ambiguity resolution(歧义消解)、eye tracking(眼动追踪)和eye movement(眼动)表明,随着科技发展和人工智能的进步,歧义消解话题受到更多关注,眼动实验技术被广泛应用于语言与记忆的研究中。

3.1.2 论文摘要库中的高频词组

按照提取题目库高频词组的方法,笔者提取了论文摘要库中前30 个高频词组(见图3)。摘要库高频词组与题目库高频词组高度重合,更细致地反映了记忆与语言研究领域关注的具体语言结构,如relative clause(关系从句)和noun phrase(名词短语)、经常使用的记忆研究范式,如serial recall(序列回忆)和cued recall(线索回忆)以及重点关注的研究对象month-old infants(新生儿)。

图3 1985—2020 年论文摘要高频词组频次分布

3.2 国际记忆与语言研究话题在36 年间的发展

为进一步探究记忆与语言研究36 年间研究热点话题的发展趋势,生成三个时期的摘要库高频词组列表(见表1)。

表1 摘要库中三个时期的高频词组列表

表1 显示,与基本认知过程相关的高频词组,如working memory(工作记忆)和word recognition(词语识别),在三个阶段的出现频率相对稳定。但总体而言,国际语言心理学研究的热点话题在36 年间产生了较大变化,每个时期具有不同特征。第一,lexical decision(词汇判断)的频次逐渐减少,表明词汇判断实验的研究热度有降低趋势。第二,eye movement(眼动)技术在第一阶段并未出现在高频词组列表,而从第二到第三阶段,其频次迅速上升,体现了眼动技术在近年语言心理学研究中愈发重要的地位。第三,自第二阶段起,relative clauses(关系从句)、priming effects(启动效应)、false memories(错误记忆)、serial recall(序列回忆)、free recall(自由回忆)和spoken word(听觉词汇)较之前受到了更多关注。第四,individual difference(个体差异)、language processing(语言加工)和structural priming(结构启动)在第三阶段成为研究热点,同时,第三阶段涌现出语言心理学领域新的研究兴趣点,如novel words(新词)、episodic memory(情境记忆)、source memory(源记忆)、statistical learning(统计学习)和cognitive load(认知负荷),这些话题在第一和第二阶段的高频词组列表中均未出现。

3.3 国际记忆与语言研究话题结构在36年间的发展

为探究不同时期记忆与语言研究的主要研究话题结构及其变化特征,我们利用Gephi 构建了摘要高频词组共现网络。经自动区块分割处理,得到三个时期共现网络图的四个主要区块(见图4~图6)。

如图4 所示,第一阶段共现网络最大的区块(蓝色部分)围绕lexical decision(词汇判断)、word recognition(词汇识别)、reaction time(反应时)和lexical access(词汇通达)展开,表明语言心理学家在这一阶段的主要研究焦点为词汇相关的语言加工过程。绿色区域以word frequency(词频)、free recall(自由回忆)和recognition memory(再认记忆)为主要节点,表明这一时期学者对记忆与词汇间关系的研究兴趣。红色区块主要围绕working memory(工作记忆)和short-term memory(短期记忆)展开。虽然工作记忆是此区块的焦点,但其节点在第一阶段并不突出,说明这一话题在当时处于起步阶段,尚未成为主要研究热点。橙色区块的主要节点有reading times(阅读时间)、time course(时间进程)、sentence processing(句子加工)、noun phrase(名词短语)、sentence comprehension(句子理解)和language comprehension(语言理解),体现了语言心理学界在早期对语言加工过程的研究兴趣。其他节点如event-related brain potentials(脑电位分析)和eye movements(眼动)在这一阶段的节点较小,连接性较低,说明此技术在早期的应用范围有限。

图5 展示了第二阶段高频词组共现网络的四个区块。黄色区块以working memory(工作记忆)为中心节点,除了上一阶段受到关注的short-term memory(短期记忆),这一阶段也关注了long-term memory(长期记忆)的概念,更多记忆研究范式如free recall(自由回忆)和serial recall(序列回忆)被频繁使用,话题结构更加多元。随着人口老龄化增长趋势的日益显现,older adults(老年人)这个关键节点表明记忆与语言研究领域对老年群体予以了更多的关注,同时,学界在这一时期也开始关注individual differences(个体差异)。蓝色区块的中心节点有eye tracking(眼动追踪)和eye movements(眼动),说明语言心理学家开始借鉴认知神经学和脑科学前沿的技术手段,用更科学的研究方法探索语言加工机制。研究者更加关注noun phrase(名词短语)结构和year-old children(儿童)这一研究群体,儿童的语言与认知能力发展越来越重要。绿色区块的中心节点为lexical access(词汇通达)。红色区块的关键节点包括lexical decision(词汇判断)、word recognition(词汇识别)、priming effects(启动效应)和second language(第二语言),说明词汇加工研究范式被广泛应用于启动效应和二语习得研究中。

图5 2001—2010 年摘要高频词组共现网络图(彩图见网络版)

与前两个阶段相比,第三阶段(2011—2020)的话题结构更加复杂多样(见图6)。黄色区块突出的节点包括working memory(工作记忆)、individual differences(个体差异)、recognition memory(再认记忆)、false alarms(虚报)和episodic memory(情境记忆),表明语言心理学家近年来越来越多地关注记忆过程的个体差异。蓝色区块的重要节点包括lexical decision(词汇判断)、word recognition(词汇识别)、new words(新词)和second language(第二语言),说明经典的词汇测试仍被广泛使用,且更多地被应用于二语习得研究。Language production(语言产出)和priming effects(启动效应)是绿色区块的关键节点,表明语言产出与启动效应的关系成为近年的研究热点。红色区块以eye tracking(眼动追踪),eye movements(眼动)和event-related brain potentials(脑电位分析)为中心节点,反映了自2011年以来研究技术的不断进步和学科交叉的研究趋势。神经科学的研究方法越来越频繁地用于探索noun phrase(名词短语)、relative clause(关系从句)等语言结构的加工过程。year-old children(儿童)仍是此区块的关键节点,揭示了儿童语言与认知发展研究是记忆与语言研究的重要焦点之一。

图6 2011—2020 年摘要高频词组共现网络图(彩图见网络版)

4 小 结

本文借助语料库和共现网络可视化工具考察了《记忆与语言杂志》1985—2020年间的研究文献,通过对比三个阶段的题目及摘要高频词组特征和共现网络特征,得出结论:第一,语言的认知加工过程是语言心理学研究的核心范畴,相对长时记忆,工作记忆一直是探索语言加工过程的关键性问题,词汇判断任务在语言心理学实验中的应用最为广泛。第二,语言的理解、产出与习得是语言心理学家持续关注的研究话题。自1985 年到2020 年,记忆与语言研究领域不断加深和拓宽,越来越多的语言结构和群体纳入研究范围,针对儿童的语言认知研究不断发展,语言与认知过程的个体差异在近年受到更多关注。第三,神经科学和脑科学领域前沿的技术方法逐渐被广泛应用于记忆与语言研究,体现了语言心理学领域学科交叉融合发展的研究趋势。

猜你喜欢
词组语料库心理学
《语料库翻译文体学》评介
爆笑心理学
爆笑心理学
爆笑心理学
爆笑心理学
基于JAVAEE的维吾尔中介语语料库开发与实现
副词和副词词组
语料库语言学未来发展趋势