国内二语词汇研究文献计量分析:合作及热点

2023-06-30 07:47孙华春
安康学院学报 2023年3期
关键词:二语语料库词汇

孙华春,王 成

(1.淮阴师范学院 外国语学院,江苏 淮安 223300;2.淮阴师范学院 外语实验教学中心,江苏 淮安 223300)

一、引言

词汇被认为是学习语言的基础,Meara(1980)在Language Teaching&Linguistics Abstracts上发表的论文Vocabulary Acquisition:A Neglected Aspect of Language Learning被认为是现代词汇习得的开始。国内二语词汇研究主要针对英语,但近几年汉语作为第二语言的研究有所增加。国内诸多学者从不同角度对二语词汇进行了研究,自1999年开始出现零星的研究,至2013年研究文献数量达到高峰,一直处于震荡上升趋势。其中有不少关于二语词汇研究的综述文章,对二语词汇研究从理论到实证进行了全面分析。二语词汇研究的相关理论可从词汇量、词汇类型、心理词汇、词汇知识及词汇习得等角度进行描述[1]。相对于理论研究,二语词汇的实证研究数量更多,如骆涵从理论和实证两个角度对二语词汇研究进行梳理,认为认知语言学将会是二语词汇研究的新趋势[2]。另一方面,词汇学习与其他语言技能关系密切,如语境对词汇量有重要影响[3];词汇量的大小对阅读和口语有一定影响,Nation 认为当写作中词汇覆盖率为95%时,学习者需要掌握的词汇量大约为4000 个最常见的词加上专有名词;而要达到98%覆盖率,则需要掌握约8000-9000 个词族加上专有名词[4];Schmitt 则认为阅读需要8000-9000 个词汇,口语需要5000-7000 个词汇[5]。除传统的二语词汇研究外,近几年来心理词汇研究逐渐增多,主要使用眼动、核磁共振等设备测试阅读中的词汇习得、词汇学习过程中的神经活动等。这些二语词汇综述文章系统梳理了二语词汇研究的现状、发展及研究方向,对二语词汇领域的发展起到了重要作用。

与此同时,部分学者基于已发表的文献对二语词汇进行了研究,如苗丽霞以国内12种外语类核心期刊从2001至2012年刊载的二语词汇附带习得研究文献为源数据,分析了国内二语词汇附带习得研究的现状与发展趋势[6]87。于涵静等使用社会网络方法对Web of Science数据库中的396篇二语词汇研究论文进行了可视化分析,分阶段分析其关键词分布,从实证研究角度探索了二语词汇研究的现状,并对教学启示和发展趋势进行探究[7]。赵蔚等选取国内外14种外语期刊发表的二语词汇研究文献,从六个方面归类分析,并对国内外研究进行比较[8]。这些基于文献的研究对于了解国内外二语词汇研究现状起到了重要作用,但在以下方面略显薄弱:(1)研究样本选择上具有主观性,大部分是选取部分核心期刊进行分析,有些则是根据作者的经验进行选择;(2)对文献计量的各种指标并未进行计算,更多的是使用归纳演绎的方法进行分析;(3)对于作者和机构的合作分析较少。

本研究选取中国知网上发表的CSSCI、CSCD期刊论文和学位论文作为研究对象,对文献计量的指标进行计算,从定量角度对国内二语词汇研究现状进行分析,并试图发现二语词汇研究的合作关系、研究热点及发展趋势。相较于以往使用CSSCI 和CSCD及学位论文的数据进行分析,基于主观选择的二语词汇文献计量分析,数据量更大也更全面;另一方面研究中统计了更多计量指标,基于文献指标的定量分析更容易从宏观角度了解二语词汇研究的现状、研究热点及趋势,同时分析过程具有可重复性。

本文对二语词汇研究领域的可能贡献包括:首先,发现二语词汇研究的主要作者、机构及其合作关系以及高被引文献和重要期刊,为研究者特别是初次进入该领域的学者提供索引。其次,作者、机构合作分析可发现二语词汇领域的主要研究者及其合作关系,为文献追踪及后期合作提供帮助。最后通过关键词共现分析发现二语词汇研究的热点主题,为后期研究提供思路。

二、研究思路与方法

随着文献数据库的发展,文献信息越来越容易获取,因此基于定量分析的文献计量方法近几年越来越多地被应用到各个学科,在语言学领域的应用如语言衰老研究的可视化分析[9]、外语教育技术研究[10]、语用学知识图谱[11]、ESP研究国际动态及其可视化分析[12]等。文献计量研究可以从宏观角度分析某一主题的研究现状及研究热点,但在进行之前需要建立相应的文献库。本研究基于中国知网获取文献数据,并使用Co-Occurrence6.7 提取相关文献计量学指标,建立共现矩阵后使用VOSviewer 软件进行可视化展现,重点分析二语词汇研究的机构合作、作者合作、关键词共现,从而发现二语词汇研究的合作情况及研究热点。

图1 为基于文献计量分析的研究思路,其中使用了作者合作分析(Co-authorship)和关键词共现分析(Co-Occurrence)两个主要的文献计量方法。

三、二语词汇研究的基本特征

(一)年度发文量分析

本研究检索到的第一篇关于二语词汇研究的论文发表于1999 年,随后发文量呈现震荡上升趋势,至2013年达到最大值,后呈现下降趋势(图2)。据此本文将国内二语词汇研究分为三个阶段:萌芽期(1999—2002)、发展期(2003—2013)、调整期(2014—2019)。单从期刊发文量来看,整体趋势平稳,最高发文量是2011年的31篇,发展期平均每年发表15.5篇,调整期的平均发表量为每年22.16篇,呈现略微上升的趋势,但2019年发表的文献数量只有13篇,已经开始出现下滑。学位论文则出现较大范围的波动,发展期平均每年发表95.5篇,调整期每年平均发表104.8篇。

图2 年度发文量趋势图

另外从年度文献作者数量来看,期刊论文年作者数最多的为2014 和2017 年,均为46 人。期刊论文年平均作者数量方面:萌芽期为2人,发展期23人,调整期39人,整体呈现上升趋势,原因是发表论文数量的增加。平均每篇文献的作者数量可以从一定程度上反映该领域的合作情况,从表1 可知二语词汇研究的作者合作较少,平均每篇文献的作者数在2006年之前均为1人,2006年开始为2人,一方面跟人文学科的特点有关,另一方面也表明二语词汇研究缺乏稳固的团队协作,具体合作关系将在下一节分析。

表1 二语词汇研究发文情况

(二) 高被引文献分析

一般来说引用量高的文献在学科领域中具有重要意义,综述类文献容易获得更高的引用量,通过了解高被引文献可以追踪二语词汇的研究热点及发展过程。本文使用中国知网引用数据统计出前20篇引用量最高的文献信息(表2)。表2中的文献最晚发表于2011年,印证了人文学科的引文周期较长的观点[13]。引用量与年均引用量并不完全一致,词汇组块教学获得了第2名的年均引用量,而2011年发表的《动态系统理论与第二语言发展》年均引用量排名第3,表明词汇组块、动态系统理论等这些新理论受到的关注依然很多。从引用量角度来看,二语词汇研究的高被引文献引用量不高,年均引用量为19次,这也表明目前二语词汇研究的关注度还不是很高。

表2 前20篇引用量最高的文献信息

从高被引文献的分类来看,主要涉及以下几个方面:首先是二语词汇习得研究,其中最主要的是词汇附带习得理论,其研究在2012年达到峰值,以对词汇附带习得的实证研究为主,随后开始慢慢下降,年发文量基本保持在40篇左右,但发表于核心期刊上的文章很少,说明学界对于词汇附带习得研究的关注度在降低。其次是词汇教学研究,其中大学英语词汇教学占据了很大比例,除词汇本身的研究外,还较多与写作、阅读等其它英语技能综合考虑相结合,旨在提升词汇教学水平。第三类是认知与心理词汇研究,如认知加工理论、隐喻意识、联想测试等理论对二语词汇习得的影响研究,近几年心理和认知理论对二语学习的影响研究越来越多。第四类是动态系统理论,其将语言学习视为一个系统,考虑学习过程中的人和社会的各种影响因素,是近年词汇研究中的热点领域。最后是对外汉语相关研究,汉语作为第二语言的相关研究近几年研究数量呈现快速上升趋势,其中汉语词汇研究亦不断增加。在后面的热点研究章节中会对相关研究作进一步梳理。

(三)期刊发文量分析

期刊发文量一方面反映了二语词汇研究在外语研究中的覆盖范围,另一方面也可以了解哪些期刊关注该领域。表3为发文量在5篇以上的期刊信息,基本包含了外语研究领域的大部分CSSCI期刊,结果进一步彰显了二语词汇研究的重要地位。其中汉语研究的期刊有2本,发表文献占比5%,表明二语词汇研究的主体依然是外语。

表3 发文量最多的期刊发文信息

四、二语词汇研究合作分析

合作分析(Co-authorship analysis)已经被广泛应用于作者、机构、国家等层面的文献计量分析。虽然合作分析跟引文网络[14]有点类似,但合作分析是一种暂时的、共同的关系,这比引文的匿名性更公平[15]。

(一)作者分布及其合作分析

作者发文量方面,二语词汇研究领域发文最多的为张萍(11篇),其次为倪传斌(8篇)、洪炜(8篇)、李红(7 篇)、范琳(6 篇)、王瑞明(5 篇)、王改燕(5篇)。通过统计文献的作者数,发现期刊文献中1位作者的文献为164篇(51.9%),2位作者的文献数107 篇(34%),3 位作者的文献数26 篇(8.3%),4位作者的文献数11篇(3.5%),5位作者的文献数3 篇(0.1%),6 位作者的文献数4 篇(1.2%)。两位以上作者文献数占总比为47.9%,合作度①作者合作度:一定时期内每篇论文的平均作者数;机构合作度:一定时期内每篇论文的平均机构数。为1.27。

因学位论文不存在合作关系,因此合作关系的分析仅限于期刊论文,本文仅选取发表文献数大于3篇的作者,构建作者共现矩阵,绘制作者合作图谱(图3)。发现二语词汇研究整体合作较少,有不少作者与其他作者没有合作关系,王瑞明与李利合作文献最多,达到4篇,两人与莫雷形成一个合作网络;张玲与5个作者有2篇的合作关系,是合作度最高的作者。潘迪、梁士利、魏莹、许廷发和王双维形成了一个紧密的合作关系。另外的合作网络有:吴诗玉与马拯(2);吴继峰、洪炜和冯聪;王震与范琳(1);杨连瑞与李旭奎(1)。总体而言,二语词汇研究的作者合作数量偏少,合作度偏低,这从一个侧面反映了当前外语研究团队合作相对匮乏。

图3 二语词汇期刊论文作者合作网络图谱

(二) 机构分布及其合作分析①机构处理原则:所有机构保留到大学一级,如南京师范大学外国语学院统一为南京师范大学。

与作者合作类似,首先分析高产机构情况,然后分析其合作情况。期刊文献由185 个机构发表,发文量最多的机构是南京师范大学(16篇),其次分别为:广东外语外贸大学(15篇)、北京外国语大学(14 篇)、华南师范大学(14 篇)、南京大学(14篇)、北京师范大学(11篇)、中山大学(11篇)及上海交通大学(10篇)。从机构合作来看,期刊文献中单机构发文量为234篇(74.3%),2个机构合作文章数68 篇(21.6%)、3 个机构合作文章数12 篇(3.8%),5个机构合作文章数1篇。2个及以上机构合作率为25.7%,合作度为0.95。

从图4 机构合作网络图谱可以看出,机构合作比作者合作更为分散,浙江工业大学和扬州大学之间的合作最紧密,共同发表二语词汇研究文章3篇。上海交通大学、华南师范大学均同时与4 个机构有合作关系。亦有一些机构无任何跨机构合作,如复旦大学、北京语言大学、南京大学及武汉大学等。

图4 二语词汇研究机构合作网络图谱

五、研究热点及趋势分析

文献计量学中一般用关键词分析获取研究热点,在进行关键词分析之前,需要对关键词进行整理,合并意义相近的关系词,如“第二语言习得”统一为“二语习得”、“第二语言”统一为“二语”。整合后期刊论文包含关键词878 个,学位论文包含关键词3161 个,期刊和学位论文共包含关键词3674个。

共现分析在文献计量学分析中得到了广泛的应用,关键词共现已被应用到热点话题分析的前沿[16],当两个关键词同时出现在一篇文章中时,称之为关键词共现[17]。使用VOSviewer绘制二语词汇研究的关键词共现网络图谱(图5),VOSviewer 利用基于距离的方法构建共现图谱,即距离越近两者之间的关系越紧密[18]。依据距离关系将图5 划分为以下研究热点,进一步分析其研究现状。

图5 关键词共现网络图谱

(一)研究热点一:词汇附带习得研究

词汇附带习得指学习者在进行有意义的语言使用活动或学习任务时,其注意力并非在词汇上,却无意中增加了词汇知识,是一种注意力聚焦于其他活动时顺便出现的认知活动[19]。词汇附带习得在图5中占据了很多节点,这从一个侧面反映了国内二语词汇研究的主体仍是词汇附带习得。国内二语词汇附带习得研究主要包括:词汇附带习得综述、投入量假设、词汇深度/广度研究、词汇与阅读、写作、口语等的附带关系研究。综述类文献介绍了国外二语习得词汇研究的定义、实证研究及其理论假设[20],也有学者将二语词汇附带习得研究分类为基础理论类研究、相关影响因素研究、输入和输出干预类研究和回顾类研究等[6]86-92。投入量假设认为词汇的附带习得效果依赖于其加工过程中由任务所诱发的“需求(need) ”“搜索(search) ”和“评估(evaluation)”三个因素构成的投入量,投入量越高,词汇的附带习得效果就越好,词汇记忆保持效果与任务的投入量成正比[21]。国内对投入量假设的实证研究较多[22-24],但最终依然无法完全验证。词汇知识对二语词汇的学习有很大影响,不少学者从词汇深度知识和广度知识的角度进行实证分析[25-26],以对词汇教学进行启示。词汇学习不是独立存在的,常常附带于阅读、口语、听力、写作等学习过程中,针对不同类型的学习任务与词汇习得的关系,不少学者进行了实证研究[27-30],用于提高词汇教学与二语学习的效率。

(二)研究热点二:动态系统理论

Larsen-Freeman 是第一个将动态系统的方法应用于二语习得领域的研究者,她从混沌论的角度出发比较全面地讨论了语言系统作为一种复杂自适应系统的特点,基本上奠定了动态系统理论应用在二语习得领域的理论框架[31]。二语词汇方面,郑咏滟从理论到实证进行了详细的论证[32-35]。段士平构建了动态系统理论视域下二语语块发展研究理论模型[36]。王小宁认为在动态系统理论下二语词汇习得中的注意机制运作是个复杂的动态系统[37]。宋健楠依据动态系统理论方法,使用单因变量双因素方差分析法对性别、频率、词汇知识(词缀、词义)等因素进行实证研究,提出词汇习得必须从多角度予以加强[38]。动态系统理论将词汇作为一个复杂系统的子系统,考虑其内部及与二语习得其他系统之间的联系,会对二语词汇研究产生颠覆性的改变,相关研究会继续保持增长趋势。

(三)研究热点三:语料库词汇研究

语料库近年在二语习得研究中的地位越来越重要,二语词汇领域语料库研究数量亦在不断增加。语料库研究更多应用于教学中,冯跃进等提出在英语词汇教学中使用语料库,可提高教学质量[39],随后关于语料库在教学中的应用研究不断出现,如数据驱动式ESP 词汇教学模式[40],语料库辅助下的英语阅读词汇教学研究[41],以及基于ESP 语料库的学术英语词汇学习法的有效性研究[42]。语料库在人工智能和大数据技术快速发展的前提下,取得了突破性发展,其规模及应用都在快速增加,在二语词汇领域亦将会有越来越多的应用。

(四)研究热点四:心理词汇研究

心理语言学研究跨学科使用心理学的理论与方法研究语言学,得到了语言学家们的认可,已经发展成为一个稳定的研究方向,心理词汇则是心理语言学领域中的一个热门话题。心理词汇一般被认为是人脑可以长时记忆存储的词汇。为了验证心理词汇的作用,诸多学者进行了实证研究,如张淑静进行了历时9 个月的跟踪研究用于了解二语心理词汇与词汇知识间的关系[43]。随后的实证研究还引入了ERP 等设备进行对比分析[44-45]。可以预见,随着心理语言学理论的发展以及ERP等设备的普及,会有越来越多的心理词汇研究的文献出现。

(五)研究热点五:汉语作为二语的词汇研究

随着国家对外开放力度加强,汉语学习者的人数也在迅速增加,汉语作为二语的研究也开始出现。其词汇研究也成了新的热点,学者们使用语言学理论对汉语二语词汇进行研究,如周琳基于动态系统理论对母语为韩语的汉语二语学习者进行词汇语义系统实证分析[46]。张江丽基于两个自建语料库,对比考察了汉语二语学习者与汉语母语学习者在产出性词汇量上的差异[47]。吴继峰等基于6 种汉语期刊2000—2016年发表的二语词汇文献进行分析[48]。可以发现汉语二语词汇研究基本是基于与外语二语词汇研究相同的方法进行不同角度的综述或实证研究。

六、研究结论及展望

本研究基于文献计量方法分析了中国知网发表的2029篇文献,发现国内二语词汇研究数量在2013年之前呈现震荡上升趋势,随后有慢慢下降趋势,其中学位论文占较大比例。二语词汇领域文献整体被引频次不高,主要研究集中在外语作为第二语言的词汇研究。合作方面,学者之间合作较为缺乏,机构间合作亦相对薄弱。通过分析关键词共现发现二语词汇研究的热点领域:词汇附带习得占据绝对优势,动态系统理论、语料库及心理词汇等新兴研究不断增加,汉语作为二语的词汇研究所占比例较小。

词汇研究的重要性已经得到学界共识,但二语词汇研究开始出现研究数量减少的趋势,迫切需要新的理论指导,如动态系统理论的研究文献在不断增加,基于心理学的跨学科研究也能给二语词汇研究带来曙光,基于认知语言学的思想为二语词汇研究带来新视角。但因这些理论和方法需要系统思维和跨学科的方法,如心理词汇的研究还需要ERP等设备的支持,对广大二语词汇研究者来说还需要不断学习和积累,相信以后会出现更多新的理论和方法促进二语词汇研究的发展。

虽然本文从文献计量角度对国内二语词汇研究进行了宏观分析,但在以下方面还需要进一步努力:文献计量分析的基础是文献数据集的建立,本文虽然从整体上搜集到尽可能多的关于二语词汇研究的文献,但在二语词汇研究的特定领域所掌握文献的种类和数量有限。后期研究一方面需要考虑将具体检索词汇纳入,如投入量假设、词块研究、心理词汇、语料库等;另一方面通过数据集中的参考文献进行迭代扩展,以确保文献集的数量和质量。

猜你喜欢
二语语料库词汇
本刊可直接用缩写的常用词汇
一些常用词汇可直接用缩写
《语料库翻译文体学》评介
本刊可直接用缩写的常用词汇
《教学二语习得简介》述评
Ferris与Truscott二语写作语法纠错之争
国内二语写作书面纠正性反馈研究述评
基于JAVAEE的维吾尔中介语语料库开发与实现
二语习得中母语正迁移的作用分析
本刊一些常用词汇可直接用缩写