国内语言学近十年研究热点识别

2018-08-29 02:17杨书霞
外国语文 2018年4期
关键词:语种主题词语言学

杨书霞

(河南大学 外语学院,河南 开封 475001)

国家人文社会科学基金自1991年设立以来,已对包括语言学在内的26个学科进行资助。立项种类包括青年项目、一般项目、重点项目、重大项目、后期资助项目、成果文库,以及中华外译项目八个类别。作为我国级别最高、影响力最大的人文社科研究基金,国家社科基金资助的项目一向被视为反映我国人文社会科学发展水平的重要指标(周丽琴,2015:48)。研究表明,针对基金立项课题进行探讨,有助于识别研究热点和重点,对相关学科的发展有指引和启示作用(文秋芳 等,2017:23)。因此,本文拟借助开源工具,对2007—2016年的国家社会科学基金语言学项目(以下简称语言学项目/语言学课题)进行数据可视化分析,全面呈现国内语言学研究现状和热点,以期为今后课题的选择和申请提供有价值的参考。

1文献回顾

针对语言学项目的研究可以从内容和方法两个层面进行回顾。从研究内容来看,已有文献集中在整体考察和专项分析两个方面。整体考察主要从宏观角度对立项课题进行分析。例如,贾蕃(2016)从产业、高校、科研机构合作共赢的视角,对语言学项目进行了量化分析;此外,还有一些学者对语言学课题的分布特点进行了历时统计分析(苏新春 等,2015;蒋跃 等,2016)。相较整体考察,专项分析则多从地域和项目类型等具体层面出发展开讨论。此类文献包括对我国少数民族地区语言学课题立项情况的研究(夏迪娅·依布拉音 等,2014;罗骥,2017),针对某语言学下属学科的立项分析(王立非 等,2011;张威,2015;黄婷 等,2017),以及对特定项目类型的分析(于云晴,2016;张世渊,2016)。由此看来,目前的研究主要围绕课题的外部文献信息展开。学者们通过立项数量、项目负责人、项目承担机构、地域分布及项目类型等对课题进行系统或专门分析。这些研究的结论和发现不仅为国家社会科学基金对语言学课题的整体规划和管理提供了参考依据,也为少数民族地区和边远地区的社会科学发展,以及地方院校具体学科的建设提供了重要指导。但是,文献回顾也表明,现有研究对项目内部文献特征的关注相对缺乏。因此,本文将着重关注语言学课题的内部文献特征,多角度考察立项课题所反映的语言学研究现状和发展趋势。

从研究方法来看,随着我国学者对实证研究的日益重视,利用专业工具对基金项目进行文献计量分析的方法也日渐普遍。使用这种方法,有助于我们深度挖掘立项课题背后的学科发展趋势,把握相关学科的研究重点和热点(徐俊 等,2014:430)。但在现有针对语言学项目的文献中,只有少量借助了此类工具,大部分仍然是通过手工采集和处理数据的方法进行分析。因此,使用专业工具对语言学项目进行探讨的研究方法还有待进一步开发和探索。与此同时,数据信息的可视化呈现正逐渐受到关注。和传统的数据处理方式相比,可视化分析能够通过高频主题词共现网络突出研究热点,从而直观形象地呈现学科研究现状。目前,对语言学项目进行可视化分析的文献比较少。综上所述,对语言学课题的研究在方法上存在数据来源不明确以及分析工具落后等问题。因此,本文拟借助开源软件,对课题进行文献计量统计和信息可视化分析,以期为今后的研究提供有价值的思路和结论。

2研究设计

2.1 研究问题和方法

本文拟回答以下问题:(1)2007—2016年语言学项目的基本概况如何?(2)语言学项目的研究热点有哪些?(3)这些热点具有什么特征?

一般认为,标题与研究主题相关,而重复出现在同一学科不同文献标题中的主题词直接反映该学科的研究热点(牛保义,2007:11)。因此,本文拟从项目标题入手,找到上述问题的答案。为保证研究的可复制性,此次研究所涉及的数据抓取、整理及信息可视化软件均为可通过互联网免费获取的开源工具。

2.2 研究框架

此次研究由数据抓取、主题词获取和可视化分析三部分组成。

数据抓取主要通过数据分析工具R语言完成。首先,我们借助R语言中的rvest网络数据自动获取包,对基金项目数据库中的语言学课题信息进行自动采集。然后,我们对所采集的数据进行程序筛选和人工核对,最终获得2607条项目名称信息。

主题词获取主要通过R语言和语料分析软件AntConc两个工具完成。首先,我们使用R语言jiebaR中文分词包对所得数据进行分词处理。随后,我们将已进行分词处理的标题信息导入AntConc,进行词频统计,从而获取主题词列表。AntConc提取的结果包括虚词和一些意义较为宽泛的名词(如“研究”等)。文献表明这些词汇对主题词间的关系判断没有参考意义(常春 等,2009:19)。因此本文在获取主题词列表的过程中,将这些词汇做停止词(stop word)处理。

可视化分析主要涉及R语言中的ggplot2画图工具包以及数据可视化工具Gephi。具体来说,我们借助ggplot2对相关数据进行可视化处理,并通过Gephi对主题词进行共现图谱绘制。

3数据分析结果与讨论

3.1 整体概况

图1为2007—2016年语言学项目年度分布图。如图所示,课题数量在2007—2009年基本呈平稳上涨趋势,三年间共立项444例,年均148例。之后,语言学课题进入快速增长期,2010—2013年立项总数为1170例,年均292例。2014—2016年,立项数量趋于稳定,共立项993例,年均331例。据此,我国近十年来的语言学研究大致可以分为三个阶段:第一阶段(2007—2009年)为平稳增长期;第二阶段(2010—2013年)为快速增长期;第三阶段(2014—2016)为稳定发展期。

3.2 高频主题词

本文对高频主题词的讨论主要围绕热点语种和研究领域两个方面展开。

3.2.1热点语种

表1为近十年语言学课题研究语种的高频主题词列表。其中,“汉语”高居榜首,遥遥领先于其他语种主题词,其词频是排名第二位的“英语”的五倍。这说明虽然英语是我国外国语言学领域的主要研究对象,但汉语研究在课题中占绝对主导地位。与此同时,排名第三的主题词“英汉/汉英”不仅表明比较/对比分析是我国学者分析英汉两种语言时常用的研究方法,也再次印证了这两种语言在国内语言学研究中的受关注程度。除英语以外,日语和俄语也是我国外国语言学领域的研究热点。但是从词频来看,这两种语言的影响力和英语相比还相差甚远。在少数民族语言研究方面,近十年来比较受关注的语种是蒙古语、藏语和维吾尔语。这三个语种的研究热度也高于日语和俄语,充分反映了国家社会科学基金对我国少数民族语言研究的支持力度。

图1 2007—2016年国家社科语言学项目年度分布图

序号语种词频1汉语6792英语1323英汉/汉英1264蒙古语/藏语/维吾尔语1115日语/俄语58

3.2.2研究领域

语言学研究领域大致可分为三个层面:微观语言学、宏观语言学和应用语言学。微观语言学是对语言本体,也就是语言内部特征的研究。从多语言比较/对比的角度看,微观语言学也包括在语法行为基础上进行的类型学研究。宏观语言学是通过语言学理论与其他学科互动而进行的跨学科研究。例如,语言学和社会学理论互动生成的社会语言学,语言学和计算机技术结合产生的计算语言学,以及关注语言与文化关系的文化语言学等等。应用语言学是将语言学发现应用于其他领域的学科,例如语言教育、词典编纂、翻译及自然语言处理等。

表2列出了各研究领域的高频主题词。可以看出,在微观语言学领域,“语法”词频最高,这说明对语言结构规则的探讨是本体研究的重点。而“语义”“句法”“语音”的高频出现,表明语法三大模块也是我国语言学研究的关注焦点。总体而言,在本体研究方面,立项课题覆盖面全,涉及语言的各个层面。这一方面表明我国语言本体研究发展已经比较成熟,另一方面也从侧面印证了国家社会科学基金对理论研究和基础研究的重视程度(苏新春 等,2015:118)。

在宏观语言学领域,近十年来利用语料库进行研究的课题高达233项,说明语料库语言学是该领域使用度和关注度最高的学科。这一结论和蒋跃、祁玉玲(2016)对语言学立项情况分析的结果一致。“认知”以133的频次高居第二,证明了认知语言学在功能主义流派中一枝独秀的主导地位。排名第三和第四的“文化”语言学和“接触”语言学都可被视为社会语言学的分支:前者主要研究语言和文化的关系,以及不同族群对世界的感知方式;后者则关注不同的言语社区在密切互动和接触时对彼此语言系统的影响。这两个主题词的高频出现,说明社会语言学已经成为我国宏观语言学领域的另一热点学科。在应用语言学领域,排名靠前的主题词分别为“翻译”“教学”“学习”和“习得”,说明这十年来我国在该领域的研究主要集中在两个方面:翻译和语言教育。

表2 研究领域高频主题词列表

从年度分布来看,如图2所示,以语料库语言学和认知语言学为理论框架的课题在2007—2016年呈快速增长趋势,表明这两个学科的影响力正在迅速扩大,也预示它们在未来还将保持强劲的发展势头。另一方面,文化和接触语言学的立项课题尽管也保持着逐年增长的趋势,但其发展速度和前两个学科相比仍有不小差距。这说明社会语言学作为研究热点之一,仍具有较大发展潜力。

图2 研究领域部分高频主题词年度分布图

图2还表明,近十年来,翻译课题数量基本呈直线上升趋势。这与张威(2015)和黄婷、黄勤(2017)对我国翻译研究的分析结果一致。同时,我国的语言教育课题主要从以教师为对象的语言教学研究和以学习者为对象的语言习得研究两个视角进行。从年度分布来看,“教学”近十年的分布曲线呈现逐年下降的趋势,不如“习得/学习”研究的发展稳定。语言学习/习得课题数量的逐年增长,表明我国学者越来越重视学生在语言教育中的主体地位。

3.3 主题词共现分析

词频统计仅能提供当前语言学的研究轮廓。利用专业工具对主题词进行共现信息统计和可视化分析,不仅可以凸显研究热点,更能清晰体现语种与研究领域的关系,将热点分析形象化与细致化(邓君 等,2014:133)。针对热点语种分布,我们分别以:属于汉语和我国少数民族语言的主题词、属于外语的主题词,以及涉及双语的主题词为基点,进行共现数据可视化分析。在主题词共现图谱中,一个节点代表一个主题词,节点之间的连线代表主题词间的共现关系。到某一节点的连线越多,说明该主题词的中心度越高。高中心度是主题词热点地位的象征。

3.3.1汉语和我国少数民族语言研究

图3是以“汉语”和我国三大少数民族语言“蒙古语”“藏语”“维吾尔语”为基点生成的主题词共现图谱。其中,“汉语”中心度最高,再次证明汉语各层面的问题是我国语言学项目的研究重点。该节点与其他三个语种节点之间的大小对比,也表明语言学课题对国内语种的关注分布不平均。

从连线来看,和四个语种主题词共现频次都比较高的一个节点是“方言”,说明在对我国语言的研究中,方言研究占比很重。从节点分布来看,学者们对方言的研究主要着眼于两个方面:方言分布研究(如“湘西地区汉语方言地图集”)和方言接触研究(如“黎语和汉语方言接触研究”)。

在微观层面,汉语和民族语的研究领域涉及语法的各个层面,但对语音问题的探讨比较突出。此外,针对这些语言的类型学研究也是一个重要热点。从宏观角度来看,语料库语言学理论在汉语及民族语研究中的应用都比较广泛。此外,认知语言学,尤其是构式语法,也是近年来汉语研究重要的理论支撑。但是,图3也反映出认知语言学理论在民族语研究中的应用并不普遍。这一方面说明该理论在我国语言研究中的应用分布不均衡,另一方面也说明和汉语相比,我国民族语研究工作的发展比较落后。

图3 汉语类主题词共现网络

图3还表明我国应用语言学领域的研究主要集中在汉语教育方面,研究重心可以从“母语VS第二语言”和“教学VS习得”两个角度进行界定。以汉语为母语的研究主要集中在儿童汉语习得和特殊汉语教育两个方面,而以汉语为第二语言的研究主要关注国际汉语教学和汉语习得。此外,语言学课题对我国少数民族的语言教育研究相对较少,具有较大的发展空间。

3.3.2外语类研究

图4是以“英语”“日语”“俄语”为基点生成的主题词共现图谱。如图所示,国内学者对英语和日俄的研究重心有显著不同。英语课题主要以英语教育研究为主。其中,对学习者听辨能力,写作能力,和读写能力的研究,以及对英语教师专业能力和发展的研究是我国学者最关心的内容。而日俄研究较少涉及应用语言学领域,主要为针对词汇、语义、句法等的语言本体研究。这种鲜明的对比是我国政府对英语教育长期重视的结果。随着我国国际社会影响力的不断提升,各个语种的人才都成为我国参与国际事务不可或缺的力量。在这一大背景下,这种重英语而轻小语种的研究模式容易造成我国小语种人才缺失(苏新春 等,2016:88)。为适应我国的发展战略,国家社会科学基金今后应考虑加大对小语种教育的支持力度。

图4 外语类研究主题词共现网络

除语言教育外,我国小语种研究的滞后性还表现在两个方面。一方面,日俄研究对语音层面的分析比较缺乏,说明国内语言学对小语种本体研究的覆盖不全面;另一方面,虽然语料库语言学在外语类课题中也是最受关注的理论,但是它在小语种研究中的应用度非常低,这从另一个侧面反映出我国外语小语种研究的落后程度。

3.3.3英汉/汉英研究

图5是以“英汉/汉英”为基点生成的主题词共现图谱。如图所示,近十年来,“英汉/汉英”的研究热点有三个:(1)对两种语言的本体比较/对比研究(如“基于语料库的英汉程度副词的极性特征对比研究”);(2)对英汉翻译的研究(如“基于翻译过程语料库的汉英翻译单位认知研究”);(3)对英汉专业语言的词典编撰(如“英汉医学大词典”)。此外,基于英汉语法行为的类型学研究也是对这两种语言进行比较/对比研究的常用角度。由此可以看出,课题对汉英两种语言的理论和应用研究都比较全面,再次印证了这两种语言在我国语言学课题中的优势地位。

图5 以“英汉/汉英”为基点的主题词共现网络

4 结语

在已有研究的基础上,本文借助开源工具对国家社会科学基金语言学项目进行了可视化文献计量分析。我们首先梳理了课题的基本概貌,然后通过网络可视化工具,对热点主题词的共现信息进行了呈现,并在此基础上对国内语言学的研究现状和热点进行了深入探讨。数据分析显示,我国语言学研究总体呈现出以下特点:

4.1 实证转向

针对各热点语种主题词的共现图谱分析表明,近十年来,语言学课题的一个重要特点就是越来越依赖以语料库为基础的研究方法。这意味着我国的语言学研究正在经历实证转向,因为语料库语言学从本质上来说属于实证性研究(Biber et al.,2017:548)。相关文献表明,近年来,国外的语言学文献也呈现出实证主义的特点(孙亚 等,2017:699)。这说明实证转向已经成为全球语言学研究的一个总体趋势。

4.2 强劲学科

高频主题词的年度分布表明,近十年来,我国有三个语言学学科呈现出强劲的发展势头。它们分别是语料库语言学、认知语言学和翻译研究。语料库和认知语言学都是20世纪80年代从国外引进的宏观语言学理论。这两个学科近年来的飞速发展,不仅表明它们已成为国内语言学的研究热点,也从侧面说明我国学界对国际前沿理论借鉴和吸纳的能力非常强。翻译课题数量的直线上涨,则是我国国际地位不断提升和对外交流繁荣发展的产物(黄婷 等,2017:36)。随着我国经济和科技实力的快速发展,翻译学科将继续保持强劲增长势头,在国内语言学的地位还会进一步提升(张威,2015:109)。

4.3 重点语种

前文的数据分析和讨论表明,汉语和英语是我国语言学项目的两个重点研究语种。立项课题不仅对英汉语的比较/对比研究覆盖全面,对两种语言教育的研究也非常关注。英语教育研究在国内语言学课题中的普及,是我国对外交流日益繁荣的必然结果。同时,随着我国国力和国际影响力的不断提高,到我国学习和工作的国际人士越来越多,国外开设汉语课程的学校也与日俱增。这意味着汉语二语教育研究在国内语言学的地位还将进一步提升。因此,国家社会科学基金也应尽早布局,适当加大对汉语二语教育研究的支持力度。

4.4 不均衡发展

汉英两种语言在语言学课题中的绝对优势地位,也表明我国语言学学科目前呈现出发展不均衡的特点。虽然国家社会科学基金近年来不断加大对民族语研究的支持力度,但无论是从立项数量还是从研究角度的多维性来看,民族语和汉语还相差甚远。汉语研究领域覆盖全面,而民族语研究在认知语言学和语言教育方面的文献相对较少。在外国语言学课题中,英语和小语种的不均衡发展也非常明显。除了立项数量的鲜明对比,这种不均衡特性还体现在对小语种本体研究覆盖面不全和对热点理论应用率低等方面。这一特性不利于我国语言学研究的长远发展。尤其是随着“一带一路”项目的深入实施,对民族语和外语小语种进行深入研究的必要性更加凸显。因此,国家社会科学基金应结合我国发展战略,考虑进一步加大对民族语和小语种研究的支持力度;学者在选择课题时,也应注意拓宽思路,对小语种和民族语进行多角度和全方位探讨。

猜你喜欢
语种主题词语言学
《波斯语课》:两个人的小语种
体认社会语言学刍议
《复制性研究在应用语言学中的实践》评介
《神经语言学和心理语言学视角下的二语习得》述评
浅谈小语种的学习方法和就业方向
《中国骨与关节杂志》2016 年第五卷英文主题词索引
我校学报第32卷第5期(2014年10月)平均每篇有3.04个21世纪的Ei主题词
我校学报第32卷第6期(2014年12月)平均每篇有3.00个21世纪的Ei主题词
频繁出现的Ei主题词也是一个大学学术实力的反映
社会语言学名词