英语学习者受阻搭配使用的语料库研究

2017-01-16 02:37孙海燕
关键词:形容词语料库词语

孙海燕

(河南师范大学 外国语学院 河南 新乡 454003)

英语学习者受阻搭配使用的语料库研究

孙海燕

(河南师范大学 外国语学院 河南 新乡 454003)

基于语料库数据探讨学习者英语写作中的搭配使用特点,研究以名词situation为节点词,通过计算Z值的统计方法提取语料库中的典型搭配词,分析不同阶段英语学习者的搭配发展特征。中国学习者常常使用一些不合英语规范的受阻搭配,影响了语言产出的自然性和地道性。学生在动名搭配方面用词不精确,在形名搭配方面缺乏多样性。受阻搭配是一种不恰当的词汇共现形式,影响了语言产出的衔接性。

语料库;学习者;受阻搭配;词汇共现

搭配知识是反映词汇深度知识的主要指标之一。随着语料库语言学的发展,基于语料库搭配研究日益受到重视,成为外语教学和研究中的一个重要领域。Nation[1]从学习的角度出发,认为搭配作为语言中高频共现的词项,具有一定程度的语义不可预测性,学习者对搭配的掌握有助于语言产出的流利性和地道性。然而,外语学习者在语言学习过程中,经常使用一些合乎语法却不地道的词语组合,Lewis[2]称这类词语组合为“受阻搭配”(blocked collocation),即学习者通过母语比照或者将英语单词同义替换而使用的搭配,但实际上是一种不适切的词汇共现。本文以situation为例,分析该节点词在各个语料库中的搭配行为。我们主要关注词语搭配,典型的词语搭配由名词、形容词、动词和副词组成[3]。通过研究中国学习者英语语料库的数据得知,学习者在写作时,有些搭配符合英语惯例,但也存在大量不地道的受阻搭配,影响了语言产出的质量,使写作缺乏准确性和连贯性。

搭配研究与语料库语言学、语义学、应用语言学等学科关系密切,不同学派采取了各自的研究传统和研究方法。在动名搭配方面,Bahns和Eldaw[4]采用翻译和完形填空的方法,研究了德国英语学习者的动名搭配产出知识,发现学生的搭配知识远远落后于总体词汇知识。Howarth从学术英语的角度研究了本族语学生和非本族语学生使用的搭配,分析了学生写作中的“动词+直接宾语”,将词语组合分为:习语、搭配、自由组合,发现许多学生没有意识到在自由组合和习语之间存在搭配这一重要领域,因此其写作很难达到学术团体的文体要求[5]。关于形名搭配,Channell[6]采用填格的方法研究了二语学习者的搭配知识,以名词为横轴,形容词为纵轴,结果表明尽管学生对这些单词本身很熟悉,却不能标出大量可接受的搭配。张文忠、陈水池[7]采用定量研究的方法探讨了中国学习者形名搭配习得,对中级偏下、高级偏下和高水平受试进行测试,研究发现受试总体上未能很好掌握形名搭配。这些研究分析了学生在搭配习得方面存在的问题,对外语教学有较好的借鉴意义。但是,以上研究只分析了动名或形名中的一种搭配,而且没有深入探讨学习者搭配对写作质量造成的影响。本文基于语料库数据分析不同阶段学习者词语搭配的使用特点,以及所使用的受阻搭配对语言质量产生的影响。

一、研究方法

语料库语言学为语言研究提供了大量可靠的数据和科学的统计工具。研究的数据主要来源于学习者语料库,采用中国学习者英语语料库(CLEC)的3个子语料库:高中生英语作文子语料库(High School Corpus, 简称HSC);大学非英语专业1—2年级学习者作文子语料库(College Non-English Major Corpus, CNC);大学英语专业3—4年级学习者作文子语料库(English Major Corpus, EMC)。参照语料库LOCNESS取自国际学习者语料库。4个语料库词容均为20万词次左右。

研究中搭配指在一定跨距内有统计意义的反复共现的词语[8]。我们采用计算Z值的方法来确定显著搭配词(Significant Collocate),在语料库驱动的搭配研究中,典型搭配可以通过提取节点词(Node)在跨距内的搭配词,计算其显著值加以确定。本文选取了在语料库中出现频数较高的名词situation为节点词,考察不同阶段学习者搭配知识的发展特征。节点词situation在LOCNESS中的观察频数为70次,在HSC中为15次,在CNC和EMC中分别为56和118次,节点词在英语专业学习者语料库中出现频数最高。研究采用的检索软件是WordSmith,该软件可以提取索引行并呈现显著搭配词。在数据分析中,我们主要关注学生使用的不地道搭配,探讨这些不恰当的受阻搭配对学习者语言输出的影响,针对学生搭配特点提出提高学生英语搭配能力的建议。

二、不同阶段学习者搭配知识的发展特征

(一) 节点词“situation”的搭配使用情况

我们以situation为例,提取它在各个语料库中的典型搭配词,考察中国英语学习者搭配知识的发展特征以及其中出现的问题。我们首先分析situation在参照语料库LOCNESS中的搭配特点(表1)。表1列出其显著搭配词和相关数据,其中“Collocate”表示在限定跨距内与节点词共现的有显著意义的搭配词(本文采用的跨距为+5,-5),“C1”表示搭配词在语料库中的观察频数,“C2”表示搭配词与节点词的共现频数,Z-score表示搭配词的显著性,由于语料库库容较小,本文所取Z值阈值为2。

表1列出了LOCNESS中situation的14个显著搭配词。其中有5个动词搭配词:assess,creating,improve,accept,discuss; 有8个形容词搭配词: hypothetical,unequal,hopeless,current,unrealistic,present,interesting,economic; 1个名词搭配词: emergency; 为了进一步分析搭配所在的语境,我们提取了节点词所在的索引行进行观察,下面是从语料库中提取的20条索引行。

表1 在LOCNESS中situation的显著搭配词

(1)Caligula was unable to accept his situation and his life can therefore be seen

(2)gula’s logic; he cannot change his situation, and so instead resolves to inflict

(3)ing needs to be done to better the situation, and soon. It is important to remem

(4)t. We won’t make this hypothetical situation any worse so lets say that the youn

(5)rnment. In 1986 a very interesting situation arose with the loss of the Socialis

(6)t they were acting in an emergency situation at the time so any evidence the det

(7)ce they had the time to assess the situation better. The emphasis on the possibl

(8)d would do just that. The present situation can be referred to as Parliamentary

(9)gain a better understanding of the situation in front of us as a nation. When we

(10)t he is really doing is creating a situation in which having confessessed his ow

(11)situation, as mainly the economic situation is the problem - a secure environme

(12)ion as the only hope in a hopeless situation. It works in favor of every party r

(13)e UK’s current balance of payments situation may even improve as a result. Simil

(14)r le of education. <#> The present situation may be liked by ChevΨnement tho

(15)untry. <#> <#> The current situation of the population today is that the

(16)E16> <#> Before we can discuss the situation of French education today and in th

(17)ld not relate to the blacks social situation. Racial prejudice has developed a t

(18)m the very start, hence creating a situation that readers can relate to and symp

(19)der to get away from a disastrous situation. These stories are from China and a

(20)ationship to God in an unrealistic situation to foil society’s imperfect relation

观察表1中的动词搭配词以及语料库索引行可知,人们既可以对一种情况进行评价(assess)或讨论(discuss),也可以改善状况(improve)。形容词搭配词可以分为以下4类:描述状况的“真实性”(hypothetical,unrealistic),传递说话者的“态度”(hopeless,interesting);表示“时间”(current,present);描述“方面”(economic,social)。这些丰富多样的词语搭配使得语言表达准确而生动。

下面我们分析中国英语学习者搭配知识的发展特征。节点词situation在高中生英语作文子语料库(HSC)中出现频数很低,只有15次。表2列出了HSC中situation的6个显著搭配词,有4个动词: imagined,tell,spoke,change,其中“tell,spoke” 的使用不合乎本族语的规范,属于受阻搭配。通过进一步提取例句的上下文可知,学生可能想要表达的意思是描述或讨论(describe,discuss) (例如: We spoke our study situation and the lives each other)。这些单词(如tell,speak,discuss)具有某种程度的语义重叠,由于近义词在心理词汇储存中位置较近,在提取时容易出现误选,因此学习者在组合词汇时常常使用近义词代替真正的搭配词。形容词搭配词只有bad,说明高中生较少使用形容词来修饰该名词。

表2 在HSC中situation的显著搭配词

在大学非英语专业学习者作文子语料库(CNC)中,situation的出现频数为56次,表3列出了它的10个显著搭配词。表中有4个动词搭配词: faced,improve,change,see, 其中,搭配词improve,change的使用符合英语惯例;而动词see 的出现反映了学习者搭配的不地道性,汉语中的对应词组为“看情况”(kan qingkuang),学习者采用了逐词翻译的策略,具有明显的母语迁移痕迹。表3中有6个形容词搭配词: serious,international,urgent,latest,current,terrible, 表明大学非英语专业学习者在形名搭配的使用上比高中生更丰富多样。他们使用serious,urgent 传递态度,使用latest,current表示时间,使用international表示方面。这些形容词的出现使其语言更加生动形象和精确,显示出学习者较高的写作水平。

表3 在CNC中situation的显著搭配词

节点词situation在大学英语专业学习者作文子语料库(EMC)中的出现频数是118次,表4列出它的14个显著搭配词。有5个动词搭配词: considering,change,alter,improved,exist, 其中,有2个动词(change,improve)和CNC中的相同;动词 alter的使用反映了英语专业学习者词汇知识较为丰富,虽然它和change是近义词,但由于它属于低频词,对学生来说更难掌握。表4中还有形容词搭配词有9个: current,worse,present,serious,unequal,general,political,peaceful,bad,除了那些和LOCNESS中相同的形容词(current,present,unequal),英语专业学习者还使用了以下搭配词:serious,general,peaceful, 这些数据表明他们能够使用各种形容词修饰名词,来表示程度、方面或传递态度。

表4 在EMC中situation的显著搭配词

为了便于比较,我们总结了situation在4个语料库中的搭配词(表5),由于名词出现较少,表中不再统计,只列出动词和形容词搭配词。表5中黑体字表示和本族语者使用一致的词语。表5显示,随着语言水平的提高,中国学生的搭配能力有一定进步。具体来说,高中生的搭配能力较为欠缺,他们使用的部分动词搭配词不符合英语惯例,使用形容词搭配词较少。大学非英语专业学生和英语专业学生的搭配水平有所提高,但也存在许多问题。中国学生使用一些合乎语法但不地道的词语搭配,如spoke/see the situation, 这些词语组合反映了学习者较低的搭配水平,影响了语言产出的质量。Lewis[2]称这些不地道的词语组合为“受阻搭配”,认为学习者或通过母语比照,或将英语单词同义替换,产出这些搭配。它们虽然符合语法规则,但几乎不为本族语者所使用。在本文中,学习者用动词spoke代替discuss的原因,可能由于这两个单词具有某种程度的语义重叠。McCarthy[9]认为学习者往往对各种语言特有的搭配感到迷惑,指出近义、反义和上下义意义关系常常引起的问题。就近义而言,有些词项虽然词义相近,但搭配特点有较大差异,适用于不同的语境或语域。由于搭配行为并非仅由普遍的语义限制所决定,这些细微的区分往往给学习者带来很大困难,他们会用词义相近的词汇代替本族语者常用的典搭配。

表5 节点词situation在4个语料库中的搭配词

(二)受阻搭配对学习者语言产出质量的影响

中国英语学习者语料库的证据表明,学习者使用的部分搭配不符合英语惯例,影响了语言产出的地道性和自然性。不同阶段学生的搭配能力虽然随着语言水平的提高略有进步,但在写作中使用了一些不恰当的受阻搭配。具体来说,学生的搭配问题主要表现在以下两个方面:动名搭配方面用词不精确;形名搭配方面缺乏多样性。就精确性而言,学生在动名搭配上表现出“用词不精确”这一特征,学生使用的动词搭配词并没有随着学习阶段的提高有很大进步。学习者语料库中的许多搭配虽然合乎语法,但并不被本族语者接受。学生倾向使用近义词代替真正的搭配词(如*tell situation代替 discuss situation),或由于母语迁移的影响(如 *see situation),产出一些不地道或不精确的动名搭配。动名搭配对于学生来说最难掌握,这一发现和以往的搭配研究结果是一致的[5]。就多样性而言,我们主要以形名搭配为例来进行讨论。数据表明,高中学生很少使用形容词来修饰名词;大学非英语专业学生的形名搭配有所进步,但多样性仍有欠缺;高水平的英语专业学生能使用更丰富的形容词修饰名词。

学习者使用的受阻搭配不仅损害了语言产出的精确性和地道性,而且还影响了语篇的连贯性。词语搭配体现了词汇共现模式,是语篇表层衔接的重要保证。他的意义体现在若干共选词当中,而不限于单个词的顺序选择。陈鹏、濮建忠[10]基于语料库数据描述了本族语者和中国学习者英语写作中的词汇衔接特点,发现学习者作文中的词汇共现模式较为单一,词汇衔接度相对较低。本文研究结果表明,学生在进行词汇组合时,由于不了解本族语使用的典型词汇共现模式,产出不地道的受阻搭配,影响了语言的衔接和写作的质量。

关于学习者搭配不地道的原因,本文认为概念迁移是影响学习者搭配习得的主要因素。在二语习得研究中,Odlin[11]提出概念迁移假说,认为学习者的习惯性思维方式会影响二语习得。在语言习得过程中,人们会形成语言概念的范畴化,主要包括:词汇概念、语法概念、语篇概念[12]。学习者对搭配的习得属于词汇概念范畴,二语学习者在目标语产出中按照母语的词汇概念进行词语组合,发生词汇概念迁移现象。我们查询了在线现代汉语语料库中的数据,检索词为situation在汉语中的对应表达“情况”。数据显示,汉语语料库中的动词搭配词有面对、研究、符合、看到、看。对比英语学习者语料库和汉语语料库中的搭配,我们发现学生在动词搭配上有明显的母语迁移痕迹,学习者使用的faced,see受到汉语中“面对、看到、看”的影响。汉语语料库中出现的形容词搭配词主要有实际、一般、糟糕、严重、新的、复杂、经济。学生使用形容词bad,serious,latest表明他们倾向于使用汉语中常用的词汇组合方式。以上证据表明,二语学习者在词汇学习过程中,受到母语概念迁移的影响,倾向于按照一语的概念网络来组织二语的词汇网络。根据心理词库的研究成果,不同词汇基于某种联系发生各种关联,词汇之间的组织形式以概念网络建立,因此学习者应努力构建二语词汇的概念网络,掌握词汇之间的典型联结方式。

三、在教学中提高学生搭配能力的建议

由于大多词语搭配没有一定的规律性,在教学中如何有效提高学生的搭配能力目前还没有很好的教学模式。Pawley 和Syder[13]认为,知道哪些合乎语法的表达是本族语者常用的,即使对高水平学习者来说也是一大难题,他们不能区分和避免那些符合语法规则但不地道的词语组合。因此,教师在教学过程中有必要指出学生使用的受阻搭配,并展示地道的用法。Bahns[14]研究了和搭配教学有关的以下问题:一是搭配在外语课堂上是否需要特殊注意?作者给出了肯定的答案,认为仅仅接触英语对学生的搭配习得是远远不够的,在搭配领域有必要进行明示教学,来帮助学生克服母语的语义干扰,加速二语词汇学习的语义重构。二是在教学中搭配的选择有何标准?研究指出那些没有对应翻译词项的搭配尤其需要关注,在选择搭配时应考虑学习者的母语背景,根据不同阶段学生的发展特点选择相应的内容。三是在课堂上应该如何处理搭配?文章中没有提供具体的操作方案。针对如何在教学中系统引入词语搭配,Nattinger 和DeCarrico[15]提出以下教学步骤:首先使用固定的程序化语言进行句型操练,然后利用代替法进行有控制的变换练习。肖武云[16]就如何利用语块知识进行了以写促说的教学实验,要求学生识别材料中的语块,并进行模仿写作和小组辩论,结果表明学生的写作能力和口语水平都有显著提高,该教学模式提高了学生语言表达的质量。这些研究成果都值得我们在教学过程中借鉴,教师应注重培养学生的搭配意识,根据学生的不同需求选择教学内容和方法。

关于语料库研究成果在教学中的应用,王家义[17]介绍了利用语料库数据进行搭配教学的方法,分析了词块理论、词汇语法理论在英语教学中的应用价值。在探讨语料库和语言教学的关系时,Granger[18]根据材料的收集及其后的教学应用方式,把学习者语料库分为两类:延时教学应用和即时教学应用。以往的语料库大多属于延时教学应用类,指语料库作为教学材料没有直接用于产出数据的学习者。近年来,即时教学应用语料库作为一种新型的语料库开始出现,指学习者不仅是语料库数据的产出者,同时又是使用者。教师把搜集资料作为正常课堂活动的一部分,学生可以分析自己产出的话语,这种方法有助于学生发现自己的问题,开展数据驱动的自主学习。

随着计算机技术的迅速发展,许多语料库检索软件都便于操作,比如AntConc软件,我们可以查询语料库提供的大量真实数据,观察节点词所在的索引行并分析搭配特征。关于在教学中如何利用语料库技术和资源,Johns[19]提出“数据驱动的学习”模式,认为应向学习者提供包含真实语境的语料。学生通过观察索引行分析典型搭配,可以归纳词语的搭配特征,加强对词汇深度知识的掌握。这种归纳式的学习方法能够促使学生进行自主学习,逐步克服对母语概念系统的依赖,提高使用语言的地道性和流利性。一方面英语教师可以从语料库中提取大量真实例句,向学生展示词语的典型用法。另一方面,学习者语料库亦可应用于课堂教学中,学生可以观察自己语言产出中的搭配特点,对比学习者语料库中的搭配词和本族语的典型搭配词,分析学生使用的不恰当搭配,提高自己的搭配意识。笔者期待在未来的教学中能有更多小型的教学应用语料库,学生通过观察自己的语言特点,提高搭配能力和语言产出的地道性。

四、结 语

学习者对词语搭配知识的掌握是其语言能力的重要组成部分。本文基于语料库数据研究不同阶段英语学习者的搭配发展特征,重点分析了其中的受阻搭配。中国英语学习者语料库的数据表明,学生的搭配能力随着语言水平的提高略有进步,但没有显著发展。学生的搭配问题表现为动名搭配的不精确性和形名搭配的缺乏多样性。学习者使用的受阻搭配影响了语言产出的精确性、多样性以及语篇的衔接性。学习者在搭配习得过程中受到概念迁移的影响,倾向于按照一语的概念网络进行二语的词汇联结。本研究对英语教学有较好的启示意义,我们认为在教学中应该采用明示教学的方法提高学生的搭配能力,教师应引导学生注意语言材料中的搭配,在教学中选择搭配时应考虑学习者的语言水平和母语背景。语料库数据和检索工具的利用有助于培养学生的搭配意识,即时教学应用语料库的开发可以促进提高学生的搭配能力。

[1] NATION I S P. Learning vocabulary in another language [M]. Cambridge: Cambridge University Press, 2001.

[2] LEWIS M. Learning in the lexical approach [C]// LEWIS M. Teaching collocation. Hove: LTP, 2000: 155-185.

[3] BENSON M, BENSON E,ILSON R. The BBI dictionary of english word combinations [M]. Amsterdam: John Benjamin Publishing Company, 1997.

[4] BAHNS J,ELDAW M. Should we teach EFL students collocations? [J]. System, 1993 (21): 101-114.

[5] HOWARTH P. Phraseology and second language proficiency [J]. Applied linguistics, 1998 (19): 24-44.

[6] CHANNELL J. Applying semantic theory to vocabulary teaching [J]. English language teaching journal, 1981 (35): 115-122.

[7] 张文忠,陈水池. EFL学习者习得英语形名搭配知识的定量研究[J]. 外语教学与研究, 2006 (4) : 251-258.

[8] SINCLAIR J. Corpus, concordance, collocation [M]. Oxford: Oxford University Press, 1991.

[9] MCCARTHY M. Vocabulary [M]. Oxford: Oxford University Press, 1990.

[10] 陈鹏,濮建忠. 意义单位与词汇衔接的实现——基于本族语者和学习者语料库的对比研究[J]. 外语教学与研究, 2011 (3): 375-386.

[11] ODLIN T.Crosslinguistic influence and conceptual transfer: What are the concepts? [J]. Annual review of applied linguistics, 2005( 25): 3-25.

[12] JARVIS S, PAVLENKO A. Crosslinguistic influence in language and cognition [M]. New York: Routledge,2008.

[13] PAWLEY A ,SYDER F H. Two puzzles for linguistic theory: Nativelike selection and nativelike fluency [C]// J RICHARDS , R SCHMIDT. Language and communication. London: Longman, 1983: 191-227.

[14] BAHNS J. Lexical collocations: a contrastive view [J]. English language teaching journal, 1993 (47) : 56-63.

[15] NATTINGER J, DECARRICO J. Lexical phrases and language teaching [M]. Oxford: Oxford University Press, 1992.

[16] 肖武云. 基于语块的以写促说的教学模式实证研究[J]. 外语教学, 2011(5): 52-55.

[17] 王家义. 基于语料库的英语词汇教学:理据与应用[J]. 外语学刊, 2012 (4) : 127-130.

[18] GRANGER S. The contribution of learner corpora to second language acquisition and foreign language teaching [C]//AIJMER K. Corpora and language teaching. Amsterdam: John Benjamins Publishing Company, 2009: 13-32.

[19] JOHNS T F. Should you be persuaded: Two examples of data-driven learning [C]//JOHNS T F, KING P. Classroom concordancing. Birmingham: ELR, 1991.

[责任编辑 王晓雪]

A Corpus-Based Study of Blocked Collocations Used by Chinese EFL Learners

SUN Haiyan

(FacultyofInternationalStudies,HenanNormalUniversity,Xinxiang453007,Henan,China)

This paper investigates Chinese EFL learners’use of collocations on the basis of corpus data. It retrieves the significant collocates of the node word “situation” by the statistical method of Z-score, and analyzes the development of Chinese EFL learners’ collocational competence. The findings indicate that Chinese learners often use unconventional blocked collocations, thus lacking naturalness and idiomaticity in language production. The learners show inaccuracy in the use of “Verb Noun” collocations and lack of variety in the use of “Adj. Noun” collocations. The learners’ writing is not cohesive due to their use of blocked collocations, which fall into an improper lexical co-occurrence.

corpus; learner; blocked collocation; lexical co-occurrence

2016-07-16

国家社会科学基金青年项目(13CYY002);河南省教育厅教师教育课程改革研究项目(2017-JSJYYB-034)。

孙海燕(1975—),女,河南焦作人,博士,副教授,主要从事应用语言学和语料库语言学的研究。 E-mail:sunhaiyan75@126.com

10.16698/j.hpu(social.sciences).1673-9779.2016.04.012

H059

A

1673-9779(2016)04-0001-07

孙海燕.英语学习者受阻搭配使用的语料库研究[J].2016,17(4):462-468.

猜你喜欢
形容词语料库词语
容易混淆的词语
认识形容词
找词语
《语料库翻译文体学》评介
基于JAVAEE的维吾尔中介语语料库开发与实现
一枚词语一门静
语篇元功能的语料库支撑范式介入
形容词