基于笔语语料库的中国学生介副词across词汇型式使用研究

2019-05-10 09:53王惠霞
商丘职业技术学院学报 2019年2期
关键词:本族语型式语料库

王惠霞

(陇南师范高等专科学校,甘肃 成县 742500)

中国学生习得词汇,习惯于对应单词表,记忆核心语义,对词汇的语体、语义场、语用特征则忽略不计。这是造成中国学生词汇学习中语音、拼写及使用过分注重核心语义的机械嫁接和汉语式英语频发的原因之一。Hunston 和Francis(2000)在对本族语者典型词汇搭配进行研究的基础上提出了型式语法( Pattern Grammar)[1]。他们指出所谓词汇型式指的是与某个词有规律地同现并对其意义产生影响的所有词项的组合。型式语法的提出有效地解决了词汇意义的组织与传达,借助语料库技术,体现词项之间的搭配关系,从而进一步确定词汇使用的语体、语义场和语用特征。

近年来,国内对英语词汇型式的研究不断增多(濮建忠2003[2];梁茂成2008[3];赵晓临2010[4];刘国兵2011[5];张琳2012[6],王惠霞2013[7],陈功2017[8]),但多围绕动词词汇型式和理论介绍展开,对副词、介词词汇型式的研究还不多见。本文选取across作为研究对象,是因为across是中国大学生较早习得的词汇之一,同时across兼有副词和介词功能,可以与动词搭配形成短语动词,也可组成介词短语,充当定语、状语、表语。

以前,学者对该词的研究主要是从界态类型(陈佳2010[9])、原型多义网络的认知理据(汪宝兵2013[10])等角度展开,迄今为止,基于笔语语料库的词汇型式研究还未出现。本研究采用中介语分析方法,试图描述中国大学生习得介副词across 的词汇型式和使用特征及差异,并分析差异产生的原因,为我国英语教学提供借鉴和参考。

一、研究设计

(一)研究问题

本研究试图回答以下三个问题:

1.书面语中,中国大学生英语学习者(以下简称中国学生)与英语本族语大学生(以下简称本族语者)相比,在使用across的总频数是否存在明显差异。

2. 中国学生与本族语者在使用across的过程中,词汇型式是否存在明显差异,原因是什么。

3. 中国学生 “v+across”词汇型式典型搭配的语义倾向与本族语者相比有何差异,原因是什么。

(二)语料库的选用

本研究选取了中国学生笔语语料库(WECCL2.0)[11]和鲁汶本族语语料库(LOCNESS)作为学习者语料库和对比语料库。中国学生笔语语料库(WECCL2.0)语料源于全国各种层次的高等院校英语专业学生限时和非限时作文,共4 950篇,总词数1 289 303,包含27个不同题目的英语议论文和说明文。鲁汶本族语语料库(LOCNESS)总词数326 093个词,包括母语为英语的大学生作文207篇。虽然就文章话题而言,这两个语料库之间有些差异,但两库语料均来自大学生作文,且多是议论文,这在某些方面弥补了文章话题上的差异和不足。

(三)研究步骤

本研究采用语料库证据支持下的中介语对比分析方法CIA(contrastive interlanguage analysis),对所获得的数据采用定量分析和定性分析相结合的分析方法。研究步骤如下:

1.使用语料库索引软件AntConc,在中国学生笔语语料库(WECCL2.0)和鲁汶本族语语料库(LOCNESS)中分别以across为检索词进行检索,提取索引行,建立across索引数据库。

2.分别统计across出现的总频数,将总频数转化为标准化频数(每千词中出现的频数),利用卡方检验计算中国学生和本族语者在使用总频数上是否有显著性差异,显著性水平设为5% ( P< 0. 05) 。

3.利用AntConc中Collocate选项卡,提取该词左右语境中的搭配词,人工标注并统计搭配词词类,形成across词汇型式,利用卡方检验计算中国学生和本族语者在具体词汇型式上是否有显著性差异。

4.观察搭配词,按照出现频率由高到低的顺序提取中国学生笔语语料库(WECCL2.0)中前5位出现的“v+across”词汇型式并与鲁汶本族语语料库(LOCNESS)进行对比,判断是否有显著性差异。

5.提取中国学生笔语语料库(WECCL2.0)最典型“v+across”应用,深入研究其语义使用特征,并分析其原因。

二、结果与讨论

(一)总体特征

以across为检索词分别对两库进行检索后,我们发现,在中国学生笔语语料库(WECCL2.0)共得到索引行107条,在鲁汶本族语语料库(LOCNESS)中共得到索引行33条。除去学习者拼写误用的索引行,共得到137条有效索引行(其中中国学生笔语语料库(WECCL2.0)104条,鲁汶本族语语料库(LOCNESS)33条。通过卡方检验和差异显著性检验,我们发现across两库中总体特征如下(见表1):

表1 两库中across总频数统计表

表1 统计结果显示,中国学生与本族语者在书面语中对across的使用不存在显著性差异(P=0.255>0.05),两者对该词的使用频率趋同。与国内学者研究结论相同。

(二)两库中across左侧1位和右侧1位词汇型式对比分析

两库中across左侧1位和右侧1位词汇型如下(见表2、表3):

表2 两库中across左侧1位(1L)搭配词类统计表

表3 两库中across 右侧1位(1R)搭配词类统计表

表2的统计结果显示,中国学生在使用across 的过程中,左侧1位最常使用 “v+across”的词汇型式,其次为 “n+across”,再次为 “adv+across”。本族语者左侧1位最常使用 “n+across”的词汇型式,其次为 “v+across”,再次为 “prep+across”。根据两者在该词语法使用规则,确定“v+across”和“n+across”为其词汇型式,其他词类忽略不计。显而易见,中国学生和本族语者在“v+across”和“n+across”词汇型式使用上存在显著性差异(P=0.007, 0.000<0.05)。具体来说,中国学生过度使用“v+across”型式,而“n+across”词汇型式明显使用不足。分析原因,我们认为这可能和中国学生首先习得across副词属性功能与动词搭配构成动词短语的词汇型式有直接关系。介词across语义表示“越过,跨过”等含义,这在汉语中均用动词表示,所以中国学习者受母语影响,对该词介词用法不敏感,掌握相对滞后。而本族语者娴熟掌握across作为介词属性含义,在使用过程中更注重介词修饰名词充当定语和状语的语法功能。

表3统计结果显示,中国学生笔语语料库(WECCL2.0)中右侧1位出现频率最高的是限定词和代词,由限定词和代词修饰名词,通常与名词同时出现的语法规则,我们可以推断 “across + determiner+ n”的词汇型式是其右侧最典型的词汇型式。同时,数据和语法规则显示“across+n” 也是右侧典型的词汇型式。与本族语者相比,中国学生在across与限定词、代词、名词搭配中都存在显著性差异(P值分别为0.040,0.014,0.015,p<0.05)。通过观察索引行,我们发现中国学生限定词使用存在使用不足的现象。在检索出的40条索引行中定冠词the占15条,不定冠词a占20条,an占5条,而本族语者限定词有且仅有定冠词the一词。这充分说明中国大学生对英语限定词,尤其是定冠词的用法掌握较差,不能正确区分使用定冠词与不定冠词的场合。就across右侧1位而言,中国学生也存在代词使用过度、名词使用广度不足的现象。名词集中在difficulty、trouble、 problem、something等词,而本族语者名词则是America、town、roads、frontiers等词。

(三)典型 “v + across”词汇型式语义分析

我们从中国学生笔语语料库(WECCL2.0)中提取频率由高到低排在前5的“v+across”词汇型式,对比鲁汶本族语语料库(LOCNESS),发现两库存在以下差异(见表4):

表4 两库中频数最高的前5位“V+across”词汇型式显著性统计表

表4 统计结果显示,come across 在中国学生笔语语料库(WECCL2.0)出现频率最高,与鲁汶本族语语料库(LOCNESS)存在显著性差异(p=0.000<0.05)。我们选取该词作为典型型式,进一步深入研究中国学生语义习得情况。通过查阅《牛津高阶英汉双解词典》[12]与《朗文当代英语词典》[13],我们将come across的语义划分为3项:一是“to meet, find or discover someone or something by accident or by chance.”;二是“an idea or meaning be understood or communicated.”; 三是“make an impression of the specified type.”。提取两库中come across 搭配索引行,建立单独语料库,共得到86条语料,其中中国学生笔语语料库(WECCL2.0)83条,鲁汶本族语语料库(LOCNESS)3条。鲁汶本族语语料库(LOCNESS)语料抽取如下:

e is some order in the world. The idea that comes across is that although in theory everything is permitted…

ully if you are reading this, the point will come across to you. I know the rules are very important to …

l and the lottery's slogan 'It could be YOU' come across well amplifying the fact that everyone who buys …

将所有86条索引行人工标注义项,得到结果如下(见表5):

表5 两库中come across 不同语义频数及差异显著性统计表

表5统计结果显示,中国学生对come across语义使用主要集中在义项1,即 “碰见、偶然遇见”,与本族语者相比,存在过多使用的情况(p=0.000<0.05)。义项2,即“被理解,被传达”及义项3 “使人产生某种印象”的含义则使用不足(p=0.045,0.047<0.05)。这说明中国学生在语义习得的过程中存在中介语石化现象。莫青杨、孙蓝认为,“中国学生对目标词首要义项的习得与其他义项的习得有极大的差距”[14]。徐鹏的研究也表明动词短语在使用深度上有所欠缺。短语使用义项集中化,往往局限于某一种语义高频大范围使用,而该短语其他义项则无所触及[15]。

观察come across 宾语使用倾向,我们发现中国学生对come across宾语搭配,存在误判的现象。本族语者常用诸如country、nation、 united states、 USA等表示地点的词,中国学生则常搭配a word、trouble、difficulty、people、lady、problem、question等词。这些词基本上属于两类语义场。一个属于人的集合,另一个属于“事”的集合。“事”的集合中多为表示消极含义的事情,其中一些搭配在英语中不可接受,是典型的中式英语,如come across trouble*, come across problems*, come across an emergency*。

探讨其原因,我们认为中国学生受母语负迁移影响,常常按照经济原则,过分依赖现成的对单词、短语等的汉语解释,习惯于简单嫁接汉语语义使用情境,从而造成汉语式英语。反映在该短语动词的习得上,中国学生将come across含义直接等同于汉语“遇见”。汉语“遇见”是中性词,可以搭配积极或消极事物,也可以搭配具体或抽象的人或事。英语中come across表示“遇见”的情况不多,多表示偶然、碰巧遇到具体人或物。此外,由于缺乏英语使用环境、教材和教参编写的局限性以及教学时数的限定,教师不能深入了解该词的其他义项,更不能通过引用大量的例句让学生掌握该词语境和语用特征,从而造成学生词汇习得深度和广度不足。

三、对教学的启示

第一,引入基于语料库的数据驱动(Data driven learning- DDL)外语学习模式。数据驱动学习是指让学生观察大量真实语言后,概括和归纳语法规则和使用特征,具有“自主学习真实语言输入”“自我探索和自我发现”“自上而下的归纳式学习方式”等主要特征[16]。我们应鼓励教师在教学中引进这种方法,帮助学生建立词汇使用的真实语境信息。

第二,加强教材教参编写的科学性。英语教材选择或编写的语言素材必须与真实生活中使用的语言一致。尽量避免教师对教材的断章取义,同时教材的编写也应增加中英语言对比研究的成果,对词汇型式、语义倾向、语义韵等方面要有一定的阐释和说明。

第三,努力克服词汇习得过程的石化现象,降低母语负迁移程度,减少语义、语法、语用错误,建立和拓展词汇习得语义网络,提升语言学习深度。同时,培养学生词块学习意识,养成以词块为基本单位,而不是孤立地学习个别单词。

四、结语

本研究基于笔语语料库,对比分析了中国学生介副词across词汇型式习得情况。研究发现,中国学生与本族语者在书面语中对across的使用不存在显著性差异(P=0.255>0.05),两者对该词的使用频率趋同。但是,两者在“v+across”和“n+across”词汇型式上存在显著性差异,中国学生过度使用“v+across”型式,而“n+across”词汇型式明显使用不足。对“v+across”典型词汇型式语义倾向分析发现,中国学生词汇习得深度和广度还有待提高。

猜你喜欢
本族语型式语料库
幕墙型式对高层建筑室内自然通风影响的模拟
现代中小河流常用有坝壅水建筑物型式探讨
《语料库翻译文体学》评介
军持的型式分析与年代分期
不同动力型式的巡飞弹总体参数对比分析
基于JAVAEE的维吾尔中介语语料库开发与实现
基于语料库的中国大陆与本族语学者英语科研论文模糊限制语比较研究——以国际期刊《纳米技术》论文为例
语篇元功能的语料库支撑范式介入
从迁移理论看研究生英语视听说课中学生的偏误
最容易发的音与最难发的音