语料库在写作词汇错误分析中的应用

2010-08-15 00:49

周 川

(大连东软信息学院英语系,辽宁大连116023)

语料库在写作词汇错误分析中的应用

周 川

(大连东软信息学院英语系,辽宁大连116023)

对中国学习者英语语料库中200篇作文的词汇错误进行分析,结果表明,学习者的词汇错误大多是由于学习者对常用词汇知识掌握不牢固引起的。要克服这些错误,学习者必须在了解英汉语言之间相关差异和英语具体规则的基础上,通过多种渠道增加英语输入量,同时通过说、写等输出活动来巩固所学词汇知识,逐步提高词汇运用能力。

语料库;英语写作;应用;错误分析;非英语专业学生

中国大学生的写作水平较低,在很多情况下是受词汇错误的影响。笔者以大学低年级和高年级学生为研究对象,采用定量和定性两种研究方法,对中国学习者英语语料库中 200篇作文的词汇错误进行分析,旨在探寻不同层次学生的词汇错误类型和数量的区别以及错误产生的原因,从而为我国大学英语写作教学提供参考。

一、国内词汇错误研究回顾

近年来,在国内随着几大语料库的建立,如桂诗春、杨惠中的《中国学习者英语语料库》(CL EC)[1],文秋芳、王立非的《中国学生英语口笔语语料库》(SWECCL),许多研究者开始对这些语料库的语言错误进行研究。杨惠中等[2]和杨和琴[3]对 CLEC的词汇失误,如替代错误、词类错误、搭配错误、连词错误和定冠词错误等进行了分析。据统计,在CLEC中词汇错误(词形失误和词汇失误)占语言错误的50.89%[2]。本研究采用桂诗春等的分类,对词形失误和词汇失误进行研究。为方便起见,笔者把这两类失误统称为词汇错误。

二、研究问题和方法

(一)研究问题

本研究拟回答以下问题:词汇错误及其分类错误与作文质量是否具有相关性?非英语专业低年级学生与高年级学生的作文词汇错误有何差异?

(二)研究工具

中国学习者英语语料库(CL EC)。本研究语料来自于CL EC的大学英语四、六级考试两个子语料库。由于此语料库的语料来源于不同题目的作文,词汇不集中,不利于研究,因此本研究的语料仅选同一题目的作文。作文题目为“Health Gains in Develo2 ping Countries”,总共200篇作文,其中四级考试作文110篇,六级考试作文90篇,共41280个单词。

语料库检索软件(AntConc3.2.1)。

去除标注工具(Detagging Tool)。中国学习者英语语料库是言语失误已标注的语料库,因研究需要使用Detagging Tool去除标注。

社会科学统计软件包SPSS13.0。

三、结果与讨论

(一)对数据的处理及分析

1.词汇错误与作文分数相关分析

词汇是信息的载体,学生词汇掌握水平往往能够决定其信息传达的范畴和能力。统计数据显示,词汇错误与作文分数负相关,说明词汇错误越多,写作水平越低,学生的词汇能力在一定程度上影响了写作质量。拼写、大小写、词类、替代、省略和冗余错误都与作文分数负相关,虽然相关系数不高,但都达到了显著水平,具有数理统计意义。

2.不同层次学生作文词汇错误差异比较

参加大学英语六级考试的学生通常是通过了大学英语四级考试的非英语专业高年级学生,比参加大学英语四级考试的低年级学生学习英语的时间长,水平高。为了了解不同层次学生词汇错误的特点,本研究对四、六级考试作文的词汇错误进行了t检验。统计数据显示,每篇四级作文的词汇错误是11147个,每篇六级作文的词汇错误是7168个,差异非常显著(t=61845,p=01000)。四级作文错误标准差比六级作文大,说明内部差异更大。就各类词汇错误而言,除四级作文的冗余错误比六级作文少外,其余各类错误均比六级作文多,且四、六级作文在拼写、大小写和词类错误方面差异显著(t值分别为 61523、61876、21027,p值分别为 01000、01000、01043)。这说明学生学习英语的时间越长,层次越高,词汇错误越少,词汇运用能力越强。

3.不同水平作文词汇错误差异比较

为了比较不同水平作文词汇错误,本研究根据作文分数的高低,把作文分数最高的前50篇定为高分组,分数最低的50篇定为低分组。统计数据显示,低分组每篇作文的平均词汇错误数量是12186个,高分组是6134个,即低分组的词汇错误比高分组多一倍左右,方差分析显示差异非常显著(F= 241315,p=01000)。就各类错误而言,低分组每篇作文的平均错误数量都比高分组多,方差分析显示高、低分组的各类错误差异显著(p值都小于0105)。这说明词汇错误越少,词汇运用能力越强,作文分数越高。

(二)学习者词汇错误的主要特点及原因分析

1.拼写错误

拼写错误发生频率最高,占词汇错误总数的35165%,且与英语作文水平负相关,拼写错误随着学习者学习层次和语言水平的提高而减少,但是,非英语专业高年级学生和语言水平较高的学习者仍然犯了许多拼写错误,需引起学习者的高度重视。

中国学习者拼写错误的原因可归结为两点。第一,英语拼音本身的复杂性。英语中音素和形素的映射并非一一对应,用于标音的字母及字母组合远比音素要多,40个音素对应70个形素。例如音素/k/可以用c、ch、ck、k等形素来表示。第二,书写时的粗心及对英语拼写的不敏感。作文中的关键词“mortality”被写成“mortility”达374次。

2.词类错误

词类错误指词根正确但词类错误的词。本研究的语料库中,词类错误占词汇错误总数的12186%,且与英语作文水平负相关。

从形式上看,这些词类错误均是实词的词尾不是上下文所要求的派生形式,这主要是因为中国学生忽视了英语实词不同词类的词尾特征。

3.替代错误

替代错误指在一定上下文中从语法角度看正确但在语义上却讲不通的词汇错误。替代错误的频次仅低于拼写错误,占词汇错误总数的19188%,几乎涉及所有词类。这些错误的产生通常与英语词汇知识掌握不好有关。英语的同义词非常丰富,但完全同义的词非常少。这些按汉语思维同义的词在英语中受语境制约,其意义和用法差异很大。有些词汇错误受汉语表达习惯的影响,是由汉语直接翻译过来的。

4.冗余型错误

冗余型错误占错误总数的6195%。这些冗余错误是语内错误,是学习者没有掌握英语习惯用法造成的,不是母语干扰造成的。

四、结论

通过数据处理及分析,笔者得出以下结论:本研究的语料库中词汇错误占语言错误的59133%;发生频率最高的词汇错误是拼写错误,其次是替代错误;作文的词汇错误数量与写作质量负相关;不同学习层次以及不同写作水平的学生的词汇错误数量差异非常显著。

通过对学习者写作语料库中词汇错误的进一步分析,本研究发现,中国学生的词汇错误主要有拼写错误、词类错误、替代错误和冗余型错误。学习者的词汇错误大多是由于学习者对常用词汇知识掌握不牢固引起的。要克服这些错误,学习者必须在了解英汉语言之间相关差异和英语具体规则的基础上,通过多种渠道增加英语输入量,同时通过说、写等输出活动来巩固所学词汇知识,逐步提高词汇运用能力。

[1]桂诗春,杨惠中.中国学习者英语语料库[M].上海:上海外语教育出版社,2003.

[2]杨惠中,桂诗春,杨达复.基于CLEC语料库的中国学习者英语分析[M].上海:上海外语教育出版社,2005.

[3]杨和琴.英语专业低年级学生作文中的替代错误研究[D].对外经济贸易大学,2006.

责任编辑 强 琛 qiangchen42@163.com

book=366,ebook=366

H315

A

1673-1395(2010)02-0148-02

2009212221

周川(1975—),男,辽宁大连人,讲师,主要从事大学英语教学与研究。