实证研究基于语料库的纠错模式对大学英语写作的影响

2014-10-13 05:02付龙云
长治学院学报 2014年4期
关键词:控制组语料库准确率

付龙云

(山西师范大学 外国语学院,山西 临汾 041004)

一、研究背景

早在上世纪九十年代,Tim Johns等人已经开始借助语料库技术来辅助语言教学。他们将基于语料库索引行的材料设计成教学材料,然后交给学生自己观察,假设推断,然后再通过学生之间互相讨论,最后归纳出答案来。这种做法一般称为“数据驱动学习”(Data-Driven Learning,DDL)。

语料库的纠错功能,按照Granger的解释,体现在语言学习者通过把自己的英语作文对比英语语料库或者参照学习者语料库的典型错误特征来纠正自身中介语的典型特征(比如词汇的误用,滥用以及少用)以此来提高自身写作的准确性和精确性。[1]尽管使用语料库索引进行英语写作纠错在国外已有一定数量的研究并都取得积极性成果,然而类似研究在国内却极其少见。鉴于此,笔者将一种基于语料库的纠错模式引进到英语写作教学中,通过课堂教学实验来探讨语料库技术在促进英语写作方面的巨大潜力。

二、研究问题和方法

(一)研究问题

实验拟回答两个问题:1、基于语料库的纠错模式在处理英语写作中的突出问题(词汇错误)是否更加有效?2、基于语料库的纠错模式能否显著提高学生的英语写作水平?

(二)研究方法

1、研究对象:山西师范大学化学专业两个平行班的学生参与了为期16周的教学实验。在实验期间,所有学生必须在教师的建议下将每一篇作文先通过Microsoft Word软件进行拼写检查,再通过电子邮箱递交。凡是没有按照实验要求或者递交作文份数不够的学生,将不被视为研究对象。最终确定下来,1班25人为实验组,2班25人为控制组。用软件SPSS对他们的高考英语成绩进行统计分析,发现两班在英语水平上并没有显著性差异(见表1,P>0.05)。

表1

(2)实验过程:山西师范大学针对非英语专业的学生,并未开设专门的英语写作课程。笔者在实验期间,兼任两个班的大学英语课程教学工作,于是每两周为两个班分别开设一节写作课,本实验就是通过16周8次写作课来完成的。

第一周,要求两班学生以“A Meaningful Life”为题写一篇不少于150词的英语作文。完成后,按照要求递交给教师进行批改。批改后的作文会在本周发给学生进行自我修改。第二周要求学生再将修改后的作文重新发给教师。第三周的写作课上,针对写作高频错误以及纠错不当进行讲解然后布置下一篇作文。也就是说,一次写作任务持续周期为两周时间。在整个学期16周的时间内,总共完成8次写作任务。由于第一次和最后一次写作要作为前测和后测依据,所以是在教室里按照规定时间完成并递交的。所有写作任务都不需要学生额外的专业知识,符合大学英语四级对写作的要求。表2为写作任务清单。

表2

无论对实验组还是控制组,作文批改一律采用间接回馈,意思是针对写作中的错误,只标注不修改。实验的变量在于两组学生所采用的纠错模式不同。控制组的学生在对作文中被标注的错误进行修改时,所依据的基本是传统的学习材料,包括英语语法书和英汉双语辞典。而实验组的学生,则在教师的指导下使用当代美语语料库(COCA)作为自我纠错的参考依据。当代美语语料库是目前线上规模最大语料最全的免费英语语料库,用户界面简洁大方,检索方便而且速度很快,非常适合学生的日常学习。

(三)数据收集与分析

学生第一次和最后一次的写作材料作为实验的前测和后测进行数据分析。作者一人负责全部工作包括作文收集、错误标注、确定T单位,计算以及分析数据。按照Chandler的建议,在作文中标注种类繁多的错误,不同评分者之间很难取得高度可靠性,而且在比较前测与后测的实验中,单独评分者的内部可靠性要比不同评分者之间的可靠性重要的多。[2]为了保证在标注错误的时候达到高度内部可靠性,作者在标注错误的时候参考了桂诗春在CLEC中所使用的错误分类表,在确定T单位的时候参考了Polio的指导性原则。为了回答语料库纠错模式的效率问题,通过计算前后测作文中的词汇错误比例(词汇错误的数量/总单词数×100)来看实验组是否比例更低一些。

为了回答语料库纠错模式能否提高写作水平,写作的准确率和词汇质量被用作衡量指数而摒弃了传统的整体评分。根据Ishikawa,整体评分更适用于水平差距较大的群体。[3]一方面准确率和词汇质量都可以通过电脑软件(MS-Word和Range)客观而准确地计算出,另一方面很多相关研究已经证实准确率和词汇质量是影响作文整体水平的两个关键因素。

参考Wolfe-Quintero的方法,本研究测量写作准确率是根据每个T单位里的错误数量来计算的。[4]词汇质量由词汇多样性(LV)和词频概貌(LEP)构成。词汇多样性指作文中类符和行符的比率,即篇章中不同词汇和所有词汇之比。词频概貌是要确定每个词的词频范围。例如150词的作文,其中100个词属于第一组最常用的1000词汇,20个属于第二组最常用的1000词汇,如此类推等等。本研究中的词频概貌所依据的是Laufer&Nation的分级词表。[5]利用Range软件可以分析出作文中类符行符比和词频概貌。

三、结果与讨论

(一)结果

将两班前后测的词汇错误量进行配对样本T检验,得到表3的结果。从表3可以看出,实验组的词汇错误率由2.79%降低到1.04%,与此同时控制组的词汇错误率也有2.46%降到1.88%。通过16周的写作训练,两班学生作文中的词汇错误都有显著下降(P<0.05),但是很明显控制组的下降幅度更大一些(超过50%)。

表3

为进一步比较实验组和控制组在实验前后所发生的变化,对实验数据进行了独立样本T检验,结果如表4所示。实验前两班作文在词汇错误率上没有显出差异(P>0.05),实验组的词汇错误甚至要比控制组多一些。然而经过语料库纠错模式的干预,实验组在控制词汇错误方面要显著优于控制组(P<0.05),控制组的词汇错误几乎是实验组的两倍。

表4

表5和表6呈现的是两班作文在准确率方面的配对样本T检验和独立样本T检验结果。表5显示出两班经过一学期的写作训练,在文章准确率方面都得到显著性提高(P<0.05)。而表6显示出实验前两班作文的准确率不存在显著差异,但是实验后实验班的准确率比控制班有了显著提高(P<0.05)。

表5

表6

为比较两班实验前后作文的词汇质量,对前后测作文中的词汇信息数据分别进行了独立样本T检验,结果如表7和表8所示。从表7可以看出,实验前两班作文的词汇质量没有显著差异,写作水平相对比较低,考虑到89%词汇属于常用1000词汇的范围。而表8显示出实验组的作文经过语料库纠错模式的干预,高级词汇(Level 3&Level 4)的使用明显增多,与控制组相比具有明显差异。

表7

表8

(二)讨论

1、基于语料库的纠错模式在处理英语写作中的突出问题(词汇错误)是否更加有效?

经过一个学期的写作训练,而且都采用了间接反馈法来批改作文,两班的写作在控制词汇错误率和整体准确率方面,都得到了显著提高。这个结果和以往关于英语写作的研究是一致的。但是通过对比实验组和控制组,不难发现,无论是词汇错误的降低幅度还是整体准确率的提高幅度,都要比控制组进步明显。基于语料库的纠错模式在处理英语写作错误方面,的确要比传统模式有效。

语料库的纠错效率,首先来源于新的语料资源与学习方法的支持。其次因为语料库的使用满足了学生写作欲望,对新技术的好奇以及在线互动——计算机辅助教学的三个关键性因素。第三语料库的纠错模式大大节约了教师的纠错时间与成本,可以在写作培训以及其他方面增加更多的辅导与指引。

2、基于语料库的纠错模式能否显著提高学生的英语写作水平?

虽然实验前后两班作文的词汇多样性方面没有显著性差异,但从表8所展示的词频概貌信息看,实验组的作文中高水平的词汇显著增加,相应的常用1000词汇的使用显著减少。Lee强调过,高水平词汇的增多会提高整个写作质量。[6]考虑到作文准确率显著提高,高水平单词的使用显著增加,可以肯定地回答,基于语料库的纠错模式可以显著提高学生的英语写作水平。

四、结论

本研究旨在探索应对英语写作的最佳纠错模式。鉴于语料库技术的发展速度以及普及程度,在英语教学当中适当引进已成为不时之需。基于语料库的纠错模式在处理学生写作中的词汇错误方面具有很高的效率,而词汇错误被证实是学生英文写作中最为严重的错误类型。实验后的实验班在词汇错误的减少,整体文章准确性以及词汇质量方面,均明显高于实验后的控制班。而在实验前,两班在这些方面是没有显著差异的。这说明基于语料库的纠错模式不仅能够有效地减少学生后续写作中的词汇错误,而且还对学生的准确性和作文整体水平产生积极的影响。

为使这种纠错方法更加实用,效果更加明显,英语写作教学应该更多关注学生的词汇发展;应该向学生提供更多更权威的语料库资源;应该让学生处在更为先进更有驱动力的互联网学习环境中。

[1]Granger,S.&Gilquin,G.(2010).How can DDL be used in language teaching?The Routledge Handbook of World Englishes, Abingdon[England]:Routledge.

[2]Chandler,J.(2003).The efficacy of various kinds of error feedback for improvement in the accuracy and fluency of L2 student writing.Journal of Second Language Writing,12,267–296.

[3]Ishikawa,S.(1995).Objective measurement of low-proficiency EFL narrative writing.Journal of Second Language Writing,4,51–70.

[4]Wolfe-Quintero,K.,Inagaki,S.&Kim,H.Y.(1998). Second Language Development in Writing:Measures of Fluency,Accuracy &Complexity.Hawai’i:University of Hawai’i Press.

[5]Laufer,B.&Nation,P. (1995).Vocabulary Size and Use: Lexical Richness in L2Written Production.Applied Linguistics,16(3),307–322.

[6]Lee,I. (2003).L2 writing teachers’perspectives,practices and problems regarding error feedback.Assessing Writing,8(3),216–237.

猜你喜欢
控制组语料库准确率
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
2015—2017 年宁夏各天气预报参考产品质量检验分析
《语料库翻译文体学》评介
给商品起名字
马来西亚华文小学识字教学的字理识字研究
高速公路车牌识别标识站准确率验证法
多模态听力教学模式对英语综合能力的影响
基于COCA语料库的近义词辨析 ——以choose和select为例
基于JAVAEE的维吾尔中介语语料库开发与实现