国内中高考英语完形填空效度研究综述
——以1998—2018 年中国知网期刊论文为例

2019-08-17 08:43梁艳玲
英语教师 2019年14期
关键词:效度考点语篇

梁艳玲 周 胜

引言

完形填空是由威尔逊·泰勒(Wilson Taylor)于1953 年根据格式塔心理学(Geztalt psychology)创设的一种用于测试以英语为本族语的人阅读课文能力的新题型。格式塔心理学,即补全心理,认为人有天生把不完整的图形补全的能力,“整体不等于部分之和,整体先于部分而存在,并制约着部分的性质和意义”(舒云祥1999:25),“应用于语言现象,则是人们利用自然语言的语言羡余现象(redundancy),将不完整的语言补全”(李筱菊1997:234)。

完形填空属于C 类综合性考点单技能试题。奥勒(Oller)将完形填空称为“语用考试(pragmatic tests)”,并认为它是最有效的语用综合性测试形式之一。相关研究发现,受试者在C 类题型试题中的得分往往与在其他种类语言测试题中的得分有相当高的相关性(李筱菊1997:234)。这种综合性测试强调在语境中测试,其测试结果会更接近学生的实际语用能力(周胜 2003:66)。奥尔德森(Alderson)的研究结果却表明,不同的删词起始点、不同的删词比例都会影响测试结果。布朗(Brown,1993)指出,在以往的研究中,效度最差的为19.00%,效度最好的为83.00%(转引自毛延生、张建丽 2008)。

20 世纪80 年代后期,完形填空开始在中高考英语测试中占据重要地位(高考卷占30 分、中考卷占25 分:选择性完形填空10 分,短文填空15 分),更被称为“障碍性阅读”,是决定学生在中高考英语测试中取胜的关键。以广东省佛山市中考英语短文填空为例,学生平均得分低于7 分。可见,完形填空测试的效度(有效性)至关重要。然而,国内对英语完形填空的效度研究并不多。李筱菊(1997:234-260)曾指出,“如果把完形填空研究的国内和国外状况进行过比较,我们会发现一个十分奇怪的情况,国内完形填空使用最多但研究最少,而国外完形填空使用不多但研究特别多。”

鉴于此,为了更好地了解国内中高考英语完形填空效度研究的实际状况,本文尝试对1998—2018 年中国知网(CNKI)收录的有关国内中高考英语完形填空的期刊论文进行梳理和分析,以期为本领域的研究动向提供参考。

一、研究状况

(一)基本情况

在中国知网(CNKI)高级搜索期刊论文搜索中输入篇名“完形填空”,以“外国语言文学”学科进行分组搜索历年文献(1998—2018 年),通过阅读和分析文献,得出专门研究中高考英语完形填空的期刊论文206 篇,并对这些论文进行分类和分析。其中,研究效度的论文34 篇,仅占总论文量的16.50%;研究解题技巧/策略的论文141 篇,占总论文量的68.45%,是研究效度论文数量的4 倍多。具体如表1 和图1 所示:

表1:1998—2018 年中高考英语完形填空研究的期刊论文统计

图1:1998—2018 年中高考英语完形填空效度研究的期刊论文年收录分布

(二)研究总趋势和特点分析

1.从所得论文数量来看,过去的二十年间,国内对中高考英语完形填空效度研究的学术关注度不高,研究不多;发展过程中虽有起有落,但总体呈上升趋势。

2.国内高考英语完形填空效度研究发展缓慢,总体经历了4 个时期,即初始期、上升期、渐落期和高峰期。

初始期(1998—2004 年):研究成果较少(1 篇);上升期(2005—2007 年):研究成果有所增长(4 篇);渐落期(2008—2010 年):研究成果下降(1 篇);高峰期(2011—2018 年):研究成果是4 个阶段中最多的(22 篇),除2011 年和2014 年各仅有1 篇论文外,其他每年论文数量都大于或等于其他3 个时期中任何一年的论文数量,并在2016 年达到峰值(6 篇)。

3.国内中考英语完形填空效度研究经历了2个阶段。

2011 年以前,中国知网上并未收录任何有关中考英语完形填空效度研究的期刊论文;2011 年之后开始进入活跃期,2011—2018 年,中国知网共收录6 篇中考英语完形填空效度研究的论文。

二、效度定义和分类

李筱菊(1997)认为,“效度”即有效性,指测试结果能够反映考查内容的准确程度,而测试结果与要考核的内容符合度越高,则效度越高。在语言测试学中,效度主要包括内容效度、表面效度、预测效度、共时效度和结构效度(Hughes,Arthur 1989;李筱菊1997;周胜2003)。内容效度是指是否测试了应考的内容,或者所考的内容是否反映了考试要求(Gronlund,Norman E 1981)。表面效度是指与考试相关的人员,如考试和教师对考试的形式和内容的评价。结构效度即考试的原则理论效度(李筱菊1997:39-41)。预测效度在于通过对比学习前后的成绩对考生的未来工作和学习作出预测;共时效度是指同一批考生两次考试结果的相关度,且两次测试之间基本上没有间隔(周胜2003:92)。

三、完形填空效度研究内容

根据上述效度的定义、分类及文献研究的具体内容,国内中高考英语完形填空效度研究内容主要集中在6 个类别,具体见表2。

表2:完形填空效度研究内容分类

(一)考点效度研究

考点效度研究是国内中高考英语完形填空效度研究的重要组成部分。学者们已据上述理论对不同年份的高考英语完形填空(全国卷或地方卷)的考点效度进行了不同角度的探究。

国内关于考点效度研究的主要理论依据是李筱菊(1997)在《语言测试科学与艺术》中提出的完形填空考点效度,包含考点层次和焦点因素。考点层次有4 种,由小到大分别为单词层次、词组层次、句子层次和语篇层次。焦点因素包括语法因素、惯用搭配因素和意义因素。低层次题目侧重语法考点,高层次题目聚焦意义。考点效度主要体现在考点层次和焦点因素两个方面,如图2(转引自李筱菊,1997:250)。

图2:考点层次与焦点因素

周长银(1999)分析了研究高考英语完形填空考点效度的原因和必要性,并依据李筱菊的考点效度理论,研究了1998 年高考英语全国卷完形填空的考点效度,得出该试题考点效度相当高、区分度很高。聂建中、赵秀红(2005),毛彦婷、高本芝(2011),卢庆庆(2017)也分别对不同年份高考英语完形填空考点效度进行了研究(见表3),结果发现所研究试题的考点效度(提)高,命题更科学化。

表3

刘善仁(2005)从语篇层面分析了2005 年高考英语(山东卷)完形填空,认为试题是从语篇层面考查学生在语境中综合运用语言和词汇的能力,区分度高。周燕(2017)从语篇角度分析了2017 年高考英语全国卷Ⅲ完形填空的内容、所设置的考点方向、模式、主述位、词汇的同现及重现,提出高中英语教师应将语篇衔接与连贯手段的相关理论运用到课堂教学实践中,培养学生的语篇分析能力。

上述研究结果表明我国高考英语完形填空更注重考查学生综合语用能力和逻辑思维能力/语篇能力。

(二)考点效度与文本、考试大纲和课程标准等结合的研究

1.高考英语完形填空测试

2007 年,国内高考英语完形填空研究开始着眼于将考点效度与文本选择、《高考英语考试大纲》《教学大纲》和《普通高中英语课程标准(实验稿)》等结合,对高考英语完形填空的效度进行更综合的质性研究,此类文章有9 篇(见表4)。虽然研究者们的具体研究结论有差异,但总体认为所研究的完形填空的体裁以记叙文为主,鲜有单纯的说明文或议论文,且题材广泛,以校园生活和奇闻逸事为主,贴近学生生活,以语篇层次为主,考点层次比较高,注重考查意义,测试效度高,充分发挥了完形填空的综合功能和篇章功能。

表4:高考英语完形填空考点效度与文本、考试大纲和课程标准等结合的研究

2.中考英语完形填空测试

国内对中考英语完形填空的考点效度研究也以李筱菊的考点效度理论为基础,并结合《全日制义务教育英语课程标准(实验稿)》《普通高级中学英语课程标准(实验稿)》《九年义务教育全日制初级中学英语教学大纲(试用修订版)》进行分析,同时提出命题、教学建议。

史慧君(2013)对2008—2012 年山西省中考英语完形填空进行文本分析,发现都有较高的考点效度(2009 年的完形填空除外),并对新课改环境下的命题和教学提出了建议。许佳英、郑志恋(2016)通过研究发现浙江省杭州市中考英语完形填空的命题已经进入成熟稳定阶段,但某些年份的完形填空对考点层次和焦点因素这两个维度的题目分配比率欠合理。陈小芳(2017) 认为浙江省某市2012—2017 年的中考英语完形填空的考点效度较高,难度适中且有上述趋势,命题者可通过调整超纲词汇来提高试题效度。

上述研究表明,学者们所研究的中考英语完形填空虽然存在某些不足,但总体符合课程标准和《九年义务教育全日制初级中学英语教学大纲(试用修订版)》的要求,考点效度较高。

(三)高考英语完形填空的分析框架研究

高考英语完形填空的分析框架是指篇章特点(体裁、题材、文章词数、设空间距)和考点效度(考点层次、焦点因素、考查项目)两个层面,七个项目(辜向东、党菲菲2008)。

董曼霞(2014)结合《高考英语考试大纲》和《普通高中英语课程标准》,并基于上述分析框架提出新的分析框架——篇章特点(体裁、题材、篇章长度、难度)和考点效度(设空间距、考点层次、焦点因素、空格词类),即在篇章特点中加入“难度”,并把“设空间距”从篇章特点中挑出,归入考点效度,并据此框架历时分析了2004—2013 年高考英语全国卷完形填空的篇章特点和考点效度。其研究结果发现,试题体裁较广,题材真实、有教育意义,长度基本符合要求,难度较适中,考点效度较高,但题材范围较窄,以个人经历为主,考点因素过于集中意义因素,实词考查过重。

康荟杰(2015)根据董曼霞的分析框架探讨了2015 年15 份高考英语试卷完形填空的篇章特点和考点效度,但缺乏对不同层次考点比重的研究。高柔云(2016)针对2016 年广东省启用全国卷的背景,对2011—2015 年高考英语全国卷Ⅰ和10 套广东卷的完形填空进行了比较与分析,探讨命题特点,为广东省高考英语完形填空命题提供参考。黄娟(2018)则主要根据《2018 年普通高等学校招生统一考试英语考试大纲》《普通高中英语课程标准(2017 年版)》和辜向东、党菲菲(2008)的完形填空分析框架共时分析了2018 年高考英语全国卷和自主命题卷完形填空的内容效度,发现题材体现时代性、注重跨文化意识培养、凸显育人导向,贴近学生生活,语篇长度较合适,考点效度较高,并针对试题存在的一些问题提出了命题和教学建议。

概观2014—2016 年的高考英语完形填空研究,其分析框架在不断完善,这些分析框架的提出,为完形填空的效度研究提供了更科学的依据和方法,并逐步在实际中(命题和教学)发挥更好的指导价值。

(四)完形填空的任务特征分析研究

任务特征(test characteristics)框架包括测试环境、测试说明、语篇输入、预期回答及语篇输入和预期回答的关系五个部分。其中,语篇输入是指考生要处理和回答的测试材料,包括材料的呈现形式和语言特征。材料的呈现形式包括材料使用的语言、材料长度和输入材料的速度等,语言特征包括材料的话题结构和语篇特征。预期回答是指考生对测试任务作出的反应和输出(Bachman&Palmer 1996)。

1.高考英语完形填空

2016—2018 年高考英语完形填空的效度研究重点集中在学者们参考上述任务特征框架及考点效度理论,以及辜向东、党菲菲(2008)的高考英语完形填空分析框架,结合《高考英语考试大纲》《普通高中英语课程标准》建构了两种高考英语完形填空的任务特征分析框架,并对高考英语完形填空进行历时和/或共时分析。一种框架包括短文特点(体裁、题材、文章难度、删词间距)、考查点特征(考点层次和焦点因素)和选项设置(考查点分布和干扰项设置)三个维度(黄丽燕、李乔娜2016),另一种框架是语篇输入(长度、体裁、题材、易读度、设空间距)和预期回答(考点效度、考点词汇)(李亦爱2017)。

黄丽燕、李乔娜(2016)通过研究发现,2011—2015 年的高考英语全国卷Ⅰ和广东卷完形填空的题材贴近生活,体裁多样化,难度适中,考点层次高,地方试题在短文体裁和难度稳定性上异于全国卷。李亦爱(2017)认为高考英语全国卷Ⅰ(2012—2016 年)完形填空体裁多样,题材涉及学生生活,广东卷(2012—2015 年)完形填空体裁单一,均为说明文,个别题材较陌生,学生不易理解;全国卷Ⅰ完形填空长度合理,设空间距规范,而广东卷完形填空超出长度标准,设空间距过大;两种试卷考点效度高。王碧文(2017)通过研究发现,2014—2015年高考英语全国卷Ⅰ、卷Ⅱ及2016 年福建省1 月、4 月质检卷,厦门市3 月质检卷的完形填空体裁以夹叙夹议为主,词数符合大纲规定,各卷考点词分布各有偏重,总体考点效度高。

2.中考英语完形填空

刘静(2011)以任务特点框架和考点效度理论为基础,结合《全日制义务教育英语课程标准(实验稿)》,从语篇输入和预期回答两个方面探讨了山西省全省中考统考卷(2008—2010 年)完形填空的内容效度,研究结果表明内容效度较高,然而在生词标注量的控制、考点层次和焦点因素的分布等方面存在问题,并提出了相应的改进建议。

从上述研究结果可以看出,被研究的完形填空的效度都得到了研究者们的肯定,但对于高考英语完形填空体裁以记叙文为主这一点,研究者们意见不一。董曼霞(2014)、李菁菁(2016)和王碧文(2017)认为以记叙文或说明文为主,可读性强,不仅体现了大纲规定的“以中等题为主”的思想,而且体现了高考英语重视实用化、生活化的特点。张青云(2015)、高柔云(2016)和李亦爱(2017)则认为这样的体裁比较单一,不符合“体裁、题材多样化”的出题原则,也不利于扩大学生的知识面和提高学生对不同体裁文本的把握能力。由此可见,不同研究者对试卷有不同的评价,即试题的表面效度不一致,也辅助说明了学界对高考英语完形填空的质量的认同度不一致。

(五)难度研究

奚翠华(2011)通过实验方式证明了语篇类型、删词类型及答题方法是影响完形填空难度的主要因素。顾吉斌(2013)从答题方式、试题文本分析(话题、句子长度和结构、词汇)、空格设计(考点层次)三个角度分析了2010—2012 年高考英语湖南卷完形填空的难度,认为题材比较广泛、体裁以记叙文和说明文为主,难度基本保持稳定。毛延生、张鹏达(2016)结合认知心理学,以完形填空为例,通过问卷调查法和访谈法探讨英语语用能力评估中的难度控制问题,并认为只有兼顾感知阶段的形式集合要素、解析阶段的意义集合要素及使用阶段的用法集合要素,才能避免语用能力评估的偏颇,并保证测试的效度与信度。

难度是影响试题内容效度的一个重要因素。上述几项研究主要说明了把握难度的因素和方法,因研究设计不同,缺少直接可比性,但总体上国内严重缺乏对中高考英语完形填空的难度研究和论证。

(六)其他研究

1.高考英语完形填空

何海燕(2007)基于巴克曼(Bachman)提出的干扰项在不同语境层次所起的干扰作用的理论,通过实验和访谈发现受试的第二语言水平有限,不同程度地受到不同层面的干扰方式的影响,并针对学生做题、教师教学及命题等提出建议。宋卫民(2012)认为2011 年中国大陆(19 套试卷)和中国台湾地区(“学测”和“指考”)高考英语完形填空的题型结构配置方面既有共同点,又有独特之处,都力求考查考生的综合语用能力。陈瑶、周榕(2018)基于Rasch 模型通过实验对2016 年高考英语全国卷Ⅱ完形填空进行研究,发现试题信度和效度较高,总体质量较好,但整体区分度不足,个别试题存在群组间的测量偏差。

2.中考英语完形填空

王丽娜(2011)从题目设计特点(语篇、实际语用要求、词汇分布、语义语法)的角度探讨2009 年全国各省市的15 篇中考英语完形填空并提出了相应的教学建议。龚文婷(2013)对比分析2012—2013 年武汉市中考英语测试中多项选择、开放式和集库式这三种完形填空,并提出相应命题建议。

综上所述,无论研究者们采用哪种理论、分析框架、调查问卷、实验研究,其结果都表明所研究的完形填空试题总体考点效度、内容效度高,命题质量在不断发展,发挥完形填空综合考查学生语用能力的作用。

四、存在的问题

在过去的20 年里,虽然国内对中高考英语完形填空的效度研究取得了一定成果,且研究论文的数量在逐渐增加,但仍有不足,有较大的发展空间。

(一)研究内容的不平衡

首先,国内对中高考英语完形填空的效度研究主要围绕部分年份的全国卷或部分省市试卷的内容效度而展开分析或对比(上述6 种主要研究类型都属于内容效度研究),严重缺乏对表面效度、预测效度、共时效度和结构效度的研究。

其次,主要集中于对高考英语完形填空的效度研究,对于中考英语完形填空特别是短文填空的效度研究很少。中考和高考都属于关键性升学考试,各自发挥着重要作用,但国内对于中考英语完形填空的效度研究严重缺乏,如中国知网收录的关于中考英语完形填空的效度研究的论文仅6 篇,且并未收录中考英语短文填空效度研究的论文。而且这些论文只涉及了浙江省和山西省及某一年的15 个市的中考英语完形填空。国内对于中考英语完形填空的效度研究的成果比较少,完形填空却在中考英语试卷中广泛使用。这不禁让人思考:为何学界对它的关注度低?因为没有统一试卷?因为研究困难?还是因为研究意义不大?

(二)研究方法有待完善

实证研究在完形填空研究中起着至关重要的作用。在没有经过实证验证之前,任何测试理论都只是假设(毛延生、张建丽2008)。然而,中高考英语完形填空效度研究的研究方法在这20 年间并没有太大的改变,仅有3 篇论文使用了实证研究方法,其他论文基本停留在非实证研究层面,主要是对一些试卷的定性分析、理论的引用等,研究方法欠多样化,跨截面研究、调查研究等还非常稀缺。

五、建议

展望未来,对于国内中高考英语完形填空的研究可以进一步从以下几个方面进行拓展。

第一,拓展研究内容,多关注中考英语完形填空,特别是短文填空(即开放式完形填空)的相关研究。短文填空属于生产性题型,更能考查学生的综合语用能力,而多项选择完形填空属于输入性题型,其综合性、区分度和难度低于短文填空。

第二,拓展中高考英语完形填空整合性效度研究,大多从预测效度、共时效度及信度入手,提高试题的质量,真正发挥完形填空考查学生综合能力的作用,以便为教与学提供正确的方向。

第三,拓展研究方法,特别是实证研究方法,能使研究更具有科学性。

第四,结合《普通高中英语课程标准(2017 年版)》所提出的发展学生语言能力、文化意识、思维品质和学习能力等英语学科核心素养进行研究,落实立德树人的根本任务。

猜你喜欢
效度考点语篇
考点展示
考点展台
不等式(组)考点大扫描
《广东地区儿童中医体质辨识量表》的信度和效度研究
新闻语篇中被动化的认知话语分析
慈善募捐规制中的国家与社会:兼论《慈善法》的效度和限度
统计常见考点追踪
被看重感指数在中国大学生中的构念效度
从语篇构建与回指解决看语篇话题
语篇特征探析