英语阅读素材的数据驱动型改编
—— 以2022 年高考英语阅读素材为例

2022-08-26 05:32李芷莹金檀
英语学习 2022年8期
关键词:限定性真题句法

文/李芷莹 金檀

引言

在英语测试阅读素材的命制过程中,阅读素材的难度往往需要调整与控制,使其符合学生水平及测试目的需要(Guo et al.,2021)。阅读素材的难度调控通过命题专家改编来实现。Green 与Hawkey(2012)的研究发现,命题专家主要关注词汇、句法与篇章三个维度的改编:在词汇上,主要的改编方式为替换难词;在句法上,主要的改编方式为调整复杂的句法结构;在篇章上,主要的改编方式为控制篇幅与总体难度等。由此可见,词汇与句法改编是控制阅读素材难度时最常见的改编策略之一(Rets et al., 2022)。与命题专家不同,一线教师在测试命题方面的经验与所受的培训较少,因此阅读素材改编对一线英语教师更具挑战性。

基于阅读素材改编的研究以及一线教师的反馈,金檀等人(2021)更新并优化了“英语阅读分级指难针”(以下简称“指难针”),帮助一线教师开展基于数据驱动的阅读素材改编(Jin & Lu, 2018)。“指难针”是一种难度评估在线工具,包含三个核心模块:难度定级、词汇分析、句法分析。“难度定级”模块提供阅读素材的总体难度评估,“词汇分析”模块与“句法分析”模块则指出具体的难点所在,对词表未收录词汇(“词表”主要指课程标准等文件附录的词表,参见Jin et al., 2016;金檀等,2019)与复杂句法结构(Jin et al., 2020)进行标注。“指难针”可先对阅读素材的篇章进行总体难度定级,评估文本改编的必要性;然后,通过词汇与句法反馈,标注并统计难词难句,便于教师开展后续改编。

使用“指难针”开展数据驱动型改编,可较好地提高阅读素材的改编质量。然而,一线教师使用“指难针”等技术工具开展素材改编的效果与方式有待进一步探究(Jin &Lu, 2018;郭凯等,2020)。因此,为进一步探究如何基于“指难针”所提供的难度定级、词汇分析与句法分析对文本进行数据驱动型改编,本文选取2022 年高考英语试卷中的阅读素材开展案例研究,主要研究目标为:第一,比较阅读素材题源与真题文本的难度变化;第二,分析命题专家对高考阅读素材在词汇与句法方面的改编痕迹。通过探究“指难针”对阅读文本总体难度定级、改编难点反馈以及专家改编方式,以期为一线英语教师开展数据驱动型改编提供可操作性建议。

研究方法

1.研究对象

本文以2022 年高考英语新高考I 卷与全国乙卷中的6 篇阅读素材的题源文本与真题文本为研究对象(共计12 篇文本)。表1 列出了试卷篇章、原文出处与原文标题。

表1 . 阅读文本题源信息

2. 研究工具

本文以“指难针”为研究工具,从难度定级、词汇分析与句法分析三个模块获取对应维度的数据。如表2 所示,在难度定级模块,“指难针”可以获取词汇难度值、句法难度值、文本难度值。在词汇分析模块,“指难针”可以获取词表未收录词汇的标注信息与统计数据;在句法分析模块,“指难针”可以获取限定性从属子句、复杂名词短语、非限定性动词短语的标注信息与统计数据。

表2 . “指难针”主要功能

3.研究步骤

(1)文本核对录入

对6 篇题源文本与6 篇真题文本进行核对,无误后录入“指难针”。由于“指难针”每天限定分析5 篇文本,因此分三天依次录入(每日录入4 篇),获取相关数据以用于分析。

(2)难度指标比较

基于“指难针”的难度定级模块,比较题源文本与真题文本在词汇难度值、句法难度值与文本难度值方面的差异。比较后选取难度差异最大的题源文本与真题文本进行改编痕迹分析。

(3)改编痕迹分析

首先,基于“指难针”中词汇分析模块与句法分析模块,获得题源文本里词表未收录词汇、复杂句法结构的标注信息与统计数据;然后,对专家的改编痕迹进行人工统计;最后,将“指难针”的标注统计与人工统计进行关联分析,探讨“指难针”所提供的词汇反馈、句法反馈在多大程度上与专家的改编痕迹相一致。

研究结果

1. 难度指标比较

表3列出了“指难针”所生成的6 篇阅读素材题源文本与6 篇真题文本的词汇难度、句法难度与文本难度的难度值,以及计算出的难度变化。难度变化为题源文本难度值减去真题文本难度值所得的值(取值范围大于2 用箭头标示)。

由表3 可见,题源文本难度值分布范围较广,绝大部分取值范围在5.00 以上(“指难针”设定难度值5.00 以上为大学阶段难度水平,参见金檀等,2021)。根据难度变化值可知,所有阅读素材的词汇难度、句法难度与文本难度均有变化,且经过专家改编后,几乎所有语篇的难度值均有显著下降。由此可见,“指难针”的词汇难度、句法难度与文本难度的难度值可较为有效地反映出专家在词汇维度、句法维度以及篇章总体维度上的改编效果。更为重要的是,在“指难针”报告的真题文本难度值里,18项指标中有17 项指标的取值范围在4.00—5.00 之间(“指难针”设定难度值4.00—5.00 之间为高考难度水平,参见金檀等,2021)。由此可见,“指难针”对改编后文本的词汇、句法与篇章的难度评估结果与高考命题专家较为一致。

表3 . 题源与真题文本难度变化

对比6 篇阅读素材的题源文本与6 篇真题文本在词汇难度值、句法难度值与文本难度值上的差异,可以发现:在词汇难度上,难度变化值大于2 的有全国乙卷C 篇(2.33 ↓);在句法难度上,难度变化值大于2 的有新高考I 卷B 篇(2.59 ↓)、全国乙卷B 篇(2.01 ↓)、全国乙卷C 篇(2.32 ↓)、全国乙卷D 篇(2.03 ↓);在文本难度上,难度变化值大于2 的有新高考I 卷C 篇(2.07 ↓)、全国乙卷C 篇(2.19 ↓)。综上,无论在词汇难度变化、句法难度变化还是文本难度变化方面,全国乙卷C 篇的难度变化最为突出,因此被选作下一步改编痕迹的分析对象。

2.改编痕迹分析

(1)“指难针”统计

表4列出了“指难针”的词汇分析与句法分析模块对全国乙卷C 篇题源文本在词表未收录词汇、限定性从属子句、复杂名词短语与非限定性动词短语等方面的统计数据:词表未收录词汇数量为27,限定性从属子句数量为23,复杂名词短语为数量为17,非限定性动词短语数量为11。

表4 . “指难针”统计题源文本数据

(2) 人工统计

表5列出了对全国乙卷C 篇题源文本与真题文本专家改编痕迹的人工统计结果。为更好地与“指难针”所生成的统计结果进行关联分析,人工统计所采取的句法维度也与“指难针”保持一致,即限定性从属子句、复杂名词短语与非限定性动词短语等三个维度。如表5所示,在词汇维度上,专家对难词进行了22 处改编;在句法维度上,专家对限定性从属子句进行了6 处改编,对复杂名词短语进行了9 处改编,对非限定性动词短语进行了5 处改编。

表5 . 人工统计专家改编痕迹数据

(3) 改编关联分析

基于对“指难针”统计结果与人工统计结果的关联分析,所得的结果如表6 所示。

① 词汇维度

如表6 所示,通过“指难针”标注与统计,题源文本中词表未收录词汇数量为27。人工对比题源与真题文本后,发现专家改编的难词数量为22。在这22 个难词中,有16 个为“指难针”所标注的词表未收录词汇,即在词汇层面实现“指难针”标注与专家改编相一致。还有6 个是专家进行改编,但不属于“指难针”所标注的词表未收录词汇。因此,“指难针”分析与专家改编的关联程度为72.73%。

表6 . 关联分析结果统计

在“指难针”标注与专家改编相一致的16 个词里,专家所采取的主要改编方式有替换与删除。替换主要是指将词表未收录词汇替换为更为简单的意思相近的词或其他表达,如将fleet 替换为group,将assure 替换为guarantee,将hazard替换为problems,将alignment 替换为correct position 等;“删除”则是指在不影响读者对原文理解的前提下删除词表未收录词汇,如在railway catenary lines 中将catenary删除,在detecting cracks in the rail or defects in switches 中将defects删除。此外,删除词表未收录词汇还可能与删减句子同步进行,如undertaking 与slots 随着句子“When undertaking infrastructure inspection,they can speed up the tasks and free-up valuable network slots for passenger and freight trains.”的删除而删除。

在“指难针”标注与专家改编不一致的6 个词里(即high-voltage、estimated、integrating、leading、We 与currently),专家 对 其 改 编方式主要为替换:将high-voltage替 换 为high-tension, 将estimated替 换 为calculated,将integrating 替换 为using, 将leading 替 换 为latest,将We 替 换 为Engineers,将currently 替换为now。

② 句法维度

如表6 所示,“指难针”统计题源文本中的限定性从属子句数量为23、复杂名词短语数量为17、非限定性动词短语数量为11。人工对比题源与真题文本后,发现专家改编的限定性从属子句数量为6、复杂名词短语数量为9、非限定性动词短语数量为5。进一步分析后发现,专家所改编的三类句法结构均为“指难针”所标注的限定性从属子句、复杂名词短语与非限定性动词短语。因此,“指难针”分析与专家改编的关联程度为100%。

对于这些句法结构的改编,专家所采取的方式主要有删除与替换。限定性从属子句、复杂名词短语与非限定性动词短语主要伴随难句的删除而被删除,例如下面这个句子:

Be it aerial or track-bound,drones could truly become a critical part of rail safety when operators move towards autonomy in the future, and Thales is ready, explains Benatar, and when you add our expertise in air and rail traffic management to our capabilities in optronics, sensors, and artificial intelligence, it is clear that we are the preferred partner for operators who want to assure the best for their rail networks’ future.

在这个句子里,限定性从属子句有4 个:“… when operators move towards…”“… when you add our expertise…”“… that we are the preferred…”“… who want to assure…”; 复 杂 名 词 短 语有5 个:“a critical part of rail safety”“expertise in air and rail traffic management”“capabilities in optronics”“the preferred partner for operators”“rail networks’ future”;非限定性动词短语有2 个:“Be it aerial or track-bound…”和“…want to assure”。此外,复杂名词短语的删除还包括保留名词短语中的核心词,但将其他部分删除,如将train passengers and freight 改为trains。替换则主要是对复杂名词短语进行更换,如将capabilities of drone 替换为technology。

讨论

1.比较阅读素材题源与真题文本的难度变化

基于“指难针”难度定级模块所提供的数据,研究者可以统计出阅读素材题源与真题文本难度值的变化,进而有效反映命题专家对阅读素材的改编程度。研究发现,“指难针”对改编后文本的词汇、句法与篇章的难度评估结果与高考命题专家较为一致。原因正如《英语阅读分级指难针使用手册》所述,“指难针”的难度定级数据主要参照阅读真题文本语料,并基于词汇、句法与篇章三个维度的12 个核心特征计算而得到(金檀等,2021)。由此可见,对于难度变化的有效反映主要取决于两个方面:一方面,难度定级数据的计算必须有可靠的基准语料作为难度评估参照,例如“指难针”选取历年中考、高考、大学四六级、考研等真题作为语料来源;另一方面,难度定级数据的指标必须能反映命题专家和一线教师对核心特征的看法,例如命题专家与一线教师一致认为“难词”在难度评估中至关重要(Jin & Lu, 2018)。

2.分析命题专家对高考阅读素材的改编痕迹

通过对 “指难针”所反馈的词汇难点(即词表未收录词汇)、句法结构难点(即复杂句法结构)与专家改编痕迹进行关联分析,我们发现“指难针”对词表未收录词汇与限定性从属子句、复杂名词短语与非限定性动词短语的标注与专家所改编词汇、句法结构有较高的一致性。因此,“指难针”能够在一定程度上反馈词汇难点与句法难点,为改编提供一定参考。具体而言,“指难针”分析结果与专家改编在句法结构方面的一致性高于词汇方面。

在词汇方面,大部分改编词汇被“指难针”标注为词表未收录词汇,只有小部分词汇没有出现在“指难针”所标注的词表未收录词汇里。专家所采取的主要改编方式为替换。从所替换的词可看出,专家主要考虑降低词汇难度,此外可能也会考虑词汇接触的必要性或篇章理解的衔接性。例如,有些词汇在改编前后都不属于词表未收录词汇,但专家出于其他考虑也对其进行了改编,如从具体语境因素来考虑,将We 替换为Engineers。

在句法层面,“指难针”基于句法结构本身进行标注,其中,限定性从属子句、复杂名词短语与非限定性动词短语是衡量难句的主要指标。通常复杂句法结构数量较多的句子会被定义为难句(Jin et al.,2020),因此,“指难针”分析结果与专家改编在句法结构方面的一致性可能也会更高一些。专家所改编的三类句法结构均为“指难针”所标注的限定性从属子句、复杂名词短语与非限定性动词短语。专家所采取的主要改编方式有删除与替换。限定性从属子句、复杂名词短语与非限定性动词短语主要随难句的删除而删除。难句中这三类结构的数量都较多。复杂名词短语的删除还包括保留名词短语中的核心词,将其他部分删除。保留核心词可以避免删除后对文本原意有过多影响。

总的来说,“指难针”在难度评估结果与难点改编定位上与专家较为一致,可为一线教师的阅读素材改编提供两个方面的数据支持(Jin & Lu, 2018):一方面,根据基准语料与核心特征提供总体难度定级结果,衡量“文本是否需要改编以调控难度”“文本经过了多少改编”“改编后文本是否符合预期难度水平”,即评估改编的必要性、程度大小以及最终效果;另一方面,基于词汇分析与句法分析提供的难词难句定位,即标注词表未收录词汇、限定性从属子句、复杂名词短语与非限定性动词短语,从而帮助教师确定改编难点,为后续改编提供方向性的指引。

结语

在英语测试命题中,阅读素材改编对一线教师来说颇具挑战性。基于此,本文采用难度评估在线工具“英语阅读分级指难针”,以2022 年高考英语试卷中的阅读素材为例,比较了题源文本与真题文本的难度差异,并分析了命题专家对高考阅读素材词汇、句法方面的改编痕迹,得到如下结论:

第一,“指难针”的难度定级功能可较为有效地反映高考阅读素材题源文本与真题文本的难度差异变化。在真题文本词汇、句法与文本难度等维度,“指难针”的评估结果与高考命题专家的难度控制较为一致。一线英语教师在选取和改编阅读素材文本时,可以适当参考“指难针”所报告的难度数据,控制文本改编的程度,使得改编后的文本在语言上处于较为合适的难度水平,进而符合学生水平与测试目标。

第二,“指难针”的词汇分析与句法分析功能可在一定程度上标注出文本的难点所在。以全国乙卷C 篇题源与真题文本专家改编痕迹分析为例,“指难针”能标出难词与难句所在,还可以对难词难句的数量进行统计。一线英语教师可根据“指难针”的标注与统计结果对难词和难句进行改编。在改编策略上,一线教师可参考命题专家的改编方式对难词难句进行替换与删除,从而减少语言难点,降低难度。

第三,一线英语教师可灵活使用“指难针”的难度定级、词汇分析与句法分析功能。一方面,可先对阅读素材文本进行难度定级后,再查阅词汇分析与句法分析所反馈的难点所在进行改编;另一方面,也可先根据词汇分析与句法分析反馈开展改编后,再通过难度定级来确认是否达到预期改编效果。

尽管“指难针”能够帮助一线英语教师开展数据驱动型改编,然而“指难针”目前仅能在词汇与句法等维度的部分特征上提供相关数据,因此一线教师应辩证地看待“指难针”的作用。同时也建议一线教师通过一定途径提高语料库研究素养,了解语料库技术的优势与不足,从而更为有效地使用“指难针”开展阅读素材改编(Jin& Lu, 2018)。此外,教师还可结合高考命题专家的改编范例,探究阅读素材改编的策略与方法(Rets et al., 2022),并将所积累的语料库知识与技能应用于改编实践,进而提升自身的专业能力。

猜你喜欢
限定性真题句法
句法与句意(外一篇)
玩转高考真题——比较大小问题
玩转高考真题——集合
玩转高考真题——几何图形中的不等式篇
述谓结构与英语句法配置
玩转高考真题——集合篇
限定性范围副词“不过”的来源及其句法语义表现
关于对限定性净资产及相关的资产、费用会计核算的几点建议
句法二题
诗词联句句法梳理