词汇推理加工研究方法:回顾与展望

2019-02-19 03:25刘雪丽魏蓉王钰
山东外语教学 2019年2期
关键词:眼动生词研究者

刘雪丽 魏蓉 王钰

(1.南京师范大学 外国语学院, 江苏 南京 210024;2. 安徽工业大学 工商学院, 安徽 马鞍山 243100;3. 北京外国语大学外国语言研究所, 北京 100089)

1.0 引言

词汇推理在语言理解及词汇习得领域受到了极大关注,学者对该心理加工过程中涉及到的理论模型、知识源分类、研究范式、影响因素等进行了诸多实证研究,取得了丰硕的成果(如Alimorad et al.,2010;Dolgunsöz,2016;Kaivanpanah & Alavi,2008;Nassaji,2006;Pulido,2003;Soria,2001;范琳等,2013;范琳、张姣,2014)。这些研究采用的实证研究方法多样,但目前对这些方法进行系统分析的研究相对匮乏,也尚无研究将功能性磁共振成像(functional Magnetic Resonance Imaging,fMRI)和事件相关电位(Event-Related Potentials,ERPs)技术应用于词汇推理加工过程。鉴于此,本文将词汇推理研究中已经采用的及未来可以使用的研究方法分为离线法和在线法两类进行系统介绍,评述其优缺点,就实验设计时需注意的问题进行剖析,以期更好地揭示词汇推理加工机制。

2.0 离线法

本文将用于词汇推理研究的问卷调查法和回溯法归为离线法。

2.1 问卷调查法

问卷调查法指呈现一系列问句或陈述句,要求受试做出回答或选择(Brown,2001:6)。采用这种方法,研究者一般考察受试的主题熟悉度(Pulido,2003,2007;Atef-Vahid,Maftoon & Zahedi,2012)、认知风格(Shen,2010)、文本类型(Shen,2018)对词汇推理加工的影响,及词汇推理过程中推理策略(Shen,2010;Rousoulioti & Mouti,2016)和知识源的使用情况(王平,2009)。此法调查范围广、内容多样,且能在短时间内收集到大量数据,因此在词汇推理实证研究中应用广泛。但问卷的信度和效度较难保证,回收率低,且不利于发挥受试的主观能动性,不够人性化;采用该方法只能获得受试主动提供的信息,并不能揭示词汇推理加工过程的本质,因此在词汇推理研究中,问卷只能作为辅助性工具。

2.2 回溯法

回溯法(retrospection)指受试完成任务后口述其在推理过程中进行的思维活动(van Someren, Barnard & Sandberg,1994:21)。研究者采用即时回溯法(immediate retrospection)考察了二语学习者在听力理解中使用的词汇推理策略(蔡薇、吴一安, 2007)及词汇推理加工过程(Cai & Lee,2012)。在采用回溯法时也有研究使用书面汇报的形式来考察二语水平与词汇推理成功率的关系(范琳等,2017)及性别和二语水平对词汇推理加工的影响(王震等,2017)。由于受试在口述过程中表现出的话语特征(speech production features)(如停顿、语速快慢、自我修正等)均可在一定程度上反映受试的词汇推理加工过程,因此,在对口述材料进行转写时,研究者应对这些特征予以重视,避免遗漏重要信息(Kasper,1998:359)。然而,要求受试准确回忆起当时的所有想法并非易事,特别是在任务完成一段时间后,这时可采用有声思维与回溯相结合的方法以克服单一方法造成的信息遗漏。

总体而言,问卷调查和回溯两种离线方法考察的是词汇推理的结果,尚无法揭示词汇推理即时、动态的加工过程。

3.0 在线法

用于词汇推理加工过程中的在线研究方法包括有声思维法、反应时法、眼动记录法等。目前,除有声思维以及有声思维和回溯相结合的内省法外,其他在线法在词汇推理加工研究中使用较少。

3.1 有声思维法

有声思维法(think-aloud)指受试口述在执行给定任务时的想法和行为(Soria,2001),在不受任何干扰的前提下边推理边口述,其口头报告由研究者录制下来,转写成书面材料加以分析。通过受试口述的内容,研究者考察了词汇推理过程中受试使用的推理策略(Comer,2012;Hu & Nassaji,2012;Anvari & Farvardin,2016)、知识源(Soria,2001;王瑛,2011)、语法知识(Kaivanpanah & Aliva,2008)、词汇知识(Nassaji,2006;王瑛,2013)及二语水平(Riazi & Babaei,2008)对词汇推理的影响,发现受试在词汇推理加工过程中使用了包括语言知识和非语言知识在内的多种知识源,且推理策略的使用数量和质量、语法知识、词汇知识的深度和广度及二语水平会共同影响词汇推理成功率。有声思维法的优势在于其运用具体的任务产出更加可信的结果,它的共时性减轻了记忆负担,受试可在不受打扰的情况下集中精力完成任务。然而,采用该方法也会导致受试汇报不充分、主观性太强等问题,这时需采用有声思维和回溯相结合的内省法来考察受试的推理加工过程。

运用有声思维和回溯相结合的方法,研究者考察了英语学习者阅读过程中的词汇加工策略和词汇学习之间的关系(Fraser,1999);词汇推理过程中使用的知识源和推理策略(范琳、张姣,2014);词汇推理策略、知识源与二语词汇推理成功率的关系(Nassaji,2006);二语阅读水平说明类语篇词汇推理加工的影响(Bengeleil & Paribakht,2004);一语迁移对二语词汇推理加工的影响(Wesche & Paribakht,2009);英语学习者的汉英词汇推理加工模式(范琳等,2013)和词汇推理发展模式(范琳等,2015)等。还有研究者探究了语法知识在词汇推理加工中的作用(Alimorad et al., 2010)和句法复杂度对学习者词汇推理加工的影响(吕新博、范琳, 2016)。将有声思维法和回溯法有机结合对词汇推理加工过程进行研究,可以更好地揭示这一重要认知加工过程的实质。但这种方法依然不能计算从目标词呈现到受试做出判断所需的时间,反应时法可以很好地弥补这一缺憾。

3.2 反应时法

反应时(response time)是指受试从接受刺激到做出反应所需的时间。用于词汇推理研究中的反应时法主要包括再认、词汇判断等实验范式(周红、范琳,2010)。目前,国内外采用该法对词汇推理加工过程进行探究的研究不多,张姣、范琳(2018)采用反应时法考察了汉语词汇化对英语词汇推理加工的影响,发现汉语词汇化影响英语词汇推理加工进程,词汇化英语目标词的词汇推理时间明显快于其非词汇化英语目标词。该方法时间精度较高,但无法获知读者在推理过程中使用知识源和推理策略的情况,需要结合其他方法如回溯法来获知信息。

3.3 眼动记录法

眼动可以反映视觉信息的选择模式,对揭示认知加工的心理机制有重要意义,因此研究者可以采用眼动仪记录受试的眼动数据对词汇推理加工过程进行实时测量。眼动记录法主要基于两种理论假说:(1)“眼—脑假说”(eye-mind assumption),即受试在看到某个词的同时就对其进行心理加工,注视和心理加工是同时进行的;(2)“即时加工假说”(immediacy assumption),即受试只有在对所注视的词完成所有加工后眼睛才继续移动,进行下一步阅读(阎国利,1997;沈德立, 2001)。眼动仪可记录受试阅读目标词汇的时间和空间数据,包含注视和眼跳两类指标,注视类指标如注视时间、注视位置、注视次数、凝视时间、溢出时间(目标词之后的注视时间);眼跳类指标如回视频率(regressive frequency)、眼跳距离(saccade distance)和眼跳停留位置(saccade landing position)等。对眼动数据的实时测量可以反映受试在自然阅读条件下对文章信息进行推理所用的时间。

国外对语篇阅读中的眼动研究开始较早,研究者们对词汇的语义推理进行了探测(O’Brien et al.,1988),对比了受试在识别真词和假词时的眼动变化情况(沈德立,2001),对词汇的预期推理进行了探究(Calvo & Castillo,2001;Calvo, Estevez & Dowens,2003),考察了词汇推理及其对英语学习者阅读速度的影响(Dolgunsöz,2016)。这些研究成果为国内采用眼动记录法考察词汇推理的相关研究提供了有价值的参考。

眼动记录法在实验过程中最贴近自然状态,对受试的干扰程度小,且能收集到丰富的数据;不仅可以反映阅读过程的整体加工,也能揭示词汇推理的即时加工进程。眼动数据是研究者分析受试在词汇推理过程中的实时认知加工指标,但对丰富的眼动数据进行分析需要耗费大量的时间和精力。

3.4 fMRI和ERPs技术

fMRI和ERPs技术是认知神经科学的前沿技术,可以帮助研究者深入了解大脑的高级认知功能,特别是语言功能。fMRI利用磁振造影测量神经元活动引发血氧消耗量的改变。这种无损、实时的探测技术,可以直观地观察大脑的动态活动过程,因此可以用该技术来考察受试在推理目标词时的认知加工过程。推理目标词词义时,受试大脑皮层某一区域神经细胞处于激活状态,消耗大量能量,导致单位时间内大脑局部血氧消耗量增加,使脑区磁场不均匀,磁共振信号增强。信号强度与推理加工难度成正比,即磁共振信号增强,推理加工难度加大。虽然fMRI技术对空间定位准确,且能实时跟踪信号的改变,但fMRI实验机非常昂贵,被试费用较高,且对受试的要求较高,如不能有脑损伤病史,身体内不能植入金属、不能有幽闭空间恐惧症等。

所谓ERPs,即施加一种特定刺激于感觉系统或脑的某一部位,在给予或撤销刺激时在脑区引起的电位变化。与语言相关的脑电成分(如N400、LAN、P600、Nref等)的变化能反映语言认知过程的变化,由此可以反映词汇推理的加工强度和加工过程。ERPs的时间分辨率极高,可以展现大脑神经活动在数毫秒内的细微变化(杨唐峰、俞瑢,2011),且设备相对简单,对环境的要求不高,因此借助ERPs可以准确观察到学习者词汇推理加工过程中的神经活动。采用该技术进行词汇推理研究也有一些不利因素,如佩戴电极帽的操作比较耗时,被试容易疲劳。另外ERPs实验中刺激呈现的方式可能会限制受试通过语境推测目标词词义。受条件限制,目前尚无研究采用fMRI和ERPs技术考察词汇推理的加工过程。研究者可以根据研究目的,结合fMRI和ERPs这两种技术各自的优点,围绕词汇推理加工的神经认知机制开展研究,形成优势互补。

4.0 研究不足及未来研究注意事项

4.1 研究不足

如前所述,研究者主要通过问卷调查法得到受试的相关个人信息,采用回溯和有声思维相结合的方法、反应时法及眼动记录法等来收集受试在词汇推理加工过程中的相关数据,发现受试在词汇推理加工过程中使用了包括语言知识和非语言知识在内的多种知识源,且读者因素(如主题熟悉度、二语水平、认知方式、语法知识等)和语篇因素(如母语词汇化、语境化、语篇难易程度等)会共同影响词汇推理成功率,在一定程度上反映了影响词汇推理成功的因素。然而,该领域采用的实证研究方法还不够多样化,倾向于采用单一的离线法来考察推理成功与否的静态因素,较少有研究采用在线法或离线与在线相结合的方法对推理过程中动态、实时的变化进行探索,且尚无研究采用fMRI和ERPs等技术考察词汇推理过程中大脑的动态变化及词汇推理加工机制。

4.2 未来研究注意事项

未来研究可将离线法与在线法结合起来考察受试推理词汇的时间进程、眼动机制和神经认知机制及其使用的知识源和推理策略,使研究结论更为可靠。除了选择合适的方法外,在实验设计中还需要注意实验语篇的选择、目标词的呈现方式及评估的标准,这些问题处理不好可能会影响研究的可信度。

4.2.1 实验语篇的选择

在选择实验语篇时要考虑其主题熟悉度(subject familiarity)、生词密度(lexical density)和线索的显性程度(explicitness of clues)。主题熟悉度即学习者关于篇章主题的背景或专业知识的熟悉程度。如果对语篇的主题不够熟悉,学习者就不能熟练使用其大脑中存储的世界知识进行词汇推理(刘雪丽、范琳, 2016)。研究者通过有声思维与回溯、访谈相结合的方法(Paribakht & Wesche,1999)及问卷调查和翻译测量相结合的方法(Pulido,2007)证实了主题熟悉度在词汇推理过程中的重要作用。

生词密度对词汇推理成功与否至关重要,过多的生词会阻碍学习者利用语境线索推理词义。王金巴(2015)探讨了生词密度与语篇理解之间的关系,发现生词密度为20%时受试理解语篇有困难,生词密度为10%和5%时受试对语篇理解不够充分,只有语篇的生词密度为2%时才有助于学生理解。这与Nation(2001)的研究发现一致,即2%-5%的生词密度有助于学习者理解语篇,其中2%的生词密度最有利于词汇推理。由此可见,词汇推理实验设计中语篇的生词密度控制在2%最合适。

当生词密度适当时,线索的显性程度在词汇推理中起重要作用。研究者(Kaivanpanah & Alavi,2008;Paribakht & Wesche,1997)认为充足、明确的语义及语言线索是词汇推理成功的前提。王改燕(2011)发现语篇线索的显性程度对词汇推理结果影响很大。线索的显性程度表现在线索的类型和位置上。如果线索的类型是以同义词、反义词或解释性语句出现,即在目标词周围出现了其同义词、反义词或解释性语句,以同义词出现的线索更有助于学习者成功推理词义。线索的位置指线索位于目标词前或目标词后。Chern(1993)发现英语学习者可以同时使用前置和后置线索,低水平学习者使用不同位置线索的频率相当,而高水平学习者使用前置线索的频率较高。

因此,在考察学习者词汇推理加工过程时须谨慎选择实验语篇,通过改变主题熟悉度、生词密度及线索的显性程度来确定实验语篇,为学习者成功推理词义创造必要条件。

4.2.2 目标词的呈现方式

以往词汇推理研究中目标词多以真词(Bengeleil & Paribakht,2004;Nassaji,2006)或真假词(Pulido,2003;Wesche & Paribakht,2009;Godfroid,Boers & Housen,2013;范琳等,2013)的形式呈现。其中,以真词为目标词是最好的选择,这是因为学习者可以用处理生词的方式和经验来处理目标词,同时有助于其附带习得目标词。然而,选用真词最大的问题在于难以确定学习者先前是否对目标词已有部分认知,即受试之前见过或听过目标词但不知其义。有时学习者在没有语境的情况下声称从未见过或听过某一单词,但一旦将其放入语境,学习者对该词的部分记忆则会被激活。由于这一缺陷,采用假词作为目标词成为研究者的首选。当然,也有研究者对此提出质疑,认为假词限制了学习者通过词根、词缀推理词汇,而且学习者还会附带习得某些假词(Frantzen,2003)。因此,实验设计时最好一半真词、一半假词以避免真词带来的缺陷及假词带来的弊端。

4.2.3 评估标准

现有研究使用的评估标准多种多样,不同的评估标准得到的结果不同。词汇知识是多维度多层次的,词汇习得是连续的,因此对词汇推理成功与否的测量也要考虑词汇习得的这一渐进本质。Horst & Meara(1999)认为,在受试完成语篇阅读后立即回访其是否记得语篇中出现的单词,这种测量方法无法反映词汇知识的逐步习得过程。Nagy, Herman & Anderson(1985)将即时访谈和多项选择测试相结合,考察了学习者的词汇知识,其中访谈数据分为从“完全不理解”到“完全理解”四个等级;多项选择任务也分三轮不同难度的测试,但这种方法的效果也不佳。鉴于二级评分法的不足,分级评分法成为研究者的首选。Smith(1987)使用多级评分模型来测量词汇项目,将词汇项目习得程度分为五个等级进行打分,即习得同义词(synonym)记4分、习得易淆词(close mislead)记3分、习得反义词(antonym)记2分、习得语境误导词(context mislead)记1分、习得音似词或形似词(sound-or look-like mislead)记0分。Wesche & Paribakht(1996)、范琳等(2013)采用了词汇知识量表(vocabulary knowledge scale,VKS)来测试受试的目标词知识掌握程度,该量表可以测量从意义辨识到准确产出等不同的词汇知识维度。张宪、亓鲁霞(2009)采用分级评分法来测量目标词的习得率,其评分标准为:受试说出目标词在上下文中的意思得2分、所说意思虽不准确但有一定关联得1分、说不出词义或所说词义与上下文意思不符得0分。该评分法可以反映学习者词汇习得的渐进本质。与二级评分法相比,采用多级评分法对词汇项目进行打分的信度和效度明显较高。

5.0 结语

本文阐述了词汇推理研究已用或未来可用的离线法和在线法的优缺点,发现目前国内外在该领域多采用问卷调查获得受试的基本信息,采用回溯和有声思维相结合的方法对词汇推理加工进行探讨,其他在线方法运用较少。任何方法都有其局限和不足之处,只有将这些方法结合起来使用,并对研究设计中需注意的因素如实验语篇的选择、目标词呈现方式及评估标准等进行改进,才可以更好地揭示词汇推理加工过程的本质,进而更好地为词汇教学服务。

猜你喜欢
眼动生词研究者
基于眼动的驾驶员危险认知
基于ssVEP与眼动追踪的混合型并行脑机接口研究
高等教育中的学生成为研究者及其启示
『五个生词』快速阅读法
基于眼动信号的便携式无线智能交互系统设计
研究者称,经CRISPR技术编辑过的双胞胎已出生。科学将如何回应?
研究者调查数据统计
静止眼动和动作表现关系的心理学机制
医生注定是研究者
生词库