藏语母语者汉语词汇识别的眼动研究 *

2020-05-21 06:03高晓雷李海燕白学军
心理与行为研究 2020年1期
关键词:词频限制性字形

高晓雷 沈 梦 李海燕 白学军 高 蕾,5

(1 西藏大学高原脑科学研究中心,拉萨 850000) (2 教育部人文社会科学重点研究基地天津师范大学心理与行为研究院,天津 300387) (3 天津师范大学心理学部,天津 300387) (4 国民心理健康评估与促进协同创新中心,天津 300387) (5 天津大学管理与经济学部,天津 300072)

1 引言

词汇识别也称词汇通达,是人们通过视觉系统和听觉系统,接受输入的字形、语音信息,并提取相应语义的过程(陈宝国, 彭聃龄, 2000)。由此可知,字形、语音信息是词汇识别的内容,也是影响词汇识别的重要因素。那么,字形和语音在词汇识别过程中究竟是怎么发挥作用的?是同时进行的,还是分先后顺序依次进行的呢?国内外研究者针对这两种信息发挥作用的时程和重要性进行了详尽的研究(陈宝国, 彭聃龄, 2001; 李丽军, 2017; 任桂琴, 韩玉昌, 于泽, 2012; 宋华, 张厚粲,舒华, 1995; 粟华利, 2011; 王彤彤, 周美玲, 王权红,2018; 张素莹, 2017; 朱璐瑶, 崔占玲, 2017; 邹丽娟,2015; Rubenstein, Lewis, & Rubenstein, 1971;Schoonbaert & Grainger, 2004; Seidenberg, 1985; Taft & van Graan, 1998),并形成了三个重要的词汇识别理论—语音中介理论、直通理论和双通道理论。

语音中介理论认为,词汇识别先由字形激活语音信息,语音信息再激活语义,在这一过程中语音起中介作用(Rubenstein, 1971)。Rubenstein采用词汇判断任务发现,被试拒绝非音同词的用时比拒绝音同词的更短,说明了语音在词义表达过程中的作用。林泳海、钱琴珍、宋凤宁和张必隐(2002)的研究也发现,当启动词和目标词首音相同时,被试对目标词命名的速度更快,错误率更低,支持语音中介理论。此外,还有许多研究者通过实验证实了语音中介理论(郭桃梅, 彭聃龄,祁志强, 徐伦, 2004; 李丽军, 2017; 马俊雅, 2018; 粟华利, 2011)。

直通理论认为,词汇识别是直接由字形表征激活语义,语音只是完成词汇识别的行为,而不是词汇识别过程中的行为(Taft & van Graan,1998)。Taft 和van Graan 采用语义分类任务,将实验材料分为规则词和不规则词,如果语音在词汇识别中起作用,那么不规则词的反应时应该长于规则词,但实验结果显示两者无显著差异,说明了字形在词汇识别中的作用。林仲贤和韩布新(1999)采用特征匹配任务,发现在回答关于字词特征的问题中,义码的反应时间显著短于音码,支持了直通理论。此外,还有很多研究者通过实验证明了这一理论(王彤彤等, 2018; 朱璐瑶, 崔占玲, 2017; 邹丽娟, 2015)。

双通道理论认为,词汇识别有两条通道,选择哪条通道是根据实际情况决定的(Seidenberg,1985)。Seidenberg 研究发现,高频词的词义由字形直接通达,而低频词的词义通达发生在语音激活之后,支持了双通道理论;宋华等(1995)采用校对任务,探讨字形、语音在阅读中的作用,发现低年级学生的阅读依赖语音信息,成人的阅读依赖字形信息,支持了双通道理论。还有其他研究证实了双通道理论(任桂琴等, 2012; 张素莹,2017)。

综上可知,研究者采用不同的实验范式分别找到了支持不同词汇识别理论的证据。那么,这些不同的理论解释是由于实验范式的差异所造成的吗?也就是说,实验范式或实验任务的差异是否影响被试对词汇识别通道的选择呢?

林泳海和张必隐(1999)采用命名任务发现,当启动词与目标词同音时,对目标词命名的反应更快,证实了语音中介理论;而当采用词汇判断任务时发现,启动词是否与目标词同音,对判断目标词真假的反应时无影响,证实了直通理论。周晓林、曲延轩和庄捷(2003)采用真假字判断任务时发现,被试在语义相关条件下,对目标字判断的正确率高于语音相关条件,间接证实了直通理论;而采用命名任务时,被试在同音规则字条件下,对目标字命名速度快于语义相关条件,证实了语音中介理论。出现上述矛盾的原因可能在于:被试在阅读的同时,还要对任务进行反应,并且每种范式要求被试做出不同反应。同时,上述实验多以词汇为阅读材料,而真实阅读多以句子为单位。因此,阅读情境的非真实性和低生态效度也可能影响被试的正常阅读和反应。那么,有没有一种方法可以避免上述问题呢?眼动追踪技术恰恰是一种能记录被试正常阅读过程的实验方法,它能记录读者在自然阅读中的阅读轨迹,实时、精确的反映读者的认知加工过程,具有良好的生态效度(Liversedge & Finday, 2000;Rayner, 2009)。此外,根据眼动数据还能获得被试在阅读过程中各个阶段的信息(Pollatsek,Reichle, & Rayner, 2006)。

除了实验方法会影响词汇识别之外,有研究表明,不同文字类型也会影响词汇识别的通道。例 如,Lukatela 和Turvey(1994)、Zhou 和Marslen-Wilson(1999)都采用启动实验方法,前者的实验结果是启动词中的音同词对目标词的激活有促进作用,证实了语音中介理论;而后者的实验结果则是启动词中的形似词对目标词的激活有促进作用,证实了直通理论。产生差异的原因可能是,英语是拼音文字,形和音存在密切联系,会更符合语音中介理论;汉字是表意文字,形和音之间没有拼音文字那么密切的联系,但字形与字义有着紧密联系,因此更符合直通理论(任慧慧, 2011; Seidenberg, 1985)。为了减弱文字类型给实验结果带来的影响,有研究者做了二语阅读的实验,如,江新(2003)、潘景景(2007)做了拼音文字母语者汉语词汇识别的实验。然而,也有研究发现,母语会影响被试的认知加工特点,以拼音文字为母语的被试阅读实验材料时会更关注语音信息(江新, 2003; 潘景景, 2007; 赵永桂, 2009; 张金桥, 王燕, 2010; Koda, 1988)。因此,找到一种兼具拼音文字和表意文字特点的语言,并让以这种语言为母语的人做汉语词汇识别实验,将大大减少文字类型带来的影响,而藏语正符合上述条件。

藏语由字母构成文字,具有拼音文字的共同特征,同时藏语属于汉藏语系,构字结构上具有立体性。因此,藏语兼具拼音文字和表意文字的特征(白学军, 高晓雷, 高蕾, 王永胜, 2017)。藏族是我国主要的少数民族之一,藏语母语者,尤其是藏族学生,他们上学前身处浓厚的藏语环境,上学后汉语成为学校教育的主要用语,汉语是他们的第二语言(朱璐瑶, 崔占玲, 2017)。以藏语母语者为被试进行汉语词汇识别实验:第一,可以减少文字类型给被试造成的影响;第二,可以控制被试对第二语言的不熟悉而造成的误差;第三,研究藏语母语者的汉字识别,可以了解他们识别汉语的模式和规则,并应用到对应的汉语教学中,为提高他们的汉语学习能力和阅读能力奠定良好的基础。

除实验范式和文字类型之外,词频和语境也是影响词汇识别的重要因素(彭磊, 2015; Yan, Tian,Bai, & Rayner, 2006)。词频指读者对字词接触的频率和熟悉的程度(江新, 2006)。研究证实,汉字的词汇识别存在词频效应,即高频字词的加工比低频字词的加工更容易,需要时间更短(Huestegge,Radach, Corbic, & Huestegge, 2009; Joseph, Nation, &Liversedge, 2013; Schilling, Rayner, & Chumbley, 1998;Vorstius, Radach, & Lonigan, 2014)。在心理学语言认知领域,语境即为文本的上下文阅读环境(马俊雅, 2018)。研究发现,语境在词汇识别过程中发挥了重要作用(Tulving & Gold, 1963)。然而,已有研究多是在单个词的基础上进行的,在这种情况下,阅读过程中全部的注意力只集中在单个字词上。但在句子语境中,会有一部分注意力被分配到句义整合上,所以前者(单个词)与后者(语境)的词汇识别过程不同,后者更接近真实语言环境。此外,限制性强度不同的语境对词汇识别的影响及作用机制也不尽相同(Rayner,Pollatsek, & Binder, 1998),高限制性语境是自上而下的作用机制,低限制语境则相反。而不同限制性强度的语境中的词频效应还有待实验的证实。

因此,本研究将采用眼动追踪技术,以藏语母语者(藏族大学生)为被试,通过两个实验考察在高限制性和低限制性句子语境中汉语词汇字形、语音的作用及词频效应。为了研究词汇识别中字形、语音的作用,我们对目标词类型进行了操纵,包括一致、音同、形似和无关控制四种不同类型。本实验的逻辑是:如果词汇识别符合语音中介理论,那么音同词就不会产生干扰,而形似词和无关控制词因为发音与一致词不同,会对词汇识别产生干扰;如果符合直通理论,音同词字形与一致词不符,因而会对词汇识别产生干扰,而形似词虽然形与一致词相似,但不是完全相同,所以也会对词汇识别产生一定程度干扰。也就是说,音同词的促进效应反映出语音信息的作用(Jared & Seidenberg, 1991; Perfetti & Zhang,1995),而字形信息的干扰效应体现字形信息的作用(黄健辉, 陈烜之, 2000; Wong & Chen, 1999)。

2 实验1:高限制性句子语境中汉语词汇形、音信息的作用

2.1 方法

2.1.1 被试

西藏大学本科生39 名,其中男20 名,女19 名,年龄在18~22 岁之间,平均年龄M=20.50(SD=0.93)。所取被试裸视或矫正视力正常,藏族,第一语言为藏语,普通话流利。

2.1.2 实验设计

采用2(词频:高、低)×4(目标词类型:一致、音同、形似、无关控制)两因素被试内实验设计。

2.1.3 实验材料

实验材料由160 个汉语句子组成。参考任桂琴、韩玉昌和于泽(2008)的研究,从《现代汉语频率词典》选出40 个音同词,其中高频词20 个,低频词20 个。然后以其为关键词,分别选取与其一致、音同、形似以及形、音均无关的控制词各40 个,由此得到四类目标词即一致类型、音同类型、形似类型以及无关控制共160 个(高低频各半)。每个一致词造1 个句子,再分别用音同词、形似词和无关控制词替换句子中的一致词,形成3 个替换句,由此得到160 个句子。

材料的评定。形似词的选取,由28 名藏族大学生对关键词与形似词是否相似进行了5 点量表评定(非常相似的评定为1,非常不相似的评定为5),评定结果的平均等级为M=1.76(SD=0.79)。为了确保句子语境的高限制性,由25 名藏族大学生对省略句尾词的不完整句进行填充。根据填充结果,选出关键词的填充概率为90% 以上的句子。参与材料评定的藏族大学生不参加正式实验。实验材料如表1。

表 1 高限制性句子语境的实验材料举例

填充材料为40 个高限制性语句,句尾词高、低词频各半。以拉丁方设计将实验材料和填充材料分为2 个测验组,每个被试只接受一个实验组的所有实验条件。

2.1.4 实验仪器

本研究采用加拿大SR Research 公司生产的Eyelink1000Plus 眼动仪,采样频率为1000 Hz。被试机刷新频率为140 Hz,分辨率为1024×768 像素。被试眼睛与被试机屏幕之间的距离约为70 cm,全部实验材料以白底黑字呈现在被试机电脑屏幕上,每次只呈现一个句子,刺激以宋体28 号字体呈现,每个汉字形成约为0.7 度视角。

2.1.5 实验程序

(1)实验采用单独施测的方式。被试进入实验室之后,首先熟悉实验室的环境,之后主试向被试简单介绍实验过程。(2)被试按要求坐在实验指定位置上,主试对被试进行头部矫正和眼部矫正。(3)矫正完成后,在被试机屏幕上向被试呈现指导语,在被试阅读完指导语后,向被试解释实验内容及要求。(4)告知被试实验任务是进行正常的阅读理解,并且部分实验材料后有问题句,要求被试通过按键对问题做出回答。(5)眼动仪自动记录被试阅读过程中的眼球运动。

2.1.6 分析指标

参考已有研究(任桂琴等, 2012)选取首次注视时间、凝视时间、总注视时间为实验的分析指标。首次注视时间是阅读中首次通过某兴趣区的首个注视点的注视时间;凝视时间是注视点第一次离开某兴趣区之前所有注视时间之和;总注视时间是兴趣区内所有注视点的时间的总和(闫国利等, 2013)。

2.2 结果与分析

使用SPSS20.0 对数据进行分析处理。

删除8 名无效被试(回答问题时错误率超过20%),留下有效被试31 人,其中男生15 名,女生16 名。参考已有文献(高晓雷, 王永胜, 郭志英,张慢慢, 白学军, 2015; 张积家, 崔占玲, 2008; Rayner,2009; Rayner, Liversedge, & White, 2006),根据以下标准对数据进行剔除:(1)注视点小于80 ms或大于1200 ms;(2)追踪失败的句子;(3)阅读过程中注视点少于3 个。删除数据占总数据的8.91%。实验结果见表2。

表 2 高限制性语境频率、类型眼动指标的平均值和标准差(M±SD)

通过方差分析发现,在首次注视时间指标上,词频主效应不显著[F1(1, 30)=0.07, p>0.05; F2(1,159)=0.34, p>0.05]。目标词类型的主效应不显著[F1(3, 90)=0.92, p>0.05; F2(3, 477)=1.23, p>0.05]。词频与目标词类型交互作用显著[F1(3, 90)=3.36,p<0.05; F2(3, 477)=4.13, p<0.05],简单效应发现,高频词条件下,被试对一致类型的首次注视时间显著短于音同和形似类型(ps<0.05)。

通过方差分析发现,在凝视时间指标上,词频主效应不显著[F1(1, 30)=0.79, p>0.05; F2(1,159)=0.64, p>0.05]。目标词类型的主效应显著[F1(3,90)=15.92, p<0.001; F2(3, 477)=19.22, p<0.001],多重比较发现,被试对一致类型的凝视时间显著短于音同、形似和无关控制类型。词频与目标词类型交互作用不显著[F1(3, 90)=1.27, p>0.05; F2(3, 477)=1.62, p>0.05]。

通过方差分析发现,在总注视时间指标上,词频主效应显著[F1(1, 30)=4.65, p<0.05; F2(1,159)=2.30, p>0.05],被试对低频词的总注视时间显著短于高频词。目标词类型的主效应显著[F1(3,90)=8.93, p<0.001; F2(3, 477)=8.35, p<0.001],多重比较发现,被试对一致类型的总注视时间显著短于音同、形似和无关控制类型。词频与目标词类型交互作用显著[F1(3, 90)=4.53, p<0.05; F2(3,477)=4.19, p<0.05],简单效应发现,高频词条件下,被试对一致类型的注视时间显著短于音同、形似和无关控制类型。

由以上结果可知,被试对一致类型的首次注视时间、凝视时间、总注视时间均显著短于音同和形似类型,而音同和形似类型在三个指标上均与无关控制类型无显著差异。说明仅保留语音信息或者仅保留字形信息对词汇识别均产生干扰,体现了语音和字形信息在词汇识别早期、中期和晚期的重要性,符合双通道理论。

3 实验2:低限制性句子语境中汉语词汇形、音的作用

3.1 研究方法

3.1.1 被试

西藏大学本科生45 名,其中男21 名,女24 名,年龄在18~23 岁之间,平均M=20.91(SD=1.75)。所有被试大学生裸视或矫正视力正常,藏族,第一语言为藏语,普通话流利。

3.1.2 实验设计

采用2(词频:高、低)×4(目标词类型:一致、音同、形似、无关控制)两因素被试内实验设计。

3.1.3 实验材料

实验材料的选取标准与实验1 相同。

材料的评定。形似词的选取,28 名藏族大学生对关键词与形似词进行了字形相似性的5 点量表主观评定。字形非常相似的评定为1,非常不相似的评定为5。评定结果的平均等级为1.72(SD=0.78);为了确保句子语境的低限制性,由26 名藏族大学生对没有句尾词的不完整句子进行填充。根据填充结果,选出关键词的填充概率25%为以下的句子,平均概率为6.3%。参与材料评定的藏族大学生不参加正式实验。实验材料如表3 所示。

表 3 低限制性句子语境的实验材料举例

填充材料为40 个低限制性句子,句子末尾的高频、低频词各半。以拉丁方设计将实验材料和填充材料分为2 个测验组,每个被试只接受一个实验组的所有实验条件。

3.1.4 实验仪器、实验程序和分析指标

同实验1。

3.2 结果与分析

使用SPSS20.0 对数据进行分析处理。

删除无效被试8 人。数据剔除标准同实验1,删除极端数据占总数据的9.75%。实验结果见表4。

通过方差分析发现,在首视时间指标上词频主效应不显著[F1(1, 36)=0.03, p>0.05; F2(1,159)=0.003, p>0.05]。目标词类型的主效应不显著[F1(3, 108)=0.86, p>0.05; F2(3, 477)=0.39, p>0.05]。词频与目标词类型交互作用不显著[F1(3, 108)=0.54,p>0.05; F2(3, 477)=0.63, p>0.05]。

通过方差分析发现,在凝视时间指标上,词频主效应显著[F1(1, 36)=7.31, p<0.05; F2(1,159)=2.23, p>0.05],低频词注视时间长于高频词。目标词类型的主效应显著[F1(3, 108)=7.57, p<0.001;F2(3, 477)=5.85, p<0.001],被试对一致类型的凝视时间显著短于音同、形似和控制类型,音同类型注视时间显著短于形似类型。词频与目标词类型交互作用不显著[F1(3, 108)=2.26, p>0.05; F2(3,477)=1.90, p>0.05]。

通过方差分析发现,在总注视时间指标上,词频主效应显著[F1(1, 36)=10.77, p<0.01; F2(1,159)=5.97, p<0.05],低频词注视时间长于高频词。目标词类型的主效应显著[F1(3, 108)=4.62, p<0.01;F2(3, 477)=5.71, p<0.001],被试对一致类型的总注视时间显著短于音同、形似和控制类型,音同类型的注视时间显著短于形似和控制类型。词频与目标词类型交互作用显著[F1(3, 108)=7.62, p<0.001;F2(3, 477)=4.97, p<0.01]。高频词条件下,被试对一致类型的总注视时间显著短于音同、形似和无关控制类型;低频条件下,音同类型的总注视时间显著短于一致、形似和无关控制类型。

由实验2 数据可知,在首次注视时间指标上,音同、形似和无关控制类型无显著差异,在凝视时间和总注视时间指标上,音同类型词注视时间显著短于形似类型。结果表明,保留语音信息对词汇识别产生了促进作用,反映出这一阶段语音信息对阅读的重要性。总的来说,语音信息在词汇识别中发挥了关键作用,符合语音中介理论。此外,在凝视时间和总注视时间两个指标上,低频词的注视时间显著长于高频词,体现了词频效应。

4 讨论

本研究以藏族大学生为被试,探讨了藏语母语者在阅读汉语不同限制性水平句子时字形、语音信息在词汇识别过程中发挥的作用。具体实验设计是:在高(低)限制性水平句子中,将句尾词换为与关键词一致、音同、形似和无关控制四种目标词类型,并控制所换目标词的词频。以此来探讨词汇识别中字形、语音的作用,以及不同语境和词频对藏语母语者汉语阅读的影响。

在数据分析中,将控制条件作为基线,将音同条件、形似条件与控制条件相比较,以此来确定读者词汇识别中字形和语音信息分别发挥的作用。如果实验结果符合语音中介理论,即音的信息有作用,那么音同词就不会对词汇识别产生干扰,而形似词的语音与一致词完全不符,所以对词汇识别产生干扰,表现为音同词注视时间显著短于控制词和形似词,形似词与控制词注视时间无显著差异;如果符合直通理论,即只有形的信息发挥作用,那么音同词的字形与一致词完全不同,就产生了干扰作用,而形似词虽然字形与一致词相似,但也不完全相同,也会对词汇识别产生干扰,表现为形似注视时间显著短于音同词,但二者与控制词无显著差异;如果符合双通道理论,既语音信息和字形信息都发挥作用,那么仅保留一种信息都会对词汇识别产生干扰,表现为音同词、形似词注视时间与控制词无显著差异,音同词和形似词之间注视时间无显著差异。

表 4 低限制性句子语境频率、类型眼动指标的平均数和标准差(M±SD)

实验1 的结果显示,在高限制性句子中,藏语母语者词汇识别符合双通道理论;在高限制性句子中,词频效应仅出现在词汇识别的晚期。针对以上结果,可能的原因是:(1)高限制性句子给被试提供了充分的信息,被试对目标词产生了预期,会将目标词与自己预期的词相匹配,当句尾是音同词或者形似词时,因为与预期不符,会停留更多时间确认该词的信息;(2)在高限制性句子中仅在词汇识别晚期出现词频效应,是因为高限制性句子条件下,语境对目标词的限定程度更大,对被试看到的低频词影响也更大,低频词和高频词的差异在丰富的语境作用下抵消(王露,2015)。实验2 的结果显示,在低限制性句子中,藏语母语者词汇识别符合语音中介理论;在低限制性句子的中期和晚期指标中,出现词频效应。针对这一结果可能的原因有:(1)低限制性语境提供给被试的信息很少,被试对目标词汇没有预期,一定程度上增加了读者的阅读难度,语音信息一旦提供给被试,被试就充分运用同音信息理解句意;(2)低限制性句子提供的语境信息少,阅读者的注意力就更多的分配在字词上,词频本身的差异就显现出来。本实验的结果也符合核证模型,高限制性语境中的核证过程慢,低限制性语境中的核证过程较快(Becker, 1980),根据实验数据可知,高限制性语境中的词频效应在总注视时间中才开始表现出来,低限制性语境中的词频效应在凝视时间就开始体现出来。

本研究的实验结果与以往同类研究不尽相同。与任桂琴等(2012)的实验相比,其高限制性语境的词汇识别符合直通理论,而本研究的实验结果符合双通道理论,其低限制性语境词汇识别符合双通道理论,本研究的实验结果符合语音中介理论。与上述两项研究相比,本研究最大的区别在于没有直接支持直通理论,产生这种实验结果可能的原因是:本研究采用藏语母语者作为被试,而非汉族被试。已有研究发现母语会影响被试的认知加工特点(江新, 2003; 潘景景, 2007; 赵永桂, 2009; 张金桥, 王燕, 2010; Koda, 1988),汉字是表意文字,藏文属于汉藏语系,但是藏文由字母构成,根据本研究的实验结果可知,藏语母语者阅读汉语文本时语音产生了作用,而任桂琴等(2012)的实验中语音的作用弱于字形,由此本研究可以推测藏语具有偏向拼音文字的特点。实验2 的词频效应与任桂琴等(2012)、王露、万鹏和任桂琴(2018)的研究结果一致,词频效应出现在凝视时间和总注视时间两个指标上,在首次注视时间上没有产生词频效应。

由实验结果可以看出,形、音在不同限制性强度的句子语境中表现出不同的特点,实验1 体现出字形和语音信息的共同作用,符合双通道理论,实验2 体现出语音信息的作用,符合语音中介理论。词汇识别在不同情况下选择了不同的通道,因此,本研究的结果符合双通道理论。

5 结论

在藏语母语者阅读汉语的过程中,句子语境影响词汇识别过程中字形、语音的作用及作用的时间进程。藏语母语者汉语词汇识别符合双通道理论。

猜你喜欢
词频限制性字形
异体字字形类似偏旁的互用类型综合字图构建
“”字形体结构的意蕴及其影响
复习生字字形的方法
添一笔变个字
词频,一部隐秘的历史
汉语音节累积词频对同音字听觉词汇表征的激活作用*
非限制性定语从句常见易错题例析
定语从句