计算机辅助PSC命题说话评分细则的修订和实施

2009-01-25 08:59彭云帆
广西教育·A版 2009年11期
关键词:离题细则应试

彭云帆 隋 雯

计算机辅助普通话水平测试(PSC)中,命题说话测试项的录音出现了与应试人面对测试员人工测试不同的一些情况。例如,机测命题说话中不时出现应试人看错了话题或说错了话题,以及背稿或离题等情况。这些情况在人工测试时有测试员及时提醒而能尽量避免,现在机测评分应当如何处理这些情况?又如,前三项即单音节、多音节和朗读短文由计算机评分,命题说话则由两位测试员背对背独立评分,若两位测试员评分的差异超过规定范围的3分,评分则为不合格,需请第三位测试员复听。有些测试员对没有前三项评判印象而给命题说话评分能否准确心存疑虑。如何在评分细则上全面准确地区分机测说话项录音答题出现的有关情况?如何将测试员之间的评分差异控制在合理的范围?这要求对计算机辅助普通话水平测试及其评分细则实施情况深入进行调查及研讨,在国家语委《普通话水平测试实施纲要》(以下简称《纲要》)的基础上,进一步明确计算机辅助普通话水平测试的目的,对评分细则进行相应的科学的修订。广西语委办多次组织不同层面的测试员,对《广西普通话水平测试评分细则》(修改稿)(以下简称《细则》)反复进行实验、研讨及修改,我们参与了实验、研讨和修订,制定出现行的机测命题说话评分细则,力求使其具有科学性、操作性和公平性。

一、语音标准程度

语音标准程度评分项分为音节的准确度和方音的表现程度。广西评分细则对“方音”的解释主要是指与方言有关的语音错误,在说话项中主要指声韵缺陷和语调偏误。对这一评分项中的语调与自然流畅程度评分项中的语调如何分别把握?我们认为,这里的“方音”评判设置,主要是在语音标准程度量化的基础上归档操作后进行微调的依据。如《纲要》中“语音标准程度”中二档、三档的设置,当语音错误数量相同时,方音表现程度的不同是分数高低调整的依据。

对说话中失误音节的定量累计,是取得评判准确性、缩小评分差异的重要保证。这里的定量包含着定性,是在定性的基础上形成的量化记录。说话中出现了什么性质的失误,是错误还是缺陷,是什么错误,是什么缺陷,测试员都要在瞬间做出判断,这就是定性;及时把错误和缺陷分类累计下来,这就是定量。同时,在评判过程中,还应对应试人说话中非音质的表现作出判断。这样有依据地作出语音标准程度归档和评分,可以由任何一位合格的测试员得出相同结果。因此,它是科学的、可控的和准确的。

对说话中失误音节的定量累计,是测试员判分的基本依据。过去有四项或五项的人工测试评分,有的测试员凭着对前三项的印象,在应试人开始说话不足2分钟时就对整个说话项作出判分。这样判分不能说都不准确,确实有不少测试员当应试人一开口就能大致判断其普通话水平等级,但从科学的角度来讲,判定普通话水平高低应以确凿的定量记录作为事实依据,不能用“大致”判定代替准确评分。当判分的依据有较大差异时,测试员之间的评分差异就难以控制。这样不依据完整测试过程来判分,就会对应试人作出不够公正的判分,使普通话水平测试工作的信度降低。因此,机测要求测试员脱离前三项评分而对应试人说话进行单独评分,有些测试员产生“单判说话不好判”的顾虑。国家测试员培训班反复强调:没有经过测试评判,谁也不能确定应试人的等级。因此,测试员对机测说话项的准确评判,必须采取语音标准程度的量化工作方式。语音标准程度的准确定量,是说话项准确评分和缩小评分差距不可或缺的重要依据。

二、词汇、语法规范程度

词汇、语法规范程度评分项,应检测不符合普通话规范的方言词语和语法,不包括偶尔出现的口误。从原则上讲,应当主要考查应试人对普通话词汇、语法这些语言成分的应用水平;对于言语成分应当从宽评判。如果3分钟说话期间反复出现话不成句的情况,应当在词汇、语法规范程度评分项中考虑适当扣分。语言成分指已经进入普通话静态系统中的语言的成分,词典收录的是词汇部分,语法教材讲解的是普通话的语法规范。从人的语感来讲,对方言词语的评判主要指意义很难理解,普通话从来不这么说的词语。例如,桂林话中的词语“把爷”,非西南方言区的人乍一听是不会理解其词义的。又如,粤方言的“吃茶”、“吃烟”、“那个人很肥”,普通话就不这么说。关于词汇、语法的规范与方言词语句式的对比材料,测试培训教材应当进行详细的收集和系统的整理。

三、自然流畅程度

自然流畅程度评分项主要分为语调自然程度和言语流畅程度两方面。命题说话是一个整体,语流中的各项要素比如语调在各项评分中会有交叉出现的现象,“细则”及其实施应让各项评分分工合作。“自然流畅程度”与“语音标准程度”在语调上有交叉,与“缺时”在“言语流畅程度”上有交叉,但是它们各有分工。自然流畅程度评分项对语调的考查,是对3分钟说话语流态势的整体考查,是在“语音标准程度”之外对语流的流畅和样态的评分;“语音标准程度”中的“方音”,只是音节量化归档的辅助性微调要素,几乎不单独占分值。“自然流畅程度”中的语调,与方音中的语调评分着眼点不同,所占分值也不同。

对说话自然流畅程度的考查,是对语言能力的考查。这种考查也体现在朗读以及多音节、单音节测试项。语言学习的目标可以分为语言能力的获得和语言应用能力的获得。语言能力是语言学习过程中的基础能力,是前一阶段的学习目标。是对语音、词汇、语法各语言要素掌握的能力,也就是说话时能否正确地发音、用词和造句的能力。假如说话中语流不顺畅,磕磕绊绊,反复出现纠正字音、方音和方言句式等现象,说明应试人普通话语言能力不过关。评分时,即使不在“语音标准程度”定量上记为语音错误,也应在“自然流畅程度”上适当扣分。

语言应用能力是应用普通话生动自如地表达思想感情的能力,是普通话语言学习的高级目标,也是普通话水平测试的侧重点。《纲要》二档中有“类似背稿子的表现”,三档中有“语调生硬”的描写。这里“类似背稿子的表现”,是指语调或腔调上的表现,“语调生硬”是“类似背稿子的表现”的程度加深。就目前的认识来讲,语调主要包括声调、句调、重音、停连以及音节长短等超音段的节律特征。“类似背稿子的表现”语调用汉语拼音无法记录,用文字只能做大致的描写:停连机械、高低无据、没有轻重之分或轻重不当、语音形式与语言内容不一致。这样的表现徒有语音形式的“顺溜”,而无言语形式与言语内容之间谐调,所以语调生硬。应试人说话全过程采用背稿子腔调或语调生硬,说明他(她)只掌握普通话语言形式,具备普通话语言发音能力,尚未达到普通话应用能力的目标,未能用标准普通话流畅生动地表达丰富的思想感情。学生们在课堂上齐读唱读的训练

方式对他们学习普通话语流起到了误导作用,这些学生用普通话说话时就会自觉不自觉地采用那些生硬腔调、背诵语调、念书腔调,禁锢语言应用能力的发展。对背诵语调、生硬语调等现象,我们在评分工作中不可忽视。

四、缺时

缺时指说话中出现持续性的空白,是人工测试和机测共有的现象。《纲要》规定缺时1分钟以内有3个分数。《细则》具体规定为“录音开头空白10秒不扣分,以后出现空白每持续10秒扣0.5分。说话不满30秒,本测试项扣40分。”以10秒为计量单位来扣分,以缩小测试员之间的评分差异,并跟“自然流畅程度”的评判相区分。

录音开头空白10秒不扣分,是出于对机测录音常见情况的考虑。应试人朗读结束后接着点击说话题,用10秒时间调整思路应该是合理的。有的应试人操作计算机时会耽搁一点儿时间,用10秒时间也是合理的。此后缺时从10秒起扣,我区把网络评分页面可以开始记录扣分的时间设置为2分51秒,提示测试员对应试人说话的听判时间不可以随意减少,以保证对应试人评分的真实可信,减少测试员评分之间差异。

缺时与自然流畅程度的评分区别在于,缺时评分项是指说话出现持续性空白,自然流畅程度评分项考查言语是否磕巴、不流利、反复纠错、停顿时间较长,而不包括10秒以上的空白。《细则》把“缺时”扣分界定为空白持续10秒起扣缺时分,对持续不到10秒钟的空白,不必累计扣分,而在自然流畅程度加以评判。这样区分两项评分,便于操作,减少测试员之间的评分差异。

五、无效话语

无效话语是安徽、上海机测命题说话测试中提出来的概念。广西《细则》中,无效话语包括“与测试话题毫不相关的话语,多次简单重复相同的语句,以背诵他人文本代替说话”等。这几条都是从内容方面考查应试人普通话应用能力,可以归为一个评分项。比如,应试人在说话时间内长长地数数,或反复叨唠同一句话,或反复地念说话题目,或背诵他人作品等。

命题说话测试中出现无效话语的原因很多。应试人准备的内容说完了不知再说些什么,或一时心理紧张造成思维短路,或担心无话说,就用与说话题目无关的一些话语应对测试。这些无效话语未能表现出应试人普通话应用能力和水平。

广西《细则》中无效话语评分项以占时扣分,每10秒加扣0.5分,便于操作。所谓“加扣”,就是在“语音标准程度”扣分之外再扣分,即先对应试人普通话语言能力进行考量,再对其普通话语言应用能力进行评判。

六、离题

普通话水平测试中的离题评判与高考作文的离题评判不一样。高考作文测查考生的写作水平,包括思维水平和语言表达水平。语言表达水平在作文评分中大约只占六分之一。普通话说话水平固然与思维水平密切相关,但它侧重于指应试人普通话口头应用能力,能否用普通话流畅地表达思想感情,而不是侧重于指应试人思维水平的高低。

普通话水平测试不是侧重评判应试人的思维水平,并且不容易准确判断其说话是否离题,所以对离题的扣分应当从宽。《细则》修订为:“说话内容与话题多少有些联系的一般不扣离题分。离题持续1分钟扣2分,以后每30秒加扣1分,全程离题加扣6分。”比如,把话题“我喜欢的节日”错说成“我喜欢的节目”,在语音标准程度、词汇语法规范程度、自然流畅程度等评分项上照常扣分,再在离题项扣6分,而不是将命题说话的40分全扣掉,因为应试人毕竟用普通话表达自己的思想。应试人以事先准备的内容应对命题说话的题目,被扣离题的6分就不能提高普通话等级。这样的分数设置,有利于准确反映应试人普通话真实水平,缓解他们临场的心理压力,也减轻测试员评分的压力。“说话内容与话题多少有些联系而不扣分”与离题扣分之间渐降的坡度不要太陡,才符合普通话水平测试侧重于考查应试人普通话应用水平这一目的。

离题与无效话语都是对命题的偏离,为何分两项扣分?《细则》规定无效话语起扣时间是10秒钟,离题起扣时间是1分钟。从录音材料中,无效话语其语言形式明显,短时间就可以判定的;离题是内容的偏离,短时间内不好判断,其起扣时间比无效话语起扣时间要长。因此,这两项不能合并,不重复、不累计扣分,以便于操作。

命题说话评分项目共有这六条。这六条相互配合,构成一个完整的合理的普通话说话评价系统,供测试员独立评分使用。对《细则》的实施,可增加测试员独立评分的可信度。命题说话测试项没有前三项评分的印象,避免两名或三名测试员评分之间相互参考,每位测试员完全凭借个人听力独立评分,与其他测试员评分差异控制在规定的3分以内,其评分就是真实性的可信的。

《广西普通话水平测试评分细则》是技术性的操作规则。我们期望测试员依据修订后的《细则》。在相同条件下能得出相同的评分结果,并在命题说话测试中不断发现新问题,以便今后进一步完善命题说话测试项评分细则。

[作者简介]

彭云帆,女,汉族。广西师范学院副教授,国家级测试员,应用语言学方向。

隋雯,女,汉族,广西幼儿师专副教授,国家级测试员,现代汉语口语方向。

(责编李景和)

猜你喜欢
离题细则应试
守正创新 追求卓越 《今传媒》征稿细则
2021年高考《选修3—4》考点预测及应试策略
《宇航计测技术》征稿细则
解释式纪录片“离题”及其运用
体育课“大翻身”须警惕陷入“应试”误区
征稿细则
《复杂油气藏》征稿细则
应试写作的文化视角探讨
六类卷:36分以下
六类卷:36分以下