好的课堂评价=GPS
——王少非教授访谈录

2019-01-12 16:35
教学月刊(小学版) 2019年9期
关键词:贵刊作业目标

□ 本刊记者 聿 实

【专家名片】王少非,男,教育学博士,台州学院教授,华东师范大学课程与教学研究所兼职研究员。一直从事教师培养和培训工作,主要从事教师教育、教师专业发展、课程教学、教育评价等方面的研究,曾为教育部师范教育改革重大项目“教师教育课程标准”研制专家组核心成员,承担过浙江省哲学社会科学研究项目、教育部人文社科研究项目和教育部人文社科研究重点基地重大项目。发表论文50余篇,出版著作6部。

记:王教授好!最近看到您在华东师范大学出版社出版的新作《促进学习的课堂评价》,印象中,您对评价相关领域的关注已经有好些年了吧?

王:很荣幸能得到贵刊的关注。非常感谢!的确如您所说,我涉足这个领域是有些年头了。说起来,介入这一领域并非兴趣,而是任务所迫。在2004年,华东师范大学课程与教学研究所钟启泉教授作为首席专家的教育部哲学社会科学重大攻关项目“素质教育课程评价体系研究”获批,作为课程与教学研究所的博士生,我参与了其中的一些外围工作。在研究过程中,我发现了一个以往很少被关注的领域,那就是教师在日常教学层面对学生学习实施的评价。限于当时的积累,我从“校内考试”这一领域着手,完成了我的博士论文。之后,就从这一领域扩展开来,关注了“教师评价素养”问题。近年来,主要开展课堂评价全领域的研究。

记:就我视野所及,课堂评价这一概念还并不太普及,我个人也并不十分明了。这个领域主要关注什么?

王:课堂评价这一术语其实来自于英文中的classroom assessment。在我们的日常教育话语中有个字面上很接近的术语,就是课堂教学评价,我们很容易将两者混同。但课堂评价与课堂教学评价的关注点完全不同:课堂评价关注的是对学生学习的评价,而课堂教学评价关注的是对教师教学活动的评价。在“课堂教学评价”中,“课堂”是用来修饰教学的,而教学则是评价的对象;在“课堂评价”中,“课堂”却是“评价”的情境,就是指教师在日常教学实践层面实施,强调了其与各种大规模评价之间的区别,指的是教师对自己的学生在教学过程中实施的各种形式的正式和非正式的评价。特别需要强调的是,课堂评价中的评价,英文中用了assessment这个词,而不是更常见的evaluation,实际上就是不强调评价的价值判断,而是强调评价的信息收集功能。因此,课堂评价关注的就是教师在日常教学实践活动中收集自己学生的学习信息并运用这些信息来改进学习的活动。具体来说,教师实施的考试、测验,作业批改,课堂提问,甚至在课堂中对学生的观察等都包含在课堂评价之中。

记:为何要关注课堂评价?

王:美国学者斯蒂金斯曾说:“如果评价不能在课堂层面有效地实施,那么其他层面的评价都是在浪费时间。”他所说的其他层面的评价,包括了学区的、州的、国家以及国际层面的。对于我们来说,这个论断几乎是颠覆性的,因为我们尤其是教育管理者一直相信,统考之类的外部评价是提升教学质量的最重要的手段。开始我并不认可这一论断,但在研究过程中发现,越来越多的证据在支持斯蒂金斯的论断,让我相信,教学上的低效很多是因为教师评价的问题,课堂评价的改进是提升教学质量,实现“轻负高质”的重要路径。另一方面,我们对课堂评价的关注非常有限。尽管我们有专门的教育评价学,可遗憾的是,传统的教育评价学源于心理测量学,并不完全适用于对教育目的的评价;我们的教师非常关注如何教,但很少关注日常评价问题——即使有关注,可能更多也是在关注课堂评价语,关注评价的激励功能,对于课堂评价如何更好地促进学生学习,关注实在有限,实践中也存在许多问题。

记:您认为存在对促进学习不起作用的课堂评价吗?这就是您在“课堂评价”之前加上“促进学习”这一修饰语的理由吗?

王:教师从事专业实践,出发点一定是促进学生学习,教师进行各种各样的评价活动,初衷一定也是促进学生学习。然而,正如您所说,教师的有些评价实践还真不能促进学习,至少可以说,评价对于促进学习的效果并不确定,有些评价能够促进学习,有些评价对学习没有明显的促进作用,有些评价甚至可能阻碍学习。举个例子说,曾经有一段时间,小学课堂中流行诸如“你真聪明”“你真棒”之类的评价语,表面上看,得到此类评价的学生似乎表现出了更高的积极性。然而,如果学生不知道朝哪个方向去努力,如何努力的话,更高的积极性并不一定能带来更好的学习表现。相反,这类评价甚至可能在鼓励学生进行错误的归因,将学习成败归因于很难改变的聪明或愚笨,结果导致所谓的“学业宿命论”。再比如说,我们许多教师都认真批改每一次作业、每一次测验,但有些学生却会在某些题上一错再错,原因很可能在于教师只指出学生某道题做错了,但未能指出他错在哪里。这说明教师的评价未能对学生学习起到良好的促进作用。

这些判断也许与教师的观感有些出入。在许多教师的经验中,激励性的评价语似乎很有效,能够对学生学习带来正面的影响。我不否认这一点。但是,最近有一本非常火的书,叫《可见的学习》,其作者在综合了800余项关于影响学生学习的因素的元分析的基础上得出一个结论:“几乎一切都对学习有影响”,所有因素都对学习有一定的效应量。因此作者经过分析后认为,只有效应量大于0.40的才算是真正有效的影响。而表扬之类的效应量仅为0.14。

记:教师评价不能对学生学习产生真正有效的影响,原因在哪里?

王:我认为,概括起来讲,原因在于两个方面:一个是评价未能收集到关于学生学习的准确的信息;二是所收集的信息未能为学生学习提供持续的充分的支持。

前一方面的表现之一是评非所教。在学生的作业、试题中,我们经常会发现一些教师未教过也未对学生提要求的题目,我的一些学生在做家庭辅导,也反映说经常碰到一些解决不了的小学作业题;网上也经常有些被称为“神题”的中小学生作业题,意指不仅适龄的学生难以解决,甚至受过良好教育的成年人也难以解决的题。这些题在本质上有个共同特点,那就是偏离了教学目标和学习目标。教师的评价中若容纳了偏离教学目标和学习目标的题,后果可能很糟糕。20世纪60年代,美国有过一个大规模调查,试图搞清楚影响学生学业成绩的因素,其结论是,学校教育对学生学业成绩几乎没有影响,对学生学业成绩起决定作用的是家庭背景。这一结论显然难以为人所接受,对我们从事教育工作的人来说尤其难以接受。但我可以很容易验证他们的结论——我只需要在用来确定“学生学业成绩”的测验中将学生在学校课程中所学的内容排除在外,只安排那些与学生生活环境相关的题目即可。这样的评价能够收集学生的信息,但不能收集到学生在达成学习目标的过程中的学习状况的准确信息。如果评价获得的信息与学生达成学习目标的状况无关,那么这些信息就无助于学习目标的达成。

表现之二是评价的方法与目标不匹配。怎么评,其实受制于评什么,评价的目标决定了评价的方法。评价目标就是教学目标,就是学习目标。学习目标是多领域的,评价目标也是多领域的,适用于某些目标领域的评价方法可能对检测另一领域目标的达成状况完全无能为力,例如,肯定无法用纸笔测验来检测学生的口头表达能力或实验操作技能。某个领域的目标也有不同的类型或层级,比如按布卢姆的教育目标分类学,认知领域的目标就有知识、领会、应用、分析、综合、评价六种类型,每一种类型对学生都有不同的要求。学生是否达成这些要求就需要用不同的方法来检测。填空题能否检测学生的分析能力?简答题能否检测分析综合能力?如果目标是分析,我们却用填空题或选择题来检测,我们得到的信息就可能是不准确的。

记:如果GPS做不到准确定位,也就无法给我们精准导航,就是这个意思吧?

王:对。准确定位是精准导航的前提,准确把握学生当前的学习状况就是运用信息来促进改进的前提。仅仅收集到信息,但不运用这些信息,改进就无法预期。当然,所收集的信息还要能正确运用。刚才我们提到评价不能有效促进学习还有一方面的原因,就是所收集的信息未能为学生的学习提供持续的充分的支持。就像您提到的GPS,如果GPS收集到您所在位置的信息,却不告知您,就像现在许多网站都在收集您的信息,却不让您知道,那么它所收集的信息就对您到达目的地没有帮助。只有GPS把所收集的信息转化成对您有用的信息,才能持续地告知您,“在当前道路上继续行驶3.6公里”或“在下一路口右转”。

记:可在大多数实际情况下,教师会把批改过的作业、试卷等发还给学生,这不是将所收集的信息告知学生了吗?为什么还会出现某些学生在某些题上一错再错的情况?

王:还是拿GPS来说吧。如果GPS告知您下一路口右转,您偏不右转,GPS对您就没有任何意义。教师通过评价收集到的信息只有为学生所知且所用,才能真正帮助学生达成学习目标。如果信息不能为学生所用,信息对学生就没有价值。教师的确会把相关信息反馈给学生,但在很多情况下,教师反馈的信息无法为学生所用,比如,作业、试卷上老师经常以√、×以及√上加个点来批改,有时可能有分数或等级。这样的信息能否为学生所用?显然不确定。对于一个缺乏自我评价能力的学生来说,看到某道题上教师给的√上加个点的符号,很可能完全不知道因为哪里有问题才有这个点;又比如一篇作文,教师给了80分,学生很可能完全不知道自己的文章与教师心目中95分的文章差距在哪里。能够为学生所用的信息通常应该是具体的信息、描述性的信息。就像您可能会碰到的情境,作者投稿,如果您觉得他的稿子不行,可能就不给任何回复,也可能会给个退稿信,说“您的稿件不符合本刊要求”。前一种情况是没反馈,后一种情况给了反馈,但这种反馈能否有助于他进一步修改?显然不能。当然,编辑没有义务来帮助所有作者改进。但如果有作者就他的论文向您请教,您一定会指出一些具体的问题,提出一些相对具体的意见或建议。向学生提供关于他作业情况的具体信息,也就是所谓的描述性反馈。所有研究都表明,相对于只给对错或分数等级的评价性反馈,描述性反馈对于改进更有效。

记:是这个道理。我们也想帮助作者提升他的文章质量,但稿件太多,真的没有时间。教师也一样,这样打√、打×的批改,就已花了那么多时间,若还要提供一些具体的描述性反馈,哪来那么多时间啊?

王:这的确是个问题。但并非不能解决。事实上,实践中很多教师有些做法能够较好地解决这个问题,比如面对面批改,比如集体讲评,都能节省教师批改作业的时间。随着现代通信手段的普及,语音反馈也能部分减轻教师批改作业的压力。在这里我想主要讲两种做法。首先,作业要精简,一方面作业量要减下来,但更重要的是作业的品质要提高,其关键在于保证作业与学习目标的匹配,也就是说作业要求应当与学习目标的要求保持一致,不能布置与当前学习目标无关的作业。其次,批改无须面面俱到,每次作业只就与本次作业目标相关的那些错误提供描述性反馈,其他的错误就别管了。

记:其他的错误完全不给反馈?那这些错误可能会一直存在,该怎么办?

王:设想一下一台GPS,功能非常强大,能够关注到很多东西,一路上喋喋不休,告诉您许多信息,不仅告诉您怎么走,而且一直指出您在开车技术动作上存在的问题,那会怎样?关于怎么走的信息就可能被淹没在繁杂的信息之中。所有的研究都告诉我们,太多的反馈通常不起作用。一种做法是,我们把看到的所有问题都指出来,结果都改不了。另一种做法是,只指出与当前学习目标相关的少量问题,然后确保其得以解决。在这两种做法中,我们一定会选择后一种做法。如果每次作业都达成预期的学习目标,学生慢慢就会有余力来解决其他的错误了。

记:如果学生能够自己发现并解决存在的问题,教师批改作业的压力就会轻很多。就像本刊的一些作者,持续向本刊投稿,开始时不行,到后来稿子质量越来越高,我们编辑基本上无须修改,可以直接发表了。

王:我相信,如果您说的那些作者不是得到他人的指点并持续改进,他一定在不断研究贵刊所发表的那些文章,而且一定会拿自己的文章与贵刊所发的文章作比较,在比较中发现问题,然后加以改进。这是一种自我评价能力。我的研究中也关注到了这个主题。学生自我评价能力的提高是减轻教师评价压力的最根本的路径。我经常对一些教师说,要让学生知道,老师是靠不住的。我的意思是,人不可能一辈子都有个类似于老师的人在身边,随时帮自己指出问题;人最终是要靠自己来发现自己的问题的。但自我评价的能力需要培养,缺乏有意识的培养,学生自我评价能力的发展会受到局限。不能只将学生当作评价的对象,而要让学生参与到评价过程之中,比如创造机会让学生自评、互评。比如有一个实验学校的教师就经常性在课后作业中减掉一些重复性的练习,加上一两道促进自我评价的题,比如,“在上面4题中,你认为答得最满意的题是?最不满意的题是?为什么?”“与同伴交流后的作业中,你哪些做得好,哪些需要改善?”当然,仅给学生提供自评互评的机会是不够的,有效的自评互评需要学生知道评价的标准——贵刊的那些作者研究贵刊所发表的文章其实就是在揣摩贵刊的录用标准——为此必须让学生清楚自己的学习目标,并帮助他们将学习目标具体化为清晰的评价指标。如果一个人明确知道自己要去哪里,而且很清楚到那里去要走的路,要经过的各种标志物,这个人就可以根据这些标志物来判断自己是否行进在正确的道路上,也就无须GPS来导航了。

记:您说“好的课堂评价等于GPS”,除了上面提到的那些之外,好的课堂评价还能从GPS中借鉴什么?此外,我觉得好的课堂评价也应该超越GPS,需要做得比GPS更多。您觉得呢?

王:课堂评价要有效促进学生学习,的确还可以从GPS那里借鉴更多。比如,GPS会实时收集信息,及时提供反馈,您肯定不会用一台会滞后一个小时向您提供反馈信息的GPS。课堂评价也一样,如果教师收集到学生学习的信息,间隔很长时间才向学生提供反馈,这种反馈对帮助学生改进就可能失去意义。再比如,GPS会持续提供反馈,如果您用一台间隔半个小时才提供一次反馈的GPS,那么很可能在上一次反馈时您还在正确的道路上,而在那次之后,您走错了,当您得到反馈时,其实您已经在错误的路上走了半个小时了。

好的课堂评价是否应当超越GPS?您的问题给我很大的启发。的确,好的课堂评价应该做得比GPS更多,GPS的有效运行需要人来设定目的地,好的课堂评价不能依赖外人来设定目标,教师必须非常清楚自己的教学目标。GPS只需要向驾驶员提供指令性反馈,驾驶员无须知道GPS为何及如何给出这样的反馈;好的课堂评价还要向学生示范良好的评价,帮助学生学会评价。也许还有其他方面需要超越的,我在后续研究中会特别关注。

记:您说的“好的课堂评价等于GPS”,更多是从课堂评价对学生学习的直接影响角度来讲的。记得您书中还提到“好的课堂评价影响学习的另一条路,即通过改进教师的教学来促进学生的学习”。

王:对的。关于好的课堂评价,我还有另一个类比,就是空调中的温度计。这个温度计干什么用?测定室温。但它测定室温之后不告诉人,而是告诉空调中的恒温调节器,恒温调节器会根据测定的室温与使用者设定的目标温度的关系,向空调中的工作系统发布继续工作或暂停工作的指令。其实,这也相当于将来无人驾驶时代GPS的作用。评价所获信息也有这样一种用途,给教师自己用,教师根据所收集的学生学习信息来支持自己的教学决策,做出有利于学生学习的调整。这一领域与之前流行的“以学定教”以及当今很热门的“精准教学”的关联非常紧密,今后较长一段时间我会关注这一领域的研究。

记:谢谢您接受我的访谈!您能在本刊主持一个关于“课堂评价”的主题专栏吗?

王:这是您和贵刊给了我与贵刊读者一个交流的机会和平台,谢谢您!我非常乐意与贵刊的读者继续交流,再次谢谢您!

猜你喜欢
贵刊作业目标
两个新发现的不等式
作业
来信
还原历史是贵刊吸引我的地
我想要自由
三十六计第七计:无中生有
新目标七年级(下)Unit 3练习(一)
新目标七年级(下)Unit 4练习(一)
(新目标)七年级下Unit 1练习(二)
我治好了脚跟痛