项目式学评中评价量表的设计迭代

2021-07-12 21:26余辛怡

余辛怡

摘要:基于项目活动,事先设计能记录和衡量学生表现特质的评价量表是项目式学评中一项极其重要的工作。通过“撒开脚丫逛世界”项目式学评活动中的四次量表设计迭代,获得评价量表设计上的启发,同时在实践探索中明确量表设计的改进方向:以“信”“达”“雅”作为数据可视化的标准;强调评价量表与档案袋、激励贴纸等的融合运用;开发形式更多样、内容更丰富的评价量表。

关键词:项目式学评;评价量表;量表设计

项目式学评基于大数据的宏观结果,反映学生个体的微观表现,使传统的“质与量的分析”中质性评价的部分借助信息技术实现,保证评价过程更加可视化,提高评价的精准度,让学生和家长能清晰看到评价标准和评价后的改进方向,真正起到补学业不足、促个人发展的功能。基于项目活动,事先设计能记录和衡量学生表现特质的评价量表是项目式学评中一项极其重要的工作。

一、什么是评价量表

评价量表是一种评价工具,是对学生的作品、成果或行为、表现进行评价或等级评定的一套标准。评价量表将项目式学评中的任务分解成多个组成部分,并对每个部分不同层次的表现进行详细描述,表达对学生完成某项任务的具体期望。

一份完整的项目式学评量表由项目描述和量规两个部分组成。项目描述用描述性语言呈现了项目名称、考查目标、任务情境、设计意图、活动流程、任务描述和场景布置(道具准备),解释了测什么、怎么测、在什么情境下测、为什么测、在哪里测。量规,简单而言就是一个评分程序或指南,列出了学生表现的特定标准,以及这些标准下的不同表现等级。量规的制订紧紧围绕测评目标展开,充分考虑到不同层次的学生在项目式学评中的多维表现。量规由评价维度、评价尺度和具体描述三个部分组成。评价维度是一种任务分析,把任务分解成构成要素,以及哪些构成要素是最重要的。评价维度方面,需包含测评的重点目标,并设置合理的权重。评价尺度用于描述任务执行的程度,按照表现水平划分层次:可以是“优秀”“良好”“合格”“有待提高”这样明确的等级评定;也可以用“模范”“熟练”“新手”“起步”等更具鼓励性的语言来表述。评价尺度需要层次分明、因材施评。具体描述是在维度中进行细分,从最高表现水平开始,按照层级做具体描述,反映实际。用作具体描述的语言要求针对性强、概念清晰、梳理详尽。表1为评价量表设计样例。

二、评价量表的四次设计迭代

评价量表第一次引入项目式学评是我校2018学年第二学期(即2019年中旬)期末测评。学校针对一至三年级的项目式学评活动,设置层次递进的三个主题:“家——家乡——国家”。三年级设计“撒开脚丫逛世界”项目式学评活动,以环球旅行为情境,设置一条别具风情的旅游线路并安排相应任务。整场旅行的起点为“Twinkle Little Star闪闪星外交馆”(306教室,用于领取“通关护照”);之后,学生分别徜徉于中国馆(301教室)、俄罗斯馆(304、305教室)、英国馆(科学教室)、巴西馆(1号楼前跑道)和澳大利亚馆(音乐教室),完成多方位、多层次、多形式的任务挑战,感受不同国家的特色文化,目的在于考查学生的多学科知识素养,测评学生的口头表达能力、倾听能力、应对能力、测量能力、解决问题能力、团队合作能力、运动能力等多项能力,进一步培养学生在语言、音乐、空间、逻辑、运动、自然、内省、人际方面的八项多元智能。

以下呈现该项目式学评评价量表的四次迭代设计,以便读者从中获得评价量表设计上的启发。

(一)聚焦:对准目标与维度

初次接触评价量表这一新事物,教师以模仿、自悟为主。在专家的理念引领和实操指导下,教师开始深入钻研评价量表的设计。

1.锚定考查目标:多学科整合,主学科引领。

项目式学评倡导多学科整合,使考查内容更灵活、丰富,但也容易出现考查目标杂糅、重点不突出的问题。若任务的设计融合了多学科能力的考查,首先应将不同学科要考查的内容进行梳理和归并,考查目标的设置和评价量表的开发则由主学科教师引领。如同样考查表达能力,语文学科侧重“表达”的“生动、富有表现力”,数学学科侧重“表达”的“条理清晰,有自己的思考”,以哪一个学科作为主学科,视项目式学评中具体的任务情境为准。

教育研究与评论小学教育教学/2021年5月独家策划如果单一学科内要考查的东西太多,应将重复考查的内容删去,以更好地聚焦考查目标。例如,“中国馆”内的学评活动最初考查学生的倾听、交际、朗读及演说能力,关注点较多,且交际、朗读、演说三者在概念上界限不清,考查能力有所重合,因此将其整合为应对能力和口头表达能力。

2.瞄准测评维度:“学理分析”,力求有料有趣。

“学理分析”主要用于梳理考查内容和内容间的层次,并做对应、具体的描述。它的目的在于明晰设计意图,并提炼量表中的测量维度。

例如,设计“俄罗斯馆”的评价量表前,数学教师所做的“学理分析”经历了几个步骤:一是梳理三年级下册数学教材中的教学目标,挑选适合开展项目式学评的部分,如“能用自选单位估计和测量图形的面积,体会并认识面积单位,会进行简单的单位换算;掌握长方形、正方形的面积公式,会用公式正确计算长方形、正方形的面积,并能估计给定的长方形、正方形的面积”“经历从实际生活中发现问题、提出问题、解决问题的过程,体会数学在日常生活中的作用,初步形成綜合运用数学知识解决问题的能力”“在实际问题情境中能收集和处理数据,并利用数据分析解决问题”;二是确定“俄罗斯馆”项目式学评活动的具体目标;三是确立测评维度,侧重测量能力、解决问题能力、口头表达能力的考查。

“学理分析”是评价量表“言之有物”的基础,而要使量表“言之有趣”,则要结合项目式学评活动的真实情境,对量表的各维度做个性化、创造性开发。如,设计一张指导学生怎样打草稿、如何绘制思维导图的量表;或者将“优秀”指向“艺术性”维度的考量,良好指向“规范性”维度的考量,增加考查的挑战性,如“朗读时充满感情,还带有动作,朗读水平很高”及“舞台表现力十足”是以朗读的“艺术化处理能力”作为维度来设计的。

(二)精细:细化测评要求

第二次探索是在量表的实操过程中生发的。教师遇到了这样的难题:设计意图无法在具体的活动中落实,希望学生达成的目标很难被真实测出,包括无法测量是否达成以及达成的程度如何。如何解决?我们从主题情境的创设、样本数据的收集和行为表现的测量三个方面寻找突破。

1.贴合主题,创设情境。

以“巴西馆”的活动为例。起初,“巴西馆”的项目式学评活动对任务情境的描述比较简单,没有充分考虑到其与整体主题的联结。通过修改,任务情境强化了“巴西馆”内的“足球”元素,既与项目式学评的大主题“撒开脚丫逛世界”紧密融合,也将“巴西馆”的国家特色凸显出来。比如,任务情境从“设计游戏足球比赛,进行考核”的简单表述,最终调整为:“足球,号称‘世界第一运动,而巴西足球,不仅是一项运动,更是巴西的文化。巴西不仅有传奇的足球明星,如大罗、小罗、卡卡、贝利等,‘五星巴西国家队,更是足球界的神话。巴西几乎人人都是球迷,他们把足球称为‘大众运动,无论是海滩上,还是在城市的街头巷尾,都有人踢球。孩子们,今天你们就是足球小明星,快来巴西馆一‘踢为快!每个小组四到五人,进行运球过杆接力比赛,碰到标杆即扣分,随后扶起标杆直至运球结束。最后,依据每小组分数高低评定名次。”这样,既激发学习兴趣,又适宜学生评价。

又如,“中国馆”评价量表的任务情境从初稿“学生六人一组,根据提供的资料,每人分工,介绍旅游城市的一处著名景点或美食”,到终稿“暑假来临之际,你最大的梦想就是去——旅游。旅游之前,要先做好旅游攻略。中国馆内共有7个展示区,对应甘肃、陕西、四川、北京、台湾、云南、新疆七个省份,每个省份展示区的资料卡上,都有三处美景或三种以上美食。学生六人或七人一组,分批进入教室。选择想要旅行的省份,根据提供的资料,分工合作,一位学生介绍该旅游省份的一处著名景点或美食,讲给组内同学听,方便他们做旅游攻略时参考。学生小组内展示,教师评价。达人必打卡的国内旅行地,等你来哦”这样更具体的表述。其主要通过三步实现:第一步,带入情境,以做好城市旅游攻略为任务;第二步,精心挑选,圈定七个具有地域特色和文化风情的城市;第三步,去繁就简,择定以学生最感兴趣的美食和美景便于他们展开交际。修正后,学生更明确测评内容,知道要做什么、该怎么做。

2.收集样本,标注数据。

为提高评价量表设计的精确性,还需要教师对学生行为的描述足够具体,使条目语言充分“可评判”。换言之,要让任何一个教师拿到这份评价量表,都能明确知道操作步骤和流程,并依据评价量表对学生的行为表现进行精准评定。在使用量表正式测评前,先选取一定量的样本进行试验,记录完成任务活动所需的时间,标注相关数据,可以让评价量表中不同等级所对应的文字描述更加精确和可测。

例如,“巴西馆”项目式学评中关于“运动能力”的考查,教师做前测采样,测量并确定了最短时间、较短时间、基本完成比赛所需的时间和较长时间所对应的具体时长。最终,“巴西馆”评价量表中对“时间评定”的具体修正如表2中的画线处所示。

□完成比赛所用时间比较长(55秒以上)又如,以“团队合作能力”考查为例,“巴西馆”项目式学评的量表由综合量表向分析量表靠拢。我们对学生行为动作的细小差别进行精准评估与鉴别,将小组成员的配合默契度、衔接流畅度、礼貌程度均设置为考查内容。针对“巴西馆”评价量表关于“团队合作能力”的条目评定,教师先后设计了初稿、终稿。初稿涉及的内容有“能在小组合作中谦让有礼,团结互助”“遇到困难能主动礼貌地请教他人”“具有团队合作精神”“能在小组合作中谦让有礼,团结互助”“遇到困难能有意识地请教他人”“能在小组合作中做到团结有礼貌”“参与小组合作”。终稿涉及的内容有“具有团队合作精神,小组成员相互尊重,配合默契,衔接流畅”“能在小组合作中谦让有礼,遇到困难主动礼貌地请教他人,团结互助”“基本做到在小组合作中团结有礼貌,有协作,但配合不够默契”“参与小组合作,但小组成员之间没有表现出礼貌和尊重”。

3.表现外化,具体测评。

在“中国馆”和“澳大利亚馆”的项目式学评的评价量表的设计中,教师遇到了两大棘手的问题:如何以学生的外在表现发现学生的内在品质,如倾听的专注和礼仪?如何以学生的外在表现测量学生的学科素养,如用正确的姿势及态度参与演唱?

通过探索和思考,针对“中国馆”活动的量表设计,教师决定重点从“倾听”“应对”“表达”三个方面来确定考查目标,对每一项考查目标又列分出详尽的小目标。比如倾听能力,就从倾听者的身体、表情等具体表现,通过观察倾听者有没有注视着对方的眼睛,有没有随意插话;有没有在听人说话时身体摇晃、手脚乱动等。如果有,是否意识到并及时停止等。通过准确捕捉、分析学生的行为表现,并在量表中对体现能力的具象化行为表现进行归纳和概括,来考量学生的倾听能力就水到渠成了。“中国馆”评价量表关于学生倾听能力的评定的初稿如表3所示,设计迭代后的终稿如表4所示。

□边听边思考合格□认真倾听有待提高□眼神飘忽,倾听不认真“澳大利亚馆”项目式学评的评价量表的第三次修改,重点在细化操作及评判指标上,特别是对“正确的姿势及态度”这一条目的行为表现描述得更具体、更直观,将“正确的姿势及态度”定义为“直立站立,口腔充分打开”。考虑到有些学生可能會随着音乐的律动轻轻摇摆身体,这并非姿势不正确的表现,但在层级评价的过程中,需要考虑到部分较弱的学生可能在演唱时会存在身体摇晃,且并未跟随音乐节奏的情况,这是细微的差别,也需要在考量条目中有所体现,以提高判断依据的精确程度。

正式将评价量表运用到项目式学评活动中时,教师在熟悉量表具体描述和iPad操作技术的基础上,在最短的时间对学生作出评价,也可根据学生的具体表现在测评中对量表进行再次修正。如“中国馆”的项目式学评中对“口头表达能力”的测评,要求脱稿讲述才能为优秀,这样的标准定得死板,可以灵活一点,要求学生也可用半脱稿的方式,只要讲得声情并茂,即为优秀。其评价量表使用中对口头表达能力条目修正后结果如下页表5所示。

(四)优化:反思优化、以生为本

1.教师:以评促思,提升教育测评内技术。

项目式学评从任务情境到测评维度的设计,让考核生本化、温柔化,测评趣味化、自主化,予测评以温度;“菜单式”评价量表的呈现,充分考虑到学生间的差异,更加体现“学生是学习主体”的新课改理念,给学生以自我学习、自我定位、自我规划的可能;“小组式考核”,让学生体会到团队合作、

iPad的使用固然为项目式学评增添了科学性的意味,但于体育等学科而言,教师也坦言受天气限制大,考查的动作多,ipad切换跟不上,一定程度上确实成了阻碍。以评促思,提升教育测量、项目评价量表研发内技术,撬动更多教师深度卷入教学实践新尝试之中,项目量表技术运用更为自如与从容。

2.学生:以评促学,强化自评互评多维能力。

项目式学评结束后,我们在第一时间对学生进行访谈和一手信息采集,内容包括:你觉得这次项目式学评自己考得怎么样?项目式学评跟做考试卷,哪个更有意思?你觉得要测这些能力还有没有更好的方法?你希望设计怎样的题目?设置这些问题的初衷在于促进教学评的一致性,让学生也参与评价,评评自己与他人,发展批判性思维,让学生在热闹的测评后留下更深度思考痕迹。

访谈对象有平日里纸笔测试中的“资优生”,也不乏“学困生”,而所有学生给出的答案是令人惊喜、出乎意料的。有学生直言,希望老师增加对学生接触大自然、观察自然能力的考查,因为现在孩子和家长的生活大多“两点一线”,鲜少在户外亲近自然,同时建议测评场地可以选在更宽阔的户外草坪进行。也有学生提出可以考查一些更贴合生活实际的问题,不仅收获解决情境中问题的技能,也学习处理生活中临时、突发的问题。针对项目式学评过程中出现的纪律不良问题,学生认为也可以通过在评价量表中设立量规来强化管理,以减少同学之间的矛盾,考查组长的管理能力和小组成员的配合能力。从学生的访谈可以明显地感觉到,评价量表的使用是有益于学生各方面发展的。

三、评价量表的改进方向

首先,以“信”达“雅”作为数据可视化的标准。信(Faithfulness),即数据表示是否准确。达(Expressiveness),即数据展示方式是否高效。雅(Elegance),即数据可视化形式是否美观。如果能够在以原始数据建立报告单和雷达图的基础上,建立更个性化的测评报告、学习能力模型,指向学习行为偏好、学习薄弱环节等,并提高数据可视化形式上的美观程度,强化仪式感和获得感,也许会更大程度地促进学生的有效学习。

其次,强调评价量表与档案袋、激励贴纸等的融合运用。档案袋评价,即学习文件夹,是在项目化学习中是运用较为广泛的过程性评价方式,它或许也能被运用在项目式学评中,以记录学生的思维可视化过程和学习的发展过程,客观、动态地反映学生在测评过程中的进步和问题。测评结束后,学生也可随时更换或增加自己档案袋中的内容,再测评、再发展,以提高学生自我评价、自我尊重、自我反省的能力。理性的评价量表精准细腻,但对小学低年段的学生而言,严格划分的等级评价更偏向成人的话语体系,少了些激励作用。在实际操作过程中,建议用童趣的主题元素代替评价尺度,再将这样的元素做成激励性的小贴纸,使评价更有趣味,更为学生所接受、喜爱。

再次,要開发形式更为多样、内容更加丰富的评价量表。除现有的以具体文字描述为主的项目评价量表外,我们也可以考虑开发图画式、图表式、数据式、图文结合式的项目评价量表,以丰富评价量表的种类、进一步提升测评的效率。

评价量表的应用引发了非纸笔测的评价方式的变革,评价的前置使学生得以看见评价的要求;依据要求,学生在测评过程中不自觉地开展自我评价,明确自身能力有大致的定位与发展方向;教师的评价使学生更了解师评和自评的差距,更好地向学习目标进发。更可贵的是,一些学生在评价量表的使用过程中,已经逐渐习得编撰简易自评量表的能力;而我们也在量表的设计开发、迭代优化中逐渐转变评价观念,全面、客观、多维地评价学生的学习历程,理性认识、精准分析,进而优化课堂教育教学。

一张小小的评价量表,所承载的除显性的知识展示、能力展现外,更蕴含隐性的素质体现,而这恰恰是撬动学生可持续发展、学习驱动力的能量。希望更多专家、一线教师加入探索的行列!