小学表现性评价的命题技术

2020-12-10 00:38王旭东
教学月刊·小学综合 2020年11期
关键词:表现性评价

【摘   要】缺乏命题技术是一线教师探索小学学科表现性评价遇到的最大困难。对现场表现性评价的项目策划、命题流程、原创技术和改编技术进行解析,可以帮助教师掌握表现性评价命题技术,提升科学评价学生的高层次能力,破解长期以来基础教育评价领域的瓶颈。

【关键词】小学学科评价;表现性评价;命题技术

表现性评价通常要求学生在某种特定的真实或模拟的情景中,运用先前所获得的知识完成某项任务或解决某个问题,以考查学生知识与技能的掌握程度,以及问题解决、交流合作和批判性思考等多种复杂能力的发展状况。测试的场景大多为真实或仿真的个人生活情境、学校生活情境或科学情境;测试内容则体现多维度学习目标,具有一定的复杂性和开放性,侧重听、看(读)、说、写、画、做等操作实践性技能和应用知识解决真实问题的能力。

当前,小学学科评价采取纸笔测试和表现性评价并举的方式,形成了两种测评的优势互补。这种评价机制是落实核心素养教育的必然途径,是教育测评发展的必然结果。浙江省、河南省等地很多小学已经在探索和实践学科表现性评价,一线教师遇到最大的困难是缺乏表现性评价命题技术,因为表现性评价试题研制技术与纸笔测试技术截然不同。本文主要介绍现场表现性评价项目策划、命题流程、原创技术和改编技术,以期为一线教师的表现性评价实践提供帮助。

一、测评项目策划

学科纸笔测试命题一般需要做一个命题方案,保证命题结构效度。表现性评价则需要做一个项目策划表(见表1),方便学校层面的顶层设计和组织协调,同时保障表现性评价试题的研制工作顺利进行。

项目策划表通常有10项内容,尤其要关注第5项。人均测评时间是指一个学生完成测试所需要的时间,以此计算全体考试对象完成项目的总时间,确定学生测评分组情况、评委数量需求以及同质异形试题数量。如果人均测评时间比较长,就需要把学生分为三组,或准备三套同质异形试题,并按照一组2个评委的标准安排6个评委。

二、试题研制流程

表现性评价试题研制流程有四个阶段。第一阶段为个人或小组研制,命题人员按项目策划表的测评内容和人均时间独立命题。第二阶段为集体研磨,与纸笔测试相比,表现性评价涉及的相关因素非常多,个别教师的独立思考容易出现局限性,必须通过学科组集体讨论,共同研究、改进命题。其实,前两个阶段可以合并为集体研制+集体研磨,类似纸笔测试的“磨卷”。第三阶段为抽样试测,面对表现性评价,学生的思考和作答行为常常出乎教师预设,必须要请几个不同层次的学生进行试测,观察他们的操作,询问他们的想法,以便及时发现问题。第四阶段为修正定型,即根据试测发现问题,进行修正完善,定型备用。

试测环节是表现性评价命题的特有环节。由于表现性评价的试题具有很强的真实性、综合性、开放性,以及解决问题方法的多样性,有些学生常出现创新作答的思维和方法,出乎命题教师的意料。如小学数学表现性评价试题“测量粽叶面积”,器材有粽叶、大白纸、刻度尺,铅笔、橡皮擦和小剪刀。命题者有两个作答预设:一是学生在白紙上描画粽叶后,表格化测量面积;二是学生先把粽叶描在白纸上,再把粽叶的图形剪出来,然后把图形剪成若干长方形或正方形,求面积之和。试测时,命题者发现有一个学生直接用剪刀把粽叶剪成若干长方形和正方形,再用刻度尺测量出各长方形和正方形的面积,把剩下小碎片拼成长方形再测面积。该学生的行为表现有两个意外:一是把测量对象“粽叶”损坏了,违背了科学测量的基本原则,原因是试题表述不严谨;二是把粽叶碎末拼成长方形测量的方法很创新,明显减少了测量工作量和测量误差。于是,试题文本中增加了“不能损坏粽叶”的要求和指导语“有没有什么简单的方法快速计算这么多小碎片的面积”,把碎片拼接计算方法纳入评价标准。

三、试题研制技术

纸笔测试的试题通常由情景、设问、答案、评分标准四部分构成。现场表现性评价试题通常由试题文本、评价规则、现场情景、人员配备、其他事项五部分构成,复杂程度显著超过纸笔测试题。

(一)试题文本

试题文本通常由题干文本、试题设问和命题说明组成。

题干文本通常用文字、数据、图表等方式描述,且常包含提示语。如“接下来,我要为你播放一段3分钟左右的视频,题目叫《美好的某某小学》,请你认真观看,回答三个问题。在观看过程中,你可以用笔记录”。

表现性评价试题的设问不同于纸笔测试,不是一次性呈现,而是以问答方式有序呈现,因而要考虑层次性,体现由易到难、由简单到综合、由定向到开放的特点。问题表达要简短明朗,通俗易懂,层层推进,不提倡用长句或复杂的书面语(见表2)。

命题说明是命题者对试题的来源、考查要素、操作建议或注意事项的描述。交代试题来源出处,能方便使用者和改编者溯源。如果试题素材是音频或视频,还要交代下载拷贝的路径。明确考查要素,是指讲清考查什么知识、什么能力、什么素养,以便使用者或评委深度理解本题的特点与价值,更好地把握现场测评工作,提高测评的信度和效度。写清操作建议或注意事项,能方便使用者现场操作或修改、生成多个同质试题,满足不同小组的测评需求。如识字测评的命题建议是“从1号生字表中抽取10个字,先单独认读,再组成词语和句子认读,注意生字难度结构”。

(二)评价规则

评价规则通常由测评方式、作答时间、参考答案、评价标准和观察要点组成。其中评价标准和观察要点比较特殊。

测评方式是对评委(包括教师、家长和学生)和受测学生的行为提出要求,如:教师准备8份识字材料,学生抽取其中1份,准备1分钟后,进行一对一口试,由教师做好详细记录。

作答时间是对学生作答行为提出时间限制。命题者既要考虑一个学生的测评时间,计算出所有考生测评的总时间,以便决定分组测评组数,又要与学校顶层设计者沟通测评时间情况,做到各学科各项目作答时间分配合理。

表现性评价试题的参考答案比纸笔测试的复杂。计算型和测量型的试题有数值型参考答案。开放性问答题通常只提供答题方向和关键词作为参考答案。实践性、操作性的试题通常把操作步骤、操作要领、操作方法和作品效果作为参考答案。

评价标准是对学生作答的言行表现和结果给予等第评价,通常设置三个等第。以“识字”评价等第标准为例,优秀为“能正确、熟练认读,没有错误”,良好为“能正确、熟练认读,读错的字数控制在3个字以内”,合格为“能正确认读,读错的字数控制在5个字以内”。在纸笔测试中,评委将学生答案对照参考答案后,就能给予结果性评分。而表现性评价中,评委一般会尽量启发、引导学生达成最高等第,只有在确实无法达到最高等第时,才会给予结果性评价。

观察要点是命题者提醒评委及时敏锐观察学生发生行为的评分点。表现性评价重视学生的行为表现,因行为表现具有即时性和动态性,故需要提醒评委优先关注动态评分点,其次关注静态评分点。如:刻度尺测量试题要先关注学生使用刻度尺的动作是否科学,读数是否准确;写字评价要先关注笔画顺序和握笔姿势,后关注书写是否正确和工整美观;考查字词认读要先关注认读是否正确,特别是要关注平、翘舌音和前、后鼻音。

(三)现场情景

现场情景由考场情景、器材准备和角色扮演三部分构成。

考场情景分为场外和场内。期末表现性评价的考场外部布置一般由学校统一设计,即统一主题、统一色调、统一框架,如用蓝色气球做成拱门,粘贴标题“小脚丫商店”。日常表现性评价的场外布置相对简约,由命题者自主设计,如在阅览室张贴“三年级阅读之春”背景图即可。考场内部情景设计要根据测评内容和方式的需要,模拟测试所需的相关生活环境、社会环境或科学环境。如考查学生人民币知识和计算能力,通常会布置几个货架和收银台模型。

器材准备通常包括测量工具、被测量物品、实验器材与药品、被研究的物品和相关货物道具等。如模拟水果店可准备一定数量的各类水果、台秤、计算器、各种面值的人民币等。

角色扮演比较常见,按情景需要让评委或学生扮演即可。

(四)人员配备

表现性评价需要多人配合,需要综合教师、现场评委和引导员的数量需求。一个测评点一般需要配置2个指导教师、8个评委、2个引导员。指导教师侧重现场管理,帮助评委处理疑难问题;评委主要负责具体测试;引导员负责管理学生,提醒他们安静等候,带领他们有序参加测评。评委和引导员通常由经过培训的高年级学生或家长担任。对评委要侧重测评项目的专项培训,以便掌握评价标准和观察要点,会使用规范的评价导语,如“请你看清楚,再次认读”“祝贺你顺利通过‘识字乐园,下一站‘诗词乐园加油”等。

(五)其他事项

其他事项主要涉及安全因素和经费预算。由于考场是由教室、操场等临时变成功能室、公园、社区等开放性的陌生空间,其间要安排情景布置和道具物品,因而命题者需要思考可能产生的安全隐患及预防措施,并提早做好经费预算,请学校后勤部门审批和购买。

四、试题改编技术

(一)基于纸笔试题改编技术

1.情景真实化。命题者将纸笔试题中的文字情景、图表情景、照片情景改编成真实情景或模拟情景。

2.物品真實化。纸笔测试题中的测量工具等物品通常以示意图或照片形式呈现,在表现性评价中则要提供真实的被测物品(可用模型替代)、测量工具。例如,纸笔测试题画有刻度尺和正方形,求正方形的面积。命题者将其改变为:提供一把刻度尺和一个正方形的塑料片,请学生用刻度尺测量正方形塑料片的面积。如此改编,测试重点就由“解题能力”向“灵活运用知识解决真实问题的能力”转变。

3.角色扮演化。命题者将纸笔试题转化为生活情境,通过角色扮演解决问题。如,将“3+5=( )”一题,改编成:学生扮演“水果店”售货员,教师扮演顾客。“顾客”先买3个苹果,等“售货员”拿出后再买5个,问“售货员”一共卖了几个苹果?

(二)基于表现性试题改编技术

1.改变情景。命题者可以改编原先表现性评价试题的情景,让知识在新情景中应用。如把音频素材变为视频素材。

2.改变物品。即指把表现性评价试题中的测量工具、测量对象、道具等物品的种类、结构和大小进行改变。如测评刻度尺的应用能力,被测物品可以是正方形、长方形、三角形、梯形等图形或实物,也可以是一段铁丝、细绳,以及桌椅、走廊、跑道、楼层等。

3.改变数量。命题者还可调整观察对象、研究对象的数量,改变信息容量。例如,将一包10颗糖果变为21颗,2分钟听力素材变为3分钟,“听一个人声音”变为“听两个人声音”。数量变化通常会影响测评难度。

4.改变难度。即通过调控情景器材复杂程度,调控物品数量复杂程度,调控内容能力综合程度,调控操作行为复杂程度等来改变命题难度。例如,把“规则几何图形面积测量”改为树叶等非规则几何图形面积测量;把“3种物品分类”改变成“5种物品分类”;在一个项目中综合考查语文的听说读写能力,甚至跨学科综合考查;将满刻度30厘米的直尺换成小量程的三角尺,用多次拼接的方法测量笔记本长度;将测量桌子高度改为测量二楼窗户离地面的高度,学生需要从楼上放下绳子,确定绳子的有效长度。

改变单一的标准化纸笔测试,大力推广表现性评价,能破解长期以来基础教育评价领域的瓶颈。希望每一个教师都能掌握表现性评价命题技术,提升科学评价学生的高层次能力,促进学生高层次能力的发展。

参考文献:

[1]王旭东.小学表现性评价的行为分类及其评价要点[J].教学与管理,2020(7).

[2]王旭东.小学表现性评价中优秀试题的五个标准[J].教学与管理,2017(8).

[3]王旭东.表现性评价:实施核心素养教育的必然途径[J].教育家,2018(4).

[4]王旭东.纸笔测试坚冰初融[J].当代教育家,2017(3).

[5]王旭东.项目化 等第化 校本化——促进小学生健康成长的学业评价体系的构建[J].未来教育家,2017(12).

(浙江省温州市教育评估院   325000)

猜你喜欢
表现性评价
学得愉快 玩得精彩
高中历史课堂教学表现性评价初探
搭建孩子自我表现的舞台
初中思想品德学生表现性评价研究
表现性评价在“营销策划”课程教学中的应用
浅析中职学生考试、考核评价策略
数学表现性评价在初中数学教学中的应用研究
数学教学中如何进行“表现性评价”
表现性评价的理论探究与实践探索