我国教育评价改革的回归与重塑

2022-04-27 13:02赵鑫李奇
北京教育·高教版 2022年4期
关键词:信任危机专业化现代化

赵鑫 李奇

摘 要:教育评价改革对深化我国教育体制改革至关重要。受传统、文化、制度等因素的影响,教育评价在当代教育实践中“指挥棒”效应加剧,引发了功利化严重、专业性较差、公信力缺乏等问题。回应与解决这些问题,须对理念、制度、技术等维度进行更新与变革,促使教育评价迈向人文化、专业化、智慧化,真正发挥“以评促建”的正向作用,回归育人本分。

关键词:教育评价改革;破“五唯”;现代化;专业化;信任危机

教育评价是教育活动中关键且复杂的环节,是推进教育治理现代化的重要内容之一,旨在通过科学系统地搜集、整理、分析各级各类教育活动的信息,监测与判断其过程、效果与价值,促进教育改革,提高教育质量。评价兼有作为工具的科学性与作为公共政策的公共性,受到了效率与公平的双重制约[1],在当前“高竞争”的社会文化氛围中,实践中的教育评价存在涉及面广、情境复杂、多因素性、结论主观、结果高利害等特征,“功利化”倾向愈发凸显,呈现出公信力缺乏、种类繁杂、价值缺失等现象[2]。

党和政府高度重视教育评价在教育改革中的重要作用。2018年全国教育大会习近平总书记强调,要“扭转不科学的教育评价导向,坚决克服唯分数、唯升学、唯文凭、唯论文、唯帽子的顽瘴痼疾,从根本上解决教育评价指挥棒问题”[3]。自此,破“五唯”引起各界热议,成为我国教育评价改革的风向标。2020年6月30日,中央全面深化改革委员会第十四次会议审议通过了《深化新时代教育评价改革总体方案》,首次系统提出“改进结果评价,强化过程评价,探索增值评价,健全综合评价”。该方案既是对全国教育大会提出任务的落实,也是未来指导教育评价改革的纲领性文件,进一步突出教育评价要摒弃“功利化”的价值导向。本文旨在回顾与剖析我国教育评价改革的历程,总结其实践逻辑,为推动新时代背景下我国教育评价改革提供参考。

我国教育评价改革的历史脉络与发展趋势

我国的教育评价最早可追溯至战国时期《礼记·学记》对学生管理与考核的规定,系统性的教育评价活动发端于科举制度,真正意义上的现代教育评价理论始于20世纪70年代末引进西方经验,并随时代发展日渐完善。受国际教育评价新理念的影响,当前我国教育评价的改革呈现了新的发展趋势。

1.教育评价发展历史脉络

作为一门分支学科,教育评价随行政管理的需要日益本土化、常规化、专业化,发展历经四个阶段:一是理论翻译与引进阶段(1977年-1985年)。源于应对1977年高校招生制度改革对教育评价理论、方法、专业人员的需要[4],开始大量引进国外及我国台湾的研究成果。此时正赶上心理测验研究的再度兴起,因而,这一时期我国教育评价以修订国外心理测验量表为主,部分学校基于实践开始尝试探索本土化的评价制度、理论与方法[5]。二是持续发展与学科體系构建阶段(1985年-2002年)。1985年5月颁布的《中共中央关于教育体制改革的决定》,标志着我国教育评价研究与实践进入全面开展阶段,国家愈发重视建立系统完备的教育质量监控系统[6],众多政策文件的出台使教育评价工作受到监管的同时,得到了制度化保障,开始结合中国国情,改良国外经验,建设具有中国特色的教育评价模式,如发展性教育评价模式[7]、素质教育三分合评价模式[8]等,并尝试构建学科体系。三是学科完善阶段(2003年-2017年)。教育部于2002年底发出《关于积极推进中小学评价与考试制度改革的通知》,要求建立以促进学生、教师和学校发展为目标的评价体系。2003年,教育部正式确立了周期性的教学工作水平评估制度,使教育评价成为全国范围的常规工作。自此,我国教育评价研究呈现两大趋势:以中国特色教育评价理论为核心构建学科体系并不断扩大;学科分化派生,呈现生长势头[4]。四是全面推进阶段(2018年至今)。2018年召开的全国教育大会成为新时代我国教育评价系统改革的风向标,也是下一阶段教育领域的工作要点。在此倡导下,我国教育评价进入全面推进与系统研究阶段,以破“五唯”为主要抓手,从根本上扭转功利化倾向[9],通过深入开展教育评价改革调查研究,针对不同领域、不同学段、不同对象,分层分类推出评价改革的相关举措,以形成包含学生评价体系、教师评价制度、学科评价体系、“双一流”建设成效评价体系等在内的、较为完整的教育评价改革的逻辑与制度框架。

2.教育评价发展趋势

当前,教育评价领域正发生深刻的变化。从对教育的评价(Assessment of Education)到促进教育的评价(Assessment for Education),主要表现在评价理念从反映论到建构论;价值取向从教育本体、社会需要转向人的需要;评价主体从政府主导到引入第三方机构;评价内容从基本的读写算技能到转向综合能力;评价功能从选拔鉴定到诊断激励;评价方式从单一题目测验到多种方法融合到借助大数据提供证据的项目设计,如“以证据为中心”的评价模式(Evidence Centered Design, ECD)[10];这一系列的转变驱使教育评价的内涵与外延日渐丰富,《教育和心理测量标准(2014版)(Standards for Educational and Psychological Testing 2014)》[11]的颁布昭示了教育评价从经验总结到日渐专业,并伴随行业发展孕育评价文化。

受此影响,我国教育评价呈现出四种变革倾向:一是评价主体日趋多元,由政府完全行政化主导向引入市场服务过渡,政府从绝对的行政主导渐变为教育督导的角色[12];二是评价对象的类型、范围扩大,由单纯指向学生的教学评价向对教师、教育管理人员、学科、学校等专业发展与质量评估扩展;三是评价方式由以测验、测量为主的定量评价转向融入档案袋评价、同行评议等定性评价,结合教育心理、教育测量等理论,充分运用现代教育技术手段[13];四是评价功能由重在鉴定与选拔向重视激励与发展转变,强调通过形成性评价引导学生主动调节学习行为[14],重视将结果作为质量保障与提升的依据[15]。要回应上述变革的要求,大数据时代下信息技术的发展与教育领域的密切融合为此提供了重要的机遇,也带来了相应的挑战。

我国教育评价改革中的现实问题和症结剖析

我国现行教育评价体系脱胎于西方,成形于本土社会文化环境,已从单纯的教学环节制度化、体系化,成为教育实践的关键环节与重要参考,但囿于教育评价文化中存在的瑕疵,其负面导向不容小觑,各界对评价本身的科学性与专业性也时有质疑。

1.教育评价的功利化问题

教育评价功利化有历史渊源。最早的教育评价重在测量学生对事实的记忆力,随后泰勒模式将重点集中于测量学生学习结果的目标达成度上,重在发挥评价的总结性鉴定与选拔功能。在我国,“学而优则仕”的传统成为教育评价选拔功能的文化渊源,在高速发展与高度竞争的社会氛围中被不断催化,为层出不穷的“分数至上”“名校情结”“文凭至上”“唯核心”“头衔至上”等现象提供了“正当性”的依据,揭示了我国的教育实践仍将评价作为甄别和筛选的主要功能的特点。

教育评价功利化也有现实因素。政府尤其是地方政府长期以来在行使教育行政职能的过程中,制造出各类不同等级的奖项、荣誉等,几乎囊括学校工作的方方面面,引导学校、教师和学生参与竞争[16]。这些过度的评选活动打乱了学校的工作节奏、干扰各级各类教育工作者的心态,助长了功利化的不正之风,客观上造成了当前教育评价的“五唯”现象。可见,当前凡是被纳入教育教学范围内的所有活动、机构、人员都被要求和经受着名目繁多的评价,评价的频率、类型、内容与方式层出不穷,看似科学、多元评价的背后,对结果的解读与应用却多简化为数量化评价,这种形式化评价盛行的背后是功利化的价值追求、缺乏人文向度的评价文化、以筛选为核心的功能选择。

2.教育评价体系的专业性问题

教育评价依托多学科理论发展,包括教育学、管理学、数学、统计學、哲学等[4]。西方教育评价具有深厚的理论根基,并从鲜活的教育实践中源源不断地汲取养分,理论与实践间形成良性循环。相较而言,我国在“奋起直追式”的教育改革中急于追求肉眼可见的效率与成果,忽视对教育评价文化性、专业性、系统性的积累与铺陈,至今尚未形成坚实的构架,尚未与教育实践形成良好互动。行政管理逻辑主导下的教育评价,长期依赖行政部门人员的主观经验,忽视理论研究与专业人员的培养[17]。单是关于教育评价的概念,便存在“Assessment”和“Evaluation”等概念的混用,对日趋丰富的评价内容及所属领域缺乏系统的理论研究,难以对实践指导发挥实际效用。同时,评价的工具与方法较为滞后:一是考试命题技术与西方社会存在落差,包括难度控制、题型使用及评分标准制定等[18];二是分数报告与结果解读较为原始,限于简单的描述统计量(如原始分、平均分等)[19],而以标准分为基础的分数报告早已是国际大型测验分数合成的常用方法[20];三是支撑形成性评价发展的技术条件尚未实现。可见,评价理论、专业人员、测量技术的缺乏,使我国教育评价依赖直观单一传统的量化评价标准,加之文化、理论、技术的积淀不足,尚未建立起专业性的教育评价体系。

3.教育评价制度的公信力问题

我国正处于现代化转型期,传统的惯习、规约与道德规范无法应对复杂多样、自由与风险并存的社会环境,制度在人际关系中的规范与调节作用日益突出。任何一项制度的顺利实施都离不开规范对象发自内心的认可、信任与接纳,教育领域亦是如此。遗憾的是,当前我国教育评价饱受社会各界的质疑,同行不认可、社会不信任的现象此起彼伏。长期以来,我国教育评价制度处于管理逻辑导向的惯习中,早已形成固定模式:由教育行政部门或教育管理者自上而下组织,基于权力、控制、管理、甄别等逻辑的评价工作,渲染了追求效率至上的行政化教育评价文化,使教育评价主体单一化,评价方法易操作化、定量化的行政化性质,极大限制了教育评价的信度与效度。近年来,我国教育评价实践开始改变政府完全行政化主导的模式,引入家长、社会、企业、行业的多方参与,独立于教育行政系统之外的,以独立性、专业性、公正性见长的社会第三方教育评价机构在高等教育与职业教育领域出现与发展[21],并通过教育行政部门、行业协会两种方式实施监管[22],这在一定程度上弥补了政府作为单一主体参与教育评价的不足。然而,由于缺乏统筹管理、相应政策法规及市场发育的土壤,加之尚未完全脱离行政化评价惯习与教育行政管理部门的权威[23],我国真正开展第三方教育评价业务的机构,数量、质量的发展都极不平衡,行业规范、专业性、公信力难以得到市场的认可。

我国教育评价改革的方向和路径

“评价本身并无好坏,只是我们没有把评价用好”[24],对教育评价的不当使用才是其负面导向作用占据主导,造成各类教育问题的原因。为此,基于对我国教育评价改革现状及问题的梳理,结合国际教育评价理论与实践,我国教育评价改革可从以下四个方面进行改进。

1.观念转变:回归以人为本的逻辑起点

评价制度对于教育发展具有诊断、选拔、发展等多重功能,发展性功能是教育评价的综合性功能,重视评价的发展性能有效避免各种单项评价的局限性,使教育评价回归教育本原。这也提醒我们,教育评价本身不是目标,只是教育管理的方式之一,终点指向人的发展。值得欣喜的是,当前无论是国际经验还是国内政策,已经开始意识到探索与发挥评价增值性功能的重要性与必要性,开始改变将人作为工具,而是作为主体与目的,以促进人的全面发展[25]。在学生评价上开始探索超越考试和课程的评价方式(如创造力、团队合作、移情等人际技能);在教师评价和学校认证上,开始探索如何将学生、教师和测试方式等因素综合纳入评价体系。由此可见,重视增值性评价,秉持“以评促学”的理念已成为国际教育评价的趋势。在此背景下,如何挖掘并结合我国教育传统与现实,有效借鉴国际经验进行本土化改造,推行全程性、全面性的发展性评价,建立面向学生未来发展,尤其是对高阶思维能力、跨学科能力和技术能力的评价体系,切实发挥教育评价的育人功能,构建有人文向度的教育评价体系与文化,是当前我国教育评价改革中的重要命题。

2.系统更新:构建多元化的教育评价体系

面对深化教育体制改革的需求,多元化、全景式、过程式的评价是今后教育评价的趋势。这要求将教育评价作为一个系统来思考,着力构建多元化、综合性的教育评价体系:依托成熟理论,建立专业评价人员队伍,制定科学的评价标准,更新评价工具与方法,对不同评价对象采取不同的标准与策略。我国教育评价发展至今已在实践中积累了丰富的经验,一方面,学界可充分梳理实践中存在的问题,厘清与界定教育评价的内涵外延,构建概念清晰、核心突出、问题明晰的研究框架,密切关注理论与实践的互动,促使该研究框架能在实践反馈的基础上不断调整与修正,在学理上为教育评价实践工作保驾护航。另一方面,基于未来学科发展角度,亟须构建涵盖各类教育领域与阶段、面向不同对象的全方位的教育评价学科体系,为此须融入多学科视角,除传统的统计学、教育学、数学等学科视角外,应结合新时代发展将计算机科学、测量学、系统科学等学科,拓宽研究视角与方法体系[26]。

3.技术保障:以技术变革推动评价过程的专业化

多元化、全景式、过程式教育评价体系的实现离不开技术支持。国外已开始尝试将其他学科的研究成果应用于教与学评价中。例如:将统计学、技术和认知研究的发展应用于不同领域、目的和类型的教育测量中,如将项目反应理论作为教育测验与量表开发的工具,指导题库建设、测验编制、分析考试成绩等[27];利用数据挖掘技术分析学生在线教育的学习日志、人口统计学数据和结课评价等信息,以提供决策支持[28]。随着信息化与教育领域的紧密融合,我国教育评价的技术方法、专业人才正面临着信息化与大数据的机遇与挑战。因此,我国可在借鉴国际经验的基础上,一方面,将统计学、脑科学等其他学科研究成果与教育实践相结合,运用多元方法、改进测试方式与结果解读提高教育评价的专业性、有效性与公平性。另一方面,融入智能化的数据挖掘技術,建立全方位、多维度的数据库,从海量的数据挖掘信息,监测、诊断评价对象的群体特征与个体特征,并通过数据建模预测未来趋势,真正建立起基于证据的教育评价,优化学习行为、教学方式、教育管理与决策,实现从心理测量、数学矩阵、价值解读到积极建构的转变[29],从而满足精准测评、深度反馈、个性化评价的需求,及时调整教育决策,推动教育评价的专业化发展。

4.文化建设:营造具有信任感的制度保障

营造具有信任感的制度保障离不开思维转变、体系构建、专业技术,更离不开政府的角色转变、市场监督与信息公开。以往的教育评价主要由政府教育职能部门担当,本质上属于被评价者的上级部门,与被评价者之间是自上而下的利益相关关系,这种利益矛盾对等性,使评价者很难做出真正客观科学的评价,第三方机构是缓解相关各方利益冲突关系、规范市场评价秩序的调和剂。国际经验告诉我们:第三方教育评价机构作为利益无涉者,往往可以发挥政府与学校之间“缓冲器”的作用。针对我国第三方教育评价机构在实践中的乱象,当务之急是要引导教育观念,鼓励培育和创设适合第三方机构的发展空间,增强第三方机构在社会公众中的认可度。具体来说,一是要减少行政控制。实现政府职能转变,适当给学校更多的课程评价等自主权,教育督导由督政向督学倾斜,教育问责以数据为判断依据[30]。二是要加强制度规范。通过立法手段,约束和规范第三方教育评价的市场秩序,同时建设好评审专家数据库,建立年检制度,做到信息公开,并辅之评价责任与荣誉制度[21]。三是第三方机构要从制度建设和队伍建设等方面提升自身核心竞争力[31]。依据评价的范围、对象,关注与尊重利益相关者的教育诉求,形成评价中利益双方共同参与协商的氛围,政府作为监督者,保证第三方机构的督导质量与公信力。

参考文献:

[1]谢维和.教育评价的双重约束—兼以高考改革为案例[J].教育研究,2019,40(9):4-13.

[2]叶赋桂.教育评价的浮华与贫困[J].清华大学教育研究,2019,40(1):18-21.

[3]习近平.坚持中国特色社会主义教育发展道路 培养德智体美劳全面发展的社会主义建设者和接班人[N].人民日报.2018-09-11(1).

[4]邱均平,王碧云,汤建民.教育评价学:理论·方法·实践[M]. 北京:科学出版社,2016:10,11-12,21.

[5]陈玉琨, 李如海. 我国教育评价发展的世纪回顾与未来展望[J].华东师范大学学报(教育科学版), 2000(1):1-12.

[6]辛涛, 李雪燕. 教育评价理论与实践的新进展[J]. 清华大学教育研究, 2005(6):38-43.

[7]刘川, 王仕尧, 张承德. 发展性评价的实践与思考[J].教育研究, 1999(3):75-76.

[8]雷鸣强, 陈绪常. 构建导向素质教育的三分合评价模式[J].中国教育学刊, 1998(6):22-25.

[9]中华人民共和国教育部.教育评价制度改革持续深入推进[EB/OL].(2019-09-11)[2022-03-21].http://www.moe.gov.cn/jyb_xwfb/moe_2082/zl_2019n/2019_zl67/201909/t20190911_398722.html.

[10]ZIEKY M J. An introduction to the use of evidence-centered design in test development [J].Psicologia Educativa, 2014, 20(2): 79-87.

[11]AERA. New Edition of Standards for Educational and Psychological Testing To Be Released This Month[EB/OL]. [2022-03-21].https://www.aera.net/Newsroom/AERA-Highlights-E-newsletter/AERA-Highlights-July-2014/New-Edition-of-Standards-for-Educational-and-Psychological-Testing-To-Be-Released-this-Month.

[12]U.S. Department of Education. Guidance on Standards, Assessments, and Accountability[EB/OL].(2009-02-04)[2022-04-02].https://www2.ed.gov/policy/elsec/guid/standardsassessment/guidance_pg4.html.

[13]JING D. The Study on Educational Technology Abilities Evaluation Method [J]. Physics Procedia, 2012, 24(Part C), 2111-2116.

[14]PANADERO E, BROADBENT J, BOUD D,& LODGE J M. Using formative assessment to influence self-and co-regulated learning: the role of evaluative judgement [J]. European Journal of Psychology of Education, 2019(34):535-557.

[15]LIU S Y. Higher education quality assessment in China: An impact study[J]. Higher Education Policy, 2015(28):175-195.

[16]吴康宁. 政府部门超强控制:制约教育改革深入推进的一个要害性问题[J]. 南京师大学报(社会科学版), 2012(5):6-11.

[17]孙玉洁. 我国教育督导制度存在的问题与改进建议[J]. 教育研究, 2004(10):64-68.

[18]王鼎, 章卫华. PISA测试命题与国内初中学业考试命题的比较分析[J].全球教育展望, 2013, 42(9):60-70.

[19]谈松华, 黄晓婷. 我国教育评价现状与改进建议[J]. 中国教育学刊, 2012(1):8-11.

[20]姜秉圻, 韦小满. 测评项目中标准分的使用及对我国高考改革的启示[J].教育测量与评价, 2017(8):59-64.

[21]顾志跃, 李彦荣. 我国教育评价的现状、问题与发展对策[J]. 人民教育, 2007(12):2-6.

[22]王璐,王世赟,尤铮.国际视野下第三方教育评价机构的规范、认证与行业自律行为研究[J].现代教育管理,2020(5):36-45.

[23]徐彬,苏泽.论教育评价改革的动因、阻力与路向[J].当代教育科学,2020(2):80-85.

[24]李鹏.评价改革是解决教育问题的“钥匙”吗?—从教育评价的“指挥棒”效应看如何反对“五唯”[J].教育科学,2019,35(3):7-13.

[25]金柏燕,蒋一之.人学视野下教育评价改革的新取向[J].现代大学教育,2020(2):32-38.

[26]吳钢.我国教育评价学研究的回顾与展望[J]. 教育测量与评价, 2010(3):19-22.

[27]SHARKNESS J,DEANGELO L.Measuring Student Involvement: A Comparison of Classical Test Theory and Item Response Theory in the Construction of Scales from Student Surveys[J]. Research in Higher Education, 2011(52): 480-507.

[28]HUNG J L,HSU Y C, RICE K. Integrating data mining in program evaluation of K-12 online education[J]. Educational Technology & Society, 2012, 15(3): 27-41.

[29]朱成晨, 闫广芬. 现代化与专业化:大数据时代教育评价的新技术推进逻辑[J]. 清华大学教育研究, 2018, 39(5):75-80.

[30]辛涛. 我国教育问责制建立的几个关键问题[J]. 北京大学教育评论, 2013, 11(1):164-171.

[31]王璐, 王小栋. 英国第三方教育评估的发展与规范:基于英国独立学校督导团的研究[J]. 外国教育研究, 2018,45(2):16-28.

(作者单位:北京师范大学教育学部高等教育研究院)

[责任编辑:于 洋]

猜你喜欢
信任危机专业化现代化
生产专业化促进农户收益提升
实现人民美好生活之道:中国式现代化道路
劳动教育课程的常态化、专业化还有多远
谱写“强富美高”新江苏的现代化新篇章
基本实现现代化需要补足哪些短板?
幼儿园保育员专业化现状调查与分析
信息时代社交软件的利弊浅析
我国航天航空产业专业化水平测算与分析
我国航天航空产业专业化水平测算与分析
新媒体时代大学生人际信任的影响因素研究