魏和平 段文颇
教育是提高人民综合素质、促进人的全面发展的重要途径,是民族振兴、社会进步的重要基石,是对中华民族伟大复兴具有决定性意义的事业。百年大计,教育为本。教育大计,教师为本[1]。教师是实施素质教育、提高教育质量的关键。面向中小学(含中职学校和幼儿园) 实施教师资格考试(National Teachers’Certification Examinations,NTCE) 与定期注册制度改革,是贯彻落实习近平总书记2014 年教师节重要讲话精神、《国家中长期教育改革和发展规划纲要(2010-2020 年)》和《国务院关于加强教师队伍建设的意见》的重要举措,是国家教育体制改革的重点内容,对于建立健全中国特色社会主义教师管理制度,改革和完善教师职业准入办法,严把教师入口关、畅通出口关,建设高素质专业化教师队伍,提升教师队伍质量,提高教师社会地位,吸引优秀人才从教具有十分重要的战略意义[2]。
这一制度改革自2011 年在全国个别省份开始试点并逐年扩大, 至2015 年已覆盖全国大部分省区,目前,已在全国范围内全面实施。制度前端的资格考试把控的是入口关(即选优),后期的定期注册把控的是出口关(即汰劣),两个环节相辅相成。由于定期注册周期较长(通常是5 年一个周期),汰劣的成效尚未充分显现。前端资格考试对教师入口关的把控是比较理想的,为优选教师作出了积极贡献,但在考试的某些环节特别是对面试评价标准的理解和统一把握上还潜藏着令一线考试工作者“头疼”的隐性问题。想办法解决这些难题,必将有利于强化考试公平的正效应,进一步提高考试的可信度,并最终从根本上维护这一教师管理制度。
考试在理论上属于教育测量的范畴,在实践层面是选拔人才的机制或手段,因此,公平成为一切考试追求的首要目标和底线要求。确保考试公平性,就一定要保证考试的每一个环节对所有考试对象都是公平的。由此不难推定,影响考试公平性的因素必定存在于考试的五个环节之中:
一是内容与形式,即题目题型。其公平性应体现在命题的科学性上,题目要能反映考查的目标要求,题型要为考试对象预知。
二是考试方式,即是传统的纸笔考试还是计算机考试或者面试。其公平性主要体现在考试对象对考试方式的普遍适应性上,考试方式要为考试对象预知。
三是考试程序,即考试步骤。其公平性主要体现在考试程序的严密性上,考试步骤要为考试对象预知。
四是考试评价,即阅卷评分。其公平性不仅体现在评阅标准的合理把握上,而且所有或者绝大多数评卷教师要基本达成一致共识。
五是考试监督,即监考督查。其公平性主要体现在严格执考执纪上,要不偏不倚、一视同仁。
可见,题目题型、考试方式、考试步骤、阅卷评分、监考督查是影响考试公平性的五个主要因素。
NTCE 主要考查应试者从事教师职业应具备的职业道德、心理素养和教育教学能力,分为笔试和面试两部分。以下拟从影响考试公平性的五个主要因素进行分析。
1.NTCE 笔试公平性分析
笔试主要考查应试者从事教师职业所应具备的教育理念、职业道德、法律法规知识,科学文化素养,阅读理解、语言表达、逻辑推理和信息处理等基本能力;教育教学、学生指导和班级管理的基本知识;拟任教学科领域的基本知识,教学设计实施评价的知识和方法,运用所学知识分析解决教育教学实际问题的能力[2]。题目题型以客观题和标准化为主,辅以少量准客观型主观题;采取为人熟知的传统纸笔考试方式和简单的考试步骤;依据基本确定的参考答案及完全量化的评分标准阅卷评分,且全国统一进行机评(客观题型)和网评(主观题型),统一划定合格线;考试和评卷过程的监督管理体系(人防加技防)健全。可见,主要影响因素在笔试各环节实施的方式或采取的措施上,其公平性是可以保证的,实践证明也是有效的。
2.NTCE 面试公平性分析
面试主要考查应试者的职业认知、心理素质、仪表仪态、言语表达、思维品质等教师基本素养和教学设计、教学实施、教学评价等教学基本技能[3]。评价标准如下(表1,以小学学段为例):
表1 小学教师资格考试面试评价标准
面试中影响考试公平的因素主要体现在以下几方面:
第一,题目题型共三类,一是回答问题(5 分钟),二是讲课演示(10 分钟),三是答辩陈述(5 分钟),虽然都是主观题,但除最后的答辩问题由面试考官针对应试者讲课演示提出外,开始的问答题和随后的讲课题目都是从计算机题库中随机抽取的 (不是面试考官现场即兴提出),这就最大限度地保证了命题的科学性(75%以上);
第二, 为了尽量减少面试考官的主观随性影响,采取计算机系统随机抽题与情境模拟展示相结合的结构化面试方式和程式化考试步骤 (①抽题;②备课;③答问;④讲课演示;⑤答辩;⑥评分),这种方式虽然新颖,但对于应试者而言仍然是模拟情境的传统表达方式,所以并不陌生,也就不存在不适应的问题;
第三,面试题都是主观题且没有像笔试题目那样的参考答案及评分标准,只有如表1 所示的8 项测试指标(每项满分为10 分)及其测评要素和所占权重,实行3 位考官背靠背同时网络评分(最终评分取误差较小的2-3 位考官评分的均值;如果3 位考官之间评分误差都较大,则由其中的考官组长主持议定),以最大限度降低考官因各种原因发生随意性或主观性评分的可能,最后由各省区教育行政部门划定本省区合格线;
第四,对面试全过程实行网上巡查(技防,电子监控并录像)和现场督查(人防,可进入候考室和备课室等面试区域但一般不进入面试室以免干扰面试进行)。
客观地说,面试各环节实施有序、规范,而且利用信息化辅助管理手段,更显严密,这种结构化与情景模拟相结合的面试方式显然比传统的原始面试方式可信度高得多,公平性受质疑的情况也少得多。但是,如果从深层数据比较分析,NTCE 面试中仍然存在一些瑕疵或“顽固性”症结,主要集中在以下两个方面:
①面试题目上,虽然开始的问答题和随后的讲课题目都从计算机题库中随机抽取,已经有75%以上的科学性,但最后的答辩问题要由面试考官针对应试者讲课演示现场即兴提出,这就对面试考官的专业性提出了较高要求,如果不专业就无法科学地提出答辩问题。
②面试题型上,由于面试主观题答案具有不确定性,除了应试者能否自圆其说外,面试得分的高低很大程度上取决于面试考官的个人衡量与判断,而这种判断力与考官的综合素养(包括经验在内)不无关系,更与考官对评价指标要素的理解和掌握具有直接关系。
上述问题虽表现在答辩提问和评分两个环节上,但实际贯穿于面试中应试者进入面试室与考官面对面接触和交流的全过程,因为在这一过程中,考官总是在观察和聆听中或者大脑回放中进行判断。这些问题看似由面试题目和题型两个因素衍生,却有一个共性,那就是都与面试考官有关。于是问题便归结为一类,即如果存在不专业、或少经验、或综合素养不高、或对评价指标要素的理解和标准的把握不够准确的面试考官,就极有可能影响面试公平。
3.潜藏在NTCE 面试评价中的隐性问题
NTCE 面试体系中建立了一套比较严格的面试考官遴选与考核评价淘汰机制,这一机制基本可以保证绝大多数考官是专业的、有经验的、综合素养达标的[4];还建立了一套比较严密的面试考官分组集体评价和考官组长主持商议仲裁机制,通过这一机制也基本可以避免因个别考官对评价指标要素的理解和标准的把握不够准确而出现误判的情况。但是,当考官组集体呈现出对评价指标要素的理解和标准的把握不够准确(偏宽或偏严)时,上述机制就难以奏效了。于是,出现面试组之间、面试考点之间、乃至面试考区之间的不平衡(即不公平),而且这种不平衡随着区域的扩大会更加明显(如考区之间)。从甘肃省某次NTCE 面试成绩分布表(表4)中节选的两个考区和全省整体的数据(表2)就很能说明这一问题:
表2 某次NTCE 面试A、M 考区与全省成绩分布情况(%)对比(省划合格线为60 分)
从表2 数据看,A 考区(省会城市)是公认的全省教育最发达地区,但面试合格率明显低于全省整体水平;而M 考区(民族地区)是公认的全省教育欠发达地区, 面试合格率却比全省整体水平高得多——二者反差较大。
其实,上面这种反差在省际间也是存在的,表3所列是某次NTCE 面试部分省区合格线及合格率数据:
表3 第N 次NTCE 面试部分省区合格线及合格率情况
表中P01、P06 二省区与P14、P17 二省区比较,四省区面试合格线均为60 分,但前二省区合格率在60%上下,而后二省区接近90%,反差也很大。当然,这也与各省对教师的需求量有较大关系。
省际间中小学教师的流动量通常很小,即使流动也需要重新考核、注册认定教师资格,而原教师资格证不作废,这种反差还不至于影响到考试公平。但是,在各省之内,教师资格(证)是无障碍自由通行(用)的,因此,省内各考区集体对评价指标要素的理解和标准的把握不够准确(偏宽或偏严),是潜藏在各省NTCE 面试评价中的最大隐性问题,它可能会在一定范围内、一定程度上影响面试公平,有时影响甚至是严重的。
1.单一的培训对解决问题难以奏效
如何解决省内考区集体对评价指标要素的理解和标准的把握不够准确(偏宽或偏严)的问题呢?最先想到的是通过培训解决,但实践表明收效甚微。究其原因有三:一是抽象化为面试评价指标要素的固有特点,培训的目的就是让抽象的评价指标要素与考官的综合素养和专业经验相结合,使之具体化,实际上,这种具体化的结果往往因人而异,加之在分级培训考官的过程中难免因信息“衰减”而“走样”;二是当应试者的表现投射到因人而异的具体内化的(还有可能是“走样”的)评价指标要素时,不同考官对同一应试者表现的理解、看法、判断往往不尽相同;三是由于地方政策因素,容易统一放宽或收窄评价标准,会放大前两点本不算大的差异。可见,从不同考官、不同面试室(考官组)、不同考点直到不同考区之间对面试评价指标要素的理解和标准的把握有差别是客观存在的,而且范围越广差距可能会越大,终将在扩大到某一范围(如全省各考区)后超过容忍度而明显损害面试公平。这应该是国家把面试合格线的划定权下放省级教育行政部门,并要求一省一线以免造成省际间不平衡的原因之一。但省内由于教师资格(证)的通行(用)性不可能继续下放面试合格线的划定权。
2.探索解决问题的新机制
在省级教育机构无法(不被允许也不合理)继续向下在省内实施一地一线的情况下,如何更好地缩小市际(考区)间对面试评价指标要素的理解和标准的把握差距,成为省级考试机构必须考虑和面对的严肃课题。通过过去几年反复实践探索与总结改进,逐渐形成了甘肃省目前正在推行的解决这一难题的新机制——“培训+督导+反馈+修正”。具体解析如下:
①培训。即按照分级培训的模式,先请国家培训师指导、培训省级督考官和培训师,再由省级培训师指导、培训市级考官。
②督导。每次面试,由省级考试机构派出督考官督查、指导各市级考区组考工作,以确保市级考官对评价指标要素和标准的把握不出大的偏差。
③反馈。每次面试成绩公布后、下次面试开始前,省级考试机构召集各市级考区主管和主考官参加下次面试部署会,其中一项重要内容是面对面反馈各市级考区面试成绩分布情况,对分析结果严重偏离整体(相当于均值)分布或客观实际的市级考区予以当面通报批评,并责令下次考试必须纠偏。
④修正。上次面试后因成绩分布有严重偏差而受到批评的市级考区,在本次面试考前培训会上统一思想,整体重新调适,修正对评价标准的把握,争取在本次面试中不跑偏。
3.新机制的有效性验证
甘肃省采用“培训+督导+反馈+修正”新机制前后连续两次NTCE 面试成绩分布如下表4、表5 所示:
表4 前一次全省各考区NTCE 面试成绩分布情况(%)对比(省划合格线为60 分)
表5 后一次全省各考区NTCE 面试成绩分布情况(%)对比(省划合格线为60 分)
各表中字体相同的考区表示成绩分布相近,字体反差越大表示成绩分布差距越大。与之相对应,两次面试前4 个成绩段全省各考区成绩分布比较直方图如下:
从前后两次面试成绩分布看,省划合格线均为60 分。
分析前一次面试成绩分布可知:I 考区与全省整体情况最为接近,L、G、F 3 个考区次之,K、A、H 三个考区虽把握评分标准明显严格一些,但成绩分布最为合理,呈准正态分布,应该是最接近客观实际的情况;而与全省整体情况相比反差(偏宽松)稍大的有N、J 两个考区,明显大的有C、D 两个考区,以M、E 两个考区为最大。
分析后一次面试成绩分布可知:G、A、I、C 四考区与全省整体情况最为接近,J、D、E 三个考区次之,M 考区虽把握评分标准明显严格一些,但成绩分布最为合理,呈准正态分布,应该是最接近客观实际的情况;而与全省整体情况相比反差(偏宽松)稍大的有H、N 两个考区,明显大的有L、K 两个考区(最宽松)。
比较甘肃省内前后两次面试成绩分布分析结果可以看出:
①与前一次相比,后一次中与全省整体情况最为接近的考区数量明显增多,较为接近和明显严格的考区数量均有减少。这说明在新机制作用下,有相当一部分考区在朝客观方向纠偏。
②前后两次面试中稍微宽松和明显宽松的考区数量未变,后一次中最宽松(偏得离谱)的情况消失。说明面试评价严重偏离客观的情况得到遏制。
③B 考区报考人数很少,前后两次面试均达到100%合格。由于样本容量(即报考人数)很小,可以认为是合理的;但连续多次面试都100%合格时,情况可能就不容乐观了,对这种情况进行分析和纠偏可能需要更长的周期。
④还有一个明显的情况是,两次面试中,除了最接近全省整体情况的I 考区、稍微宽松的N 考区和报考人数很少的B 考区保持未变外,其他考区均改变了原来把握的评价标准区间,有的由宽变严,有的由严变宽,甚至个别由最严变为最宽。这表达了一个重要信号,就是“培训+督导+反馈+修正”这一机制作用是有效果的。
综合上述多角度对考试实践数据比较分析的结果足以说明,“培训+督导+反馈+修正”这一机制,对于纠正考官之间、考室之间、考点之间、特别是考区之间理解和把握面试评价标准的偏差,不仅是可行的,而且是有效的。实践也证明,坚持推行循环运用这一纠偏机制的效果是良好的。
实施教师资格考试与定期注册制度是教师队伍建设领域牵一发动全身的重要改革,它不是一项临时性任务,而是需要长期坚持的制度。从国家教育改革发展的全局和高度看,国家统一推行这一制度的意义是深远的,目的主要在于严格教师职业准入,破除教师资格终身制,加强教师培养培训和教师管理;扩大优质教师资源增量,盘活现有教师资源存量,提升教师队伍质量和水平,建立能进能出、良性竞争的师资力量储备和教师队伍管理体制。因此,高度重视、积极推动做好这项事业不仅是国家任务,更肩负着重要社会责任。其中的NTCE 面试是一项全新的工作,与以往其他考试相比,无论是考试内容、方式、手段,还是管理、评价理念方面,都有明显的创新,需要在考试实践中不断完善各环节运行机制,探索解决难题的新途径,以确保国家考试应有的公平性和公信力。