增值性评价:来自美国田纳西州的核心经验

2020-11-25 02:40周瑶陈星贝
中小学管理 2020年10期

周瑶 陈星贝

摘要在加强教育问责的背景下,美国田纳西州于1992年在全州范围内启动增值性评价系统,经过二十多年的探索与改进积累了丰富经验。具体包括以下几项:注重整体推动,进行系统评价;依托专业支持,实现高效合作;州与联邦两级联动,保障经费投入;聚焦测验质量,确保信效度;结果公开,通俗易懂。借鉴国外经验,我国在推动增值性评价时需注意:基于试点经验逐步推广增值性评价,适时引入以数据为基础的第三方评价,倡导诊断与问责下的结果公开。

关键词 增值性评价;增值评价系统;教育问责;第三方评价;管办评分离

中图分类号G63

文献标识码B

文章编号1002-2384(2020)10-0011-05

注释:① 本文系北京市教育科学“十三五”规划重点课题“中小学学校治理现代化:问题、原因分析与改进”(课题批准号:CCAA2020037)的研究成果之一。

增值性评价(Value-added Assessment)通过测量学生跨时间段的学业成就增值情况来评估教师、学校乃至地区在学生培养过程中发挥的效能,是一种发展性评价模式。与传统上以学生单次终结性学业成就为依据的横向比较模式不同,它关注学生在学业成就上的变化,并且在一定程度上控制了其他无关因素的影响,增加了评价结果的可比性与公平性。[1][2]《深化新时代教育评价改革总体方案》提出在教育评价改革实践中积极“探索增值评价”,这是我国第一次在中央政策文件中倡导与推动增值性评价,因此它很快成为中小学管理领域的研究热点。但由于我国相关研究起步较晚,实践上也缺乏成熟经验,因此,寻找、分析和借鉴他国标杆经验具有重要的现实意义。美国田纳西州是全球最早一批实施增值性评价的区域之一,经过数十年的发展和改进积累了大量的实践经验,其教育评价发展历程可以带给我们诸多启示。

一、美国田纳西州增值性评价系统:问责驱动的改革

20世纪80年代,美国学生在国际学业成就测验中成绩下滑,引发社会各界对教育发展状况的担心。1983年,美国高质量教育委员会颁布具有里程碑意义的《国家处在危险之中:教育改革势在必行》(A Nation at Risk: The Imperative for Educational Reform)。该报告显示1963年至1980年间,美国学生的SAT成绩持续下滑,语文平均成绩下降了50分以上,数学平均成绩也下滑了近40分,此外约有13%的青年是半文盲。[3]这些问题对个体发展和美国未来都构成了威胁。1989年,时任总统布什(George W. Bush)与各州州长召开教育峰会并制定了六项国家教育目标。为实现这些教育目标,美国各州在增加教育财政投入、推动课程与教学改革的同时,逐步建立了基于教育评估结果的教育问责制度。[4]

在田纳西州,时任州长麦克沃特(N e d R . McWher ter)于1992年签署《教育改进法案》(Education Improvement Act,EIA),提出要加强教育问责,教育部每年要公布各学区和部分公立中小学的质量与绩效数据,包括出勤率、升学率、辍学率、测试成绩等,以敦促各地方教育机构合理使用经费,切实提高学生学业成就。但是,许多教育者认为学生成绩受家庭社会经济背景的影响很大,用成绩问责教师或学校是不公平的。于是,增值性评价成为教育问责的新依据。[5][6]在此背景下,该州启用了田纳西州增值性评价系统(Tennessee Value-Added Assessment System,TVAAS),在全州實施增值性评价。

TVAAS是桑德斯(William L.Sanders)基于统计分析系统(Statistical Analysis System, SAS)开发的,因此又被称为桑德斯模型。[7]它是一种基于标准化测试数据的统计方法,用于衡量一个地区、学校或教师对个别学生或学生群体学业进步(增长率)的影响。[8]从概念上来讲,“增值=当前的成就/结果-先前成就/结果”。它关注的是学生随着时间变化所取得的学业进步,而不是学生的成就水平是否达标。学生可能两次(或多次)的测验成绩都处在及格线之下,但如果对比发现他的学业成就获得了相对提高,那么这里也存在增值。

为计算出学生成绩的增值,探讨教师、学校和学区对学生发展的净影响,TVAAS收集了三个方面的基础数据。第一方面是学生通过标准化测试取得的学科学业成绩。尽管学校课程结构和考试科目会不断发展变化,但田纳西州增值性评价系统还是尽可能多地将所有具有终结性评价的学科成绩都纳入数据收集和分析中,比如学生的学年结课成绩、ACT(American College Test,美国大学入学考试)成绩、部分AP(Advanced Placement,大学先修课程)课程成绩等。第二方面是学生的背景信息,包括学生姓名、性别、出生日期、种族、是否是天才学生、是否是移民、是否属于处境不利学生(是否获得免费/减价午餐),以及学生参加考试的年级、学期、所在学区编码、所在学校编码、出勤率等。第三部分是教师信息。收集这部分信息的目的是将学生和其授课教师的数据连接起来,主要内容包括教师姓名、教师证编号、该教师名下的学生姓名和学生证编号、所在学校和学区的信息、教学责任的百分比(教学的时间)、教学的科目及考试等相关信息。[9]

在收集多样且高质量的学生、教师和学校数据后,TVAAS运用专门的统计模型来计算学生个体学业成绩的增值,以此为基础计算教师、学校以及学区带给其所服务学生的平均增值,将其作为对教师、学校和学区效能评估与问责的依据。TVAAS使用多变量响应模型(Multivariate Response Model,MRM)来具体计算增值,它就“对一个具体年级的具体学科来说,与州内的其他学生学业成就相比,被评价学生学业成就所处的相对位置发生了怎样的变化”这一问题进行了回答。在MRM中,学生的相对位置是用正态曲线等值(Normal Curve Equivalents,NCEs)来表示的,这是一种相对分数,是根据标准正态分布表将学生的测试成绩逐步转化而来的,分值之间具有相同的测量尺度,可以直接被用来比较。TVAAS的NCEs值取值范围为1~99,其中州平均值恒定为50,得分低于50代表学生的学业水平低于州平均水平。MRM是一个多元纵向线性混合模型,它的基本公式为:Y=Xβ+Zν+ε,其中Y表示教师/学校/学区对应的所有学生的NCEs值,X和Z分别表示所有固定效应和所有随机效应,β和ν是待估计的固定效应和随机效应系数,ε是残差项。[10]在具体使用该模型对教师、学校和学区进行评估时,MRM会随着评估对象的不同或测验机制的不同而进行相应调整。

TVAAS已经在实践中应用了二十多年,并产生了广泛影响。目前,这个体系在美国北卡罗来纳、俄亥俄和宾夕法尼亚等多个州进行了全州范围的推广,其他州(如得克萨斯州、路易斯安那州)也有很多学区或学校在使用田纳西州增值性评价的模型和方法。[11]

二、美国田纳西州增值性评价系统的核心经验

TVAAS建立了一个多学科大规模纵向数据库,运用复杂统计模型计算学生个体学业成绩的增值,以此评估教师、学校和学区的教育效能。经过多年的发展与完善,TVAAS积累的丰富经验值得我们学习和借鉴。

1. 整体推动,系统设计

与单一的教师增值性评价或学校增值性评价系统不同,TVAAS是由田纳西州教育部统筹推动的综合性评价系统。它不局限在单独的学校或某一学区内,而是一个覆盖田纳西州全州的评价系统,学生转学、教师州内调动等都不会影响增值性评价的实施。TVAAS通过系统设计最大化地利用数据资源,通过追踪学生的标准化测试成绩增值,既可以评估教师、学校和学区对学生学业发展的影响,也可以为每个学生提供自身学业发展轨迹。[12]这样它不仅为教育问责提供了实证依据,而且也能及时确认需要进行学业干预的学生、需要提升绩效的教师及需要改进的学校或学区,[13]从而发挥诊断作用。

2. 专业支持,高效合作

在用学生成绩进行教师评价或学校评价时,传统评价方式一般都是统计学生的测验成绩达标率。相对而言,这种统计方法比较简单,学校或区域教育系统内部就能运算,极易运用和推广。但增值性评价是通过构建大规模纵向综合数据库,运用高级统计模型来处理数据,它得出的统计结果较为复杂,需要专业人员进行解释;此外,随着测验类型的增加、新实践问题的出现及统计方法的不断进步,增值性评价的模型需要逐步更新,以满足教育实践的需求。因此,增值性评价需要专业的统计人员乃至专业的统计公司来协助收集或处理数据、阐释结果,最终为教育实践者和教育政策制定者提供依据。

因此,田纳西州教育部在推动增值性评价过程中,一直与桑德斯及SAS公司保持密切的合作关系。自1993年起,SAS公司的EVAAS模块就开始为TVAAS提供强大的技术支持。[14]随着桑德斯从田纳西大学转到SAS公司工作,田纳西州教育部开始与SAS公司签订合同,由SAS公司進行数据的处理和结果的报告。州教育部在每年6月1日把学生的测验成绩及相关信息提供给SAS公司,SAS公司会在当月15日反馈增值性评价结果。[15]田纳西州通过这种服务外包的方式,将复杂的数据处理委托给专业的统计公司,既能获得稳健精确的评价结果,保证评价结果的科学性,又能充分发挥第三方评价的优势,保障评价结果的公平性。

3. 两级联动,保障经费

作为一种专业程度较高、需要基于大数据及专业统计方法来实施的评价方法,增值性评价的推广和实施不但需要法律法规的保障、教育行政力量的主导,还需要财政投入的支持。在TVAAS的实施和推广中,美国联邦政府和州政府两级联动,投入大量的教育经费。从1991年至1999年,田纳西州教育部与桑德斯签订合同,使用桑德斯模型和方法来进行增值性评价,该合同平均每年的投入经费约26万美元。[16]自2000年田纳西州教育部与SAS公司签订新合同后,据统计,2005年至2009年这五年,州教育部付给SAS公司约853万美元,其中州政府投入约652万美元,联邦经费投入约201万美元;而2010年至2014年的合同总金额为1436万美元,其中州政府投入约866万美元,联邦经费支付570万美元。[17]已有数据表明,田纳西州在推广增值性评价时,通过联邦和州两级政府的财政支出来保障足够的经费投入到增值性评价中。

4. 聚焦测验,确保信效度

TVAAS是围绕学生的标准化测验成绩展开的,标准化测验的质量决定了增值性评价的准确性和可靠性。为了保证评价的信效度,TVAAS对纳入系统的标准化测验提出了三条标准。首先,测验有充分伸展性(Stretch)。测验能够保证每个参与的学生都具有增值的空间,克服标准化测验可能存在的天花板效应和地板效应,真实有效地测量不同成就学生的真实学业水平。其次,测验内容与已有学业标准相关(Relevance)。TVAAS通过测量学生在年级/学科/学年上的学业增值,评估教师、学校和学区所发挥的作用,及时进行教育干预,最终让每一位州内学生都获得应有的成长,因此测验内容必须与已有的学业标准相关,能够测量学生在每个年级具体学科上预期掌握的知识和能力。最后,测验结果是可靠的(Reliability)。TVAAS的评价结果是基于学生多学年多学科多次测验的数据计算而来的,因此测验结果要能够经得起时间检验,保证跨年比较结果的稳定可靠。[18]

5. 结果公开,通俗易懂

TVAAS最初建立的主要目的是对学生成长、教师发展和学校/学区改进提供及时诊断,为教育问责提供实证依据。因此,它致力于最大化利用增值性评价结果,将增值性评价结果向各级教育工作者和社会公众公开。田纳西州教育部在官网上建立了专门的TVAAS模块,通过文字和视频等多样形式,详细介绍了田纳西州增值性评价的基本原理、操作过程和年度结果报告,这部分信息对每一位公众公开。教师及教育行政人员可登录网站下载侧重点不同的报告,获得增值性评价反馈并进行相应的改进。单就教师来说,他们能从网站上下载教师增值报告、教师诊断报告、教师增值汇总报告和教师诊断总结报告。此外,学生、家长及其他公众可以登录增值性评价数据查询网站,了解每一个学区、每一所学校的增值性评价结果及诊断报告,并可以自行选择学区、学校、学科进行交叉查询,比较不同学区、不同学校在各个学科上的表现。

当然,由于TVAAS选择运用复杂的统计模型来计算学生、教师、学校和学区的增值表现结果,不仅普通公众认为这些数据、模型、运算过程和结果晦涩难懂,一般教育工作者也难以理解和运用它们。因此,TVAAS对复杂统计结果还进行了通俗易懂的转化和阐释,利用多样图表和不同颜色来反馈评价结果。TVAAS报告用彩色编码来解读增值数据,就像红绿灯一样,绿色代表学区或学校内学生取得的进展超过了预期,黄色表示等于预期成果,红色则表示低于预期进展。[19]同样,在面向公众开放的增值性评价结果网站上,TVAAS也用不同颜色来表示学校/学区的表现。通过这种简单易读的形式,教育工作者和公众都可以一目了然地获得他们查询的结果,真正实现了信息公开的价值。

三、TVAAS对我国推动增值性评价的启示

没有十全十美的评价方式。田纳西州增值性评价系统在实施过程中也存在些许不足,比如它的具体模型、运算代码及数据库都是非公开的,其统计模型类似于“黑匣子”,其评价结果也未能接受同行的审阅。不过,作为最早实施增值性评价的区域之一,田纳西州增值性评价系统还是能给我们带来很多启示。

1. 基于试点经验逐步推广增值性评价

评价改革作为教育改革的风向标,牵一发而动全身,因此在推广增值性评价时,我们要借鉴田纳西州增值性评价系统的设计思路,汲取可操作经验。但在具体实践中必须稳中求变,不能急于求成,要综合考虑各方利益主体的需求。在实施范围上,增值性评价可以从小规模的区域试点起步,在实践中积累经验教训,逐步推广到省市层面;在实施内容上,我国增值性评价可以先聚焦学校层面,建立学校增值性评价体系,在可行的基础上逐步增加教师增值性评价和区域增值性评价;在结果使用上,教育政策制定者或教育实践者要审慎使用增值性评价结果,它可以作为教师评价、学校评价的指标,但不能作为唯一评价标准,尤其是在考虑教师晋升、评聘等相关高利害评价时,一定要结合其他评价结果综合考量。通过由点到线、由线到面的探索,最终逐步建立适合我国实际情况的增值性评价体系。

2. 引入以数据为基础的第三方评价

建立大规模追踪数据库是实施增值性评价的前提条件。田纳西州自上世纪90年代起,就逐步建立包含学生个体信息、教师信息和学生标准化测验成绩的纵向数据库,在此基础上展开了全州范围的增值性评价。数据库随着追踪年限不断增长而变得越来越庞大,信息也越来越丰富,对数据库的维护直接决定着增值性评价的效果。[20]因此,我国在实施增值性评价时,首先要加强数据意识,用证据说话,构建区域教育的大数据。

另外,田纳西州增值性评价系统的原理比较简单,但操作较为复杂,在模型的选择、使用、更新及数据处理上,田纳西州都是由专业统计人员或统计公司来处理的。我国在2015年出台的《教育部关于深入推进教育管办评分离促进政府职能转变的若干意见》中也提到要“支持专业机构和社会组织规范开展教育评价……引入市场机制,将委托专业机构和社会组织开展教育评价纳入政府购买服务范围”。因此,我国在建立增值性评价体系时,可加强与第三方评价机构的合作,将专业的工作交给专业的人员。

3. 倡导诊断与问责下的结果公开

TVAAS通过测量教师、学校和学区对学生学业成绩增值的作用,一方面为教育问责提供了数据依据,以此保障州内所有学生享有公平的教育机会,获得基于自身的学业增长,综合提高区域教育质量;另一方面也通过对学生、教师、学校和学区数据进行追踪,发挥了诊断性评价的功能。教育评价改革要注重教育评价目的的转变,为政府、学校和学生提供多元诊断服务。[21]因此,我國在实施增值性评价时,一定要综合使用评价结果,既要充分发挥增值性评价结果的追踪诊断功能,及时对学生、教师、学校和区域进行改进干预;又要将评价结果进行有效公开,为各个相关利益群体(教师、校长、教育行政人员、社会公众等)提供教育问责的证据支持。

教育评价是教育现代化发展和教育改革的指挥棒。当前,我国正处于教育评价改革的关键期,实施增值性评价能创新评价形式、推动评价改革,为建设公平而有质量的教育体系提供支持。

参考文献:

[1] 辛涛,姜宇,刘文玲.中高考数据链接:对学校进行增值性评价—以某市40所高中2132名学生中高考数据的实证分析为例[J].中小学管理,2012(6):4-7.

[2] Koedel C,Mihaly K,Rockoff J E.Value-added modeling:A review[J].Economics of Education Review,2015(47):180-195.

[3] National Commission on Excellence in Education . A Nation at Risk: The Imperative for Educational Reform[J]. Elementary School Journal, 1983(2):112-130.

[4][5][7] Sanders W L,Horn S P.Research Findings from the Tennessee Value-Added Assessment System (TVAAS) Database: Implications for Educational Evaluation and Research[J].Journal of Personnel Evaluation in Education,1998(3):247-256.

[6] Sanders W L,Horn S P.The tennessee value-added assessment system(TVAAS):Mixed-model methodology in educational assessment[J].Journal of Personnel Evaluation in Education,1994(3):299-311.

[8] Justin P.Wilson.Defining Tennessee Education:A Glossary of Education Terms volumeⅠ[R/OL].(2016-01)[2020-09-12].https:// comptroller.tn.gov/content/dam/cot/orea/documents/Tennessee_ Education_Glossary.pdf.

[9][10][12][14][18] Statistical Models and Business Rules of TVAAS Analyses[R/OL].[2020-08-31].https://www.tn.gov/content/dam/tn/ education/data/tvaas/Statistical_Models_and_Business_Rules.pdf.

[11][13][15][17] Tennessee Value-Added Assessment System: A Brief Overview[R/OL].[2020-08-31].https://comptroller.tn.gov/content/dam/ cot/orea/advanced-search/2013/2013_OREA_TVAASBrief.pdf.

[16] John G Morgan.The Education Improvement Act :a progress report[R/OL].(2004-04)[2020-08-31].https://comptroller.tn.gov/ content/dam/cot/orea/advanced-search/orea-reports-2004/2004_OREA_ EdImpAct.pdf.

[19] Misconceptions about Value-Added Reporting in Tennessee[R/OL].[2020-08-31].https://tvaas.sas.com/support/MisconceptionsAboutVA.pdf.[20] 边玉芳,王烨晖.增值评价:学校办学质量评估的一种有效途径[J].教育学报,2013(1):43-48.

[21] 黄晓婷.管办评分离背景下的教育评价新视野[J].中小学管理,2015(8):4-6.

(编辑 崔若峰)