中西方关于学生评教研究的比较

2016-06-21 07:18杨雪燕
关键词:学生评教内容分析教学质量

杨雪燕,陶 鑫

(1.复旦大学 英语系,上海 200433;2.首都医科大学 卫生管理与教育学院,北京 100069)

中西方关于学生评教研究的比较

杨雪燕1,陶鑫2

(1.复旦大学 英语系,上海 200433;2.首都医科大学 卫生管理与教育学院,北京 100069)

[摘要]学生评教关乎高校教学质量和教师个人发展,但有关研究在国内尚未引起足够重视。根据中西方有影响期刊最近40年共349篇学生评教方面文章,采用内容分析方法,比较国内与西方在研究方法、关注点、研究问题与结论等方面的异同,经分析,发现:西方研究多采用实证性方法,国内多采用非实证性方法;西方更注重评教的可靠性和实际效果,国内更关注评教制度的建立与改进;与西方相比,国内在评教问卷设计、过程管理、结果解读及运用等方面有待加强科学性。论文对学生评教研究的现状、趋势和存在的问题进行全面深入梳理,为加强和改进我国高校学生评教的研究及实践提供了一系列有益启示。

[关键词]学生评教;教学质量;教师;内容分析;中国和西方

一、引言

“学生评教”指高等院校学生对教师的课堂教学质量进行评价,以下简称“评教”。严格地讲,评教即在一定的评价理论指导下,采用科学的工具和方法,组织学生对任课教师的课堂教学情况做出价值判断①雷敏:《论提高高校学生评教质量的方法和策略》,《高教探索》,2005年第1期,第50-53页。。评教已成为高校教学质量保证体系中的重要组成部分,也被看作“教学质量保障的根本制度”②别敦荣、孟凡:《论学生评教及高校教学质量保障体系的改善》,《高等教育研究》,2007年第12期,第77-83页。。在实践中,各高校不仅通过评教来监督教学质量,有时还把评教结果当作奖惩教师的依据乃至教师晋级的参考,使之成为衡量教学质量的重要标准。

随着评教在国内外高校广泛开展,相关的争论也从未停止过,有关评教的有效性和目的性一直存在着争议③孟凡、黄巧俐:《试析大学学生评教制度的实质》,《江苏高教》,2013年第3期,第79-82页;Wachtel,H.K.Student evaluation of college teaching effectiveness:A brief review.Assessment & Evaluation in Higher Education,1998,23(2):191-212.。然而,针对评教而展开的深入系统的研究并不多,国内则更少,加强这方面研究十分必要。本文从中西方有影响的期刊上收集了最近40年发表的相关文章共349篇,对文章进行内容分析,旨在对评教研究方面的文献进行梳理,比较中西方研究之间的异同,了解该领域的研究现状和发展趋势,认识所存在的问题,为加强我国高校学生评教的研究及实践提供启示。

二、分析方法

(一)文献样本

我们选择了有关评教研究的文献作为分析对象,以中西方有影响的期刊上文章作为样本,通过电子数据库检索而获取。在选择文章发表的时间段时有两点考虑。第一,20世纪70年代是西方评教研究的“黄金时代”④Centra,J.A.Reflective Faculty Evaluation:Enhancing Teaching and Determining Faculty Effectiveness.San Francisco:Jossey-Bass,1993,p.49.,为了能充分反映西方研究的主要成果,选择70年代为收集文献的起始点。第二,多数电子数据库提供的相关文章最早始于1973年左右,因此选择了从1974—2013年共40年作为收集期刊文章的时间段。

西方文献来源于英文期刊。选择期刊时,参照Bray和Major*Bray,N.J.and C.H.Major.Status of journals in the field of higher education.The Journal of Higher Education,2011,82(4):479-503.与Wellington和Torgerson*Wellington,J.and C.J.Torgerson.Writing for publication:What counts as a “high status,eminent academic journal”?Journal of Further and Higher Education,2005,29(1):35-48.对西方高等教育领域期刊的排名,选定其中排名靠前的30种期刊。使用的电子数据库包括EBSCO、WILEY-BLACKWELL、JSTOR和SAGE。先逐一以期刊名为来源,以teaching evaluation和student evaluation为关键词进行文献检索。然后基于检索到的文章题目和关键词,排除那些并非关注评教的文章。再根据文章的参考书目,找到一些也可能关注评教的其他有影响期刊*如Journal of Educational Psychology,影响因子达3.158。,以这些期刊名为来源进行二度检索,并重复上述人工排查步骤。

国内文献来源于中文核心期刊,包括《中文社会科学引文索引》(2012—2013)“教育学”目录中高等教育类,以及《中文核心期刊要目总览》(2011版)中的“教育学/教育事业,师范教育、教师教育”类和“高等教育”类,共42种期刊。通过中国学术期刊网络出版总库进行检索,选择的学科领域为“高等教育”和“教育理论与教育管理”、来源类别为“核心期刊”、来源为期刊名,并根据中国的实际情况选定关键词“学生评教”、“教师教学质量”、“教学质量评价”和“教学评价”。对于检索到的文章,也做了人工排查和二度检索。

在完成电子数据库检索之后,在阅读和分析每一篇文章的过程中,若发现有文章实际上与评教无关,则予以排除。最终共得到349篇文章。其中英文文章166篇,源于共11种有影响的有关期刊(见附录一);中文文章183篇,源于共32种国内核心期刊(见附录二)。

(二)研究问题

通过对文献进行内容分析,试图回答三个问题,即中西方评教研究1)采用了哪些研究方法?2)关注了哪些问题?3)得到了哪些结论?

(三)内容分类

针对以上研究问题,首先在阅读、分析每篇文章内容的基础之上,根据文章中相关词语,归纳出一些内容类别。然后采用这些类别对文章内容进行初级标码,在标码过程中确定各个类别的准确性、相互排斥性以及适用性。经过两位研究者反复讨论、修订以及二度标码检验,最终建立了以下两个类别体系。

1.评教研究方法类别体系

该体系的建立主要基于文章题目、摘要和正文中涉及研究方法的内容,共归纳出7个评教研究方法类别,详细描述见表1(词语实例出自中英文文章;有些只有英文而没有中文实例,是因为相关类别在国内研究中未出现;下同)。

2.评教研究问题类别体系

该体系的建立主要基于文章题目、摘要、关键词和涉及研究结果的内容,共归纳出15个评教研究问题类别,并进而将这些类别归纳为5个维度,可谓5个评教研究的关注点,详细描述见表2。

表1评教研究方法类别体系

表2评教研究问题类别体系

(四)分析过程

分析包括三个部分。第一,在确立了上述两个类别体系之后,对所有文章进行正式标码。然后以文章为单位,统计7个研究方法类别以及5个研究问题维度出现的频次及其分别在中西方文献中的分布,以便比较中西方在研究方法以及关注点上的异同。第二,针对15个具体的研究问题类别,深入挖掘中西方文献中得出的结论,以便比较中西方研究的现状、趋势和存在的问题。第三,还分别统计了中西方文献历年的数量,以便了解和比较中西方研究的概貌和变化趋势。

三、分析结果与讨论

以下基于分析结果,先比较中西方评教研究的概貌以及变化趋势;然后比较中西方在研究方法和关注点上的异同,从中可以看到中西方研究的基本状况以及存在的问题;此后给出在15个研究问题上得出的结论,深入比较中西方研究分别重视哪些问题,以及在解决问题时取得了哪些进展。

(一)评教研究的概貌

从1974年到2013年共40年间,中西方对于评教研究的关注程度以及变化趋势均存在不少差异。以下图1给出40年间有关评教的中西方文献篇数的统计结果。

从图1中可以看到,西方的评教研究起步比较早,40年来虽然有小幅波动,但始终保持适度的关注,近几年有缓慢上升的趋势。从文献中看,高校学生评教起源于美国,第一份评教问卷——普渡教学评价量表(Purdue Rating Scale for Instructors)诞生于1927年。同年,题为Experimental Data on the Purdue Rating Scale for Instructors*Remmers,H.H.and G.C.Brandenburg.Experimental data on the Purdue Rating Scale for Instructors.Educational Administration and Supervision,1927,13(6):519-527.的第一篇研究评教的文章发表于美国期刊EducationalAdministrationandSupervision。在西方,评教于20世纪60年代进入发展期,一些大学开始成立专门研究评教的机构;70年代发展最快,大批学校更加系统地开展评教。就是在这一发展阶段,一些有影响的(如Centra*Centra,J.A.Student ratings of instruction and their relationship to student learning.American Educational Research Journal,1977,14(1):17-24.等人的)研究出现了,论证评教的有效性,并肯定了评教在形成性评价和总结性评价中的不同作用*Centra,J.A.Reflective Faculty Evaluation:Enhancing Teaching and Determining Faculty Effectiveness.San Francisco:Jossey-Bass,1993,49.。80年代之后趋于稳定,评教已经成为多数高校评价教学质量的一种制度。而在这一较长的稳定阶段,对评教的关注度有增无减;更重要的是,研究更为深入,在澄清、整合已有研究结果的同时,开始关注评教方法的科学性、影响评教的因素等(详见后文中讨论)。

国内的评教实践与研究起步较晚,直到上世纪80年代才开始。1984年,北京师范大学在计算教师教学工作的“量”时,对教学的“质”也进行了简单的评价,这可谓我国最早的在评价高校教师教学方面的实践。随后,学生评教逐步发展成为评价教师教学质量的一个重要信息来源。1990年,第一篇研究学生评教的文章发表于《高等师范教育研究》(2003年更名为《教师教育研究》),题为“高师生评定教师课堂教学评价指标的调查”*范晓玲:《高师生评定教师课堂教学评价指标的调查》,《高等师范教育研究》,1990年第1期,第48-53页。。90年代,随着北大、人大、北师大几所名校率先向师生公布评教结果*魏红:《我国高校教师教学评价发展的回顾与展望》,《高等师范教育研究》,2001年第3期,第68-72页。,学生评教在国内高校中逐步推广开来。在这一起步阶段,评教研究的文章并不多。21世纪以来进入高速发展期,大批高校迅速加入评教的行列,评教方面文章数量也迅速增长,到2011年达到巅峰。在这一发展阶段,研究者主要关注如何优化对评教过程的管理,以及如何建立科学的评教制度。而近两年开始,随着评教制度成熟化,虽有个别研究开始关注受学生欢迎老师的特点,但整体来看研究的势头有回落的迹象。那么,评教研究是否已经解决了需要解决的问题?研究方法是否可靠?得到的结论为评教实践带来了哪些有益的启示?这些都是值得深入调查研究的。

(二)评教研究的方法

除了从研究走势上看,从研究方法来看中西方研究也存在着很多差异。以下图2给出了各种研究方法类别在中西方文献中的分布情况。

从图2中可以看出,西方研究有两个特点。第一,问卷所占比例最大,而且除了单独使用外,还与测试和访谈分别一起使用,显然是采用最多的研究方法。第二,问卷、访谈、测试和实验均属于实证性研究方法,加起来所占比例高达80%,而经验总结、思辨加讨论、综述这类非实证性研究方法所占比例相对很小。实证性研究的特点是,通过对研究对象大量的观察、实验和调查而获取客观材料,多采用量化分析手段,要求所得结论在相同条件下具有可证性*邓猛、赵振州:《教育科学研究方法与写作基本规范的思考》,《教育研究与实验》,2005年第1期,第1-6页。。这种研究方法强调结论的客观性和普遍性,有利于归纳出事物的本质属性和发展规律。还值得注意的是,即使在综述类之中,西方有些研究采用了元分析方法(meta-analysis),即收集已有的研究结果,对其进行量化分析和梳理,以便客观而准确地反映研究现状*Glass,G.V.Primary,secondary,and meta-analysis of research.Educational Researcher,1976,5(10):3-8.。由此看来,西方的评教研究比较注重研究方法的科学性。

国内研究在方法类别的分布上与西方研究正好相反。包括思辨加讨论、经验总结和综述在内的非实证性研究方法加起来所占比例高达73%,接近实证性研究方法在西方研究中所占比例。思辨加讨论式研究最多,其次是经验总结式。也就是说,大量的文章并不是基于调查或实验数据,而是基于主观认识或理性分析。综述性研究相对较少,没有采用元分析方法,而只是评述,以介绍他人研究成果为主。就实证性方法而言,国内研究没有采用实验或测试,主要采用问卷,有少量研究采用问卷加访谈的方法,但合起来所占比例依然远远低于西方研究。由此看来,国内研究过多采用非实证性方法,有较强的主观性,有待加强科学性。

(三)评教研究的关注点

在评教研究的关注点上,中西方研究之间也存在不少差异。图3给出了围绕5个评教研究关注点的中西方文献篇数的统计结果。

从图3可以看到,“评教管理”在中西方研究中都是最为重要的关注点,但国内的关注程度更为突出,达到西方的1.6倍。随着评教日益成为国内高校的一种教学管理制度,同时由于国内高校数量多且层次、类别多样,究竟应该如何实施评教便成为一个特别值得关注的问题。而且,学生、教师以及管理人员对评教的看法和认识也随之增多,这一点反映在国内研究对于“各方态度”的关注程度也达到了西方同类研究的1.8倍。然而,国内研究对“影响评教的因素”和“评教结果解读”重视相对不足,关注程度分别只是西方同类研究的52%和20%。这说明国内研究多把评教当作一种需要实施的制度,对如何提高评教质量关注不够,对评教之后如何帮助教师提高认识、改进教学则关注更少。中西方研究只有在“评教问卷设计”上比较接近,都予以相当程度的关注,因为评教问卷是整个评教工作中最重要的组成部分,其内容决定了评教最终将给教师和管理者提供何种信息*Marsh,H.W.Students’ evaluations of university teaching:Research findings,methodological issues,and directions for future research.International Journal of Educational Research,1987,11(3):253-388.。正因为如此,评教问卷所涉及的研究问题也比较多,这一点在下文中有详细讨论。

(四)评教研究的问题与结论

基于对文献的深入分析,以下针对上述5个关注点所涉及的总共15个研究问题类别,详细比较中西方研究已经得到的结论。由于中西方研究不仅在整体关注点上存在差异,而且对具体研究问题类别的关注程度也不同,甚至有些类别在国内几乎未得到关注,因此以下的部分小节中很少或不包括国内研究得出的结论。

1.评教问卷设计

(1)问卷内容

评教问卷的内容是评教问卷设计中的关键。西方国家高校的评教问卷由学校的教学指导或评估中心研制开发,或由专门的评教机构研制后有偿提供;国内高校的评教问卷往往由学校的行政管理部门制定。因此国内文献中很少涉及问卷的内容,而主要是介绍西方有关研究成果。

根据西方研究,评教问卷可大体分为单维度和多维度两种框架。前者的支持者认为,教学本质上只反映一种技能,因此教学质量只需一个综合维度来衡量,如“总体授课技能”,其中已经包涵传授知识、促进互动、评价学生等不同教学技巧。然而多数研究者认同多维评教框架创始人Marsh的观点,即有效的教学是多维度复杂活动,且各维度间相互独立*Marsh,H.W.Students’ evaluations of university teaching:Research findings,methodological issues,and directions for future research.International Journal of Educational Research,1987,11(3):253-388.。这意味着有效教学并不拘泥于一种教学模式,例如有的教师教学有条理但缺乏热情,两个得分相同的教师可以在不同维度上得分不同。还有研究显示,每个教师都有自己的“个人轮廓”,而且可长达十几年基本不变*Marsh,H.W.and M.Bailey.Multidimensional students’ evaluations of teaching effectiveness:A profile analysis.The Journal of Higher Education,1993,64(1):1-18.。

Marsh设计的评教问卷SEEQ(Student Evaluation of Educational Quality Questionnaire)影响很大,内容包括九个方面:学习价值感、教学热情、组织清晰性、群体互动、人际和谐、知识宽度、考试评分、作业阅读材料和功课量难度*中译文的译者为北京师范大学心理学系教授孟庆茂(见孟庆茂、刘红云:《大学教师教学效果评价维度结构及影响因素研究》,《心理科学》,2003年第4期,第617-619页)。。在国内,很多评教问卷内容主要包括教学态度、教学内容、教学方法和教学效果,显得比较笼统,更接近单维度问卷。

(2)师生角度

评教实际上是收集学生对教师教学质量的看法,因此问卷设计需从学生的角度出发,同时从教师角度考虑到实际教学情况与要求。

从学生的角度出发,问卷的指标应该是学生可以观察和判断的,而不能过于抽象。西方高校的评价指标与教师的教学行为相对应,表述具体而明确,如“是否鼓励学生质疑老师并发表看法”、“是否邀请学生分享他们的观点和知识”等*Marsh,H.W.and M.Bailey.Multidimensional students’ evaluations of teaching effectiveness:A profile analysis.The Journal of Higher Education,1993,64(1):1-18.。而国内大学的有些评价指标表述比较抽象,如“备课情况”、“教学研究和教学改革措施”等*王笃美:《学生评教的有效性稳定性分析》,《江苏高教》,1996年第2期,第23-26页。,学生往往难以判断。此外,学生评教的主要依据是自己的学习收获及满意度*吴培群、陈小红:《大学生评教的统计分析及其改革途径探讨——基于北京一所高校学生评教分数的统计分析》,《高教探索》,2010年第3期,第78-81页。。西方问卷更为关注学生的收获,但国内问卷指标集中于教师表现却极少提及学生具体的进步与变化。

从教师的角度看,教师本人最了解自己学生的要求以及所授课程及学科的特点,因此让教师参与问卷设计很有必要,甚至是决定评教成败的一个关键因素。西方很多高校的教师在评教中享有相当的自主权,可自拟一些问题,或从评教题库中选择问题自行编制问卷。有研究发现,相对于问卷中的必选问题,教师自选的问题可在更大程度上反映学生对课程的整体满意度*Denson,N.,T.Loveday and H.Dalton.Student evaluation of courses:What predicts satisfaction?Higher Education Research & Development,2010,29(4):339-356.。但在国内,教师是被评价、被监督的对象,对于评教指标的设计与改进几乎没有发言权。

(3)学科环境

不同院系、学科的教学过程和重点不同,对教师的要求也不同,构成了学科的评教环境。西方有研究发现,自然科学注重课程设计,强调发展学生的逻辑思维能力;教育学注重对学生的关心以及知识的实践意义;心理学注重培养学生的研究热情,关注课堂组织;人文学科则注重培养批判性思维能力,强调课堂组织及教育性目标*Ghedin,E.and D.Aquario.Moving towards multidimensional evaluation of teaching in higher education:A study across four faculties.Higher Education,2008,56(5):583-597.。有美国大学先在学校层面制定一般性指南,然后由各院系编制符合学科环境的问卷。

国内专门针对特定学科问卷的研究很少。以外语学科为例,笔者在中国学术期刊网络出版总库上检索外语类核心期刊,并查阅特别针对外语教育的刊物《中国外语教育》、《中国英语教育》和《广东外语外贸大学学报》,只发现两篇文章提到学生评教*夏伟蓉、吕长、魏俊轩:《从学生网上评价教师课堂教学质量调查分析大学英语教学和教材》,《外语界》,2004年第3期,第18-25页;陈丽霞、曾燕冰:《大学英语教师课堂教学质量调查——通过学生网上评教的渠道》,《教育学术月刊》,2013年第5期,第94-96页。,并没有专门研究外语学科评教的文章。

(4)文化环境

不同的文化与教育制度也构成了不同的评教环境,会影响学生的认知。同一个评教问卷中的某些维度可能具有跨文化性,另一些维度则会反映出文化差异。例如北美评教问卷SEEQ已应用于7个国家和地区(澳大利亚、巴布亚新几内亚、西班牙、中国、中国香港、尼日尼亚和印度)。西方有研究表明,该问卷中的“教学热情”和“知识宽度”两个维度在印度显示出较高的重合度*Watkins,D.and B.Thomas.Assessing teaching effectiveness:An Indian perspective.Assessment & Evaluation in Higher Education,1991,16(3):185-198.。国内研究也指出有些维度在中国有所重合,导致将“教学热情”与“组织清晰性”合二为一,并将“考试评分”与“作业阅读材料”合并为“教学管理”*孟庆茂、赵增梅:《大学生评价教师教学效果的多维性研究》,《新世纪测验学术发展趋势》,中国测验学会编,台北:台北心理出版公司,1999年版,第541-560页。。

2.评教管理

(1)前期动员

就评教的实施过程而言,前期需对参评的学生和受评的教师做好引导和动员工作。西方有研究发现,学生对评教指标的解读与设计者预期会有出入,不确定项目内涵时便自己猜测*Robertson,S.I.Student perceptions of student perception of module questionnaires:Questionnaire completion as problem solving.Assessment & Evaluation in Higher Education,2004,29(6):663-679.。国内研究也发现,很多学生因不清楚评教目的而处在“信息不对称”状态*周继良:《试论信息不对称与高等学校学生评教》,《高教发展与评估》,2011年第2期,第44-53页。,因此被动、敷衍地对待评教,或根据对教师的整体印象打分而不是逐条评价。大量国内研究认为,应该通过集中培训等方法向学生解释问卷项目的内涵和评教的方法,以便培养和提高学生的评教能力;而且可提前告知评教的目的和用途,使学生端正态度并树立主人翁意识。

同时,要引导教师认真对待评教,就要尊重教师的权利、注重教师的职业发展。但国内高校的教师除了作为评教对象之外,往往处于评教制度之外。国内不少研究建议,学校可以公布教学质量要求,使教师在思想和教学上有充裕的时间准备和改进;还可以学习西方的做法,由系主任将评教的重要性、如何运用评教结果以及评教管理办法都告知每位教师。

(2)时机与模式

一般认为,评教时机应视评教目的而定,总结性评价适合在期末进行,形成性评价适合在期中进行。西方有调查显示,参加与不参加期中评教的教师在期末评教中得分不同,前者比后者高出15%*Cohen,P.A.Effectiveness of student-rating feedback for improving college instruction:A meta-analysis of findings.Research in Higher Education,1980,31(4):321-341.。

关于网上评教模式,国内有人建议长期开通网上评教系统,方便学生随时反馈意见,教师也能随时了解意见以便改进教学。但随着网络评教系统出现,网上回馈率已成为一个问题。西方有研究认为,把课程学分与参与评教挂钩有助于提高回馈率。国内也有人指出应控制网上评教过程中可能出现的误差,减少无效信息源。

(3)结果运用

评教结果具有多种用途。首先是促进教师改进教学,这也是评教的主要目的。西方有些学校会向教师提供评教结果的说明,对反映出的问题进行针对性辅导和培训。有研究表明,接受过专家咨询的教师再次参加评教时得分有显著提高*Marsh,H.W.and L.A.Roche.The use of students’ evaluations and an individually structured intervention to enhance university teaching effectiveness.American Educational Research Journal,1993,30(1):217-251.。国内学校在评教结束后很少对评教结果进行分析和研究,或制定改进教学的计划。

评教结果还普遍用于人事管理,把评教得分当作教师提职称和提拔的参考标准。例如,美国高校在教师的任用和晋级等问题上会征集学生意见,但只是作为参考;国内则有高校将评教结果直接用于人事决策。此外,评教结果常用于教学管理。在西方,教师的评教得分可供学生选课时参考。在国内,教师的评教得分往往并不公开,而只被当作奖惩教师的依据。

3.影响评教的因素

(1)教师因素

教师的性格会影响到教师得分。西方有研究发现,同事对教师性格的判断可以准确预测教师得分,且不同的性格特点适合讲授不同类型的课程,如教师外向和开明程度与本科生评分成正相关,而教师的成就与忍耐度与研究生评分成正相关*Murray,H.G.,J.P.Rushton and S.V.Paunonen.Teacher personality traits and student instructional ratings in six types of university courses.Journal of Educational Psychology,1990,82(2):250-261.。受学生欢迎并因此得分高的教师往往具有个人魅力*Shevlin,M.,P.Banyard,M.Davies and M.Griffiths.The validity of student evaluation of teaching in higher education:Love me,love my lectures?Assessment & Evaluation in Higher Education,2000,25(4):397-405.,或者有目标性、自信并给人安全感*Brems,C.,M.R.Baldwin,L.Davis and L.Namyniuk.The imposter syndrome as related to teaching evaluations and advising relationships of university faculty members.The Journal of Higher Education,1994,65(2):183-193.。国内有研究还发现,情绪稳定、外向的老师更受学生欢迎。

教师的年龄也会影响得分。西方有研究表明,教师得分开始下降的年龄因学科而异,自然科学领域为50岁,人文学科为35岁(45岁再次上升),社会科学领域为40岁(65岁再次上升)。心理学教师在33至65岁之间得分与年龄成反比*Renaud,R.D.and H.G.Murray.Aging,personality,and teaching effectiveness in academic psychologists.Research in Higher Education,1996,37(3):323-340.。国内不少研究却发现年龄对教师得分影响不大,但教师的职称越高评教得分越高。

教师科研能力的影响不稳定。中西方多数研究表明,二者之间不相关或存在弱相关,但教师科研成果的引用率与评教得分显著相关*Stack,S.Research productivity and student evaluation of teaching in social science classes:A research note.Research in Higher Education,2003,44(5):539-556.。

(2)学生因素

学生方面的影响因素主要包括对课程的兴趣以及对自己成绩的期望值。中西方研究均表明,对课程越有兴趣的学生给老师打分越高,这也是对学生影响最大的因素;同时,想得高分的学生给老师打分也高。西方研究对此的解释是,教师为了得高分,会给学生不应得的高分数,学生也反过来给老师打高分*Greenwald,A.G.and G.M.Gillmore.Grading leniency is a removable contaminant of student ratings.American Psychologist,1997,52(11):1209-1217.。另一种解释是,首先是因为学生自己有兴趣且学得好,因而得高分,所以给教师也打高分*Marsh,H.W.and L.A.Roche.Effects of grading leniency and low workload on students’ evaluations of teaching:Popular myth,bias,validity,or innocent bystanders?Journal of Educational Psychology,2000,92(1):202-228.。但国内也有研究发现,学生的成绩期望值对教师得分影响不大。

(3)课程因素

课程难度与教师得分往往成反比。国内研究发现,课程越难教师得分越低,为迎合学生而降低难度便有可能得高分。西方研究则提出,课程难度可分“坏”与“好”,前者会导致学生打低分,后者可促进学生积极学习,因此反而会得高分*Marsh,H.W.Distinguishing between good (useful)and bad workloads on students’ evaluations of teaching.American Educational Research Journal,2001,38(1):183-212.。国内研究也表明,认为课程深度与功课负担都适度的学生给老师打分最高*魏红、申继亮:《背景特征对学生评价教师教学的影响》,《高等教育研究》,2003年第4期,第85-90页。。

课程所属的学科领域对教师得分有很大影响。西方有研究发现,人文艺术领域教师得分较高,社会科学领域居中,理工科得分较低*Feldman,K.A.Course characteristics and college students’ ratings of their teachers:What we know and what we don’t.Research in Higher Education,1978,9(3):199-242.。数学和科学领域教师在所有领域中得分最低,因为这些课程较难且进度快。国内则有研究发现,语言教师得分普遍高于社会科学、自然科学以及其他人文学科的教师*陈国海:《中国大学学生评教系统的稳定性和相关性分析》,《广东外语外贸大学学报》,2009年第5期,第100-104页。。

课程类型也会影响教师得分。西方有研究表明,选修课教师比必修课教师得分高,这可能因为学生对选修课更感兴趣。国内学者则发现,学生看重必修课教师的教学水平,看重选修课教师的知识广度和深度。

4.评教结果解读

(1)学生成绩

西方有观点认为,既然评教的目的是衡量和监督教学质量,而高质量的教学应当促进学生学习,那么学生成绩应该是判断评教有效性的一个标准*Cohen,P.A.Student ratings of instruction and student achievement:A meta-analysis of multi-section validity studies.Review of Educational Research,1981,51(3):281-309.。因此,评教不应只关注教师行为,还应结合学生学习的效果来解读评教结果。西方有实证性研究表明,学生成绩和教师得分之间存在正相关,特别是与“课程价值”和“教师讲解”等评教指标相关,但与“师生关系”和“课程难度”无关*Centra,J.A.Student ratings of instruction and their relationship to student learning.American Educational Research Journal,1977,14(1):17-24.。

(2)教学质量

对教学质量的解读主要涉及到何为“好老师”和“有效教学”,但从理论出发的深入认识和界定很少。西方这方面研究主要围绕如何衡量教学质量,特别是应采用单项评教指标还是多项指标。一般认为,如果作为形成性评价,应通过多项指标来看待教师的教学质量;如果作为总结性评价,研究者的看法不一。有人认为应注重“教师总评”和“课程总评”这类指标*Cashin,W.E.and R.G.Downey.Using global student rating items for summative evaluation.Journal of Educational Psychology,1992,84(4):563-572.;也有人认为只看总评是不够的,二级因子会更好地反映教师的整体教学效果*Harrison,P.D.,D.K.Douglas and C.A.Burdsal.The relative merits of different types of overall evaluations of teaching effectiveness.Research in Higher Education,2004,45(3):311-323.。

国内这方面研究很少。近年来有个别研究开始关注“好老师”的特点,发现受欢迎的教师往往除了乐于人际交流和具备人格魅力之外,还特别重视教学,并且擅长组织分析型和评价型课堂活动。

5.各方态度

(1)学生态度

学生普遍愿意参与评教,却认为教师和管理者不会在意评教结果。西方研究表明,学生赞成评教的主要原因是希望教师提高教学水平、改进课程内容与形式,并不关心教师晋级*Chen,Y.and L.B.Hoshower.Student evaluation of teaching effectiveness:An assessment of student perception and motivation.Assessment & Evaluation in Higher Education,2003,28(1):71-88.。国内有调查显示,学生对评教之后会有什么结果不太清楚也不关心,只有1/5的学生参加评教时态度“非常认真”*蔡敏、张丽:《大学生参与教师教学评价的调查研究》,《高等教育研究》,2005年第3期,第69-73页。,超过1/3学生不清楚教师对评教持何种态度,70%的学生认为教师只是“可能会”因评教提高教学质量。

(2)教师态度

教师多赞成评教,但持怀疑态度的也不少。中西方均有不少研究表明,教师虽然认为评教有助于改进教学,却对学生评教的能力不太信任。教师的这种态度也反映在评教之后的行动之中。西方有研究表明,教师很少因评教而改变教学方法*Nasser,F.and B.Fresko.Faculty views of student evaluation of college teaching.Assessment & Evaluation in Higher Education,2002,27(2):187-198.。国内研究发现,大多数教师不会刻意迎合学生,但有40%的教师会为了得高分而照顾学生的感受,而1/5的教师则认为自己教学的创造性因评教而受到抑制*蔡敏、张丽:《大学生参与教师教学评价的调查研究》,《高等教育研究》,2005年第3期,第69-73页。。

(3)研究者态度

西方的评教研究已走过80多年,大多数研究者相信评教是“可靠、有效且有价值的教学评估手段”*Wachtel,H.K.Student evaluation of college teaching effectiveness:A brief review.Assessment & Evaluation in Higher Education,1998,23(2):191-212.。虽然有人对评教结果用于人事决策表示质疑,但根据Marsh*Marsh,H.W.Students’ evaluations of university teaching:Research findings,methodological issues,and directions for future research.International Journal of Educational Research,1987,11(3):253-388.的观点,任何人事决策中都存在不确定性,而相对于评价员工的所有其他手段而言,评教经过研究并得到数据支撑,因而可谓最好的评价手段之一。

国内的研究者普遍认为,评教目前有重评价轻发展的倾向,通过评教来考核和评价教师,却很少考虑如何促进教师的职业发展。评教的真正意义在于给学校、教师和学生一个不断提升的契机,然而当前国内高校评教却以考核教师为目的,

这等于混淆了评教的目的与手段*黄桂:《分数膨胀与等级膨胀:评教系统双重失效原因探析——基于某部属重点高校大学生评教的视角》,《高教探索》,2011年第6期,第95-103页。。很多人呼吁,管理者不能只热衷于把评教结果用于人事决策和教学管理,而应积极建立师生沟通渠道,并为教师提供职业培训和专家指导,建议将学生评教与同行评价、领导评教、督导评价等方式结合起来。

四、结语

通过对中西方相关文献进行内容分析,我们对学生评教方面的研究方法、关注点、研究问题与结论进行全面深入的梳理,对中西方研究的现状、发展趋势以及存在的问题等方面的异同进行比较,从而对该领域有了较为全面而清楚的认识。可以看到,国内研究多采用非实证性研究方法,最为关注的是评教管理,极少关注评教结果的解读;而西方研究多采用实证性研究方法,关注点相对比较均衡,关注程度较高的除评教管理之外,还有影响评教的非教学因素以及问卷设计。这说明国内研究更注重如何建立与实施评教制度;西方研究则更注重评教制度建立之后应当如何完善,注重如何增强评教的科学性和有效性,这些可以成为国内研究今后发展的方向。

从评教研究出发,我们还注意到一些存在的问题和有待加强的研究方向:

1)目前国内评教研究量大,却多为思辨加讨论,缺乏实证性研究。应当注重科学的研究方法,以便减少主观性和随意性、增强研究的可信度。

2)目前国内研究更为关注操作层面的具体问题,对于评教的科学性重视不足。应加强基础研究,包括设计适合中国文化的评教问卷、制订针对特定学科的评教维度和指标、科学地界定和解读教学质量,等等。

从评教研究以及评教实践出发,可以得到如下启示:

1)评教问卷设计是一个系统工程,既要有科学的理论支撑,也要考虑实际情况。要制定客观合理的评教维度和指标,考虑评教的学科环境和文化环境,并且征询师生意见。

2)评教过程不应流于形式,应加强科学细致的管理。要向教师说明评教的内容、目的和用途,得到教师的认同并告知其努力的方向。评教之前要向学生说明评教的目的和用途,特别要解释评教指标的内涵,以便提高其评教能力,同时避免学生打分时受到与教学无关因素的影响。

3)评教结果应得到科学的解读。可通过实践以及研究,逐步建立关于“有效教学”和“好老师”的科学认识,解读评教结果时除了看总分还应了解教师的“个人轮廓”,要结合教师发展而谨慎、细致地对待每一位教师。

4)运用评教结果要合理。应区分总结性评价和形成性评价,改变“重评价轻发展”的做法,避免挫伤教师的工作积极性。

5)为达到监督和提高教学质量的评教目的,可建立配套的专家咨询制度,帮助教师进行诊断和提高。

总之,与西方相比,中国高校开展评教的时间不算长,不少学校还处于不断总结的阶段,各方对评教的态度不一也很正常。然而,由于评教工作不仅关乎教学质量的提高,而且会影响教师对教学工作以及教师角色的认知,关系到教师个人的职业发展,所以有必要加强评教方面的研究,以便充分发挥评教的作用,促进我国高等院校教学质量不断提高。

附录(一)11种英文期刊

1.AmericanEducationalResearchJournal,2.Assessment&EvaluationinHigherEducation,3.BritishEducationalResearchJournal,4.HigherEducation,5.HarvardEducationalReview,6.HigherEducationResearch&Development,7.JournalofEducationalPsychology,8.ResearchinHigherEducation,9.ReviewofHigherEducation,10.ReviewofEducationalResearch,11TheJournalofHigherEducation

附录(二)32种中文期刊

1.《比较教育研究》,2.《大学教育科学》,3.《当代教育科学》,4.《电化教育研究》,5.《复旦教育论坛》,6.《高等工程教育研究》,7.《高等教育研究》,8.《高教发展与评估》,9.《高教探索》,10.《国家教育行政学院学报》,11.《河北师范大学学报(教育科学版)》,12.《黑龙江高教研究》,13.《华东师范大学学报(教育科学版)》,14.《江苏高教》,15.《教师教育研究》,16.《教育发展研究》,17.《教育科学》,18.《教育理论与实践》,19.《教育评论》,20.《教育探索》,21.《教育学术月刊》,22.《教育研究》,23.《辽宁教育研究》(已改名为《现代教育管理》),24.《清华大学教育研究》,25.《全球教育展望》,26.《外国教育研究》,27.《现代大学教育》,28.《现代教育技术》,29.《学位与研究生教育》,30.《中国大学教学》,31.《中国电化教育》,32.《中国高等教育》

(责任编辑蒋重跃责任校对刘伟孟大虎)

Teaching Evaluation by Students:A Comparison between Studies done in China and in the West

YANG Xue-yan1,TAO Xin2

(1.Department of English Language and Literature,Fudan University,Shanghai 200433;2.School of Health Management and Education,Capital Medical University,Beijing 100069,China)

Abstract:Teaching evaluation by students has an impact on both teaching quality and teacher development, but has not drawn enough attention from researchers in China. This paper presents a content analysis of 349 relevant articles published in peer-reviewed Chinese and Western journals in the past 40 years, comparing studies done in China and in the West in terms of methodology adopted, focus of attention, issues investigated, and findings made. It is found that studies done in the West tend to adopt empirical methods, and studies done in China non-empirical methods; the former are more concerned with the validity and effect of teaching evaluation, and the latter the establishment and implementation of the system of teaching evaluation; and the former put more emphasis than the latter on the scientific designing of evaluation questionnaires, careful handling of the evaluating process, and proper interpretation and application of evaluation results. By offering a thorough and critical review of the state of the art, trends of development, and problems left unsolved in the area, the paper points to directions for further research into, and practice of, teaching evaluation in Chinese universities.

Keywords:teaching evaluation by students; teaching quality; teachers; content analysis; China and the West

[收稿日期]2015-12-12

[中图分类号]G64

[文献标识码]A

[文章编号]1002-0209(2016)03-0015-11

猜你喜欢
学生评教内容分析教学质量
努力改善办学条件 不断提高教学质量
提高教学质量,重在科学管理
2016年《中国日报》“两会”数据新闻报道研究
从《远程教育》35年载文看远程教育研究趋势
高校学生评教有效性分析与策略研究
残疾大学生评教制度效果和问题研究
关于民办高等学校学生评教可靠性的研究
如何提高英语课堂教学质量
提高语文教学质量的几点思考