物理中考试题与内容标准的一致性研究

2012-07-19 08:01张宁波
物理教师 2012年8期
关键词:表格一致性试卷

张宁波

(南京第九初级中学,江苏 南京 210018)

1 问题的提出和研究的意义

我国初中物理课程标准的实施至今已有10年,在这次课程改革中,课程理念、课程目的、课程框架和内容要求等方面都有了很大的改变,中考也应随着新课程发生一定的变化.研究表明,只有当考试与课程要求的内容标准相一致的时候,教学才有希望与内容标准相一致,教育系统的其他因素比如职业发展也才有希望跟内容标准保持一致.[1]这意味着中考与课程改革的平行推进,势必有助于促进我国初中新课程朝着积极、有益的方向发展.课程改革的最直观表现就是用课程标准取代沿用已久的教学大纲,各学科课程标准的研制是课程改革的核心工作.《基础教育课程改革纲要(试行)》明确指出,“国家课程标准是教材编写、教学、评估和考试命题的依据,是国家管理和评价课程的基础.”[2]因此,中考的考试内容及要求理应与初中课程标准保持一致,才能有效地促进学生发展,实现教育公平,实现最基本的物理科学素养,落实新课程标准.实际情况如何呢?

多年来对课堂教学内容和评价的关注不难发现:在中考试卷中反映出的实际考查项目与标准要求的内容以及相应的分值存在着出入.这给一线教师的教学带来一定的干扰.教师们主要根据考试的内容、要求和命题方向调整着自己的教学,而往往忽视了课程的内容标准,使得教学本末倒置.本研究正是基于以上的背景,尝试通过量化分析的方法,分析2011年N市中考物理试卷与初中物理课程标准之间的一致性情况,以期为新课程背景下的课堂教学与考试评价工作的开展和决策提供基于研究的一些证据.

2 研究现状

在美国,对州内容标准和州标准化测验之间的一致性研究一直在进行着.美国国家研究理事会(NRC)授权进行的一项回顾性评论表明,州内容标准和标准化测验之间的一致性现状总体来说不容乐观.美国教师联合会认为只有11个州的内容标准和测验之间的一致性良好,而各个州和测验发行商的报道则认为除了3个州以外,其他所有州的内容标准与测验一致性良好.

文献[3]对美国纽约、新加坡和中国江苏的物理内容标准与标准化测验的一致性进行了比较研究,最后分析出的数据是,中国和新加坡的porter一致性指数都是0.67,纽约州的是0.8,从而得出了这样的结论:美国纽约州的物理内容标准和标准化测验之间有显著的一致性,而中国和新加坡则不具有这种显著的一致性.

此外,还有童莉、黄翔的在《数学教育学报》上的《寻求课程的一致性——对美国数学课程焦点的分析与思考》,朱行健,李勇的《新课程物理高考考试大纲与课程标准的匹配性研究》(课程·教材·教法),陈娴等的《物理内容标准与考试之间的一致性研究》(课程·教材·教法),北京师范大学郭玉英等做了关于高中物理课程标准和山东、宁夏、海南、广东省某年的学业水平考试一致性的研究等.

3 研究方法和流程

(1)一致性的测量方法.

研究一致性的问题,需要用可接受的方法来衡量内容标准和评价体系的一致性程度.不同的一致性研究方法有不同的测量手段,并且复杂性程度也是不同的.本研究采用美国学者安德鲁·帕特(Andrew Porter)和约翰·史密森(John Smithson)所开发并研制的评价与课程标准一致性水平分析程序和方法,即“SEC”一致性分析范式.

利用这种方法,我们分别对物理内容标准和标准化测验进行内容主题和认知水平两个维度的划分,从而把物理内容标准和试卷转换为具有两个相同结构的表格,两者间的一致性是基于两个表格对应单元格值的符合程度.为了便于两个表格的比较,所有单元格值都被转化为总和为1的比率,形成两个与之相对应的比率表.

Porter一致性指标P被定义如下:

其中,n是表格中单元格的总数;i代表表格中一个特定的值,范围是从0到n.

例如,对于一个5×6的矩阵表格,共有30个单元格值,因此n=30.Xi代表表格X 的第i个值(例如物理内容标准表格),Yi代表对应表格Y中的第i个值(例如试卷表格).Xi和Yi都是比率从0到1的数值.X1到Xn的总和等于1,Y1和Yn的总和也等于1.内容标准表格和试卷表格的第i个单元格值之差可以被计算,即是Xi—Yi.通过把两个表格相对应的全部单元格值的绝对差值相加求和可以把总的绝对差值计算出来.然后计算帕特的一致性指标,来反映两个表格全部对应单元格值的总差异.

一致性指数P的范围是从0到1,0表示内容标准与试卷之间的差异性最大,1表示二者完全一致.对于5×6的表格,在0.05的显著性水平上具有统计学意义,一致性指数需达到0.780.[3]

(2)研究流程.

① 内容与认知水平的分类.

研究者采用帕特(2002)的通用编码框架——内容×认知水平矩阵来对初中物理课程标准和中考物理试卷进行编码.编码之前,首先需要对内容和认知水平进行分类.

我国全日制义务教育物理课程标准(实验稿)中的内容标准分为两大部分,科学探究和科学内容.考虑到科学探究既以科学内容为载体,也是教学的一种手段和方法,我们只对科学内容进行了量化分析.这里共有五个内容主题:能量、运动和力、电、波、物质的特性.每个内容主题都包含了一系列分主题.[4]

认知水平的分类是按照修订后的布卢姆认知目标分类,它包括从低级到高级的6个水平:记忆、理解、应用、分析、评价、创造.在每个水平中又分为多种具体类别,对此,布卢姆的有关专著和一些学者的研究中有详细说明.[5]

② 内容与认知水平的编码.

参与此项研究的是两位物理学科在读在职教育硕士.经过培训,两人独立完成了对内容标准和物理试卷的布卢姆认知水平的划分.用SPSS13.0软件计算两人的相关,在p=0.01的显著性水平上,相关都超过0.8.又经过3~4次的讨论和斟酌,两人对内容标准和试卷的认知水平达成了统一的分类,得到了本次研究所需的原始数据,即物理内容标准和中考物理试卷中5个内容主题在6个认知水平上分布的两个5×6数据表格(见表1和表2).

表1 全日制义务教育物理内容标准编码结果(数量)

表2 2011年N市中考物理试卷编码结果(数量)

续表

为了方便比较内容标准和试卷之间的异同,把它们化成各单元格比率值之和为1的比率表(见表3和表4).

表3 全日制义务教育物理内容标准编码结果(比率)

表4 2011年N市中考物理试卷编码结果(比率)

4 研究结果和分析

经过计算,物理内容标准与2011年N市中考物理试卷P值为0.525.

文章的研究方法部分提到,从统计学角度看,对于5×6的矩阵表格,为了使显著性水平(p)在0.05上具有统计学意义,我们需要使一致性指标达到0.780.可见,物理内容标准与中考物理试卷的一致性指标在统计学上都是没有意义的,即物理内容标准与2011年N市中考物理试卷的一致性程度不高.

为了更直观、具体的说明物理内容标准与试卷的一致性程度,下面从3个方面进行分析.

(1)物理内容标准和试卷在5个内容主题上的比较.

如图1,物理内容标准中,“物质的特性”(29%)和“能量”(26%)在所有内容主题里占有的比率值为最大,“电”(10%)为最小;而在2011年N市中考物理试卷中,则表现为对“电”的考查力度明显加大,对“物质的特性”“能量”的考查反而比内容标准中的要求低出很多.

图1 物理内容标准和试卷内容主题的比较

(2)物理内容标准和试卷在6个认知水平上的比较.

如图2所示,物理内容标准中,“记忆”(48%)和“理解”(36%)在所有认知水平中占有的比率值最大,“应用”及其以上的认知水平所占比率很小;而在2011年N市中考物理试卷中,则表现为在“应用”和“分析”水平的考查比内容标准高出很多,而在“记忆”上的考查比内容标准要求低出很多;在“评价”和“创造”上,内容标准的要求和试卷的考查都很少.

图2 物理内容标准和试卷的认知水平比较

(3)物理内容标准和试卷一致性的比较.

我们用二维地形图来表示物理内容标准或2011年N市中考物理试卷中的不同内容主题及认知水平的相对权重,如图3和图4所示.在这些地形图中,灰色区域表示所占权重最小(比率低于0.04),斜阴影部分表示所占权重稍高(比率在0.04和0.08之间),白色区域表示所占权重较高(比率在0.08和0.12之间),雪花点阴影区域表示比率在0.12和0.16之间的比率,黑色区域表示所占权重最高(比率在0.16和0.2之间).把图3和表3联系起来,我们可看到“能量”中“记忆”(0.13)和“理解”(0.12)与“物质的特性”中“记忆”(0.15)的比率值都位于0.12和0.16之间.图3是基于表3中的比率值得到的.用相同的涂色方法可以得到2011年N市中考物理试卷的二维地形图,即图4.

把图3和图4进行比较,能够看出图3中没有表示权重最大的黑色区域,表示权重次大的雪花区域有两个,分别在图3的左上角和左下角;而图4的试卷中,有表示权重最大的黑色区域,为“电”中的“应用”(0.17)的比率值,此外还表现出雪花区域向图中间积聚和集中;表示较高权重的白色区域、阴影区域也都有向右移的现象;内容标准和试卷中的5个主题在“评价”和“创造”水平上都显示为灰色区域.

图3 全日制义务教育物理内容标准地形图

通过比较图3和图4的区域分布,我们可以看出内容标准和2011年N市中考物理试卷的地形图形状有很大不同,也说明了两者之间的一致性不够.

图4 2011年N市中考物理试卷地形图

5 讨论和启示

通过以上研究表明,全日制义务教育课程标准与2011年N市的中考物理试卷之间的一致性程度不够,两者在内容主题和认知水平上存在明显差异.这些差异产生的原因有如下几个方面.

(1)中考的认知水平向高层次推移.

通过以上的数据和图表说明,2011年N市物理中考整体向高层次认知水平推进.课程内容标准中的低等层次认知水平的内容在中考中大幅减少,而高层次认知水平的内容在中考中却大幅增加,无形之中加大教师教学难度和降低了学生学习物理的兴趣.[6]

(2)物理中考兼具选拔和学业水平测试两种功能的性质.

一般而言,考试可以分为“常模参照评价”和“标准参照评价”.前者如“高考”,主要功能是甄别和选拔;后者如“学生学业水平测试”是根据事先制定的课程标准,看学生对于既定课程内容的达成情况如何.两种评价目标不同,各有运用.在常模参照评价中(如中考),由于考试目的指向甄别,为保证考试结果的大致正态分布,考题往往越考越难;而学业水平考试是为学生发展服务的,其应与内容标准保持一致.但有些省市“中考”与“中学学业水平考试”是合二为一的,这必将对一致性造成影响.

(3)物理中考笔试的局限性.

物理中考一般采用的是纸笔测验的形式.纸笔测验确有其优势,但其缺点也是非常明显的,它不适合评价学生的实验技能和科学探究过程;不适合检查学生较高认知水平的发展,如认知水平中的评价和创造等.同时,由于纸笔测验的局限性,一些学生在情感与态度方面是无法测量的,这在很大程度上削弱了一致性.

所以以纸笔测验这种单一评价方式,远远适应不了考查学生多方面学习成果的需要.为了更好地实施新课程,评价应该有更大的改革力度.例如,通过学生的实验报告和研究论文能够比较好地反映实验技能和对科学探究的理解,能够考察学生的分析、评价和创造性水平.

(4)Porter方法的局限性及知识样本的平衡性问题.

Porter方法也有它的局限,而且我们只选了N市中考试卷为样本,选取的样本太少,且不平衡,并不能代表大范围的长时间的一致性.由此带给我们以下一些启示.

① 课程标准制定的科学性.

标准的形成并不是一劳永逸的,考虑到随之建立的评价是高利害的,所以,应该每隔一段时间就要对标准进行再检视和修订.同时,要防止这样的误解,即只有评价可以修改,标准就一定是正确的.事实上,通过评价的数据对标准进行进一步的完善也是一种可行并且必要的方法.“基于标准的评价”的实现,首先需要对课程标准加以具体化的目标描述,只有当标准规定的内容领域具体、清晰时,评价的目标才有可能是明确的,评价才能做到“有的放矢”.那么在进行课程标准制定时,有必要考虑在内容标准的基础上,增加表现标准,使教师在教学过程中能较准确地实施课程标准,进而使教学过程与课程标准也具有较好的一致性.试题的研究者也能更科学地根据课程标准编制试卷,提高评价与课程标准的一致性,体现评价的有效程度.明确、完善的标准为学生、教师、家长、试题编制人员、甚至是社会各界人士都提供了一份对学生期望的清晰图景.[7]

② 明确考试的功能.

当考试具有高利害关系时,教师常被鼓励去追求更高的分数,“为不适当的考而教”,而不是去更好地理解学生学习上的困难;一些消极的甚至不合常理的实践就成为学生学习中常态.在这种情况下,最完美、最有效的考试却导致最糟糕的学习.反观我国的大规模评价(如高考、会考、中考),其竞争色彩过于浓重,强调的是评价的甄别性功能,而发展性功能并没有得以发挥,并没有真正起到学生学业成就质量监测的作用.这样就造成了教学活动围着考试团团转的场景,忽视了评价的发展和监测功能,势必使每一场考试都成为将学校和学生卷入其中的你死我活的决斗.[7]因此,明确不同考试的主要功能,让不同的考试发挥不同的作用至关重要.

③ 评价形式的多样化.

当我们以课程标准的形式规定了我们的学生在完成一定时期的学业之后应达到的目标时,我们的课程标准能否在实践中发生作用也许就取决于评价与课程标准之间的关系了.如果学生学业成就评价与课程标准间不能建立有意义的联系,必然导致课程标准无从落实.课程标准规定的课程目标是多样的,单一的评价方式不可能适应所有的课程目标,因而整合多种类型的评价方式是必然的.

1 Webb,N.L.Issues related to judging the alignment of curriculum standards and assessments.Applied Measurement in Education,2007.20(1):7—25

2 中华人民共和国教育部.基础教育课程改革纲要(试行).北京:人民教育版社,2001.

3 Xiufeng Liu,Baohui Zhang,Ling L.Liang,Gavin Fulmer,Beaumie Kim,Haiquan Yuan.Alignment Between the Physics Content Standard and the Standardized Test:A Comparison A-mong the United States-New York State,Singapore,and China-Jiangsu.Science Education,22December 2008.

4 Ling L.Liang and Haiquan Yuan.Examining the Alignment of Chinese National Physics Curriculum Guidelines and 12thgrade Exit Examinations:A case study.International Journal of Science Education,30(2008):1823-1835

5 盛群力,褚献华.布鲁姆认知分类修订的二维框架.课程·教材·教法,2004(9).

6 陈娴,郑璨璨,陈宁.物理内容标准与考试之间的一致性研究.课程·教材·教法,2010(7).

7 崔允漷,王少非等.基于标准的学生学业成就评价.上海:华东师范大学出版社,2008.109,117,63,46

猜你喜欢
表格一致性试卷
《现代临床医学》来稿表格要求
关注减污降碳协同的一致性和整体性
《现代临床医学》来稿表格要求
注重教、学、评一致性 提高一轮复习效率
IOl-master 700和Pentacam测量Kappa角一致性分析
统计表格的要求
Module5 A Trip Along the Three Gorges
Module5 Great People and Great Inventions of Ancient China
Module 4 Sandstorms in Asia
Module 1 Europe