浅析SPSS软件在物理试卷分析中的应用

2011-07-25 03:21马功平
物理教师 2011年9期
关键词:区分度信度试卷

马功平

(慈溪市杨贤江中学,浙江慈溪 315300)

美国教育心理学家布卢姆认为,评价是一种获取和处理用以确定学生水平和教学有效性的证据的方法.测试则是评价的有利工具,高质量的试卷能检验教学效果和反映学生的学习能力,从而体现评价的科学性,有效地对教学加以监督和调整.鉴于目前多数教师凭借经验出题,不仅不能保证试卷应有的质量,不能全面客观地检测学生的学习效果,而且由于缺乏必要的简单统计知识,对考试结果不能做出正确的解释,致使考试结果中蕴藏的大量信息白白浪费.全面的试卷分析往往考试人数众多,指标算法繁琐,工作量大,目前尚无较好的试卷分析软件.本文尝试使用SPSS统计软件进行试卷分析,其具有实用、简单、可操作性强等特点,能满足试卷分析全部指标的分析计算,以期抛砖引玉.

1 SPSS软件简介

SPSS(Statistic Package for the Social Science)是由美国SPSS软件公司开发的大型社会科学统计软件包,它集数据整理、分析和结果输出等功能于一身,是世界上最早的统计分析软件之一.目前该软件的版本数据管理和分析功能强大,界面友好,操作简单,全部为视窗菜单式操作、编辑,具有灵活的变量变换和文件交换系统,多种统计图表的结果输出,并与Microsoft Office软件兼容等特点,已经广泛应用于医学、心理学、人文学、生物学、教育学等领域.

2 试卷分析统计指标

根据教育评价理论,试卷分析包括试卷成绩分析和试卷质量分析两个部分,结合试卷分析要求和自身的实践,试卷分析具体指标主要包括以下几个方面.

2.1 试卷成绩分析

涉及指标有学生总数、参加考试人数,最高分、最低分,平均分与标准差,优秀、良好、及格与不及格的人数分布及百分比等.以上指标要求按班级、年级对试卷成绩及总评成绩进行分析.

2.2 试卷质量分析

定量指标:难度指数 P、区分度D、信度 r、效度等.

定性指标:试卷覆盖面、内容效度、卷面失分原因分析;试题的表述是否科学、正确;名词术语是否准确;选择题备选答案设计是否合适、排列是否随机;参考答案是否正确、卷中内容是否对答案有提示等.

2.3 成绩的差异性检验

在进行试卷分析时,不能孤立地去看每个班的成绩.有必要比较不同班级的成绩,不同班级间成绩等级分布,从而有助于分析班级间存在的差异.涉及的指标有独立样本的T检验及 χ2检验等.

3 SPSS在试卷分析中的应用

选取了慈溪市某高中2010学年同一任课教师任教的高一两个平行班的物理期末成绩为样本,浅析SPSS软件在物理试卷分析中的具体应用.

3.1 课程基本情况及数据录入

3.1.1 课程基本情况及试卷结构(如表 1,表2所示).

表1 课程基本情况

表2 试题分值分布

图1 数据定义

3.1.2 数据录入

数据文件的建立可选用Excel、dBase、SPSS等软件进行,Excel、dBase数据文件可以转换到SPSS数据文件.本文选用SPSS软件建立数据文件,行为记录,列为变量.单击Variable view 标签,在Name标题下定义:学号、姓名、题号……期末成绩等.其中各题和期末成绩均定义成Numeric类型,Decimals(小数点后长度)为0,其余各项使用默认(见图1).再单击Data View标签,逐个录入每个记录数据,即学生信息和每题得分.

3.2 试卷成绩分析

3.2.1 成绩的基本描述性统计

考试成绩的基本描述统计量包括均值(mean)、标准差(Standard Deviation:Std Dev)、偏度(Skewness)和峰度(Kurtosis)等.均值代表数据的集中趋势;标准差可用来描述数据的离散程度,标准差越大说明数据间的差异越大;偏度和峰度用来描述数据分布是否对称,偏斜程度如何,分布陡缓程度等.

以年级为单位,对试卷进行成绩的基本描述性统计.步骤如下:①单击 Analyze→Descriptive Statistics→Descriptives;②将需计算的变量“期末成绩”移入Variable(s)框中;③再单击Options按钮,选上mean、Std Deviation、Skew ness、Kurtosis四个指标;④最后点击OK 按钮(见图 2).操作完毕即可得表3的结果.

图2

表3 总体成绩基本描述性统计

以班为单位,对试卷进行成绩的基本描述性统计.拆分文件:单击 Data→Spilt File→Organize Output by Groups,将“班级”变量移入Groups Based框中,再单击 OK按钮,即可将数据按“班级”拆分.再按上述步骤可完成对不同班级的成绩的基本描述性统计.(见图3)

图3 班级拆分对话框

3.2.2 成绩等级比率统计

在进行试卷分析时往往还要统计成绩等级的人数及所占的比例,比如90分以上的,70-80分数段之间有多少人等.步骤如下:①将百分制分数转换成优秀(≥80分),良好(79~70),及格(69~60),不及格(<60)4个等级;②单击Transform→Recode→Intodifferent variables;③将“期末成绩”变量移入Numeric Variable→Output Variable框中,并在Output Variable框中输入“期末成绩等级”;④在Name框中单击Old and New Values按扭,选择 Range,在其下框中输入相应的分数范围,在New Value栏中Value的框中输入相对应的分数等级,单击Add逐个添入;⑤单击Continue及OK按钮;⑥单击 Analyze→Descriptive Statistics→Crosstabs,将行变量“班级”移入到 Row(s)框中,将列变量“期末成绩等级”移入到Column(s)框中;⑦单击Cells按钮,在Percentages框中选择 Row、Column和 Total(见图 4),操作完毕即可得表4.

图4 成绩转换为分数段对话框

表4 各班物理成绩等级分布

本卷统计发现,学生较多集中在及格(30.5%)和不及格(36.9%)段,优秀和良好段分布相对较少(占32.6%),说明本试卷适中.

3.3 试卷质量分析

3.3.1 试卷的难度系数

表5 各大题难度系数

通过试卷各题的难度表可以看出,试卷难度程度为0.65,难易适中,基本能客观地反映出学生的学习效果.其中题 1、2、3、5、13、16、21题偏易,需适当增加难度,而题 9、11、23偏难,期末考试不是选拔性考试,应适当降低难度.

3.3.2 试卷的区分度

区分度是指某次测验对考生实际水平的区分程度,用符号D表示,其数值范围为[-1.00,+1.00].一般情况下,D≥0.4,具有较好的区分度;0.3≤D<0.4,良好,如能改进更加理想;0.2≤D<0.3,区分度尚可,但还需加以改进;D<0.2,区分度较差,该试题需淘汰.

区分度的计算方法很多,对于主观题来说,使用等级相关分析即采用Serarman相关分析;对于客观题来说,看成是非等间距测度的连续变量,采用皮尔逊(Pearson)相关分析.在SPSS中单击Analyze→Correlate→Bivariate,把计算相关分析的系数的期末成绩,单1、单2等变量选到Variables,选择Pearson相关系数.输出结果的每小题与期末成绩之间的相关系数即为区分度.

经整理可知本卷客观题区分度一般,题2、3、5、13、16、21的区分度不够,需要淘汰或调整.但整张试卷的区分度适中,学生之间的实际差别,学生之间的差距基本拉开,学生所掌握的知识范畴及对知识的理解程度、巩固程度和运用能力就能得到了充分体现.

3.3.3 试卷的信度

信度是指同一个测试对同一组测试两次或多次得分的一致程度,它通常反映了考试的可靠性.在SPSS软件中一般采用科隆巴赫(Cronbach)α系数,其取值范围为 0~1,值越大,信度越高.一般认为标准化能力测试或升学测试信度应在0.90以上,对于教师自编测试信度达到 0.60即可.步骤如下:①单击Analyze→Scale→Reliability Analysis;②在对话框中将所有表示题目的字段全部移入Items框中;③在Model栏中选择Alpha方法.操作完毕即可得分析结果Alpha=0.689,可见本次考试的信度一般.为了提高试卷的信度,可以适当提升试题的质量,保持试题的难度接近正态分布,提高试题的区分度,严格监考和按评分标准给分等.

3.4 成绩的差异性检验

在进行试卷分析时,对于同一个教师执教的平行班的成绩差异,除了与两个班的平均分有关,还与标准差和样本数有关.如果要判断两个班级的成绩差异是否显著,就需要进行均值的差异性统计检验——独立样本t检验.其步骤如下:①单击Analyze→Compare→Independent-Samples T Test;②将检验变量“期末成绩”移入 Test Varibles(s)框中;③将总体标志变量“班级”移入Grouping Variables框中;④单击Define Groups按钮定义“班级”的标志值(见图 5).操作完毕即可得表6.

图5 两个班级的独立样本t检验

表6 两个班级的期末成绩独立样本t检验结果

通过独立样本t检验结果显示,Sig.(2-tailed):p=0.10>0.05,说明两者之间并无显著差异,由此不难分析出尽管两班之间的平均分相差2.01分,但两班成绩无显著差异.

3.5 试卷的综合分析

综合分析是在上述统计分析和检验结果的基础上定出的总体定性结论.通过利用SPSS软件得出了该次期末试卷与成绩的初步评价,试卷基本上覆盖了《物理》必修1教材中的主要知识点,且各章节所占的分数基本上与各章的课时所占的比重成正比,分布合理.本次考试的平均分是65.34分,标准差是14.67,成绩基本上符合正态分布.试卷的难度系数是0.65,相对比较合理,区分度适中,基本能区别学生的真实水平,另外信度系数为0.689,信度一般.再则通过两个班级的期末成绩独立样本t检验表明两个班级学生对知识的掌握程度并无显著差异.总之,本次物理考试的试卷符合新课标的要求,题型合理、题量适中、难度一般、区分度适中,有利于激励学生的积极性,能促进教师完善教学手段和方法.

猜你喜欢
区分度信度试卷
《广东地区儿童中医体质辨识量表》的信度和效度研究
浅谈试卷分析常用的几个参数及其应用
图形推理测量指标相关性考察*
Module5 A Trip Along the Three Gorges
Module5 Great People and Great Inventions of Ancient China
Module 4 Sandstorms in Asia
Module 1 Europe
浅观一道题的“区分度”
科技成果评价的信度分析及模型优化
单维参数型与非参数型项目反应理论项目参数的比较研究*