以SPSS为工具提升教师数据分析能力

2021-07-29 02:20王晓荣钱旭升
中学历史教学 2021年3期
关键词:区分度信度效度

王晓荣 钱旭升

SPSS是世界上最具影响力的统计软件之一。综合考虑操作简易程度与数据分析效果,SPSS是帮助历史教师提高数据分析能力的最佳选择,本文具体采用SPSS20.0中文版。

一、数据的来源、录入

本文数据以桐庐富春高中高一期末历史考试为例。该校学生成绩在全县居于中等水平,其数据分析结论可推论至全县乃至全市。这是本文以其为数据来源的原因。

SPSS的数据录入通过数据窗口的变量视图和数据视图实现,有手動输入和自动导入两种方式,后者以前者为基础。数据视图与excel相似,可导入excel,在导入时勾选“从第一行数据读取变量名”。导入后,对自动产生的其他变量属性做必要修改。教师可根据要分析的变量的数量对原excel进行删减,只保留各题题号、总分作为变量,每位学生作为一个观察项。可将该excel命名为“高一学生的各题及总分表”。

本次历史考卷有30道选择题每题2分,3道材料题各为15分、13分、12分,共100分。参考学生643名。故本次导入SPSS的变量有34个,观察项有643个,在数据视图中形成34×643个单元格。

二、数据的分析

SPSS的操作是手段,让其跑出我们需要的统计结果是目的。我们无需学会SPSS的所有功能,甚至无需知道其计算、分析的统计学原理,而只需在明确具体分析目的后正确点击、勾选、输入即可。

(一)总分、主观题得分的频数分布分析

总分、主观题得分是多值的,其频数可能呈正态分布。点击分析—描述统计—频率,将“总分”、“t31”、“t32”、“t33”移入“变量”中,点击图表—直方图,勾选“在直方图上显示正态曲线”,跑出直方图。

观察可得,总分、31题略显负偏态,32题、33题为明显负偏态。教师也可通过K-S检验对正态分布进行量化判定。点击分析—非参数检验—单样本,点击“运行”跑出结果。结果显示四个sig.的值都小于0.05,所以四个原假设都被拒绝,即总分、31题、32题、33题的分值频数都不呈正态分布,见表1。

(二)总分、主观题得分的集中、离散趋势分析

集中趋势分析是指用一个代表值来反映一组数据的一般水平,常用统计量有均值、中位数、众数。如表2显示本次考试总分的平均分、中位数、众数分别是47.51分、47分、52分。离散趋势分析是指用一个特别值来反映一组数据相互之间的离散程度,用这个值来说明变量的各个值从这组数据的中间位置向两端离散的程度,常用统计量有全距(又称极差)、标准差、离散系数(标准差与均值的比,又称差异系数)。如表2显示本次考试总分的全距为76﹣22=54分,标准差为10.231分,离散系数10.231÷47.51=21.5%。点击分析—描述统计—频率,将“总分”、“t31”、“t32”、“t33”移入“变量”中,点击统计量,勾选集中趋势下的“均值”、“中位数”、“众数”,勾选离散下的“标准差”、“最小值”、“最大值”,跑出结果,见表2。

(三)试卷全卷及各题质量分析

试卷质量分析的指标主要有:难度系数(P)、区分度(D)、信度(α)、效度(V)。

1. 难度系数

难度系数为平均分与满分之比。一般认为,p≥0.7为较易,0.4≤p<0.7为中等难度,p<0.4为较难。全卷平均分47.51分,难度系数0.48,属中等难度。教师可将各题的平均分、满分做成一个新excel直接导入SPSS。此时SPSS中有变量2个、观察项33个,在数据视图中形成2×33个单元格。SPSS可以根据已有变量“转换”得出新变量。点击转换—计算变量,在“目标变量”框中输入:p的值,在“数字表达式”框中移入或输入:各题的平均分 / 各题的满分,跑出结果,在数据视图增加了一个新变量:p的值。

再对新变量“p的值”进行“转换”,得出另一个新变量:难易程度。点击转换—重新编码为不同变量,在“输出变量”框中输入:难易程度,点击旧值和新值,设置旧值和新值的对应关系:0.7 thru Highest 对应3,Lowest thru 0.3999对应1,0.4 thru 0.6999对应2。然后在变量视图中设置新变量“难易程度”的值标签,1=较难、2=中等难度、3=较易。点击分析—描述统计—频率,跑出难易程度的频率表,见表3。

2. 区分度

区分度是指试题对不同水平考生的区分程度。一般认为,区分度最好大于0.3。教育统计学中利用某试题得分与总分的相关关系作为该试题的区分度,客观题用Spearman等级相关系数,主观题用Pearson积差相关系数。导入excel“高一学生的各题及总分表”,点击分析—相关—双变量,将“t1”到“t30”及“总分”移入“变量”中,勾选相关系数下的“spearman”,跑出结果。主观题的操作相似,区别是将“t31”到“t33”及“总分”移入“变量”中,勾选相关系数下的“pearson”,得出结果,见表4。

结果显示12、13两道客观题的区分度为负数,3道主观题区分度分别为0.707、0.641、0.553。

3. 信度

信度是指测量工具对同一被试进行两次或多次测量的一致程度,是检验试卷反映考生水平可靠性或稳定性的指标。信度有内在信度、折半信度、重测信度等。教育统计学中通常用Cronbachs Alpha系数(简称α系数)测量试卷内部题目一致性来实现对试卷内在信度的检验。一般认为,α≥0.8时信度较好,0.6≤α<0.8时信度相当,α<0.6时信度较差。导入excel“高一学生的各题及总分表”,点击分析—度量—可靠性分析,将“t1”到“t33”移入“项目”中,跑出α的值为0.66。

4. 效度

效度是指测量的有效程度,是检验试卷是否考查了原定考查内容的指标。信度检验稳定性,效度检验精准性,两者常配合使用。效度有内容效度、关联效度。教育统计学中,将结果与效标之间的一致性程度作为试卷效度,这属于关联效度。SPSS中具体使用Pearson积差相关系数,其操作过程与主观题区分度的操作相同。以什么为效标,是SPSS中跑出效度的关键。随着学习推进,会有部分学生进步或退步较大,这会对效度的分析结果产生一定影响,可利用不同效标多跑几次Pearson系数,再综合判定。在效标适当的情况下,效度值要求在0.3~0.7之间,不得低于0.3。如以期中历史考试成绩为效标,先在excel中将每位学生的期中成绩与期末成绩成对,删除因缺考使成绩无法成对的学生后剩下学生606位。在SPSS中导入该excel,变量为期末成绩、期中成绩,观察项为606位学生,得出效度值为0.679。

三、讨论与建议

通过学生成绩、试卷质量两个维度的分析,我们可作如下讨论与建议:

(1)学生成绩。总分、主观题分值频数都呈负偏态分布,说明平均分及上下人数过少,而低于平均分人数过多尤其是32题、33题。频率表显示32题0分有145人占总人数22.6%之多。期末考试作为合格性考试,总分、主观题分值的频数应呈正态或正偏态分布,即中等分值或高分值学生应尽量多。

全卷47.51的平均分、0.48的难度系数,偏低偏难。尤其32题、33题的平均分过低,中位数或众数都只有2分、3分,直接影响区分度。我们建议应适当提高难度系数,降低难度。10.231分的标准差、21.5%的离散系数可以接受,但全距偏大,说明学生的两极分化比较严重,建议教师对低水平学生进行针对性教学。

(2)试卷质量。我们认为期末试卷全卷难度系数控制在0.6~0.7比较适宜。本试卷33道题较易、中等难度、较难的比例为10:15:8,中等难度和较难占比69.7%,应增加较易题。我们认为三者比例5:3:2比较合适。

12、13题的区分度为负数,说明有很多高水平同学反而选错,需要命题者注意,也需要教师反思教学。3道主观题的区分度都较高,说明区分度在主观题的内部分配不很合理。区分度与难度系数有一定关联,为提高难度系数可适当降低区分度。中等难度题的区分度高,过易或过难的题都无法将不同水平学生区分开从而使区分度偏低。

信度为0.66可以接受。全卷信度与各题的区分度有一定关联,当各题的区分度提高后,同一水平学生回答同一题的答案趋向一致,全卷信度随之提升。作为合格性考试,区分度、信度可适当降低。0.679的效度值,反映了本试卷的效度比较理想。

猜你喜欢
区分度信度效度
校企融合背景下,思政教师在职业生涯规划教学中的效度探索
谈高效课堂下效度的提升策略
巧用模型法提高科学课堂教学的效度
《生物统计》的试卷分析与解读
大学生积极自我量表初步编制
浅观一道题的“区分度”
论高职英语多元化综合评价模式的效度与信度
利用垂直平分线的定义巧解题
计算机辅助英语测试研究
墨子论度