基于正态分布的成绩分析

2019-05-22 10:27孙永科熊飞
电脑知识与技术 2019年6期
关键词:正态分布学习能力

孙永科 熊飞

摘要:该文介绍了一种学生成绩等级的划分方法,按照正态分布的3-sigma理论将学生的成绩划分为不同的等级。与传统的纯数字成绩比较,该方法屏蔽了试卷和课程的难易程度的影响,配合线箱图可以反映学生的成绩分布和个体成绩等级。

关键词:正态分布;学习能力;线箱图

中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2019)06-0207-02

A Visual Analysis of Students Score Based on Normal Distribution

SUN Yong-ke, XIONG Fei

(Southwest Forestry University, Kunming 650224, China)

Abstract: This article presented a visual analysis of students score which divide students into different levels according the 3-sigma theory about normal distribution. Compared with traditional method which only display number, this method has ability to estimate the level of student more accurately than before, it can easily display the distribution of class scores and personal position in class level.

Key words: normal distribution; ability of study; box plot

1 背景

每个学期结束时,学校都要进行学生成绩分析,并给学生家长发放学生成绩通知单。传统的学生成绩通知单中只包含各科成绩的列表,信息量比较少,缺乏成绩的分布信息,所以家长很难了解学生的学生情况。例如某门课程的成绩90分,这并不能说明该学生学习水平高,可能本次试卷简单,90分也许是全班的最低成绩;因为试卷难度不同,分数会表现出不同的差异,仅仅通过考试的成绩很难对学生的学习水平进行正确评价。文献[1-3]中作者使用统计学方法分析学生成绩,从不同的角度展示成绩的分布特点,但是结果复杂需要相关的专业知识才能理解。目前成绩分析研究热点是课程的重要性分析和关联度分析[4-8]。

利用学生成绩总体呈正太分布的特点,结合正态分布理论,学生的成绩可以划分为5个不同的等级。这种划分方法不仅可以描述成绩的整体分布情况,而且还可以的描述个体与整体之间的关系。有利于了解学生的个人学习情况和整体的成绩分布。

2 原理介绍

近几年关于学生成绩分布的研究都认为:学生的成绩一般都呈正太分布[9-11],文献[11]中作者利用R语言对一高等学校的学生进行了分析,再次证明了学生的成绩呈正态分布,同时作者還进一步解释了学生成绩与正态分布之间的关联关系。在正态分布理论认为学生的成绩应该集中分布在平均分附近,多数人的智力水平都处于平均水平,成绩越远离平均分,人数越少,其分布图类似一个对称的山峰。利用概率可以把学生的成绩划分为优、良、中、低和差5个等级。以图1为例,人数最多的区域被划分为中间水平,覆盖了50%的学生对应图中Q1和Q3之间的区域;两端的24.65%分别被划分良和低,成绩良好的占24.65%,对应图中的UCL和Q3之间的区域,成绩低的也占24.65%,对应图中LCL和Q1之间的区域。优秀的数量和差的数量最少,分布在最两端共占0.7%。

Box线箱图基于上述的划分原则,按照比例对数据进行可视化展示。箱子(矩形区域,如图2所示)的上下边界分别对应Q1和Q3,上尾线对应UCL,下尾线对应LCL。利用box线箱图可以清楚地看到班级的成绩分布和个人的成绩所处的位置,不同课程进行比较,还可以了解课程之间的难度差异。

线箱图中没有出现班级中其他学生的成绩,保护了其他学生隐私。但是通过观察箱子、尾线和原点(黄色的原点表示学生的成绩位置,如图2所示)的位置,可以让学生和家长非常容易地了解到班级整体的成绩分布和学生个人成绩的位置。

3 分析实例

以表1的学生成绩为例。表中的《C语言程序设计实习》成绩是90分,《英语》是69分。如果按照成绩的高低评判,《C语言程序设计实习》成绩远高于英语的成绩,多数人很容易认为该学生的《C语言程序设计实习》成绩好,英语的成绩差,但实际情况却恰恰相反。

同样的学生成绩,使用线箱图进行可视化分析结果就和之前的分析出现了明显的。图2是该学生的线箱图,在图中的每一列分别代表一门课程,课程代码与表1中的代码相同。图2中的C2列是《C语言程序设计实习》的成绩分布,蓝色的矩形框是50%学生成绩的分布区域,黄色的点为当前学生的成绩。可以清晰地看出虽然该门课程的成绩是90分,但是该学生的成绩仍处于平均水平。C7列为英语成绩,虽然学生的成绩是69分,但是图中的黄点已经明显的超出了矩形框的上边界,说明该学生的成绩高于班级的平均水平。

课程C2的矩形区域比C7的长,说明C2的成绩比C7的成绩分散,成绩分散说明成绩的集合的方差比较大,意味着学生之间的差异比较大。C2中箱子位置比C7的位置高,说明C2的成绩整体比C7的成绩高,位置高说明班级中多数人的成绩都比较高,学习效果比较好。线箱图按照成绩人数的分布划分成绩等级,等级的界定与成绩本身没有关系至于人数的多少有关系,这样能很好体现个体在群体中的排名位置。

对比表1和图2的结果发现:表1中的课程只有成绩没有标识等级区域,学生的等级只能按照成绩分数来判断,二在图2中不仅可以看到成绩而且还可以清楚地看到成绩所处的等级区域,按照表对学习进行登记划分出出现一些偏差,例如,表1中课程C7的成绩只有69分,C2的成绩有90分,仅从这个数字来衡量,很容易错误地认为该学生课程C2的成绩等级比C7的等级高。但是,在图2中C2的成绩处于平均水平,而C7的成绩却高于平均水平,等级排名比较靠前。

单纯地依靠成绩来衡量学生的学习能力,不能客观全面地反应学生的学习能力和水平。课程难度差异和试卷难度差异都会对这个评价结果产生比较大的影响。而通过线箱图来评价学生的学习能力,重点考察成绩的分布特点和个人的排名位置,反映的是学生在班集体中的学习水平。因此后者的排名更为科学合理。

4 总结

基于线箱图的学生成绩分析方法可以对学生成绩进行等级划分,可以展示课程成绩的分布特点。教学机构使用该方法,可以快速地掌握学校的教学情况。使用该方法进行不同课程之间的比较,可以及时发现课程难易程度的差异;进行相同课程之间的比较,可以发现不同班级之间的差异。使用线箱图制作成绩通知单,图中不出现其他学生的成绩信息,保护了其他学生的个人隐私,同时又能够清晰地把学生的成绩、成绩等级和大概位次告知家长,方便家长有目的地对学生进行家庭辅导。

参考文献:

[1] 许德泓. 大学生学习能力达成评价指标体系的研究[J]. 国家教育行政学院学报, 2016(12):66-71.

[2] 张玲. 考试成绩评价指标的统计分析及研究[J]. 数学学习与研究, 2018(5).

[3] 马奕, 涂淑珍, 吕卫平. SPSS统计分析在成绩评价中的应用[J]. 龙岩学院学报, 2015(2):110-114.

[4] 王成勇. 基于關联规则Apriori算法的学生成绩分析[J]. 价值工程, 2018(5):17-171.

[5] 陈喜华, 黄海宁, 黄沛杰. 基于聚类分析的学生成绩分析[J]. 清远职业技术学院学报, 2018(2).

[6] 李曦. 多元统计在学生成绩分析的运用[J]. 南昌航空大学学报: 自然科学版, 2006,20(3): 58-62.

[7] 石平. 基于决策树分类的成绩分析系统研究[J]. 长春师范大学学报, 2018(2).

[8] 李娟, 杨丽丽. 学生成绩分析系统的设计与实现[J]. 河北职业教育, 2009,5(10): 143-144.

[9] 孙文兴, 陈智刚, 罗婕, 等. 成绩数据无量纲化在学生综合测评中的应用[J]. 昆明冶金高等专科学校学报, 2017, 33(5): 87-91.

[10] 龚玉玲, 徐晓栋. 基于SAS的学生成绩混合正态分布的研究[J]. 江苏科技信息,2018(1).

[11] 王培. 学生成绩与正态分布之关联[J]. 现代经济信息, 2017(3):382-382.

【通联编辑:谢媛媛】

猜你喜欢
正态分布学习能力
基于对数正态分布的出行时长可靠性计算
谈如何培养小学生的数学学习能力
学业导师制对本科生学习能力和素质教育造成的影响
关于二维正态分布的一个教学注记
正态分布题型剖析
χ2分布、t 分布、F 分布与正态分布间的关系
基于Copula函数对二维正态分布中常见认识误区的分析