基于多元线性回归模型的考试成绩评价与预测

2013-10-15 06:13刘仁云冷晓冰臧雪柏
吉林大学学报(信息科学版) 2013年4期
关键词:考试成绩回归方程显著性

孙 毅, 刘仁云, 王 松, 冷晓冰, 臧雪柏

(1. 吉林大学 a. 数学学院; b. 计算机科学与技术学院, 长春 130012; 2. 长春师范学院 数学学院, 长春 130032;3. 中国石油吉林石化公司 信息管理部, 吉林 吉林 132000)

0 引 言

考试是评价学生学习情况的一种考核方式, 教师可通过对考试成绩的分析准确了解学生对知识的掌握程度, 并有针对性地调整教学方法及教学模式[1]。正确、 客观的评价考试成绩是每个教师都需要面对的问题。

合理有效的成绩评价一方面可帮助任课教师反思课堂教学中的不足; 另一方面也能帮助出题教师正确估计学生的学习状态, 尽最大可能避免负面影响产生, 在一定程度上将会对后续课程如何教学提供重要参考[2,3]。笔者提出的考试成绩评价与预测方法就是基于这两个方面的考虑。

2 考试成绩评价回归模型

笔者通过一个实例阐述考试成绩评价与预测的回归分析法。

收集某校非英语专业50名学生1~3学期英语期末考试成绩, 根据所给数据建立合理的考试成绩模型, 并预测这50名学生的英语四级考试成绩。

2.1 假设及变量说明

1)y: 英语四级考试成绩;

2)x1: 第1学期英语期末考试成绩;

3)x2: 第2学期英语期末考试成绩;

4)x3: 第3学期英语期末考试成绩;

5)β0,β1,β2,β3为未知参数, 其中β0为回归常数,β1,β2,β3为回归系数;

6)ε为随机误差。

2.2 模型建立与求解

依据题意建立多元线性回归模型[4,5]

y=β0+β1x1+β2x2+β3x3+ε

(1)

对于随机误差ε, 假设

E(ε)=0, Var(ε)=σ2

(2)

则理论回归方程为

E(y)=β0+β1x1+β2x2+β3x3

(3)

对50名学生的成绩获得50组数据(xi1,xi2,xi3;yi),i=1,2, …,50, 则模型可表示为

(4)

则模型可化为矩阵模式

y=Xβ+ε

(5)

模型满足下列条件。

1) 自变量x1,x2,…,x50是确定性变量, 且rank(X)=3+1<50, 即X为一个列满秩矩阵。

2) 满足高斯马尔科夫条件(G-M条件), 即

(6)

3) 正态分布的假设条件为

条件1)说明其为自变量确定性的回归问题。条件2)说明随机误差的平均值为零, 且没有系统误差。随机误差项εi的协方差为零, 表明随机误差项在不同的样本点之间是不相关的, 即不存在序列相关。条件3)说明误差项是正态分布, 在实践中是合理的。

在满足条件1)和条件2)的前提下, 多元回归模型的矩阵式(5)可写成

(7)

若同时满足条件1)~3), 多元回归模型矩阵式(5)可简化为

(8)

考虑模型式(8)的检验, 假设

H0:Hβ=c

(9)

其中

rank(X)=p+1, rank(H)=q≤p+1

(10)

3 多元线性回归模型的显著性检验(F-检验)

若对回归方程进行显著性检验, 可假设

H0:β1=β2=β3=0

(11)

如果H0被接受, 则表明用模型式(1)表示y与自变量x1,x2,x3的关系不合适。为建立对H0进行检验的统计量, 可在式(9)中取适合的H和c, 即可构造出式(11), 以检验统计量[6]。显然, 取H=(0,IP),c=0即可。

为建立对H0进行检验的统计量, 将总偏差平方和进行分解得

(12)

(13)

先对H0进行统计量检验, 计算F统计量, 再由给定的的显著水平a,查F分布表, 得到临界值Fa(p,n-p-1)。如果F>Fa(p,n-p-1), 则认定在显著水平a下,y与自变量x1,x2,x3有显著的线性关系, 即回归方程是显著的; 反之, 则认为方程不显著。该检验过程的方差分析公式表如表1所示。

表1 方差分析公式表

经计算求得上述表格中的各项结果如表2所示。

表2 方差分析数值表

显然回归方程是显著的。

4 多元线性回归模型的回归系数的显著性检验(t-检验)

对于多元线性回归模型, 总体回归方程线性关系的显著性, 并不意味着每个自变量x1,x2,x3对因变量y的影响都是显著的[7,8]。因此, 有必要对每个自变量进行显著性检验, 这样可把对y影响不显著的自变量从模型中剔除, 而只保留对y影响显著的自变量, 以建立更为简单合理的多元线性回归模型。

如果某个自变量xj对y的作用不显著, 则在回归模型中其系数βj可取值为零。因此, 检验变量xj是否显著, 等价于检验假设H0j:βj=0。若接受假设H0j,则xj不显著; 反之,xj显著。

5 模型检验

图1 英语四级考试成绩对比图

根据已知的50名学生3个学期的期末考试成绩, 将数据进行初步处理, 应用已建立的模型y=85+1.829x1+0.054x2+4.205x3+ε预测该50名学生在国家英语四级考试中应得的成绩。首先对成绩进行分析说明; 其次说明成绩的合理可靠性; 最后再将预测的50名学生在国家英语四级考试中应得的成绩与其实际成绩相对比, 其结果如图1所示[9]。

由图1可以看出, 两条折线比较吻合。在个别学生的预测中出现不在预测模型中的情况, 造成这种情况有多种原因, 但基本上均为客观原因或极特殊的主观原因导致学生考试成绩出现了偏差。观察折线图, 通过对比可检验模型的有效性, 所预测的成绩基本合理可靠。

6 结 语

应用回归分析模型不仅能评价考试成绩, 还能对成绩进行合理的预测, 通过综上实例, 应用回归分析模型进行考试成绩评价有以下几个优点:

1) 应用回归分析评价考试成绩可得到各种因素对考试成绩影响的大小, 主要体现在自变量的系数上;

2) 通过对模型的显著性检验(F-检验)可初步判断模型的合理性, 通过模型的回归系数显著性检验(t-检验)可找到对因变量影响相对较弱的自变量, 将其剔除, 从而简化模型, 使模型的应用更简单方便;

3) 应用回归分析法评价考试成绩, 不仅能对已知的成绩进行分析评价, 同时能通过数据对未知的成绩进行合理预测, 并且预测结果合理可靠。

但笔者所应用的考试成绩评价模型未考虑到现实中影响考试成绩的全部因素, 导致了极个别学生的预测成绩与实际成绩之间有一定差距, 在今后的实际预测中应多考虑造成影响的因素, 以使误差减小, 当然, 模型也会变得相对复杂。

参考文献:

[1] 胡晓华. 学生心理辅导案例新选 [M]. 杭州: 浙江教育出版社, 2010.

HU Xiao-hua. Case Newly Selected Student Counseling [M]. Hangzhou: Zhejiang Education Press, 2010.

[2]王晋. 大学生心理健康 [M]. 北京: 北京大学出版社, 2008.

WANG Jin. University Student’s Mental Healthy [M]. Beijing: Peking University Press, 2008.

[3]吕丛笑. 由文献量变规律看我国数学研究的发展动向 [J]. 宁波师院学报, 1996, 14(3): 84-88.

LÜ Cong-xiao. The Developments of Mathematical Based on Quantitative Rules of the Literature [J]. Journal of Ningbo Teachers School, 1996, 14(3): 84-88.

[4]施雨, 李耀武. 概率论与数理统计应用 [M].西安: 西安交通大学出版社, 2005.

SHI Yu, LI Yao-wu. Probability Theory and Mathematical Statistics Application [M]. Xi’an: Xi’an Jiaotong University Press, 2005.

[5]李忠范, 孙毅, 高文森. 大学数学-随机数学 [M]. 北京: 高等教育出版社, 2009.

LI Zhong-fan, SUN Yi, GAO Wen-sen. Mathematics-Random Mathematics [M]. Beijing: Higher Education Press, 2009.

[6]冯力. 回归分析方法原理及SPSS实际操作 [M]. 北京: 中国金融出版社, 2004.

FENG Li. Regression Analysis Theory and SPSS Application [M]. Beijing: China Financial Publishing House, 2004.

[7]RAYMOND H MYERS. Classical and Modern Regression with Applications [M]. 2nd ed. Beijing: Highter Education Press, 2008.

[8]DOUGLAS M BATES, DONALD GWATTS. 非线性回归分析及其应用 [M]. 北京: 中国统计出版社, 1997.

DOUGLAS M BATES, DONALD G WATTS. Nonlinear Regression Analysis and Applications [M]. Beijing: China Statistics Press, 1997.

[9]安维默. 用Excel管理和分析数据 [M]. 北京: 人民邮电出版社, 2003.

AN Wei-mo. Manage and Analyze Data Using Excel [M]. Beijing: People’s Posts& Telecom Press, 2003.

猜你喜欢
考试成绩回归方程显著性
采用直线回归方程预测桑瘿蚊防治适期
线性回归方程的求解与应用
线性回归方程要点导学
本刊对论文中有关统计学表达的要求
走进回归分析,让回归方程不再是你高考的绊脚石
基于显著性权重融合的图像拼接算法
基于视觉显著性的视频差错掩盖算法
论商标固有显著性的认定
跳过去
斯诗私塾