基于贝叶斯网络的试卷分析

2014-11-27 14:52王娜
科技与创新 2014年21期
关键词:贝叶斯网络试卷分析

王娜

摘 要:简要介绍了基于贝叶斯网络的试卷分析试验,试验主要用到的工具是基于MATLAB语言编写的BNT软件包。通过试验研究,分析了平时的出勤率、作业提交率等五方面内容对学生成绩的影响。

关键词:试卷分析;贝叶斯网络;概率推理;BNT工具包

中图分类号:TP183 文献标识码:A 文章编号:2095-6835(2014)21-0137-02

考试是教学过程中不可缺少的组成部分,是对教和学的质量检验。考试结果可以反馈出大量的信息——反映出整个教学过程的得失,反映出各个教学环节的情况,反映出学生的能力,反映出学生的学习特点和规律。针对以上几方面,在命题时要有多方面的设计。考试结果可以反映命题和考试本身的情况,也就是测量工具、测量方法和测量过程的情况。分析这些信息,进行一定的思考,提出一些观点和建议,供领导决策时参考,以此作为制订工作策略的依据,为学校老师和学生提供一定的指导。所以说,试卷分析是一件很重要的工作。

1 贝叶斯网络与因果推理

贝叶斯网络又称为置信网络,是基于概率分析、图论的一种不确定性知识的表达和推理模型。一个典型的贝叶斯网络由两部分组成:①有向无环的图,其中每一个节点代表一个变量、属性、状态或其他的实体,节点之间的弧反映了变量间的依赖关系,指向节点X的所有节点被称为X的父节点。②与每个节点相联系的条件概率表列出了此节点相对于其父节点所有可能的条件概率。贝叶斯网络约定以节点Vi的父节点为条件,Vi与任意非Vi子节点条件独立。

2 利用BNT软件包分析试卷

在此次的试卷分析试验中,以过去学生的期末考试成绩为依托,随机抽取了一部分学生的考试信息作为此次试验的原始数据。利用软件筛选、整理这些数据,然后通过基于MATLAB语言开发的关于贝叶斯网络学习的BNT软件包建模,主要完成建立贝叶斯网络的工作,以此来反映选定因素对试卷成绩的影响。影响试卷成绩的因素主要有:A——作业提交率、B——上课出勤率、C——否是留级生、D——主观题得分率和E——客观题得分率。

2.1 为试卷分析筛选数据

第一步:把影响试卷的因素作为变量,即贝叶斯网络模型中的节点,得到的候选数据集如表1所示。其中,R(is pass)标记为该样本的状态值,“1”表示成绩及格,“0”表示成绩不及格。

表1 变量与状态的关系

A B C D E R

0.67 0.85 0 0.78 0.56 1

0.54 0.66 1 0.54 0.39 0

0.89 0.96 0 0.85 0.78 1

… … … … … …

第二步:由于贝叶斯网络是用离散型变量,因此,对原始数据进行处理,数据离散处理结果如表2所示。

例如离散处理“上课出勤率”这一变量。根据教学经验,一般同学的出勤率都在90%以上,如果低于70%,学习成绩很

———————————————————————————

可能不理想,所以,将变量B分为3段——小于70%为low,70%~90%为mid,大于90%为high。

表2 对表1数据的离散处理结果

A B C D E R

high mid no high mid yes

mid low yes mid mid no

high high no high high yes

… … … … … …

第三步:数据格式转换。

根据MATLAB的特点,将数据集转换为矩阵的形式,而且所有属性的取值全部依次编号为1,2,3.

表2对应的矩阵为: .

以由此得到的样本数据集作为模型数据集来构造模型。

2.2 贝叶斯网络的建模

接下来的工作就是以得到的数据建立贝叶斯网络,然后对得到的贝叶斯网络进行参数学习。从得到的贝叶斯网络和学习得到的参数中可以看出选定的因素对试卷的影响。

经过实践,笔者得到的结果是:“上课出勤率”和“作业提交率”是影响其他因素的原因,而“上课出勤率”又可以影响到“作业提交”,这是与限制了父节点个数的结果相同的部分,不同的是:①“是否是留级生”又影响了“客观题得分率”和“主观题得分率”两项。如果出现这样的结果,不难看出,留级生在考试分数上和正班生还是有一定差距的。②“主观题得分率”影响了“是否及格”这一项。出现这种结果是因为在统计数据时,主观题分值占了60%.

从以上试验结果的数据中可以看出,作业提交率和上课出勤率对其他三个因素的影响。

3 结论

对试验结果分析后发现,得到的结果基本符合实际情况。学生的“上课出勤率”和“作业提交率”是影响其学习成绩的重要因素。由此可见,知识是平时一点一滴积累起来的,即便是在大学校园,在日常教学过程中,也应加强对学生的纪律管理,督促学生按部就班地学习。

参考文献

[1]沈海峰.基于贝叶斯网络数据挖掘技术理论计算法的研究[D].安徽:合肥工业大学,2005.

〔编辑:白洁〕

Paper based on Bayesian Network Analysis

Wang Na

Abstract: This paper introduces the papers based on Bayesian network analysis test; the test is based on the main tools used MATLAB language BNT package. Through experimental research, analyzes the impact of the five aspects of the usual attendance, job submission rate on student achievement.

Key words: paper analysis; Bayesian networks; probabilistic inference; BNT Kit

摘 要:简要介绍了基于贝叶斯网络的试卷分析试验,试验主要用到的工具是基于MATLAB语言编写的BNT软件包。通过试验研究,分析了平时的出勤率、作业提交率等五方面内容对学生成绩的影响。

关键词:试卷分析;贝叶斯网络;概率推理;BNT工具包

中图分类号:TP183 文献标识码:A 文章编号:2095-6835(2014)21-0137-02

考试是教学过程中不可缺少的组成部分,是对教和学的质量检验。考试结果可以反馈出大量的信息——反映出整个教学过程的得失,反映出各个教学环节的情况,反映出学生的能力,反映出学生的学习特点和规律。针对以上几方面,在命题时要有多方面的设计。考试结果可以反映命题和考试本身的情况,也就是测量工具、测量方法和测量过程的情况。分析这些信息,进行一定的思考,提出一些观点和建议,供领导决策时参考,以此作为制订工作策略的依据,为学校老师和学生提供一定的指导。所以说,试卷分析是一件很重要的工作。

1 贝叶斯网络与因果推理

贝叶斯网络又称为置信网络,是基于概率分析、图论的一种不确定性知识的表达和推理模型。一个典型的贝叶斯网络由两部分组成:①有向无环的图,其中每一个节点代表一个变量、属性、状态或其他的实体,节点之间的弧反映了变量间的依赖关系,指向节点X的所有节点被称为X的父节点。②与每个节点相联系的条件概率表列出了此节点相对于其父节点所有可能的条件概率。贝叶斯网络约定以节点Vi的父节点为条件,Vi与任意非Vi子节点条件独立。

2 利用BNT软件包分析试卷

在此次的试卷分析试验中,以过去学生的期末考试成绩为依托,随机抽取了一部分学生的考试信息作为此次试验的原始数据。利用软件筛选、整理这些数据,然后通过基于MATLAB语言开发的关于贝叶斯网络学习的BNT软件包建模,主要完成建立贝叶斯网络的工作,以此来反映选定因素对试卷成绩的影响。影响试卷成绩的因素主要有:A——作业提交率、B——上课出勤率、C——否是留级生、D——主观题得分率和E——客观题得分率。

2.1 为试卷分析筛选数据

第一步:把影响试卷的因素作为变量,即贝叶斯网络模型中的节点,得到的候选数据集如表1所示。其中,R(is pass)标记为该样本的状态值,“1”表示成绩及格,“0”表示成绩不及格。

表1 变量与状态的关系

A B C D E R

0.67 0.85 0 0.78 0.56 1

0.54 0.66 1 0.54 0.39 0

0.89 0.96 0 0.85 0.78 1

… … … … … …

第二步:由于贝叶斯网络是用离散型变量,因此,对原始数据进行处理,数据离散处理结果如表2所示。

例如离散处理“上课出勤率”这一变量。根据教学经验,一般同学的出勤率都在90%以上,如果低于70%,学习成绩很

———————————————————————————

可能不理想,所以,将变量B分为3段——小于70%为low,70%~90%为mid,大于90%为high。

表2 对表1数据的离散处理结果

A B C D E R

high mid no high mid yes

mid low yes mid mid no

high high no high high yes

… … … … … …

第三步:数据格式转换。

根据MATLAB的特点,将数据集转换为矩阵的形式,而且所有属性的取值全部依次编号为1,2,3.

表2对应的矩阵为: .

以由此得到的样本数据集作为模型数据集来构造模型。

2.2 贝叶斯网络的建模

接下来的工作就是以得到的数据建立贝叶斯网络,然后对得到的贝叶斯网络进行参数学习。从得到的贝叶斯网络和学习得到的参数中可以看出选定的因素对试卷的影响。

经过实践,笔者得到的结果是:“上课出勤率”和“作业提交率”是影响其他因素的原因,而“上课出勤率”又可以影响到“作业提交”,这是与限制了父节点个数的结果相同的部分,不同的是:①“是否是留级生”又影响了“客观题得分率”和“主观题得分率”两项。如果出现这样的结果,不难看出,留级生在考试分数上和正班生还是有一定差距的。②“主观题得分率”影响了“是否及格”这一项。出现这种结果是因为在统计数据时,主观题分值占了60%.

从以上试验结果的数据中可以看出,作业提交率和上课出勤率对其他三个因素的影响。

3 结论

对试验结果分析后发现,得到的结果基本符合实际情况。学生的“上课出勤率”和“作业提交率”是影响其学习成绩的重要因素。由此可见,知识是平时一点一滴积累起来的,即便是在大学校园,在日常教学过程中,也应加强对学生的纪律管理,督促学生按部就班地学习。

参考文献

[1]沈海峰.基于贝叶斯网络数据挖掘技术理论计算法的研究[D].安徽:合肥工业大学,2005.

〔编辑:白洁〕

Paper based on Bayesian Network Analysis

Wang Na

Abstract: This paper introduces the papers based on Bayesian network analysis test; the test is based on the main tools used MATLAB language BNT package. Through experimental research, analyzes the impact of the five aspects of the usual attendance, job submission rate on student achievement.

Key words: paper analysis; Bayesian networks; probabilistic inference; BNT Kit

摘 要:简要介绍了基于贝叶斯网络的试卷分析试验,试验主要用到的工具是基于MATLAB语言编写的BNT软件包。通过试验研究,分析了平时的出勤率、作业提交率等五方面内容对学生成绩的影响。

关键词:试卷分析;贝叶斯网络;概率推理;BNT工具包

中图分类号:TP183 文献标识码:A 文章编号:2095-6835(2014)21-0137-02

考试是教学过程中不可缺少的组成部分,是对教和学的质量检验。考试结果可以反馈出大量的信息——反映出整个教学过程的得失,反映出各个教学环节的情况,反映出学生的能力,反映出学生的学习特点和规律。针对以上几方面,在命题时要有多方面的设计。考试结果可以反映命题和考试本身的情况,也就是测量工具、测量方法和测量过程的情况。分析这些信息,进行一定的思考,提出一些观点和建议,供领导决策时参考,以此作为制订工作策略的依据,为学校老师和学生提供一定的指导。所以说,试卷分析是一件很重要的工作。

1 贝叶斯网络与因果推理

贝叶斯网络又称为置信网络,是基于概率分析、图论的一种不确定性知识的表达和推理模型。一个典型的贝叶斯网络由两部分组成:①有向无环的图,其中每一个节点代表一个变量、属性、状态或其他的实体,节点之间的弧反映了变量间的依赖关系,指向节点X的所有节点被称为X的父节点。②与每个节点相联系的条件概率表列出了此节点相对于其父节点所有可能的条件概率。贝叶斯网络约定以节点Vi的父节点为条件,Vi与任意非Vi子节点条件独立。

2 利用BNT软件包分析试卷

在此次的试卷分析试验中,以过去学生的期末考试成绩为依托,随机抽取了一部分学生的考试信息作为此次试验的原始数据。利用软件筛选、整理这些数据,然后通过基于MATLAB语言开发的关于贝叶斯网络学习的BNT软件包建模,主要完成建立贝叶斯网络的工作,以此来反映选定因素对试卷成绩的影响。影响试卷成绩的因素主要有:A——作业提交率、B——上课出勤率、C——否是留级生、D——主观题得分率和E——客观题得分率。

2.1 为试卷分析筛选数据

第一步:把影响试卷的因素作为变量,即贝叶斯网络模型中的节点,得到的候选数据集如表1所示。其中,R(is pass)标记为该样本的状态值,“1”表示成绩及格,“0”表示成绩不及格。

表1 变量与状态的关系

A B C D E R

0.67 0.85 0 0.78 0.56 1

0.54 0.66 1 0.54 0.39 0

0.89 0.96 0 0.85 0.78 1

… … … … … …

第二步:由于贝叶斯网络是用离散型变量,因此,对原始数据进行处理,数据离散处理结果如表2所示。

例如离散处理“上课出勤率”这一变量。根据教学经验,一般同学的出勤率都在90%以上,如果低于70%,学习成绩很

———————————————————————————

可能不理想,所以,将变量B分为3段——小于70%为low,70%~90%为mid,大于90%为high。

表2 对表1数据的离散处理结果

A B C D E R

high mid no high mid yes

mid low yes mid mid no

high high no high high yes

… … … … … …

第三步:数据格式转换。

根据MATLAB的特点,将数据集转换为矩阵的形式,而且所有属性的取值全部依次编号为1,2,3.

表2对应的矩阵为: .

以由此得到的样本数据集作为模型数据集来构造模型。

2.2 贝叶斯网络的建模

接下来的工作就是以得到的数据建立贝叶斯网络,然后对得到的贝叶斯网络进行参数学习。从得到的贝叶斯网络和学习得到的参数中可以看出选定的因素对试卷的影响。

经过实践,笔者得到的结果是:“上课出勤率”和“作业提交率”是影响其他因素的原因,而“上课出勤率”又可以影响到“作业提交”,这是与限制了父节点个数的结果相同的部分,不同的是:①“是否是留级生”又影响了“客观题得分率”和“主观题得分率”两项。如果出现这样的结果,不难看出,留级生在考试分数上和正班生还是有一定差距的。②“主观题得分率”影响了“是否及格”这一项。出现这种结果是因为在统计数据时,主观题分值占了60%.

从以上试验结果的数据中可以看出,作业提交率和上课出勤率对其他三个因素的影响。

3 结论

对试验结果分析后发现,得到的结果基本符合实际情况。学生的“上课出勤率”和“作业提交率”是影响其学习成绩的重要因素。由此可见,知识是平时一点一滴积累起来的,即便是在大学校园,在日常教学过程中,也应加强对学生的纪律管理,督促学生按部就班地学习。

参考文献

[1]沈海峰.基于贝叶斯网络数据挖掘技术理论计算法的研究[D].安徽:合肥工业大学,2005.

〔编辑:白洁〕

Paper based on Bayesian Network Analysis

Wang Na

Abstract: This paper introduces the papers based on Bayesian network analysis test; the test is based on the main tools used MATLAB language BNT package. Through experimental research, analyzes the impact of the five aspects of the usual attendance, job submission rate on student achievement.

Key words: paper analysis; Bayesian networks; probabilistic inference; BNT Kit

猜你喜欢
贝叶斯网络试卷分析
基于分布式贝叶斯网络的多故障诊断方法研究
无人机数据链测试与评估研究
基于贝叶斯网络的流域内水文事件丰枯遭遇研究
初中数学教学中的对比效应
基于兴趣预测和热点分析的联合推荐算法研究 
《桥梁工程》课程的试卷分析及教学改进措施
让试卷分析更贴心
预科数学试卷分析与重难点教学探索
基于贝叶斯网络的城市居民出行方式研究