大学生学业表现对于就业去向的影响研究

2023-04-13 16:50刘中国蒋浩杰丁国勇
计算机时代 2023年4期
关键词:贝叶斯网络决策树神经网络

刘中国 蒋浩杰 丁国勇

摘  要: 大学生就业去向的影响因素是复杂多样的。本研究以某财经高校金融学院为案例,来探究学生学业表现对学生就业的影响。通过采集应届毕业生的在校学习成绩和就业信息数据,应用教育数据挖掘中的人工神经网络、决策树和贝叶斯网络等算法,得出学生学业表现的不同对学生选择具体行业以及职位时有一定的影响。相关研究成果对于高校专业培养模式改革及学生引导有一定的参考价值。

关键词: 教育数据挖掘; 学业表现; 就业去向; 神经网络; 决策树; 贝叶斯网络

中图分类号:TP391.1          文献标识码:A     文章编号:1006-8228(2023)04-86-05

Abstract: The factors influencing the employment destination of college students are complex and diverse. In this study, taking the school of finance in a financial university as a case, through collecting the academic performance and employment information data of fresh graduates, and using artificial neural network, decision tree and Bayesian network algorithms in educational data mining, we explore the impact of students' academic performance on students' employment. Relevant research results have certain reference value for the reform of professional training mode and student guidance in universities.

Key words: educational data mining; academic performance; graduation destination; neural networks; decision tree; Bayesian network

0 引言

大学生就业情况一直是社会关注的重点。据2021年全国大学生就业报告,2021年我国高等院校毕业生数量已达到909.4万,较2020年增长4.1%。大学生的学业情况与就业去向存在一定的关联性,大学生会依据自身学业表现选择就业单位,就业单位在招聘大学生时会考虑学生的学业表现、实习经验以及证书获取等情况。本文欲利用江苏省某高校生就业实际数据来探究大学生就业去向与其在校期间课程成绩、四六级成绩、以及所获取的相关证书的关系,以期为学校人才培养模式改革、学生发展等提供一些实证参考。

1 文献回顾

国内外已有一些学者使用教育数据挖掘方法来探究学业表现对就业去向的影响。Ann Warner研究学生就业、教育和健康相关特征与学期成绩之间的关系[1],通过学生学业上的表现预判其每学期GPA高低。作者以美国南部四所大学学生的学业表现数据为研究样本,发现卫生保健专业学生的GPA高于非卫生保健专业学生。Hanna Soroka-Potrzebna探究证书对于就业的影响[2],在大学生就业过程中,拥有相关专业的证书,则可以提高自身在就业中的核心竞争力。

关于学生的学业表现对就业去向的影响,目前有不同的研究方案与研究成果。吴汉卿[3]认为大学生在校学习成绩作为学生智力、学习态度等因素的直观结果,较为准确地反映学生的整体水平。王郦玉[4]就大学生就业情况开展实证研究,构建二元Logit模型进行回归分析,分析学生的性别、家庭背景、在校期间学业成绩与学生就业情况的关联性。李梦竹[5]研究发现,在毕业去向上尽管积极的在校表现能够预测更优的毕业去向,但出生于弱势阶层的大学生却倾向于就业,而优势阶层的大学生更倾向于深造。冯沁雪[6]研究了我国高校毕业生专业兴趣对就业质量的影响,考察了成绩和学用匹配在其中发挥的中介效应,分析了影响随时间变化的趋势。程诗婷[7]基于对C9高校博士毕业生相关数据的分析发现,博士生教育阶段的学习结果并未对其就业去向形成显著影响。胡德鑫[8]通过实验发现,与其他学科相比,工科博士毕业生选择学术职业的比例占50%以上,另有近一半的毕业生选择到企业或党政机关单位就业,呈现出多元化发展趋势。Sara Morsy[9]提出学习浅线性模型,通过学生的知识状态和目标课程之间的相似性来预测学生的成绩。Byungsoo Kim[10]提出DPA,一种带有判别预训练任务的迁移学习框架,用于学习成绩预测。

2 数据预处理

2.1 数据选取

本论文选用的数据来源于江苏省某高校金融学院432名应届毕业生的学业成绩表、四、六级通过详情表以及考取证书详情表。该校金融学院包括信用管理、金融学、投资学、保险学四个专业。在处理模型所需要的输入数据时,由于学号、姓名等属性值是为了标识出学生的惟一性,对挖掘结果不产生影响,故本文首先排除了这些属性值的影响。通过观察可知学业成绩表具体包含专业课程、通识课程、基础课程以及体育课程等课程的所有成绩,并且课程成绩是按照百分制计分,本文以学业成绩表中的各科成绩作为模型输入变量。

2.2 数据规范

在对教务原始数据进行相关处理时,按照以下规则对各科目成绩展開分类,并划分为四个类别。90分到100分之间的成绩划分在第一类;80分到90分之间的成绩划分在第二类;70分到80分之间的成绩划分在第三类;将0分到70分之间的成绩划分在第四类。将处理后的课程成绩数据作为模型的输入值,将学生的毕业去向类别作为模型的输出。在模型处理完相关数据后,模型会自动生成相关结果报告。

本文在处理数据时,将毕业生的七个就业方向归类为两个就业类别。首先合并体制内就业的学生与去向非金融企业的学生,将其就业类别称为“非对口专业就业类”。在该类别中所有学生的就业单位不是与专业对口的金融单位,故合并选择证券公司、保险公司、贸易公司、投资公司以及国有银行与股份制银行的毕业生,并将其就业类别称为“对口专业就业类”。

3 实验分析

3.1 实验准备

3.1.1 算法介绍

决策树是监督学习算法的一种,主要应用于分类问题。决策树从数据中挑选具有区分性的变量,将数据集拆分为两个或两个以上的子集合,一步一步拆分,最終形成了一棵“树”,“树”的每个叶子节点代表该分支最终的预测结果。人工神经网络模型中,信息从输入层开始输入,每层的神经元接收前一级输入,并输出到下一级,直至输出层。并且任何层的输出都不会影响同级层,可用一个有向无环图表示。

3.1.2 建模流程(如图1所示)

⑴ 输入、输出变量的设置:依据实验要求将规范后的数据作为模型的输入变量。并根据实验目的,在模型中设置相应的目标变量以探究不同数据组之间的关系。

⑵ 数据集的划分:将数据样本中百分之七十的数据划分成训练集,将百分之三十的数据划分成测试集。如果模型结果出现过拟合现象,则考虑使用其他比例的训练集与测试集数据。例如将数据样本中百分之六十的数据划分成训练集,将百分之四十的数据划分成测试集。

⑶ 选定实验算法:通过对多次实验结果的精度与模型所生成的结果报告的对比分析,本文考虑选用决策树C5.0模型、神经网络模型、贝叶斯网络模型三个模型展开相关实验。

⑷ 模型调参:在调用不同的算法做数据分析与预测的过程中,依据输入数据的特征,本文对实验中的相关参数进行调配以达到更好的效果。

⑸ 结果可视化:在算法对数据分析、预测完毕之后,我们将选用分析模块对算法生成的结果做可视化的分析。通过表格的形式展示结果,以给用户带来更直观的体验。

3.2 实验过程

3.2.1 实验一、研究学生各类型的平均成绩、四、六级成绩、考证情况对就业去向的影响

⑴ 数据准备

通过调研432名应届毕业生以下课程类目中所有科目的平均分,来探寻哪些类型的课程在学生毕业去向选择起着重要的影响。将经过分类处理后的专业课、专业主干课、专业选修课、通识课、通识选修课、学科基础课、实践课、体育课、英语四级、英语六级等各科成绩作为模型的输入变量,学生的毕业去向分类数据作为模型的输出变量。

⑵ 调用模型

将上述实验一数据准备模块中的科目成绩作为输入数据,调用图1所示的相关模型,进行数据分析。

⑶ 实验报告一

各类型平均成绩、四、六级成绩、考证情况对学生就业去向影响(每个类别中的柱状图依次按照1.神经网络、2.决策树、3.贝叶斯网络顺序排列)

报告分析:

图2是利用决策树C5.0模型、神经网络模型、贝叶斯网络模型这三个模型得到的各类型科目重要性比较图。该实验的报告结果显示:学科基础类别下的科目与专业课类别下的科目以及相关证书的考取对学生的毕业去向有着重要的影响。决策树C5.0模型、神经网络模型、贝叶斯网络模型这三个模型对学科基础类别的成绩与对专业课类别的成绩所预测重要程度值都达到0.2以上。决策树C5.0模型、贝叶斯网络模型对于证书获取所预测的重要程度值达到0.2,并且神经网络模型对其所预测的重要程度值也接近0.2。说明学生应该把握好学科基础类目、专业课类目中所有科目的学习,以及考取专业所要求的证书。这三个模型对英语四级成绩、实践课成绩、体育成绩所预测的重要程度值相较与前者来说,数值较小,即意味着其对于学生毕业去向的影响程度较小。

3.2.2 实验二、探究学生所有专业课程、基础课程成绩对就业去向的影响

⑴ 数据准备

通过调研432名应届毕业生专业课程以及基础课程中所有科目成绩,来探究哪些科目对于学生在选择就业方向上有重要的影响。首先我们从教务数据库中获得金融工程、金融企业会计、国际结算、信用管理学、保险学、商业银行业务与经营、证券投资学、金融前沿问题,这八门专业课程成绩,以及会计学、货币银行学、宏观经济学、微观经济学、管理学、国际贸易这六门基础课程成绩。然后将所有成绩进行分类处理,最后将分类处理后的数据作为模型的输入值。

⑵ 调用模型

将上述实验二数据准备模块中的科目成绩作为输入数据,调用图1所示的相关模型,进行数据分析。

⑶ 实验报告二

学生专业课程成绩对第一类就业去向的影响(每个类别中的柱状图依次按照1.神经网络、2.贝叶斯网络、3.决策树顺序排列)。

结果分析:

图3为利用决策树C5.0模型、神经网络模型、贝叶斯网络模型得到的各科目专业课成绩对第一类就业去向重要性比较图。这三个模型对于预测就业类别一的学生专业课程的重要性程度有重要意义。通过决策树 C5.0模型、神经网络模型、贝叶斯网络模型所预测金融企业会计、金融工程、商业银行学、保险学这四门课程重要程度值都达到0.15以上。说明这四门课程对于学生未来在非对口专业单位就业有着重要影响。该结论表明:想在非对口专业单位就业的学生应该在众多门类的专业课上合理分配时间,着重把握重要课程,为将来的就业做好知识积累。

⑷ 实验报告三

学生专业课程成绩对第二类就业去向的影响(每个类别中的柱状图依次按照1.神经网络;2.贝叶斯网络;3.决策树顺序排列)。

结果分析:

图4为利用决策树C5.0模型、神经网络模型、贝叶斯网络模型得到的各科目专业课成绩对第二类就业去向重要性比较图。通过决策树C5.0模型、神经网络模型、贝叶斯网络模型所预测金融企业会计、金融前沿问题、商业银行学、证券投资学这四门课程的重要程度值大部分达到0.15以上,其余也都接近于0.15。说明这四门课程对于学生未来在对口专业单位就业有着重要的影响。这对于未来在专业领域相关的公司单位就业的学生有着积极的引导作用,该类学生应积极努力学好相关课程知识。

3.3 实验三、预测学生毕业去向

3.3.1 数据准备

通过使用432名应届毕业生的专业课程类目中所有科目成绩以及课程基础类目的所有科目成绩作为模型的输入数据,来预测学生毕业去向。我们将经过分类处理后的保险学、商业银行业务与经营、证券投资学、国际金融学、中央银行学、会计学、货币银行学、宏观经济学、微观经济学、管理学、国际贸易等科目成绩作为模型的输入值,学生的毕业去向分类数据作为模型的输出值。

3.3.2 调用模型

以上述科目成绩作为实验三的输入数据,调用图1所示的相关模型进行数据预测。

3.3.3 实验结果

如表2所示,三种算法的测试集正确率都在80%以上,这说明三种算法的预测效果都较为良好,其中正确率最高的算法是神经网络,为85.85%。从精确度、灵敏度和F1值这三个指标来看,神经网络相较与决策树、贝叶斯网络有比较好的预测值。说明在本论文所探究的数据关系中,神经网络更具适用性。

4 结论与建议

4.1 结论

通过以上三个层面分析与预测学生的学业表现与毕业去向的相关性。首先是从学生的各个类型课程角度来探究,哪些类型的课程对学生的毕业去向有重要的影响。探究的结果对学校将来调整教学方案有着重要的作用,学校可以着力加强相关类型课程的建设。然后将实验报告一所得结论中有重要影响的两大类课程体系详细展开讨论,探究两大类型中的所有科目对学生毕业去向的影响大小。从而将重要影响因素确定在具体的课程上,引导学校大力发展有重要影响作用的课程。

4.2 建议

首先在课程分类层面上,根据实验结果显示可知学科基础类别与专业课类别中的所有课程以及相关证书的考取是重要变量。学科基础类别中会计学、货币银行学、宏观经济学等课程是金融学院的学生们了解自己专业知识的基石,只有在打好此基础之上,才能游刃有余的学习更加高深的专业知识以及运用专业知识来解决实际问题。专业课中的金融工程、金融企业会计、公司金融、国际结算等课程是学生们间接了解未来工作的通道,掌握专业课程中的相关技能帮助学生们在未来面对实际专业问题时,能更好的面对与解决。学生们也就应该积极的考取专业相关证书,这在未来就业的时候是自我竞争力的一部分体现。对于想要应聘证券、基金、保险等行业的同学们应当在学校就读期间积极考取对应岗位的资格证书,这是行业招聘的门槛。

其次对于去向第一类就业单位的同学,应该注重学习好金融企业会计、金融工程、商业银行学、保险学这四门专业课程以及货币银行学、国际贸易、管理学这三门基础课程。学生们通过学习相关的基础课程知识,可以了解到如何调节国内生产要素的利用率,改善国际间的供求关系,调整经济结构,增加财政收入。学生在学好本专业的同时也获得了一定的学习能力,培养出一定的学习素养,为将来在非金融岗位上奉献力量做铺垫。也为将来在公务员系统、非金融公司工作所需要的能力做一定的积累。

最后对于去向第二类就业单位的同学,应该注重学习好金融企业会计、金融前沿问题、商业银行学、证券投资学专业课程以及国际贸易、宏观经济学、微观经济学、会计学这四门基础课程。通过金融相关专业课程的学习,学生可以掌握金融学基本知识和理论、金融运作和金融市场的基本知识与基本技能;熟悉国际金融规则、惯例及WTO的运行机制;通晓中国对外金融管理政策法规,了解当代金融市场的发展状况;运用现代化科技手段,进行现代金融业务操作。帮助自我提升专业能力。在应聘投资、贸易公司、证券、基金与保险公司、国有银行、股份制银行金融岗位时,更具有竞争力。

参考文献(References):

[1] Ann Warner, The relationship among BSN students' employment, educational,and healthrelated characteristics and semester grades: A multi-site study[J].Journal of Professional Nursing

[2] Hanna Soroka-Potrzebna, The importance of certification in project management in the labor Market,University of Szzcecin, Al. Papie?a Jana  II 22a, Szczecin 70-453, Poland.

[3] 吴汉卿.基于粗糙集的大学生学习与就业关系分析[J].计算机技术与发展,2017,27(5):188-191

[4] 王郦玉,张敏,刘雪珂.性别、家庭背景、学业成绩对就业的影响[J].合作经济与科技,2021,16(37):90-93

[5] 李梦竹.阶层背景对大学生在校表现及毕业去向的影响研究[J].当代教育科学,2018(6):88-92

[6] 冯沁雪,曹宇莲,岳昌君.專业兴趣会影响就业质量吗?—基于2009-2019年高校毕业生就业调查的实证研究[J].教育与经济,2021,37(4):56-64

[7] 程诗婷,廖文武.多元化就业与博士生教育—基于C9高校数据的实证分析[J].研究生教育研究,2020,5(59):24-30

[8] 胡德鑫,金蕾莅,林成涛,等.我国顶尖研究型大学工科博士职业选择多元化及其应对策略——以清华大学为例[J].中国高教研究,2017(4):72-77

[9] Sara Morsy,George Karypis.Sparse Neural Attentive Knowledge-based Models for Grade Prediction[J]//International Conference on Eduacational Data Mining 2017,2017

[10] Byungsoo Kim, Hangyeol Yu,Dongmin Shin, Youngduck Choi.Knowledge Transfer by Discriminative Pre-training for Academic Performance Prediction[J]//International Conference on Eduacational Data Mining 2018,2018

*基金项目:全国教育科学“十三五”规划教育部重点课题“教育大数据背景下高校学生学业表现建模研究”(课题号:DIA180378)

作者简介:刘中国(1997-),安徽滁州人,硕士研究生,主要研究方向:教育数据挖掘。

猜你喜欢
贝叶斯网络决策树神经网络
神经网络抑制无线通信干扰探究
一种针对不均衡数据集的SVM决策树算法
决策树和随机森林方法在管理决策中的应用
无人机数据链测试与评估研究
基于贝叶斯网络的流域内水文事件丰枯遭遇研究
基于兴趣预测和热点分析的联合推荐算法研究 
基于决策树的出租车乘客出行目的识别
基于神经网络的拉矫机控制模型建立
基于贝叶斯网络的城市居民出行方式研究
复数神经网络在基于WiFi的室内LBS应用