决策树在后疫情时期(大学生)就业指导中的应用研究

2021-10-14 22:22易倩文
速读·中旬 2021年10期
关键词:决策树

易倩文

◆摘  要:为了能够深入的挖掘和剖析影响当前高校大学生毕业求职就业的关键影响因素,找到当前大学生就业选择因素之间的相互作用原因,笔者对重庆工程学院2021届毕业生进行了关于“后疫情期间就业情况调研”的问卷调查,然后以数据挖掘分类技术为支撑设计出C4.5算法对各种影响重庆工程学院毕业生就业选择的因素针对性的进行分析,以此来得出影响应届毕业生就业选择的决策模型,根据这一算法模型,帮助以后的大学生更好的在大学期间完善自己的专业技能,强化自己的综合能力,提高自己的社会竞争力,为以后走出校园,在求职就业上有更多的选择,提高应届毕业生的就业率。而这一算法模型的运用对于高校在后疫情时期面对严峻的就业形势以及社会经济发展趋势下,能够起到有效的就业指导效果,通过算法模型能够最大程度的帮助高校了解就业形式,实现在就业指数上的多项比较,以此来针对性的改进教学计划,刺激高校毕业生就业率的不断提高。

◆关键词:决策树;大学生就业指导;重庆工程学院

运用决策树来保证在后疫情时期高校大学生的就业率能够有效提高,其本身是基于决策树分类法能够深度的挖掘高校毕业生的相关就业数据,借助数据分析去找到毕业生潜在的就业规律,以此来得出影响高校毕业生就业率的关键因素,从而帮助高校更好的对应届毕业生进行就业上的分类指导、精准服务,这样不仅有助于提高高校在就业指导工作上的效率,还能够帮助高校打出知名度,提升教育信誉度。在这个后疫情时期,能够降低疫情对于高校毕业生就业的影响,能够提高毕业生的就业率以及就业质量。

1决策树分类法所运用到的C4.5算法

C4.5算法其实是对ID3算法的一种优化,它是以数据增益率为标准来选择决策树的节点属性的一种算法,其本身默认选择的是当前分支节点下数据增益率最高属性作为当下的节点测试属性,因此C4.5算法本身能够极大的减少对于样本分类所需要的数据量,同时也能够保证数据本身的最小随机性或者说“不纯性”。因此C4.5算法能够降低调研难度,测试数目可以达到最小化,因此基于C4.5算法可以设计出最简单的一棵决策树。

2数据挖掘对象以及决策树分析目标

本文是将重庆工程学院2021届毕业生作为数据挖掘的对象,以他们作为研究对象,通过对他们的就业意向进行调查,获取到他们的专业成绩、英语水平、计算机技能以及就业选择等多项相关个人能力因素,并且通过调查报告去确定他们期望的上班时间、薪资范围、福利待遇以及期望得到的就业指导内容等多个影响个人就业选择的因素,以此来帮助重庆工程学院获得相关的毕业生就业数据,通过决策树分类法帮助重庆工程学院学生工作委员会以及就业指导中心掌握相关的就业指导课程改进以及课程安排,为就业指导教学的开展提供了数据理论的支撑。

3数据采集

要想借助C4.5算法来进行数据的深入挖掘,首先需要确定的是具体可查的研究对象,需要对可能影响高校毕业生就业选择的诸多因素进行系统的准确的数据收集,可以说整个数据收集的准确度在一定程度上决定着整个C4.5算法对于结果分析上的准确性,而越是准确的结果分析也才越是具有参考的价值。

基于这一点,我们对于重庆工程学院2021届的毕业生都进行了就业意向调查统计,我们首先从学院中的学生学籍管理系统中获取了2021届毕业生的学生基本信息,包括他们的院系、专业、班级、姓名、学号、性别、籍贯、政治面貌以及身份證号等。其次我们还从学校的“成绩查询服务网站”中获取到了2021届毕业生的学习成绩,包括各科成绩、专业绩点、学分等。然后从这些数据中心抽取相应的部分毕业生信息作为这次研究分析的对象,一次来保证数据信息本身的准确性以及随机性。

4构造决策树

在后疫情时期,影响学生进行就业选择的因素更多,而疫情对于学生就业选择的影响也是当前高校在进行就业指导过程中不可忽视的一点。而因为我们选的研究对象是重庆工程学院2021届的所有毕业生,因此所涉及到的信息数量是十分巨大的,而任务采集也足足花费了将近一年的时间,采集任务重,耗时长,所涉及到的数据信息如果想要完全处理,难度极大,因此我们为了保证数据本身的有效性,需要对数据进行预处理,通过数据集成以及属性归纳的方式对数据进行预处理。同时通过运用C4.5算法获得的决策树,往往也是十分庞大复杂的,要想凸显主要的影响因素,提高整个决策树的实用性,我们需要去除掉决策树中对于实际就业情况影响不大的因素,对决策树进行必要的修剪,这就需要使用到悲观后剪枝法。

通过对重庆工程学院2021届毕业生进行信息数据的调查以及分析我们发现,所有学生对于自己毕业之后的第一份工作都是十分重视的,但是在针对就业单位的选择上考虑的点却有很大的区别,在薪资方面,40%以上的毕业生希望在月薪5000元以上,可见现在年轻人对于薪资待遇还是十分重视的。其次就是45%的毕业生都不太关注专业是否对口的问题,只看中行业未来的发展潜力以及自己未来的发展机会。当然对于就业单位所能够提供的福利待遇则是很多毕业生都关注的问题,95%的毕业生都有强烈的五险一金意识,其次对于周末双休、带薪休假、进修培训以及包吃住等也都十分重视。而更多的毕业生是希望能够通过第一份工作获得宝贵的经验以及清晰的职业规划的。这些调查对于重庆工程学院构建出清晰的毕业生决策树是有很大的帮助的,对于该校以后进行就业指导也有很大的帮助。

5疫情影响下决策树在毕业生就业指导的应用

在构造决策树之后,就需要依据决策树所提供的数据信息从决策树的根结点到叶结点进行分类规则的归纳生成。而基于后疫情时期的高校毕业生就业选择所涉及到的相关研究文献比较缺乏,因此需要在不断的自我总结和深度研究的过程中去探索关于疫情对于高校毕业生就业选择影响的因素,同时搭建针对新冠疫情影响的决策树理论框架,以及相对应的数据调查方法,从而尝试性的探究决策树在后疫情时期对于大学生就业指导工作的应用研究。

参考文献

[1]杨断利,张锐,王文显.基于模糊决策树的高校就业数据挖掘研究[J].河北农业大学学报,2012,35(2):111-114.

[2]麦晓冬,贾萍,翁建荣,等.基于多尺度粗糙集模型的决策树在高校就业数据分析中的应用[J].华南师范大学学报(自然科学版),201,46(4):31-36.

[3]李冬梅,路春艳,张雅惠:决策树分类方法在大学生就业指导中的应用[J].统计与咨询,2017(06):29-32.

猜你喜欢
决策树
简述一种基于C4.5的随机决策树集成分类算法设计
一种改进的MEP决策树剪枝算法
决策树学习的剪枝方法
改进的ID3算法在个人贷款信用风险评估中的应用
ID3分类及其剪枝算法研究
不同年龄段关于养老问题认知的差异
森林资源动态监测系统与ENVI决策树分类技术的应用
基于遥感技术的植被信息提取方法研究
决策树在成绩分析中的应用
决策树在成绩分析中的应用