基于大数据的中小学生心理问题教育分析模式及策略研究

2021-12-02 18:55李茹孟琴王艳张金丽
科学与生活 2021年25期
关键词:关联数据挖掘数据库

李茹 孟琴 王艳 张金丽

摘要:近些年来,很多中学生不堪面对学习压力大,出现了严重的心理问题。针对此种情况,本文提出首先通过采集大数据信息,再经过数据处理程序剔除冗余信息,并对数据进行综合分析,采取相应措施的一种通过大数据预防心理问题的方式,从而预防中小学生心理问题并进行及时治疗的目的。

关键字:大数据;心理问题;分析模式

一、研究现状及意义

在2016年3月出台的“十三五”规划纲要中指出,实施国家大数据战略。把大数据作为基础性战略资源,全面实施促进大数据发展行动,加快推动数据资源共享开放和开发应用,助力产业转型升级和社会治理创新。如何从海量的学生学习行为数据中发现学习行为的潜在规律,是当前阶段亟待研究的重要问题。

二、学生信息采集情况分析

根据影响中小学心理健康的相关属性建立信息数据库,本论文主要参考症状自评量表SCL90对心理健康状况进行考评,并根据全国常模设置正常的数据参考范围。信息数据库包括个人基本情况和家庭支持情况两项,个人基本情况包括学生信息(采集学生的姓名、学号、头像、年级、年龄)、校园一卡通的消费数据[1]、上课、实验操作的情况,图书馆借阅记录,社会支持情况主要指家庭情况包括户籍所在地、父母学历、工作单位、经济条件等信息。

三、基于大数据的教育分析模型的整体框架

大数据模型是由数据采集库、数据处理库、数据综合分析、数据展示四部分组成的,其中数据采集库主要是采集、记录学生在课堂听课、出勤记录、图书馆借阅图书、食堂的就餐时间和饮食记录等的行为数据,从众多的数据中提取出与心理问题属性相关的参数。完成数据采集后,数据处理库对采集到的数据进行预处理,清除掉重复冗余的、缺失的、不能表达实际意义的虚词等数据,保证后期数据挖掘工作基础数据的正确性。

数据分析是将已经提取的学生行为特征进行分析,运用数据挖掘算法挖掘进行关联规则挖掘,实现对学生行为的有效分类、关联分析等,构建学生行为特征数据库,最终达到通过监测、分析学生在各个方面的行为特征与SCL90症状自评量表测试的关联度,挖掘频繁项集从而发现强关联规则[1]。当数据库中学生的行为特征与心理测试中的测试项之间有关联关系或相互依存就说明二者之间可以建立一条关联规则,预测学生心理健康与否,指导学生行为向健康方向发展。

四、基于大数据的教育分析模型原理

(一)心理测试量表

在数据处理数据库中需要参照SCL-90心理测试量表[2],该量表具有操作性强,使用广泛,覆盖面全等优点,从十个因子分别反映十个方面的心理症状情况,可以对被测个体整体上和某项因子心理健康的状况,实现较完整的系统呈现。如果某一项的因子得分较高,说明被测人在该因子上所表现出来的心理症状比较严重,评分标准采用五级评分法,可以反映被测个体在各个针对性方面有倾向性的预判数据和系统类比分析。

(二)归一化处理函数

在数据分析阶段需要先将不同量纲的数据信息做归一化处理,数据归一化问题[3 ]是数据挖掘中特征向量表达时的一项基础工作,当不同的特征向量放在一起的时候,由于向量本身的特点不同,不同的评价指标往往具有不同的测量单位,导致有些小数据被大数据忽略的情况,显然类似的情况大数据会主导目标函数的分析的结果,为了消除各指标之间的这种影响,需要对抽取出来的特征向量进行归一化处理,以解决数据指标之间的可比性,保证分类操作的准确执行。

(三)Apriori数据挖掘算法

在数据经过归一化处理后,数据挖掘算法进行智能处理,Apriori[4]是一种挖掘布尔关联规则频繁项集的算法,采用逐层搜索的迭代方式,使用频繁项集性质的先验知识。简而言之就是两步:找出所有的频繁项集,由频繁项集产生强关联规则。 Apriori 算法的具体实现步骤如下:

1、扫描数据库,得到候选k=1-项集的集合C1,计算出各个 k = 1 项集的支持度。

2、根据设定的最小支持度,当候选1-项集的集合C1大于或等于最小支持度時,产生频繁1-项集的集合L1。

3、当k>1时,重复执行步骤4,5,6,不断产生候选k+1项集。

4、执行剪枝操作,由Lk执行连接和减枝操作,产生候选k+1-项集的集合Ck +1。

5、与最小支持度进行比较,遍历候选(k+1)-项集的集合Ck +1,产生频繁(k+1)-项集的集合Lk+1,删除不满足条件的候选项集。

6、如果L不是空集,则令k=k+1,转入步骤4,否则结束。

7. 重新扫描数据库,计算出置信度,满足大于或等于最小置信度的即为强关联规则。

五、总结

传统的基于调查问卷、实验、测量的心理学研究方法,采集的样本容量是有限的,被调查者在回答问题的时候有迎合的成分存在,虽然有些调查者采用随机抽样的方式,但仍然存在一定的误差。而依靠大数据技术能够比较客观的对研究主体进行分析,同时结合心理咨询师的线下考察,保障了研究结果的可靠性。通过整合大数据平台采集的信息,结合心理测试和咨询师的专业分析,更好的解决学生的心理问题,为学生的人生保驾护航。

参考文献

[1]https://baike.baidu.com/item/症状自评量表SCL90/721900?fr=Aladdin.

[2]金华,吴文源,张明园.中国正常人SCL-90评定结果的初步分析[J].中国精神疾病杂志,1986,12(5):260-263.

[3] https://blog.csdn.net/leiting_imecas/article/details/54986045

[4]赵宏利.改进的 Apriori 算法在大学生心理分析中的研究[D].武汉:华中师范大学,2015.

课题:全国教育信息化办公室2016年青年课题 课题立项编号:162043643

猜你喜欢
关联数据挖掘数据库
奇趣搭配
拼一拼
数据挖掘综述
数据库
软件工程领域中的异常数据挖掘算法
智趣
基于R的医学大数据挖掘系统研究
数据库
数据库
数据库