高职智慧校园大数据的挖掘技术

2021-06-16 09:35施喜平李家坤
电子技术与软件工程 2021年7期
关键词:可视化校园智慧

施喜平 李家坤

(长江工程职业技术学院 湖北省武汉市 430212)

1 校园大数据的挖掘对智慧校园建设的意义

随着云计算、大数据在高职院校校园管理过程中的应用,高职校园数字化建设进入到一个全新的阶段。随着我国高等教育事业的快速发展,高职院校招生方式的多样化,逐渐形成高职院校学生特点的多样化。大数据的引入使用,必将对高职教育在人才培养模式、课程模式、教学模式、评价体系等等方面带来一系列的变革。

2 高职院校智慧校园大数据应用的背景

当前我国高等职业教育事业的快速发展,高职院校招生方式的多样化,逐渐形成高职院校学生特点的多样化。高职教育主要是培养技术型、应用型的高级专业人才,同普通高等教育相比,高职教育在人才培养模式、课程模式、教学模式、评价体系等等方面进行了一系列的变革。随着云计算、大数据的应用,高职教育进入的一个全新的阶段,如何应用大数据来进行教学行为,进而指导学生的学习行为。大数据背景下传统的课堂教学模式、教学评价等早已不能满足当前高职课堂教学的需要,因此各高职院校都加入了智慧校园建设中。

3 校园大数据挖掘技术

当前智慧校园建设大数据挖掘方法包括:数据分类、数据聚类分析、数据关联分析、挖掘大数据算法优化、可视化技术五类。

(1)数据分类的目的是分析输入数据,通过分析集中的数据表现出来的特性,为每一个类找到一种准确描述或者模型,这种描述常常用谓词来表示。由此生成的类描述用来对未来的测试数据进行分类。尽管这些未来测试数据的类标签是未知的,仍可以由此预测这些新数据所属的类。也可以由此对数据中每一个类有更好的理解。

(2)“物以类聚,人以群分”,数据聚类(Clustering)是人类认识世界的一种重要方法。所谓聚类就是按照事物的某些属性,把事物聚集成簇,使簇内的对象之间具有较高的相似性,而不同簇的对象之间的相似程度较差。

(3)数据关联规则是一种描述性的而非预测性的方法,经常用于发现隐藏在大型数据集背后的,项集之间的有趣关联或相互关系。20 世纪60年代,Hajek 等人在早期研究中介绍了许多关联规则学习的关键概念和方法,但是主要关注的是数学表达,而不是算法。20 世纪90年代初,IBM 公司Almaden 研究中心的Agrawal 等人将关联规则学习架构引入数据库社区。

(4)挖掘大数据算法优化。

1.分类算法:在MapReduce 框架下,一个任务通常会被分为两个阶段:Map 阶段和Reduce 阶段,且所有的操作都是基于(key,value)键值对的。图1 为MapReduce 任务工作过程。

图1: MapReduce 任务工作过程

图2:FeedBackSVM 流程图

图3:贫困生补助系统数据流程图

图4:教务系统教学过程数据流程图

图5:某课程的网络教学资源学生访问情况统计饼图

2.反馈式并行支持向量机算法实现。反馈式并行支持向量机就是将原始训练数据集分块,通过并行训练子样本集加速全局支持向量的训练速度,通过反馈,将本次迭代的结果返回初始分类器进行调整和更新,从而进一步提高分类准确率。改善目前高职学生在课堂中缺乏运用解决问题策略所需的复杂情境;教师课堂以项目教学式为主,但高职学生在各环节学习过程中缺乏主动参与性,更缺乏批判性学习思维,造成不少学生的学习情况和效果呈现出低水平认知活动。

基于这些原因,我们提出在校园大数据的挖掘优化算法中,设计和实现基于MapReduce 编程框架的反馈式并行支持向量机时,加强重视数据集的划分和如何迭代这两个问题。图2 给出了FeedBackSVM 流程图。

网络数据中最重要的是安全问题。校园信息安全,首要的是解决校园大数据产生的网络安全问题,在大数据算法优化中最著名的当属Apriori 算法。我们的大数据已经从简单的处理对象开始转变为一种基础性资源,确保这一校园基础性资源的安全,是我们选择校园大数据处理方式首要考虑的问题。Apriori 算法目前广泛应用于网络安全领域,比如网络入侵检测技术中。网络系统早期都收集审计信息来建立跟踪档,但是早些年网络审计跟踪的目的多是为了性能测试或计费,因此对网络恶意信息攻击检测提供的有用信息有限。而Apriori 算法通过模式的学习和训练可以发现网络用户的异常行为模式。

因此,当前Apriori 算法广泛应用于高职院校信息管理数据库中。随着高职院校学生来源的多样化,学校管理部门在教学工作、学工工作、学生资助专项工作难度、学生学籍管理工作等各项工作中采集的信息量和处理信息量也剧增。

例一:以学工系统其中一个功能为例,Apriori 算法加入在学工贫困生补助系统中,其运行过程如图3 所示。通过学生一卡通校园消费来精准及时后,贫困生补助系统会自动发放生活补助金帮扶贫困生。

例二:以学校教务系统其中一个功能为例,Apriori 算法加入在课堂教学师生互动系统动态数据中,其运行过程如图4 所示。可以捕捉到课堂教学中有效的教与学的数据,从而优化课堂管理,完善师生评价体系。

(5)可视化技术。数据可视化是通过借助于图形化手段,清晰有效地传达与沟通信息。

数据:解决数据的采集,清理,预处理,分析,挖掘。

图形:对光学图像进行接收、提取信息、加工变换、模式识别及存储显示。

可视化:数据与图形间的交互处理。

数据可视化分为以下五个层面:

①数据统计图表化阶段:表达收集数据结果。

②数据结果展示:集成了大量的图形、可视化算法,降低复杂的图表的成本。

③数据分析过程可视化:对数据的分析过程进行可视化,更好的探索规律、查找问题。

④VR/AR 阶段的虚拟现实的可视化:虚拟现实提升概率思维、多维数据的可视化、高密度信息的展示、以及提供情境使人们更全面地理解问题。

⑤人工智能:人和数据的连接方式。筛选大数据隐含的规律,产生指导性结论。

因可视化技术具有参与感知,群体感知和移动感知计算,目前被广泛应用于新一代人工智能领域中。

大数据可视化工具有很多种,从大部分教育工作者熟知的角度来说,常见的、便于使用的数据可视化工具,如Excel、Processing 等。其中Excel 是Microsoft Office 中的一款电子表格软件。该软件通过工作簿(电子表格集合)来存储数据和分析数据。Excel 可生成诸如规划、财务等数据分析模型,并支持编写公式来处理数据和通过各类图表来显示数据。在Excel2016 后,更是有内置Power Query插件、管理数据模型、预测工作表、Power Privot、Power View 和 Power Map 等数据查询分析工具。使用者对Excel 也比较容易上手操作。

例三:对于校园教务系统中的教学资料来说,学生每天的访问都会产生非常庞大的数据,如果能够对这些数据做到合理的利用,就可以针对学生的访问形式,制作更有针对性、更易于学生课余学习的教学资源。可视化技术在智慧校园教务系统中一个应用如图5所示。

4 智慧校园数据挖掘过程面临的问题

智慧校园帮助高职院校教育工作者全面掌握、公平的评价学生的各项学习行为,从而更好的为学生服务,使教与学达到良好的促进关系。

综上,智慧校园建设过程中的大数据挖掘过程中,面临的问题也是显而易见。由于技术应用限制、数据专业人才缺乏以及伦理道德与隐私安全风险等方面造成的挑战,需要更多技术层面的应对措施,来确保大数据时代高校的智慧校园的,使得校园内的各种设施都和信息技术建立联系,方便学生的生活和学习,加强校园的安全保护,更便于对学生的健康管理。让高职院校的学生有自信、有能力的从校园走向各技能型工作岗位,是高职院校智慧校园建设的最终目的。

猜你喜欢
可视化校园智慧
基于CiteSpace的足三里穴研究可视化分析
基于Power BI的油田注水运行动态分析与可视化展示
基于CGAL和OpenGL的海底地形三维可视化
“融评”:党媒评论的可视化创新
智慧派
智慧决定成败
智慧往前冲,统计百分百(1)