基于关联分析的大学生信息素养教育对策研究

2021-11-13 12:02黄耿生
太原城市职业技术学院学报 2021年10期
关键词:项集生源检索

■王 圆,黄耿生

(广东行政职业学院,广东 广州 510800)

在大数据、人工智能等新技术不断涌现的新时代,整个产业领域和社会资源动态重构,人们的生活、学习和工作也随之受到了全面影响。从大学生就业的角度出发,大量传统的工作岗位正在消失或者面临转型升级,职业岗位、职业内涵、职业素质要求发生了深刻变化,对高等教育提出了更高的要求。知识结构陈旧、无法保持学习能力的人将被职场所淘汰。对于当代大学生来说,个人无法改变大的社会发展趋势,必须积极拥抱新技术,适应经济社会对劳动力的新要求,自主学习,自我完善,不断提高自己的就业生存力和就业竞争力。

现代社会是终身学习的社会,终身学习需要大学生具备良好的信息素养,不断提高个人综合素质[1]。信息素养的内涵丰富,包括有意识能确定自身信息需求,有技术手段能获取信息、有组织手段能存储信息、有科学手段能评价信息、有创新思维能创造新信息等内涵。大学生信息素养研究已成为全球高等教育普遍关心的重点领域,新的信息生态逐渐形成背景下[2],高校教育工作者有必要与时俱进,满足新时代的新要求,不断探索培育大学生信息素养的新路径。

一、研究背景

2019年5月,教育部印发了《高职扩招专项工作实施方案》[3],根据实施方案,允许高职院校面向退役军人、下岗失业人员等群体扩大招生,计划招生人数高达100万人。此次扩招体现了高等教育提质化要求[4],扩招导致高职院校生源日趋多元化,为高职院校的人才培养提出了新要求。从育人的角度,高职院校需要及时应对新情况,从实际学情出发,考察不同生源的特点,因材施教,大学生信息素养教育同样不例外。以广东省省属公办高职院校为例,目前在校生的生源主要有三大类:普通高考、学考(普通高中学业水平考试)、3+专业技能课程证书(面向中职毕业生,以下简称“3+证书”)。不同生源的学生在基础知识、学习习惯等方面存在着明显差异,有必要从生源角度辨析大学生的信息素养现状,同时分析影响大学生信息素养的其他可能因素。

二、研究方案

(一)大学生信息素养调查

高等教育中关于大学信息素养评价标准的研究历来有之。早在2000年,美国发布《高等教育信息素养能力标准》,给全球高校的信息素养教育提供了有价值的参考,产生了广泛的影响。2015年,其发布机构美国大学与研究图书馆协会再次修订了该标准,进一步提出《高等教育信息素养框架》[5],该框架可以作为评价信息素养水平的参考和依据。鉴于框架的内容很多,经过整理和分析,同时借鉴国内已有的研究,筛选出最常用且实用的评价指标,构造以大学生为研究对象的信息素养调查问卷。

首先确定问卷考察的维度指标,再细化问卷题目,通过专家深度访谈和小范围预测试,确保正式问卷的题目描述和选项描述均清晰无歧义,可以有效开展测量。正式问卷编制完成后,以广东行政职业学院在校生为研究对象,使用软件随机发放电子问卷。收集到的答卷显示,被试大学生所在的专业领域范围广泛覆盖了理学、经济学、法学、管理学等十余个学科专业。信息素养调查共回收到1063份有效问卷样本,为后续的关联规则挖掘构建了研究所必需的数据集。

(二)Apriori算法

使用Apriori算法对数据集合进行关联规则挖掘,分析新时代大学生信息素养的现状,探讨当前高校信息素养教育可能存在的问题。Apriori算法是关联规则挖掘领域的经典算法之一,主要用于挖掘数据集中潜在的关联关系。该算法的主要指标有支持度、置信度及提升度。支持度计算公式为:support(X->Y)=P(X∪Y)=P(XY),X、Y代表不同项集,支持度即X、Y同时出现的概率。

置信度计算公式为:confidence(X->Y)=P(Y|X),即项集X发生时,项集Y发生的概率。

提升度计算公式:LX->Y=confidence(X->Y)/support(Y),提升度反映了后件Y受到前件X影响的程度,有效的强关联规则一般要求提升度大于1。

其中,支持度和置信度需要研究者根据实际自行设置合理的阈值,经常需要多次尝试得出。有效的强关联规则需要两个条件,即同时满足最小支持度(min_sup)和最小置信度(min_conf)。

Apriori算法的基本思路是,先计算支持度,依据min_sup不断迭代找出数据集中的频繁项集;再依据min_conf,在频繁项集中计算出满足条件的强关联规则。关联规则最初经常用于购物篮事务数据挖掘,比如可以将女士套装和手包组合促销,以期获得两种商品的销量增加。

三、基于Apriori算法进行关联分析

(一)数据挖掘

准备阶段,导入Excel格式的问卷文件,在PyCharm环境下编写Python3.7程序,导入第三方库mlxtend,其中包含的apriori和association_rules模块可以用于频繁项集分析和导出关联规则[6]。

执行算法第一步,首先进行数据预处理。将问卷数据转化为Apriori算法待处理的数据格式,共计12项待处理数据。其中三类指标:第一类为基本情况包括性别、年级、专业、生源合计4项指标;第二类为信息行为包括完成作业、信息获取与理解、信息的鉴别和评价、检索是否遇到困难等7项指标;第三类为信息素养包括选课意愿1项指标。篇幅所限,表1所示为经过预处理后的部分数据集。

表1 经预处理后的数据集(部分)

预处理阶段完成后,执行算法第二步即计算支持度,主要是推导出频繁项集,经实验最小支持度阈值设为0.3,推出频繁项集81个。表2所示为部分频繁项集。

表2 部分频繁项集

执行算法第三步,得出频繁项集后,再找出满足最小置信度和最小提升度的关联规则。由前面的置信度公式可知,由于第二步已经计算了支持度,这一步很容易推导出置信度。这里设置置信度阈值为0.6,提升度阈值为1.1,最终得到关联规则25个。最后考察规则的实际意义,剔除其中的无效规则。经过筛选选择6条典型的关联规则,如表3所示。

表3 生成的典型关联规则

(二)结果分析

如果学生会利用检索工具,但是利用网络解决问题时,能找到答案但不太理解,那么不缺乏检索途径的可能性为73%;如果学生不缺乏检索途径,但是利用网络解决问题时,能找到答案但不太理解,那么该学生有88%的可能性会利用检索工具;如果学生认为有必要开设信息素养选修课,不缺乏检索途径,那么学生89%会使用检索工具;如果性别为女生且认为有必要开设信息素养选修课,那么该学生63%的可能性来自普通高考录取;如果学生生源来自普通高考录取,并且遇到“检索结果太多,难以选择”的实际困难,那么该学生82%的可能性为女生;如果学生为女生,并且遇到“检索结果太多,难以选择”的实际困难,该学生存在63%的可能性来自普通高考录取生源。

四、对策与建议

(一)政府教育主管部门应发挥信息素养教育的指引作用

政府教育主管部门指导高等学校的教育工作,政府制定、发布的各项政策和指导性文件起到风向标的作用。要解决大学生信息素养培养问题,必须首先明确信息素养对于现代社会中个人素质全面发展的重要作用。信息素养教育是人本教育,以德育人,积极践行社会主义核心价值观前提下[7],由政府指引,强化社会共识,从思想认识层面上提高全社会对于信息素养的关注,引导形成良好的信息环境、信息氛围和信息文化。政府提供政策支持及加大资金投入,引导社会各主体力量如高等学校、行业企业和其他社会团体,整合教育大资源和建设大平台[8],以省、市、区图书馆为中心推进跨界合作[9]。从国内已有的研究来看,目前我国尚缺少统一的信息素养评价标准。随着时代的发展,信息素养的内涵不断丰富和发展,建议先从行业入手,研究适合各个行业的信息素养评价标准,并以此指导高校各个学科的信息素养教育。对于高职院校来讲,其人才培养更加强调职业素养,信息素养正是职业素养必不可缺的组成部分。

(二)高校应发挥信息素养教育的主导作用

1.加强信息鉴别和信息评价教育

信息素养教育要因材施教,从学情出发,科学制定教育方案。从调查结果分析角度,大学生遇到困难最多的是解决问题时“找到答案但不太理解”和检索信息时“检索结果太多,难以选择”。存在这两个困难主要说明,大学生已经具备一定的信息检索能力,在此前提下学生可以自如地根据自己的实际需求检索和获取信息。但目前的信息资源体量巨大,并且在源源不断持续产生中,尤其是互联网信息的无限扩展导致了大数据时代的信息泛滥和信息超载。大学生在专业学习中,也面临着专业学习资源的急剧膨胀,大数据时代的到来使得信息获取变得极为容易,通过网络随时随地可以轻而易举获取信息,但获取信息后,学生往往难于取舍,无法筛选、甄别出真正有价值的信息,大学生普遍存在信息迷失的情况。这种情况反映出学生的信息鉴别和信息评价能力不足,无法实现更精准的信息获取,高校可以从此方面强化信息素养教育。

2.制定信息素养分层教育课程体系

相比男生而言,女生在信息素养方面需要教师提供更多的帮助。从已有的研究来看,男生和女生的信息素养的确存在着显著的性别差异。究其原因,信息素养的主要指标之一是计算机技能,女生的计算机实操和问题解决能力大概率弱于男生,但女生在信息社会责任方面的表现可能优于男生[10]。从关联分析结果来看,女生比男生更愿意选修信息素养课程,高校信息素养课程的课程设计和教学方案应充分考虑到学生的性别差异。建议将信息素养课程设置为选修课而不是必修课,有需要的学生可以根据自己的实际需求选修课程从而获得学分。同时结合最新的移动互联网络技术,高校还可以依托移动社交媒体平台开展灵活多样的信息素养教育活动[11]。

3.制定不同生源的信息素养教育方案

从高职的生源角度来看,普通高考录取的学生相比其他生源学生,更欠缺信息素养。不同生源的学生在学业基础和学习行为习惯方面存在明显差异[12],普通高考录取和学考录取的生源主要来自普通高中,这部分学生理论知识基础较扎实,但实践操作能力偏弱。“3+证书”学生从中职学校直升高职,原有中职专业各异,进入高职学习后理论知识不够扎实,但由于中职教育同高职教育均非常重视学生实践教学,中职阶段学生接触了大量实操类、实训类实践教学活动,在中职阶段还组织学生参加社会实习。故“3+证书”生源学生动手能力和解决问题的能力相对于普通高中生源明显强一些。高校的信息素养教育要因材施教,既然不同生源的学情基础不同,有必要根据不同生源的信息素养水平拟定A、B两套教学大纲和教学计划,在教学大纲和教学计划中,体现差异教学。

(三)大学生自身发挥信息素养教育的主体作用

当前的教育界,早已达成“以学生为中心”的教育共识,教师是引路人,学生是学习的主体,信息素养教育同样要坚持以学生为主体。信息意识是前提,以教启智,启发大学生在学习、工作和生活中积极发挥主观能动性,有意识地主动探索信息、高效地获取信息、合理地使用信息、客观地评价信息和激发创新思维成就个人学业。如果没有构建以学生为主体的信息素养教育,仍然沿用传统的教条式、灌输式的教师讲授,信息素养教育将不会产生良好的效果。信息素养的培育是现代公民的终身课题,信息素养教育的落脚点在于指导实践,而要产生良好的实践效果需要学生的积极参与和自我反思。大学生在校学习的时空有限,终身学习的时空无限,只有大学生自身积极发挥主观能动性,主动将信息素养融入到自己的专业学习、实习实践和生活技能中,信息素养教育才算真正取得成功。

将Apriori关联规则算法应用到信息素养实证研究中,探讨不同生源、不同性别大学生在信息素养现状上存在的差异,思考新时代大学生信息素养培育的对策,建议政府、高校、大学生三方形成合力,由政府引导、高校主导、以大学生为主体,积极推动我国大学生的信息素养教育。

猜你喜欢
项集生源检索
基于共现结构的频繁高效用项集挖掘算法
新形势下提升传统本科专业生源质量的思考和认识
农村生源不是“摇钱树”
瑞典专利数据库的检索技巧
在IEEE 数据库中检索的一点经验
一种基于Python的音乐检索方法的研究
基于矩阵相乘的Apriori改进算法
不确定数据中的代表频繁项集近似挖掘
跨省生源调控