大数据时代下我校研究生数据素养调查分析及提升策略探讨

2019-05-14 11:02万星火徐述檀亦丽王红莲
课程教育研究·学法教法研究 2019年10期
关键词:数据素养数据共享

万星火 徐述 檀亦丽 王红莲

【摘 要】数据素养(data literacy)通常指的是研究者在工作中对科学数据的采集、组织和管理、处理和分析、共享等过程中所具有的能力,大数据环境下,数据素养已逐渐成为提升科研创新能力的必备因素和核心竞争力。为使我校硕士研究生教育更好地适应我国科技进步、经济建设和创新型社会的发展需要,提高硕士研究生培养质量。本文参考国内外有关数据素养研究相关文献,构建自己的数据素养量表体系并对于本校的工科研究生数据素养进行了问卷调查获得本校研究生的相关数据,通过数据分析来了解研究生数据素养的现状;对目前研究生数据素养进行了综合评价并提出了相关建议。

【关键词】数据素养;数据意识;数据共享

【中图分类号】TP391 【文献标识码】A

【文章编号】2095-3089(2019)10-0004-01

大数据背景下,数据作为一种重要的学术资源对研究工作产生了极大的价值,数据素养成为研究生学术发展的必备能力之一,已经引起国内外学者的高度重视。对研究生数据素养评价是开展针对性、有效性数据素养教育的前提基础,对于提升大数据时代高校研究生信息素养水平、优化科研方式具有重要意义。

本论文以华北理工大学在校研究生为调查对象,针对我校研究生的培养要求以及“大数据”时代背景下如何培养出具有较高的数据素养去适应社会创新需求的高级人才。基于大数据的背景设计调查问卷,通过调查数据对本校研究生的数据素养现状进行分析,掌握我校研究生数据素养培养存在的主要问题和制约因素,揭示我校研究生数据素养的现实状况和实际需求,引起和研究生对数据素养的重视。实现我校研究生数据素养的培养体系系统化、规范化的研究目标。

由于各学科数据素养的差异性存在,本次调查采用分层抽样的方法,将在校研究生按照所属学科来分层来抽取。因为各层抽样的费用相近,则按照内曼分配的原则来分配样本量,以研究生数量比例及各分层的方差差异作为调整权重进行分层依据来抽样;在每个分层中采取简单随机取样的方法,以研究生的宿舍为抽取单位进行随机取样。

对在校研究生总体采用分层抽样的调查方法,首先通过预调查发现各层中样本方差存在差异,基于校研究生各学科的具体数量,记研究生总数为N,各学科的研究生为Nh,取权重Wh=Nh/N,以预调查各学科样本方差估计真实方差,通过算得各学科的应收集的样本量情况,如下表:

为了提高调查结果的精度,保证回收样本量的充足,本次问卷调查共发放问卷360份,回收345份,其中有效问卷330份,回收率和有效率均约为96%。

数据分析:调查结果显示,有效样本中,46.84%的学生不了解数据素养 ,31.55%的学生通过网络新闻了解数据素养,11.17%的学生通过查阅文献了解数据素养,仅有10.44%的学生通过课堂教学了解数据素养。并且有80%以上的学生认为数据素养应该具备数据分析、数据收集和数据意识,大约70%的学生认为数据素养应该具备数据运用和数据描述。由此可以看出,我校外国语学科的学生的数据素养明显偏低,大约二分之一的学生不了解数据素养。

数据素养的自我评价

〖XC4.JPG;%30%30〗

在本次调查活动中发现,在校研究生对于数据素养的自我评价情况较为集中,绝大数处于一般水平,占总样本将近七成;另外处于差与较差水平的共占不到8%,对于自己数据素养评价为较好与好的占约22%。可以推测总体研究生数据素养的自我评价处于中等偏上的水平。

被调查者从何种途径获得数据素养教育(数据相关活动的参与情况)

〖XC5.JPG;%30%30〗

数据统计分析方法的使用:如果在学习或科研过程中需要做统计分析时,大部分学生会选择自己先试试的做法,占总人数的79.55%;有12.12%的学生选择请人帮忙的做法,一少部分同学学的比较好的会选择自己直接操作的做法。在调查的研究生中,均值、中位数、众数等为最常用的统计方法,也是最基本的统计方法,86.42%的人进行了选择,标准差、正态分布、抽样、概率等方法也都有超过一半的人选择,而是用t检验、方差分析、卡方分析等其他方法的人比之较少,说明研究生对数据分析具有多样性,但是对推断统计方法的掌握和使用程度还不够,仍需要多加学习和使用。

基于层次分析评价模型的我校研究生数据素养差异分析

目标层为比较各学科研究生数据素养A;准则层为数据意识B1、数据采集能力B2、数据管理能力B3、数据处理和分析能力B4、数据共享B5。方案层为3个工科、医科、理学科研究生C1、C2、C3。

方案C1在目标中的组合权重为:0.156+0.039+0.024+0.063+0.018=0.300

方案C2在目标中的组合权重为:0.073+0.112+0.024+0.019 +0.018=0.246

方案C2在目标中的组合权重为:0.034+0.324+0.008 +0.017+0.073=0.456

由以上数据,我们可以得出,研究生专业数据素养评价相关因素的重要性排序结果依次为: 理学类研究生、工学类专业研究生、医学类专业研究生,即我校研究生中理学类研究生数据素养水平最高,其次是工学类专业专业的学生,之后是医学类研究生的數据素养水平在三个专业比较中水平较差。

结论

我校研究生教育总体上是比较关注对学生的数据素养的教育的,不仅开设一些相关课程,还经常举办讲座、竞赛活动为研究生提供学习的机会与便利,但学校仍需注意对不同专业不同水平的学生进行针对性教育,在某些方面仍需改善。

我校研究生具备基本的数据素养能力,部分数据素养水平较高,但大部分学生的数据素养仍处于中间或偏低水平。在此对数据素养的各方面进行总结。首先从数据意识方面来说,我校研究生绝大多数都对数据素养有一定的了解,但仍有很多不足之处,没有形成主观意识。其次,我校研究生具备一定的数据收集能力,但大部分情况下不具有客观性,大多还是参照二手数据,在这方面应多加改善。对于数据分析整理方面,大部分研究生的能力比较欠缺,很少能够找到合理准确的方法对问题进行分析。

建议

1.重视数据意识的提升,对于数据意识教育来说,“育”大于“教”。研究生学院应该积极鼓励教师、学生对数据素养的研究,大力宣传有关数据素养的知识,包括大数据时代背景,数据素养等相关内容、概念以及在科研中的重要地位。引导研究生主动提升自身数据意识的兴趣。

2.加强数据技能的培养:数据技能是数据素养中的最为核心部分。应建设一支好用的数据并且数据素养较强的教师以及学生队伍,开设学分课程、学位课程、讲座、短期培训等多样的教学模式,基于数据素养的相关知识,创造学生感兴趣的学习环境,再结合当前大数据时代的物联网、云计算等技术,大胆创新,积极尝试,让学生能够将理论与实践结合在一起。对学生来说,认真学习,努力创新,提升自己的数据技能。

3.开展嵌入式和差异化的数据素养教育:由于学生个体之间存在着差异性,在数据素养方面也是如此,为了响应以学生为主体的教育教学模式,可以针对不同专业、不同性别或不同年级的学生来分别展开有关数据素养教育的相关课程,开展有针对性、多层次的数据素养教育,要重视数据素养教育,为建设科教强国提供人才上的支持。

参考文献

[1]Carlson J,Fosmire M,Miller C,ct al.Determining data information literacy needs:a study of students and research faculty[J].Portal-Libraries and the Academy,2011,11(2):629-657.

[2]黄如花,王春迎.面向学科的数据素养现状及需求调查——以《信息检索》MOOC学生为例[J].图书馆.

[3]卜冰华.大数据环境下我国大学生数据素养教育研究综述[J].数字图书馆论坛,2017(12):63-67.

[4]张明海,周艳红.大数据时代大学生数据素养教育的目标定位及体系构建[J].图书馆,2016(10):84-88.

[5]吴晶娥.高校图书馆大学生数据素养教育探析[J].图书馆理论与实践,2015(12):73-77.

[6]沈婷婷.数据素养及其对科学数据管理的影响[J].图书馆论坛,2015,01:68-73.

[7]隆茜.数据素养能力指标体系构建及高校師生数据素养能力现状调查与分析[J].图书馆,2015,12:51-56+62.

[8] Shields M.Information literacy,statistical literacy, data literacy[J]. IASSIST Quarterly,2004,28(2/3):56-61.

猜你喜欢
数据素养数据共享
大数据时代高校图书馆数据素养教育研究
大数据时代图书馆员的数据素养研究