基于图书馆借阅数据的量化自我阅读系统构建

2020-06-22 13:15冯雪晴
软件导刊 2020年5期
关键词:教育大数据

冯雪晴

摘 要:随着教育信息化的逐渐发展,新型技术和创新理论不断衍生。图书馆借阅数据是重要的教育大数据,仅用于图书管理难以发挥其真正价值,如何基于阅读行为数据优化学生阅读是当前研究的关键问题。从学生阅读实际需求出发,借助量化自我理论衍生出量化自我阅读的概念与框架,以江南大学图书馆借阅现状为例分析其可行性,并构建量化自我阅读系统。该系统包括学生基本信息、个人借阅信息、专业书目推荐、个性阅读推荐、互动学习讨论和系统使用建议6个模块。构建量化自我阅读系统有利于图书馆数据充分利用和馆藏资源利用率提升,为优化学生阅读提供了新思路。

关键词:教育大数据;图书馆借阅数据;量化自我理论;阅读系统

DOI:10. 11907/rjdk. 201021 开放科学(资源服务)标识码(OSID):

中图分类号:TP319文献标识码:A 文章编号:1672-7800(2020)005-0136-05

0 引言

阅读是学生进行高质量学习的重要过程,而图书馆是支持学生阅读的关键场所,图书馆借阅数据饱含有关学生阅读行为的宝贵信息。从知网数据看,以“图书馆”为关键词的相关研究共180 995篇,而以“图书馆+借阅数据”为关键词的仅73篇,以“图书馆+量化分析”为关键词的更是低至20篇(检索时间截至2019年12月22日)。就研究现状看,虽然学术界并无对图书馆借阅数据概念的统一界定,但已有学者对其展开了相关研究。韩翠峰[1]从大数据技术对图书馆的影响角度出发,提出传统信息服务将会转变为以数据为核心、以数据挖掘技术为关键的个性化服务;李艳等[2]基于大数据挖掘技术和决策分析流程构建了资源使用率统计与甄选模型、外部声誉监控与预警模型和高效科研分析模型,通过对图书馆数据的挖掘分析优化“微服务”水平、提供个性化服务,为管理者提供决策支持等。还有学者针对图书馆“业务数据”进行数据挖掘,发现数据背后隐藏的用户需求,从而提供馆藏结构优化和馆藏推荐等创新性服务[3]。从已有研究看,图书馆借阅行为数据主要用于帮助管理者和决策者提高工作效率和质量,以及如何帮助图书馆优化工作服务等方面[4],将数据价值作用于借阅行为主体的研究较少,缺乏站在学生角度思考“借阅数据对于学生自身的帮助”是什么的相关研究。

本文创新性地从量化自我理论出发,以帮助学生优化自身阅读为根本目标,通过大数据技术获取借阅行为主体(学生)的阅读现状和需求。随着教育信息化的推进,科技进步与理论创新对图书馆发展及其服务内容提出了新的要求和挑战[5]。从被动应用转向主动迎合学生需求,从支持学生阅读到帮助优化学生阅读是图书馆创新发展的必经之路。量化自我理论为图书馆借阅数据的充分应用提供了参考路径,将学生借阅行为产生的数据经过挖掘分析展示给学生个人,从而帮助判断、指导选择并优化学生阅读。

1 教育大数据

1.1 大数据起源与定义

“大数据”的概念最早由美国NASA的研究人员Michael Cox&DavidEllsworth[6]于1997年提出,用来描述超级计算机生成的巨大数据,这些数据具有难处理、难分析等特点,对当时技术水平是一项巨大挑战。目前,大数据有多种定义,《国务院关于印发促进大数据发展行动纲要的通知》将大数据定义为对多元化的海量数据进行采集、存储、关联分析,从中发现新知识,创造较高价值,并提升数据应用价值[7]。有学者[8]认为,大数据是指太大或种类太多,以至于传统工具无法有效管理的数据;也有学者认为,大数据即一般软件或工具难以捕捉、管理和分析的海量数据,通过对这些海量数据的交换、整合、分析,可以发现新知识、创造新价值,从而带来大知识、大科技、大利润和大发展[9]。大数据具有以下基本特征:数据量较大、难以管理和分析、数据背后具有丰富的信息和重要意义。

1.2 教育大数据与图书馆借阅数据

杨现民等[10]认为教育大数据是“大数据”的子集,是指整個教育活动过程中产生的以及根据教育需要采集到的,一切用于教育发展并可创造巨大潜在价值的数据集合。教育大数据涉及到教育活动的方方面面,每个环节所产生的数据经过深入挖掘和有效分析后都将对教育效果产生影响。其中,图书馆作为学生活动的重要场所,学生借阅行为过程会产生大量数据,尤其是最明显又容易被忽视的借阅数据。

本文认为图书馆借阅数据即学生在图书馆借阅书籍过程中产生的行为数据,记录学生借阅书目、借阅时间和归还时间等信息。看似简单的数据,经过有效的数据汇聚、整合和分析,可以得出优化师生阅读的重要信息,通过向学生提供阅读书目推荐服务、生成量化阅读报告优化学生阅读,如图1所示。

2 图书馆借阅数据潜在价值

2.1 借阅数据是宝贵的教育大数据

图书馆是学生获取精神食粮的“食堂”,是满足学生学习需求、提升学生专业知识的“第二课堂”,在该场所每天会产生很多数据,这些数据不仅仅有利于图书馆管理,更是了解学生阅读需求、优化学生阅读的重要依据。图书馆借阅数据中包括学生基本信息、借阅历史、检索记录等,潜藏着关于学生阅读的多重信息,对学生学习效果具有重要影响,是教育过程中宝贵的教育大数据。

2.2 数据分析可挖掘学生阅读需求

数据挖掘是一门跨越多个学科,利用各种数据库、人工智能、机器学习、统计学、神经网络等相关技术,从存放在数据库、数据仓库或其它信息库的数据中挖掘有用知识的新兴技术。其在图书馆中的应用主要包括两个方面:①优化图书馆管理工作,提高图书利用率;②获取读者阅读需求,实现智能化服务[11]。目前,图书馆根据借阅数据实现的智能化服务主要是站在管理者的视角,若能将学生借阅行为信息处理后展示给学生会实现数据的更大价值。量化自我理论的基础是通过个体行为数据判断个体情况,借阅数据是学生借阅行为所产生的数据,挖掘分析后有助于了解学生阅读情况、把握阅读需求,向学生提供推荐服务。同时,让学生直观看到自己的借阅信息,也能够让学生明确自己的阅读情况。

2.3 阅读推荐有助于资源充分利用

信息时代,人们每天习惯通过各种公众号进行快餐式閱读,很容易在信息的海洋中迷航。这种现象不仅仅由信息时代的到来和人们日益忙碌的快节奏生活所致,更多是在信息化环境下纸质书籍和图书馆没有应对时代变换作出相应调整而造成。在面对图书馆庞大的馆藏量时,学生不仅仅是欣喜,也会被“我该读哪些书籍”难题所困扰,导致学生阅读需求无法满足且馆藏图书未被充分利用。

馆藏书籍的利用率高低受两方面影响:一是馆藏书籍是否符合学生需求;二是学生(读者)的情报素质,即情报意识和情报能力的综合水平[12]。准确的阅读推荐和服务可有效辅助学生选择图书,减少因情报素质不足而无法发现并阅读图书的情况,提高馆藏书籍利用率。

3 量化自我理论与阅读系统可行性分析

“Quantified Self”(简称QS)即“量化自我”由美国《连线》杂志Gary Wolf&Kevin Kelly[13]最先提出,指人们利用可穿戴设备和传感器等技术记录自身状态与行为活动的过程[14],该理论的应用可提高“自我意识”、帮助“自我发现”、增强“自我了解”、促进“自我进步”,在此基础上实现系统性的“自我改进”,总而言之就是对自身信息的跟踪、记录和反馈[15]。目前,量化自我理论应用已逐渐从健康检测领域发展到个体学习领域,主要涉及学习分析研究,依赖于大数据的支撑,是对大数据价值的延展和实践[16]。大数据是量化自我产生的基础,数据获取设备是实现量化自我的关键,大数据处理技术和可视化技术是将数据转化为信息流的手段。量化自我除个体的量化自我外还包括集体的量化自我,即将个体的量化自我数据汇聚成更大的数据集,让个人与他人的数据进行比较等,从而优化个人行为或预测集体行为[17]。

根据学生基本信息和阅读信息,可以对学生进行阅读书目推荐,从效率和效果上优化学生阅读。量化自我阅读基本框架如图2所示。利用各种技术手段获取学生阅读数据,通过量化分析等过程制定出调控策略,并最终优化学生阅读。量化自我阅读系统即通过技术手段收集学生个体及群体阅读行为数据,并基于量化自我理论对数据进行分析,从而向学生个体进行阅读推荐、生成量化自我阅读报告以优化学生阅读。

3.1 “校园卡”即借阅数据集合载体

教育活动中的数据并不都是有效的,也会产生大量无意义的噪声数据[7]。因此,保障数据的有效性尤为必要。以江南大学图书馆为例,学生借阅书籍、归还书籍时均需使用学生卡,此举有利于图书馆对图书的规范管理,能够确保书籍借阅、归还在可控的时间范围内。QS理论强调获取数据的“可穿戴设备”,“校园卡”是学生在学校学习、生活必须随身携带的设备,在图书馆借阅数据收集中即相当于“可穿戴设备”。

从以下角度论证“校园卡”即图书借阅数据集合载体:①图书馆借阅需要使用记录个人信息的校园卡,由于校园卡即消费卡,也是宿舍、教学楼、图书馆等场所的门禁卡,学生需随身携带,为借阅信息采集提供了一定可靠性;②校园卡会记载学生个人信息,其中专业和年级可将学生归为一类群体,如:孟某、人文学院、2017级教育技术学研究生;③图书馆借阅数据会采集所借的书籍信息,通过分析学生经常借阅的书籍类型,获知学生阅读倾向和兴趣;④借阅书籍和归还书籍的时间有记录,根据此时间差,大致推断出学生阅读速度;⑤通过分析“集体的量化自我”数据集,可获得馆藏书籍借阅频次排名信息。

3.2 借阅信息是“量化自我”的依据

学生可以根据自身学习数据分析结果,了解近期学习情况,并通过预测进行适应性学习和自我导向学习[18]。借阅信息是学生借阅行为的表征,可作为“量化自我”的依据,将学生行为数据可视化后展示给学生。这一方面有助于学生根据“个人的量化自我”数据了解自身阅读情况,调整阅读行为,适应自身需求;另一方面有助于学生根据“集体的量化自我”数据获得宝贵的集体经验,引导自身优化阅读。

3.3 技术可支撑“阅读优化”实现

信息化社会带来的先进技术可支撑图书馆借阅数据的挖掘和分析,通过对学生借阅行为产生的大量数据进行可视化,可获知学生的阅读需求,并通过有效的图书馆服务方式实现对学生的“阅读优化”。如通过关联规则、聚类、决策树和时间序列等多种数据挖掘技术,处理分析图书馆借阅数据,从而预测出学生在未来某个时间段的借阅行为,为学生提供准确的个性化支持服务,促进图书馆管理工作智能化[19]。

4 量化自我阅读系统理论构建

从目前可获得的图书馆借阅数据和学生基本阅读需求考虑,量化自我阅读系统应该包括学生基本信息模块、个人借阅信息模块、专业书目推荐模块、个性化阅读推荐模块、互动学习讨论模块、系统使用建议模块,其中后两个模块为该阅读系统的基础模块。学生基本信息模块和个人借阅信息模块属于上文量化自我阅读框架中的阅读数据部分,利用技术获取学生数据,经过量化分析过程制定调控决策。优化学生阅读的调控决策部分在该系统中体现为专业书目推荐模块和个性化阅读推荐模块,如图4所示。

(1)学生基本信息模块。该模块较简单,采集学生基本信息,如姓名、性别、学院、专业、班级等。这些基本信息虽然简单但也非常关键,通过这些基本信息可以对学生进行一些需求分析,如所学专业信息可以作为专业书目推荐模块的依据。该模块是“集体量化自我”理论应用的基础,根据该模块可将个体归类,并将一类(如,同一专业)个体的“量化自我”数据汇聚成“数据集”,从而获取集体阅读经验,为学生提供引导和自我检测。

(2)个人借阅信息模块。通过采集学生借阅信息,可以统计学生借阅种类、借阅数量、借阅时间和归还时间差等,将这些信息以数据形式直观呈现,并将学生个人数据与其他学生数据进行对比,如该学生在某一个时间段借阅书籍的数量超过了多少学生。这种直观的具有互动性的数据可以在感官和心理上刺激学生的阅读冲动。从这方面而言,该模块不仅有助于学生了解自身阅读情况,还可以激发学生阅读兴趣。个人借阅信息模块,可以说在某种层面上使学生在阅读范围内量化了自我的阅读兴趣、能力、数量等。

(3)专业书目推荐模块。美国著名的成人教育家林德曼和诺尔斯[20]认为,“在成人教育活动中,要重视经验的作用”。该理论强调经验在教育活动中的重要性。根據学生基本信息,将学生归为一个集体,使得具有相似阅读需求的集体,可以更方便地获得书目推荐,如专业书目推荐。学生想要获得更多专业知识和更深入复杂的专业信息,就需要阅读一定量的著作。但每个专业的相关书籍有很多,为帮助学生在短期内正确选择阅读书目,迫切需要教师指导帮助和他人经验。在专业书目推荐模块,至少应该包括两方面内容:一是专业教师推荐书目;二是以往该专业学生借阅量较多的一些书目。专业教师推荐书目由该专业的教师们讨论得出,教师根据教学需要和时代变化对该书目进行增加和删减。由于是专业教师精心挑选,因此具有非常大的指导价值,在很大程度上指出了学生阅读方向。此外,参考以往该专业学生借阅量较多的书目有助于学生快速作出选择。

(4)个性阅读推荐模块。个人阅读推荐模块可满足学生除专业书籍以外的阅读需求,根据学生在阅读系统中留下的行为数据,如搜索、收藏和借阅等,确定学生阅读兴趣标签从而根据个性化需求向其推荐书目[21]。在该模块中,可根据个人借阅信息模块有关信息,为学生提供个性化书目推荐。个人借阅信息模块呈现了学生个人阅读的书籍种类和数量,该信息有助于分析出学生的阅读兴趣和方向。因此,可以根据学生阅读兴趣标签向其推荐同一类型的阅读书目。如张某同学的个人借阅信息模块中显示其酷爱历史书籍,经常借阅历史人物传记、历史题材小说等,则个性化阅读推荐模块会检索出一系列相关题材的书籍目录,推荐给该学生。

(5)互动学习讨论模块。交互性对话有利于激发学生学习动机[22],在学习过程中起到升华知识的作用,在阅读时学生需要在互动环节对阅读感悟和知识进行深入加工。一方面,互动形式能够调动学生继续阅读的积极性,在一本书籍阅读的过程中能够分享自己的观点并评价他人言论,这极大提升了学生阅读过程中的参与感,使学生丰富阅读体验,激发兴趣并提高深入阅读能力;另一方面,互动讨论环节所产生的数据、留言可作为分析学生需求的重要依据[23],可提高个性化阅读推荐的准确性和及时性。互动学习讨论模块可以设置个人动态、话题讨论和求助提问等互动形式。学生可以发表个人阅读心得、体会或疑惑,在与人分享的过程中进一步思考阅读内容;可以围绕某个话题形成一个话题讨论群体;如果在阅读中遇到问题,可以在求助提问区进行提问,其他学生以评论、点赞等方式参与。

(6)系统使用建议模块。学生在使用该阅读系统初级版本的过程中,难免会遇到一些系统无法满足的需求。为了更好地向学生提供量化自我阅读服务,可在该模块提供留言陈述建议功能,与系统开发管理人员共同完善该阅读系统。

5 结语

“大数据”技术、“量化自我”理论与教育的深度融合有助于学习效果提升和教育发展。将信息化时代的先进技术与结合理论研究相结合并作用于教育领域,是教育信息化发展的要求,也是促进我国教育质量提升的有效路径。量化自我阅读系统本质上是利用技术手段帮助学生更好地了解自己,调整阅读行为从而优化阅读,对学生有效阅读具有重要影响。图书馆最根本的价值是为阅读者提供服务、支持读者阅读行为、满足读者阅读需求,不管是利用借阅数据提高管理人员工作效率,还是根据数据显示需求为读者提供个性化服务,其最终价值取向都是“以读者需求为导向,优化阅读体验和效果”。

参考文献:

[1] 韩翠峰. 大数据带给图书馆的影响与挑战[J]. 图书与情报,2012(5):37-40.

[2] 李艳,吕鹏,李珑. 基于大数据挖掘与决策分析体系的高校图书馆个性化服务研究[J]. 图书情报知识,2016(2):60-68.

[3] 廖文果,廖光萍. 基于数据挖掘的图书馆创新服务研究[J]. 软件导刊,2014,13(8):116-118.

[4] 王最,王立宏,刘斌. 高校图书馆大数据统计分析研究[J]. 软件导刊,2017,16(11):200-201,205.

[5] 高丽,邹春梅,王竹. 教学研究型大学图书馆信息支持平台研究[J]. 软件导刊,2014,13(11):62-64.

[6] 何克抗. 大数据面面观[J]. 电化教育研究,2014,35(10):8-16,22.

[7] 刘克成,耿凯峰. 大数据在高校教学信息化中的应用[J]. 软件导刊,2019,18(2):222-224.

[8] 张杰夫. 大数据 大视野 大教育[J]. 中小学信息技术教育,2013(10):12-14.

[9] 徐子沛. 大数据:正在到来的数据革命,以及它如何改变政府、商业与我们的生活[M]. 桂林:广西师范大学出版社,2012.

[10] 杨现民,唐斯斯,李冀红. 发展教育大数据:内涵、价值和挑战[J]. 现代远程教育研究,2016(1):50-61.

[11] 刘晓东. 数据挖掘在图书馆工作中的应用[J]. 情报杂志,2005(8):63-65.

[12] 潘玉田. 藏书保障发展的量化分析[J]. 图书馆理论与实践,1988(3):61-63,23.

[13] LEE R.Whats Happening in the “Quantified Self” Movement?[EB/OL]. [2017-12-02]. http://digitalcommons.usu.edu/itlsfacpub/491.

[14] AMON R, FEDERICA C, JUDY K, et al. The future of personal data: envisioning new personalized services enabled by quantified self technologies[EB/OL]. http://www.cs.usyd.edu.au/-judy/Homec/Pubs/2016_FuturePD_preface.pdf,2017.

[15] 王鹏涛,路璐. 量化自我与碎片化阅读融合进路中的阅读效率提升机制研究[J]. 出版发行研究,2019(3):82-86.

[16] 方海光,罗金萍,陈俊达,等. 基于教育大数据的量化自我MOOC自适应学习系统研究[J]. 电化教育研究,2016,37(11):38-42,92.

[17] 刘咏梅,剧晓红. 量化自我在健康领域的应用——基于大数据的角度[J]. 情报资料工作,2018(4):56-63.

[18] JOHNSON L,ADAMS S,CUMMINS M.The NMC Horizon report: 2012 higher education edition[R]. Texas: The New Media Consortium,2012.

[19] 蒋细芳,刘羽,冯现坤. 基于时间序列的图书馆个性化服务研究[J]. 软件导刊,2011,10(5):125-126.

[20] 方海光,罗金萍,陈俊达,杜婧敏. 基于教育大数据的量化自我MOOC自适应学习系统研究[J]. 电化教育研究,2016,37(11):38-42,92.

[21] 孙承爱,季胜男,田刚. 基于混合模型的个性化阅读系统设计[J]. 软件导刊,2019,18(8):80-82,87.

[22] KATHARINA K,ALEXANDER G,ANN K P,et al. Effects of a classroom discourse intervention on teachers ‘practice and students motivation to learn mathematics and science[J].  Learning and Instruction,2015(35):94-103.

[23] 田娜,周驿,严蓉. 基于MOOC的课程讨论文本话题挖掘研究[J/OL]. 软件导刊:1-5. [2020-01-04]. http://kns.cnki.net/kcms/detail/42.1671.TP.20200102.1620.020.html.

(责任编辑:孙 娟)

猜你喜欢
教育大数据
教育大数据应用中存在的问题、原因及对策
教育大数据支持的教师教学决策改进与实现路径
教育数据:制式化、设计及作为研究范式
大数据背景下大学生自主学习探析
大数据在教育领域的运用
狭义教育大数据在英语教学中的应用模式