基于图书馆借阅行为数据的分析及研究

2022-07-17 12:16胡杰
科技资讯 2022年12期
关键词:数据分析图书馆高校

胡杰

摘  要:多个维度分析与挖掘高校图书馆读者的图书借阅行为规律,以便更好地提供个性化服务与精准的阅读推广,为图书馆的智慧化运营与采购决策提供新的思路。该文在分析了相关研究现状的基础上,对大数据时代如何科技赋能高校图书馆的智慧化建设进行了一定思考。以宁波工程学院为例,通过PL/SQL Developer平台采用SQL对该校图书馆图书近5年的图书借阅数据进行预处理、数据挖掘、结果分析等流程,对处理后的数据进行统计与分析得出读者借阅书籍与不同因素之间的多角度关系。并利用这些数据,为图书馆智慧化服务与精准推荐提供数据依据,对图书馆提高读者服务能力、图书阅读推广及图书资源采购等方面具有借鉴意义。

关键词:借阅数据  图书馆  高校  数据分析

中图分类号:G25      文献标识码:A           文章编号:1672-3791(2022)06(b)-0000-00

随着数字化改革在各行各业不断的深入,大数据正在以不同的形式和方式影响着人们的生活与工作。信息化时代的今天,在各个领域中都会产生海量的数据,而数据挖掘可从海量的生产数据中挖掘出反映用户的属性以及信息行为等有效的信息。在这种大环境下,高校图书馆每日产生大量的读者图书借阅数据,其中包含了大量十分有价值的信息,而如何通过海量的借阅行为的数据去观察预测读者的借阅习惯与喜好,从而进一步完善智慧图书馆的建设,不断提升借阅服务水平值得思考。

1  研究背景

在大数据蓬勃发展的时代背景下,各个行业都不可避免地受到其影响,大数据技术正以自身的巨大魅力推动着社会上方方面面的深刻变革。高校图书馆的建设过程中,依托数字信息技术等新型科技力量赋能高校图书馆的服务升级,打造智慧化图书馆服务新生态,已逐渐成为了现代高校图书馆的发展方向。

现阶段,数据的分析和挖掘在图书馆领域中的研究较多,已有许多该领域的学者发表了大量的相关研究文章。但大多成果还处于理论研究状态,投入图书馆实际工作应用中的还比较少。如张连分从智慧化系统角度研究,认为采用基于大数据的图书馆服务,包括建立以大数据为基础的图书推荐系统,使用数据分析技术来提高图书馆的个性化服务水平[1],刘海鸥等人则从预测读者喜好角度思考,提出基于大数据并行处理技术对融合后的海量数据进行深入挖掘,引入情境推荐算法来预测用户的情境兴趣偏好,以此实现精准的个性化推荐服务[2]。杨莉等人则是对图书馆入馆数据进行深度挖掘,通过分析图书馆入馆行为数据,采用ARIMA算法预测年入馆人流量趋势,对于图书馆管理规划与资源调配有一定的借鉴意义[3]。李荣等人利用汇文文献信息系统抓取了用户借阅数据,利用数据库技术探索用户群体的借阅行为变化趋势[4]。而徐震等人通过研究图书馆的借阅量进行估计模型的设计,用相关模型预测借阅量[5]。通过已有的相关研究文献可以看出,数据挖掘在提升图书馆的精准服务和转型升级方面有着巨大的作用,但在研究读者借阅数据时较少地通过多维度进行分析。

该文基于宁波工程学院图书馆的金盘系统近5年的用户图书借阅数据,采用PL/SQL Developer平台对海量且杂乱的借阅数据进行SQL语句编程分析,在多个维度分析了图书馆图书借阅的情况,为优化高校图书馆业务管理、提升读者服务质量提供了有效的数据支撑,实验研究结果将应用于该校图书馆的读者服务工作和决策制定方面。

2  相关数据分析

2.1  研究对象

该文以宁波工程学院图书馆近5年的读者图书借阅数据作为研究对象。从该校图书馆的金盘系统中导出相关数据,利用数据库技术SQL语句对相关数据进行去重、清理、挖掘,通过多个不同的维度分析研究该校的图书借阅情况。

2.2  研究方法

在PL/SQL Developer平台上采用SQL语句对于高校图书馆的图书借阅数据进行处理。主要分析处理了数据库中的流通日志表、馆藏书目库表、读者库表等多张数据表。流通日志中包含了借阅书籍、借阅时间、借阅者信息等内容。通过流通日志表关联馆藏书目库可以关联出借阅书籍的详细信息,包括书目名称、索引号、图书种类等信息;之后再对读者库表进行关联,关联出借阅者的具体信息,主要是学号、姓名、性别、所在学院、所学专业等信息。通过关联后的數据表进行去重、挖掘与分析。

该文基于统计学方法分为4个维度,分别为人群所属部门、基于中图法的图书类别、基于读者性别、基于月份借阅分布等进行可视化分析与研究。

2.3  数据可视化分析

通过金盘系统采集了2016年12月至2021年12月时间段的5年图书借阅数据,共计241288条借阅数据。基于借阅者人群所属部门的维度进行分析,如表1所示,针对不同学院和专业的人群图书借阅情况。由于金盘系统并没有学生专业信息,只能选择以借阅者所属学院为单位进行分析。在总借阅数量上,建工学院最多,为40 837册,而读者人数最多的经管学院借阅图书总数为37 764册,人文学院在总人数将近为经管学院人数一半的情况下,其借阅总数有38 023册。在人均借阅方面,机械学院为4.66、国交学院为3.89、机器人学院为6.07,这3个学院人均借阅图书的数量较少;而人文学院为24.17、建工学院为18.15、外语学院为14.68,人均借阅图书数据较多。这里需要说明一些特殊的情况:机器人学院近年才刚刚成立,缺少历史借阅数据。国交学院就读学生的专业为中外合作专业,在校时间较短;机械学院不在本部校区,借阅图书相对不便,导致3个学院借阅较少。其他学院无特殊情况,但是其借阅图书的人均借阅量方面还是有一定的差别的。可以看出,不同学院的人均图书借阅量是有较大差别的。

从图书馆的图书类别角度分析。目前高校图书馆的图书分类多是根据《中国图书馆分类法》进行图书分类,该法将图书馆的所有图书分为22个基本大类。从中图分类法的角度分析,对该校图书借阅数据进行进一步的挖掘。如图1所示:最主要的借阅种类是I文学为69 909册和T工业技术为62 793册。而I文学、T工业技术、H语言与文字、O数理科学和化学、F经济这5个类别的书籍借阅数大约占据总借阅图书数据的九成。与以往的认知存在一定误差:该校在学校定位方面虽然是以工科为主的多科性协调发展的高校,工科专业的学生占了总人数中的绝大多数,但是图书馆的图书借阅方面,在I文学以及H语言与文字、F经济等文学类经济学类的书籍借阅数量占比较高,3种类别的图书借阅总数加起来多达114 630册,其数据超过了该校图书馆总借阅图书数量的47.5%。这项数据说明该校学生借阅书籍的种类,并不一定是学生专业相关的书籍,决定读者借阅什么类型的图书,除了学生所学的专业影响借阅图书种类外,兴趣爱好是很大的一个因素。需要注意的是,工科学生读者对于文学类书籍的阅读需求也比较大。

从图书借阅者的性别角度进行分析,该校的图书总借阅人数为241 359人。其中有借阅行为的男性读者总数量为113 725人,女性读者总数量为127 634人。不同类别图书的借阅情况如图2所示。进一步通过查询该校相关数据可知,该校学生的男女比例大致为7∶3,而借阅人数男女比例接近1∶1,这强烈说明了该校男同学借阅书籍的热情度远远低于女同学。针对I、H、F类图书的借阅情况,可以看出:在I、H、F类图书中,女生的借阅占比为66.72%,男生的借阅占比是33.28%。说明这3类书在女性读者中借阅较多。女性读者更为喜爱阅读C、F、G、H、I、J等类别的书籍,其借阅量均超过了男性读者,而男性读者则倾向于借阅E、N、O、P、T、U、V、X、Y等类别的书籍,尤其是T类书籍,男生的借阅人数远远超过女生。结合该校的性别比例可以发现,男性学生借阅图书的热情还有进一步激发出来的空间。可以得出结论,不同的性别对于借阅书籍的行为以及不同类别的书籍的借阅占比,或者说喜爱程度有一定的关联性。

从借阅图书的时间轴线上分析,由于高校学生的学习阶段存在阶段性,一年可分为春季学期和秋季学期两个学期。可从不同月份图书的借阅情况进行深入分析。在寒暑假期间即2月份、7~8月图书借阅情况出现十分明显的下降,尤其是在暑假期间,图书馆借阅图书数量趋近于0。开学初的3月份以及9~10月份,学生借阅书籍的需求表现得十分旺盛,借阅热情高涨,特别是在9~10月份达到了一年借阅书籍的最高峰,月均借阅量将近4万册。9~10月考虑到有新生入学的因素,这部分人群对于高校图书馆具有一定的好奇心与借阅图书的需求。之后读者的借阅书籍数量便出现了缓慢下降的趋势。而秋季整个学期的图书借阅量又整体多于春季学期的图书借阅量,春季学期的图书借阅量大约是秋季学期的图书借阅量的80%。由此可以看出图书馆的图书借阅情况和时间月份有一定的关联关系。

3  数据价值与应用

3.1  对图书馆阅读推广工作的启示

从图书的阅读推广角度上看,需要着重分析图书借阅量不高的地方。针对借阅量不高的学院,如机械学院,需要加强图书馆自身服务的建设。

(1)解决不同校区间学生借阅图书馆图书不便的问题。包括如何使非本部的这部分学生能够同本部学生图书资源共享,实现不同校区学生借阅书籍的通借通还,使所有读者都能够更加便捷地借还图书。

(2)提高对图书馆空间的建设的要求,读者的阅读环境构建是对于读者阅读的需求有润物细无声的激励作用。以环境为依托,给读者提供一个温馨舒适的阅读环境,提高图书借阅量的一个基本条件就是提高进馆人数,只有让读者进入图书馆,才有机会浏览书籍、借阅书籍。通过图书馆的空间建设,达到一定的视觉冲击与温馨感,由此来吸引更多的读者走进图书馆、爱上图书馆,才能进一步促进图书的阅读推广。

(3)从阅读推广的推广活动角度上分析,要结合读者的兴趣进行阅读推广。对借阅量较大的图书类别进行有效推广从而激发读者参与兴趣,特别是考虑到现阶段该校男性读者的借阅热情不高,借阅图书数量不多等情况,可策划适量地吸引男性读者的内容,包括体育、计算机、国际时事等主题的阅读活动,吸引男性读者参与其中,提高男性读者的黏性。

3.2  对图书馆图书采购工作的思考

对于图书馆图书采购的决策的思考,在高校图书馆进行图书采购过程中,通常是根据图书馆图书采购经费的情况进行有选择的挑选。当前部分高校的文献采购工作是根据学校发展规划、学科布局、馆藏比例以及经费实际情况等因素综合考虑后进行图书采选工作。在经费一定的情况下,考虑学校的发展定位为工科为主时则优先采购工科类书籍、学校的优势专业有哪些则优先采选相关专业的书籍。什么类别的书需要增加采购,什么类别的书需要适当减少采购,还应考虑读者的借阅情况,即图书馆图书的供求关系,需要采购者尽量保持不同类别图书的供求平衡。对于借阅量较大而采购量不多的图书种类应加強采购;反之,对于采购量较大而借阅数据较少的图书,则需要适当减少采购量。可以对比历史数据中不同类别书籍的采购比例与读者的借阅比例,促使采购比例与借阅比例保持相对的一致性,既能动态地保持图书的供求平衡,也能在某种意义上提高文献资源的利用率,实现高校图书馆和大学生阅读需求建设的良性互动,进而提升高校图书馆的服务水平。

3.3  对图书馆读者服务工作的启迪

通过分析不同时间段读者的图书借阅情况,对图书馆读者服务方面有一定的工作启示。可以看出不同时间段的读者图书借阅量存在较大的差别,在每学期开学初的1个月左右的时间是图书馆全馆图书借阅量最大的时间段。因而图书馆管理员需要在开学初加大服务力度,做好充分的准备为广大学生提供信息咨询、答疑解惑服务。同时巨大的借阅人流量也是图书馆进行必要服务宣传的最佳时期,图书馆需充分利用馆内人流高峰期积极进行读者服务与入馆培训工作。积极引导读者熟悉图书馆空间功能,包括创客中心、研修包间、电影院、自修室等空间使用,进一步触发图书馆空间使用的活跃度。抓紧这一黄金时间段提高读者的用户黏性,用自身优质的读者服务促进图书借阅数量的提升。这对图书馆的工作人员提出了更高的要求,作为图书馆的直接服务人员,在自身素质与业务能力方面亦要有所提升,要改善传统的服务方式与工作流程,充分融入大数据的工作平台中[6]。

4  结语

随着以信息技术为核心的大数据时代的到来,数据库技术在高校智慧图书馆的建设过程中具有极高的应用价值。该文以宁波工程学院图书馆5年时间的图书借阅数据为研究对象,多个维度地分析了该校图书馆的图书借阅情况。在分析结果的基础上,进一步思考图书馆图书借阅数据对于图书馆的阅读推广、文献采购、读者服务等工作方面的启示,针对性地提出了具体的想法与服务思路。对图书馆的读者服务工作、资源优化方面以及数字化转型方面有一定的积极影响。

参考文献

[1] 张连分.数据驱动的是图书馆服务创新研究[J].图书馆工作与研究,    2021(1):104-108,123.

[2] 刘海鸥,姚苏梅,黄文娜,等.基于用户画像的图书馆大数据知识服务情境化推荐[J].图书馆学研究,2018(24):57-63,32.

[3] 杨莉,袁少博,曾本冲,等.图书馆入馆行为数据分析及可视化[J].电子测量技术,2020,43(14):22-28.

[4] 李荣,廖映红,李双.东北财经大学图书馆用户借阅记录数据集[J].图书馆杂志,2021(6):1-6.

[5] 徐震,李杨,冯玉平.基于大数据的图书馆借阅量估计模型设计[J].技术与市场,2022,29(2):85-87.

[6] 龙颖,孟德光.大数据思维下高校图书馆精准服务策略探讨[J].内蒙古科技与经济,2021(22):124-125.

猜你喜欢
数据分析图书馆高校
图书馆
新常态下集团公司内部审计工作研究
浅析大数据时代对企业营销模式的影响
中日高校本科生导师制的比较
学研产模式下的医药英语人才培养研究
高校创新型人才培养制度的建设与思考
高校科研创新团队建设存在的问题及对策研究
去图书馆