数据挖掘在中学图书管理系统中的应用研究

2017-05-27 08:11汪涛
中文信息 2016年12期
关键词:数据挖掘中学

汪涛

摘 要: 数据挖掘作为一种深层次的数据分析方法,此方法可以从大量数据中寻找出反应用户特征的信息和规则,将中学图书管理与数据挖掘相结合,寻找提取隐藏在大量的管理数据之中的有效数据,包括用户数据的搜集、数据仓的建立,以及用户特征的分析等主要内容。

关键词:数据挖掘 中学 图书管理系统

中图分类号:TP315 文献标识码:A 文章编号:1003-9082(2016)12-0151-01

现今时代,随着数据库技术的成熟和数据引用的普及,人类积累的数据量正以指数级迅速增长。进入九十年代,随着英特网的出现和高速发展,以及随之到来的私有网以及内部网和外部网的产生运用,整个世界之间的距离被缩小,人们可以利用发达的网络跨越时空的局限,在网络上进行数据的交换。因此,曾经的局部数据库不复存在,展现在人们面前的是庞大的的信息海洋,数据正如洪水一般向人们涌来。当数据量庞大到一定范围时,如果没有有效的方法,找寻提取有限数据的工作难度加大,人们面对着如海洋一般庞大的数据像大海捞针一样徒劳无功。据有效估计,一个大型企业数据库中只有约7.23%的数据得到应用。

随着我国经济的快速发展,在教育之中投入了更多的基础建设资金,不少中学都拥有自己的图书馆,学生的学习方式更加多样化,不仅仅是只用教科书,图书馆的建立扩大了学生的知识来源,大量的数据需要更加合适的管理才能将图书馆的功能发挥最大化。

数字图书馆概念的提出无疑是传统图书馆管理的一次新进步、新改革,数字图书馆是在传统图书馆的基础上建立起来的,是现代图书馆进化阶段的一大步。未来中学图书馆的发展重点将是在数字化管理信息的基础上发展,稳定高效的信息管理系统是图书馆发展的大前提大后方。

数据挖掘技术的应用将更好地帮助图书馆管理系统的运行。

一、数据挖掘的定义

数据挖掘是机器学习、人工智能以及数据库三者有机结合所得的产物。21世纪是数字化的时代,信息大爆炸所带来的科学数据的大量积累,因此数据库被广泛使用,人们在利用数据的过程中认识到海量的数据利用起来十分不方便、效率低下,并且從大量的数据之中找出有效数据的难度巨大。在这样的困难的敦促之下,数据库挖掘技术适时而生。

数据挖掘技术是从大量的、随机的、有干扰的数据之中,寻找提取出隐藏在海量数据中对人们有用的或人们不自知但又存在潜在的利用价值的数据、知识、规则或者模型。数据挖掘是一门包含很多复杂知识的交叉学科,它不仅包括数理统计,模式识别、模糊数学这些有关数学的专业知识,还包括神经网络、数据库等相关的技术知识。

数据挖掘技术的内容主要有三个方面:数据、算法和技术以及建模能力。数据挖掘技术按照功能可分为两大类:预测新模式以及描述性模式[1]。

数据挖掘的步骤内容庞大,简单概括得到以下内容:

1.从海量的数据库中获得数据;

2.选择适当的特征属性;

3.挑选出合适的样本策略;

4.排除数据中不正常的数据,同时补充不够的部分;

5.用恰当的降维、变换的手段使数据挖掘的过程与数据模型相适配;

6.辨识出所得到的数据是否可视化或者是信息化;

这些步骤是从数据到知识的必经之路。每一步骤都可能是成功的关键或失败的开始。在一般的定义中数据挖掘是知识获取的一部分。

二、数据挖掘技术在图书管理系统上的应用意义

关于数据挖掘技术在图书管理系统上的应用,有以下几个理论与方法: Kyle Banerjee 先生在1998年提出数据挖掘技术更适用于全文本动态变化的数据库;Nicholson和Stanton在2002年的图书馆中数据挖掘的研究中提出了“书目挖掘(Bibliomining)”这一专业名词,书目挖掘是指在图书馆的数据管理中,将数据挖掘、统计学原理、书目计量方式和报告工具这些技术有机的结合在一起,在行为信息与数据的基础上获取隐藏的模式。[2]

在中学的图书馆中大致有两个方面的问题,第一,图书馆的管理中会有大量的不断需要更新数据和之前需要保存的历史数据,这些数据如何被高效的利用起来。另一个方面,许多中学为了一些关于图书馆的评测,只重视图书馆的藏书量,但忽略了这些图书的分类结构与质量高低,这大大降低了图书馆数据的利用率,导致图书馆的藏书不能物尽其用,大量的书籍闲置。

因为以上所述的原因,笔者认为数据挖掘技术将能够在中学图书馆管理系统之中有很大的研究价值及发展空间。

三、在中学图书馆管理系统中应用数据挖掘技术的重点

1.图书馆中大量的数据

大量的数据是数据挖掘技术的基础,图书馆中的信息面对着不断的更新,例如用户的借还信息,图书馆每日人流量,借阅图书名录等,这些信息都可以作为数据挖掘的数据来源,每一日的新数据在第二天都将变成历史数据,在不断增加的历史数据面前,传统的数据库只能起到数据管理的作用,而不能透过这些数据得到规律。

2.读者的需求分析

一般的分析是以调查研究为基础,但数据挖掘的分析与此不同,运用数据分析可以从海量的、不同类型的数据中挖掘出读者身份,读者阅读习惯等具有特色的数据。

3.服务个性化

随着各种书籍的种类、内容、出版社等日益增多,知识的载体也逐渐丰富,读者的需求越来越难以把握,想要做到读者满意与资金的利用两方平衡十分不易。应用数据挖掘技术可以更好地帮助这个问题的解决,利用大数据的挖掘分析出事物之间的联系与规律,在大量的用户数据中分析出他们读书类型的倾向,以方便图书馆购书便利以及优化图书馆藏书结构。用大数据挖掘实现个性化的服务。

四、在图书馆管理系统中应用数据挖掘技术还存在的问题

1.在大数据中数据挖掘的精度问题

在现今的数据挖掘中都是利用数据驱动来进行数据挖掘,这只能在数据内容上得出规律,这样的数据准确性及精度远远不够[3]。而且,数据挖掘并不是万能的,它只是一个帮助更容易分析数据的一个工具,它能够辅助图书馆工作人员更加深入的分析数据,但他不能辨识出数据的实际价值。

2.用户的数据安全

现在是信息化的时代,个人的信息安全问题得到人们的重视。在构建数据库、运用各种数据挖掘、分析工具的同时,要注意用户隐私数据的处理。

3.数据挖掘技术与图书馆其他应用的融合问题

目前数据挖掘技术还不是十分完备,它正处于一个不断发展的过程中,要是数据挖掘技术可以和更多的管理应用系统相融合,成为一种嵌入式技术,使各个技术都能发挥优势的一面,而不轻易出现互相冲突。

参考文献

[1]周倩,《数据挖掘在图书馆用户资源管理中的应用研究》[J],《图书情报知识》2006(6)

[2]周倩,《构建图书馆现代化CRM系统》[J],《图书情报工作》,2004(6)

[3]杨睿娜,《数据挖掘在高职院校图书馆管理中的应用》[J],《科技创新与应用》2012(3)

猜你喜欢
数据挖掘中学
在多解中学创新
Big Hero 6: Always be with You
基于并行计算的大数据挖掘在电网中的应用
一种基于Hadoop的大数据挖掘云服务及应用
数据挖掘的分析与探索
基于GPGPU的离散数据挖掘研究