试析大数据环境下图书馆公共媒体数据库建设与利用

2016-06-17 19:08洪克诗
电脑知识与技术 2016年11期
关键词:大数据图书馆

洪克诗

摘要:在大数据背景下,人们对图书馆的要求越来越高,图书馆扮演的角色越来越多样,图书馆公共媒体数据库的构建得到了社会各界的广泛关注。该文立足于现阶段图书馆建设的现状及问题,提出图书馆公共媒体数据库建设具体方案,并着重分析了对图书馆公共媒体数据库的应用方向与方法,以期在大数据背景下,建设更加高效、科学的图书馆公共媒体数据库平台,充分发挥图书馆作用。

关键词:大数据;图书馆;公共媒体;数据库建设与利用

中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2016)11-0008-02

Abstract: Under the background of big data, it requires more and more of the library, the library's role more and more diverse, to build public media library database has been widespread concern in the community. Based on the Present Status and Problems of Library Construction proposed public media library database building specific programs, and analyzes the application direction and methods of public media library database to the data of the large background, building a more efficient, Science Library public media database platform, give full play to the role of the library.

Key words: big data; library; public media; database construction and utilization

1 图书馆资源建设现状与现存问题

我国图书馆在长期数字化、信息化的影响下,取得了不错的成绩,同时我们也不得不承认还有很多需待解决和优化的问题存在。现阶段图书馆资源建设中存在的问题主要包括:资源类型局限,缺乏高质量灰色文献;主题分布不均,部分文献资源不完善;资源落后,存在大量的过时信息;数据库利用率低,开放程度不够等。

在大数据的背景下,图书馆公共媒体数据库的用户本身及用户行为有其显著特征。主要体现在两方面:一方面,体现在对信息量与信息种类的需求增长,用户获取信息的形式已不再局限于传统的新闻报道、调查报告等,更包含社交网络、音频视频网站等新兴途径,获取的内容也不再局限于消息本身,而是更大范围的各种类型的数据;另一方面,用户对服务速度及质量要求更高,比如,在进行查询时,用户希望能以最简便快捷的检索方式来获取高匹配度、具备高价值的信息,这对数据库信息查询与信息过滤能力将是不小的挑战,与此同时,信息服务不再局限于传统的信息检索功能,而是朝着更加多元化、综合化的方向发展。

2 大数据环境下图书馆公共媒体数据库具体建设

1)总体框架

图书馆公共媒体数据库系统在设计时的目标为:将传统结构化数据管理模式与非结构数据管理模式有机结合,构建具备高度可扩展性与灵活性的数据库系统,最终达到提供智能化个性服务的要求。图书馆公共媒体数据库建设从生命周期角度研究可分为获取阶段、整合阶段和分析阶段,分别进行数据资源获取、数据存储和组织、数据分析工作。公共媒体数据库数据库包括用户行为子数据库、社交网络子数据库、公共管理子数据库三个子数据库。

2)用户行为子数据库的建设

当用户通过端口进行浏览操作时,服务器会自动记录相应信息,并保存在原始日志文件中,用户行为子数据库便可通过服务器日志来获取用户浏览信息。在进行数据整合时,首先要进行数据的筛选,即对信息数据进行分类并分配权值,根据浏览行为分析出喜好与习惯;其次要进行数据组织,即将精简后的数据按照分类分众法进行有序化;最后要进行数据的存储与索引,按照列式存储方式进行存储,便于求得行为数据总量及平均值。

3)社交网络子数据库的建设

社交网络的子数据库建设是对用户评论信息、发表博文、收藏情况、标签添加、文献贡献等信息进行搜集、分析与整合,最终形成社交网络子数据库。其中,数据的获取主要是通过社交网络爬虫抓取的方式,而数据的整合主要采用人物分类法。

4)公共管理子数据库的建设

公共管理大多数据是借助传感器等实现数据采集、数据转移的过程。公共管理中的数据数量大且具备较高的实时性,需结合大数据技术来实现数据的有序存储与资源的快速搜索。

3 对大数据环境下图书馆公共媒体数据库利用方式的整体探索

3.1图书馆用户流失分析与价值分析

(1)用户流失分析。对图书馆用户流失与用户价值进行分析是对图书馆综合评价的有力依据,同时也能为图书馆改善方向及措施提供参考。在用户使用图书馆公共媒体数据库的过程中,导致用户流失的原因大致包括信息可靠性、搜索便捷度、服务人性化程度、数据更新速度以及能否符合用户需求与期望等几个方面,这同时也是图书馆公共媒体数据库应不断加强的地方,以用户的角度不断进行优化与完善,才可能避免用户的流失,增强用户对图书馆甚至政府的认可度。

(2)用户价值。用户价值主要包括用户知识价值与用户口碑价值两方面。用户知识价值指用户在与平台交互过程中,生成的基于自身显性或隐性知识的内容,这对对平台知识的更新和丰富具有推动作用。用户口碑价值体现在用户在对图书馆自身感受的基础上对外宣传的价值,良好的口碑是图书馆扩大用户范围,提高资源利用率的有利条件,也是图书馆平台及政府应当努力的方向。

3.2开拓新的服务领域

在大数据背景下,图书馆的竞争力已不再是单纯的馆藏资源量比拼,还包括对数据的组织分析能力和知识化服务能力,在大量信息资源、知识资源、用户资源的基础上,图书馆能发挥的职能种类更加多样。

(1)知识咨询服务。知识咨询服务主要是面对用户需求,解决用户疑问,这就需要高质量的知识数据来做支撑,图书馆公共媒体数据库恰恰符合要求。同时知识咨询服务涉及领域较多,很多时候会出现多个学科交叉的情况,图书馆现有的按专业分门别类的数据库难以满足要求,而功能公共媒体数据库以主题分类,并涵盖基于灰色文献资源和系统跟踪分析的大量数据,服务专业性与可靠性更高。

(2)市场情报服务。市场情报服务可为企业提供大量的用户行为数据,为企业确定市场方向、进行科学分析以及市场预测提供数据基础,同时,大规模的公共媒体数据库资源对于企业研究现存问题进行分析并相应作出优化调整具有相当强的可行性。

3.3公共危机预警与决策分析

(1)公共危机预警。公共媒体数据库的预警功能是指在一些公共危机未产生萌芽前,借助数据分析与数据挖掘技术,找出潜在关系链,对事态进行分析预测,及时向公众发出警告,并协助引导积极走向。

(2)突发事件决策与舆论环境构建。当发生突发事件时,政府的决策须实时、可靠、全面的信息作为决策支持,而当事件处理过后,需重新建立政府与民众间信任,恢复社会稳定环境,此时图书馆公共媒体平台可进行正面宣传,引导积极舆论导向。

4 结论

在信息更新快、数据数量大、种类多的大数据背景下,大数据可为图书馆公共媒体数据库的资源制作提供数据筛选,促进资源组织和管理能力的提升,并加速公共媒体服务的变革,从而最终满足人们日益增长的知识需求。随着图书馆馆藏资源中数字资源比例的逐渐升高,加之计算机技术、物联网技术以及云计算的普及,未来图书馆可能成为以数字资源为基础的复合型图书馆。

参考文献:

[1] 张瑜.大数据环境下图书馆公共媒体数据库建设与利用研究[D].辽宁师范大学,2014.

[2] 陈巧玲.智慧时代国内高校图书馆服务创新研究[D].福建师范大学,2014.

[3] 刘颖.高校图书馆嵌入式学科服务研究[D].武汉大学,2010.

[4] 刘峰.大数据时代的电视媒体营销研究[D].华东师范大学,2014.

猜你喜欢
大数据图书馆
图书馆
大数据环境下基于移动客户端的传统媒体转型思路