云存储影响下的数字图书馆

2011-07-24 06:12
图书馆界 2011年5期
关键词:存储设备存储系统数字

黄 燕

(西南政法大学图书馆,重庆 401120)

随着计算机技术以及网络技术的飞速发展,各图书馆纷纷投入大量的经费进行数字资源建设,使得数据存储成为各图书馆亟须解决的一大难题。云存储的兴起,可以有效解决数字图书馆数据存储这一难题。

1 云存储技术

1.1 相关概念

近年来,随着云计算[1]和软件即服务(SaaS)[2]的诞生,云存储成为信息存储领域的一个研究热点。与传统存储不同的是,云存储不仅仅是一个硬件设备,它是由存储设备、网络设备、服务器、应用软件、公用访问接口以及接入网等组成的一个系统。[3]云存储是云计算技术的一个延伸,可以认为它是一个配备了海量存储空间的云计算系统。提供存储服务是云存储的主要功能,通过网络将本地的数据存放到存储服务提供商(SSP)提供的在线存储空间,用户不需要再花费大量的人力、物力来建立自己的数据中心,只要向SSP进行在线申请,就可以得到存储服务。这样可以避免存储平台和数据的重复建设带来的存储空间的浪费。

1.2 特点及体系架构

与传统的存储系统相比较,云存储具有以下3个特点:1)云存储面对的是用户需要的网上海量数据的存储服务,而传统的存储系统只是某一企业为了某一目的而搭建的具有高速计算能力、事务处理能力的数据中心;2)云存储首先考虑的是数据的安全性、可靠性以及效率等问题,采用加密技术以及身份认证等进行数据保护;3)云存储不仅局限于提供对传统文件的访问,还可以提供对海量数据的管理与维护以及用户的正常访问等。

正是由于云存储具有以上特点,故云存储的体系结构可以分为以下4个层面,自底向上分别为:数据存储层、数据管理层、应用接口层和用户访问层。具体结构如图1所示。

图1 云存储体系结构图

(1)数据存储层。这是云存储最基础的部分,是由FC光纤通道存储设备、NAS和iSCSI等IP存储设备或SCSI、SAS等DAS存储设备云存储组成的海量数据池。这些不同类型的存储设备分散在不同的地方,云存储运用广域网、互联网、光纤等将其进行物理连接,运用存储虚拟化技术实现不同型号的存储设备的兼容,使其成为一个有机的整体,并通过统一的管理逻辑和接口实现存储设备的集中管理、状态监控以及管理软件的升级。

(2)数据管理层。它实现了底层的存储设备与上层应用的无缝连接,利用群集系统、分布式文件系统、网格计算等技术保证了各个存储设备之间的有机协同工作,利用内容发布、P2P实现数据的发布与传输,利用压缩技术、数据比对技术对数据进行删减,利用加密、备份、容灾技术来保障数据的安全。

(3)应用接口层。这是云存储平台中可以灵活扩展并直接面向用户的部分。根据用户需求,可以开发出不同的应用接口。用户需求不同,应用服务接口也就不同。

(4)用户访问层。它由广大用户组成,无论在任何地方,只需一台能联网的终端机,任何一个授权用户通过标准的应用接口都可以登录到云存储平台,享受到云存储提供的数据存储服务。

2 云存储给图书馆带来的好处

云存储技术是数据存储领域的核心技术。图书馆是信息搜集、存储和进行知识服务的机构,图书馆的数据每年呈千万兆级的趋势增长,由于缺乏专业的计算机人才对存储系统进行管理,严重影响了读者方便、快捷地进行信息资源的获取。云存储为图书馆带来了数据存储的新选择,为图书馆开展业务工作提供了技术保障,为读者顺利获取信息提供了稳定的环境。主要表现在以下6个方面。

2.1 减少资金投入

图书馆每年都要投入大量的资金进行存储设备的扩容。扩容的方式主要有2种,一种是直接在整列柜中添加磁盘。采用这种方式比较省钱,但是必须购买与原有磁盘品牌、接口、型号等完全相同的磁盘。众所周知,计算机硬件发展迅速,更新较快,一般两三年后厂家就不再生产同一类型的硬件了,而且以前的存储系统无论在传输速度以及接口方式上都已经无法满足数据存储的需求,所以这种方式采用得并不多。另一种方式是购买新的存储系统。采用这种方式资金投入比较大,大多数图书馆很难承受。而云存储系统对存储设备、服务器设备、硬盘等产品的一致性并没有要求,不同介质、容量、厂牌、型号的硬盘,利用存储虚拟化技术都可以一起协同工作,既可以实现原有硬件的利旧保护投入,又可以实现新技术、新设备的快速更新。

2.2 降低管理难度

目前每一个数字图书馆都需要配备专门的计算机专业人才对服务器、存储系统进行日常管理和维护,由此会产生一定的人员成本和技术成本。专业技术人员需要了解不同商家的不同存储系统的使用情况,工作难度较大。在硬盘或是存储服务器损坏时,数据丢失的可能性也很大。而云存储则没有这些困扰,硬盘坏了不需要立即更换,数据会自动迁移到别的硬盘,从而大大减轻了管理人员的工作负担,避免了由于数据丢失而造成的损失。

2.3 方式灵活,易于扩容

云存储的用户群体庞大,需要具有专业知识且经验丰富的技术人员对存储系统进行管理与维护,图书馆只需要提出自己的访问数量、使用时限以及服务项目等情况,存储提供商再根据服务项目进行合理收费。图书馆还可以根据资金承受能力随时提出需求变换,真正做到“按需使用”。

2.4 数据更安全

云存储可以近乎完美地避免“数据库不能正常访问”等问题的发生。云存储是将文件和数据保存在不同的存储节点上,它知道文件的存放的位置,当发现某一文件不可访问时,系统会自动将读写指令发送到另外一个服务器上的文件,使服务持续进行。

2.5 推动信息共享

图书馆之间可以达成协议,将数据都提供给同一个SSP进行存储与管理(也就是不同的图书馆将自己的数据放到同一个数据池中),SSP就会给协议内的图书馆授权,从而实现不同图书馆之间的数据共享。对于参加合作的图书馆来说,在云存储系统中,通过云计算技术,他们可以实时地获得其他图书馆的资料,使用户的信息需求获得极大满足。[4]

2.6 避免重复存储

目前,许多图书馆都购买了自己的存储系统和相同的数字资源,这就造成了相同数据的重复存储。云存储通过光纤、广域网将分布在各地的存储设备连接起来,通过存储虚拟化技术进行集中管理,当不同的图书馆提供给SSP的数据重复时,云存储会通过数据管理层对重复数据进行删除。

3 云存储给图书馆带来的困扰

毫无疑问,云存储可以很好地解决图书馆存储空间与日益增长的数据量之间的矛盾,节省了图书馆的经费开支,为图书馆之间的信息共享起到推动作用。但是,如果图书馆将全部数据都托付给SSP,也会在技术、版权保护等方面出现问题。

3.1 云存储的技术问题

虽然在国外云存储已经有了很多成熟的案例,如由JISC资助的项目Fedorazon[5]解决了大规模仓储所面临的数据量不断增长和复杂度不断增加的问题;DuraSpace发起的 DuraCloud[6]扩展了多个云存储平台,并力图解决在不同平台间的数据迁移。而国内云存储技术发展比较迟缓,仅停滞于理论研究阶段。国外的实践表明,云存储的访问对网络的传输速度要求很高,就目前的网络环境而言,如果执行大规模数据请求或数据恢复操作,云存储是否可以提供足够的访问空间以及所有站点的中心设备的高速响应是云存储亟须解决的问题。在未来,当网络环境得到优化后,或许云存储厂商可以提供一套组件,在完全本地化的系统上来模仿云地址,让本地NAS网关设备继续正常运行而无需重新设置,数据传输将更加迅捷。如此一来,即便是客户的本地数据发生了灾难性的损坏,云存储厂商也可以将数据重新快速传输给客户数据中心。

3.2 图书馆对商业模式的认同度

云存储采用商业模式来运作,用户需要根据服务时间、服务内容来付费。孙卫[7]分析了6种主要云存储商类型,总结出3种商业模式:1)以商业销售硬件、软件帮助客户建立云计算环境的商业产品模式,以IBM、SUN、微软为典型代表;2)以互联网运营商提供免费服务获得更多广告的云的支撑模式,以谷歌、亚马逊、微软为代表;3)为有商业价值的传统行业专门服务并收费的云的支撑模式。众所周知,图书馆是公益性的服务机构,商业模式的开展会受到一定的制约。如何在享受云存储服务商提供服务的同时,避免受到云存储服务在价格方面的制约,是图书馆要解决的一个问题。

4 云存储带给图书馆的思考

4.1 部分数据托管

图书馆应该有选择性地将部分资源托管给SSP,在日常业务和管理环节中局部地应用一些专业的云服务商提供的服务。[8]此种模式国外已开先河,如哥伦比亚区公共图书馆正在使用Amazon的EC2服务托管它们的网站,图书馆联盟OhioLINK正在使用Amazon's Web Services托管一小部分它们的数字公共资源。国内的图书馆联盟应号召成员馆将有价值的、无版权纠纷的数字资源部分托管给SSP,在SSP提供的平台上进行数据共享,这样每一个成员馆都能做到用最小的投入获得最大的收获,充分实现利益最大化。

4.2 重新定位图书馆的信息服务

云存储在很大程度上弱化了图书馆的数据库维护、存储系统维护等IT功能,也可以说减小了数字资源管理人员的工作难度和强度。未来的图书馆应利用云存储的强大计算能力、海量存储能力,考虑增强新的业务功能,寻求新的定位。特别是在数字资源的选择、评价、分析、整合上,利用数据挖掘及知识发现工具,为用户在云存储的数据池中利用信息资源提供指导依据。

[1]Hayes B.Cloud Computing[J].Communications of the ACM,2008,51(7):9-11.

[2] Laplante P A,Zhang J,Voas J.What's in a Name?Distinguishing Between SaaS and SOA[J].IT Professional,2008,10(3):46—50.

[3]王庆波,金 涬,何 乐,等.虚拟化与云计算[M].北京:电子工业出版社,2009:10—20.

[4]永 先,栾旭伦,李森森.图书馆迎来“云”时代[J].高校图书情报论坛,2009(3):59—62.

[5] Fedorazon[EB/OL].[2010-04-20].http://www.ukoln.ac.uk/repositories/digirep/index/Fedorazon.

[6]DuraCloud[EB/OL].[2010-04-20].http://www.duraspace.org/duracloud.Php.

[7]孙 卫.图书馆在云时代的思考[J].数字图书馆论坛,2009(6):35—41.

[8]图书馆云地图:云计算和存储指南[EB/OL].[2009-07-22].http://www.yeeya n.com/articIes/view/100748/58660.

猜你喜欢
存储设备存储系统数字
天河超算存储系统在美创佳绩
面向4K/8K的到来 存储该怎么办?
答数字
数字看G20
浅析计算机硬件发展史
浅析铁路视频监控存储设备设计
成双成对
数字变变变
防止USB接口泄密