基于云计算和IDC的图书馆建设研究

2015-08-02 07:03莉,王
关键词:数据中心服务器图书馆

梁 莉,王 涛

(1.西安体育学院图书馆,西安710068;2.西安交通大学计算机科学与技术系,西安710049)

基于云计算和IDC的图书馆建设研究

梁 莉1,王 涛2

(1.西安体育学院图书馆,西安710068;2.西安交通大学计算机科学与技术系,西安710049)

大数据和移动互联网时代下,图书馆需要对海量信息进行保存与处理,同时还需要满足用户不断增加的个性化需求.传统建设方式已经不能满足当前需求,借助于IDC的动态资源池和云计算虚拟化技术可以实现最大程度的资源整合,提高计算能力、存储能力以及系统可靠性,缩短图书馆建设周期.探讨了云计算和数据中心技术在图书馆领域的影响及作用,并在此基础上探讨基于云计算和数据中心技术的图书馆建设方案.

云计算;数字图书馆;虚拟化;IDC

1 当前图书馆建设面临的困境

随着信息化技术不断革新,传统图书馆逐步呈现落伍态势:

第一,建设周期过长.以三万用户的高校图书馆为例,从集采电脑、服务器、网络设备等,再到安装调试,业务上线,建设周期往往需要数年之久.

第二,投资金额巨大,后期维护成本高昂.图书馆建设当中IT设备和PC机占据很大一部分成本,设备正常损耗和运维费用是一笔不菲的数字.图书馆数字化建设需要众多专业运维人员从事计算机网络、操作系统、数据库、存储、软件开发以及信息处理、信息咨询等工作.图书馆经常需要部署软件、更新和修补程序,这些工作需要对多种PC配置的部署进行测试和验证,因而会耗费大量的人力.同时,由于标准化程度不高,支持人员经常需要亲临现场解决问题,这就进一步增加了支持成本[2].

第三,业务上线效率低下.每一次业务部署都要经历硬件选型、采购、上架安装、操作系统和应用程序安装以及网络配置等操作,使得业务的部署极为缓慢.

第四,高能耗、高排放.一台PC的能耗在200瓦左右,每台PC个人电脑平均运行8小时,一台PC一年耗电500~600度电左右,对于图书馆上百台规模的PC以及数量众多的IT设备和机房空调,一年的耗电量非常惊人.

第五,资源未能充分利用.PC的分布式特性使人们难以通过集中资源的方式提高利用率和降低成本,大部分用户的使用和访问集中在上班时间,非正常上班时间利用率很低,大量业务系统处于空闲状态,CPU和内存利用率不超过10%,但支持这些应用系统正常运行的硬件设备却需要不间断工作,能耗和运维成本居高不下.

第六,低可靠性.当任意一台服务器出现硬件故障或者软件故障时,则与本服务器相关的应用系统都不能使用,造成应用系统瘫痪.

第七,数据安全级别较低.PC通常是应用系统的客户端,可接收、处理、存储应用系统的数据,若这些数据是关键信息资产,则有可能造成信息泄露.另外,当前图书馆中的数据都集中存储在本地服务器上,一旦服务器出现故障,图书馆将无法提供正常的服务,甚至发生数据丢失.

第八,网络安全形势严峻.高校图书馆系统使用大量的OS、DB、Web等通用软件,很容易遭受病毒入侵、漏洞攻击、木马、拒绝服务等安全威胁,从而影响正常运营.高校图书馆采用众多低端网络设备,对于常见的病毒攻击和DDOS攻击等应对能力较差.由于缺乏高端防火墙和VPN设备支撑,常用的WWW、MAIL、FTP、DNS、数据库等服务器很容易被入侵,很容易造成极大的安全事故.

2 使用虚拟化技术的IDC图书馆技术实现

IDC的建设在硬件选型、网络架构、业务迁移、容灾备份等方面都要求更加严格,每一环节都必须精确评估.云计算技术应用也需要经过严格的业务调研、数据采集、性能分析、容量评估、硬件选型、数据中心方案制定、网络方案制定、云平台搭建、业务迁移、业务上线测试、压力测试、容灾演练等,只有这样才能建设一个健壮可靠的现代图书馆,下面对建设方案进行详细说明.

(1)业务调研:用户调研作为图书馆建设的第一环节,至关重要.我们需要对学校相关职能部门、信息化部、IT管理部门、老师、学生、图书馆工作人员、运维人员、第三方厂家代表等进行访谈,获取本次建设的规划、诉求、痛点、日常用户行为和业务场景等,获取这些信息之后我们才能对整体方案有一个全面的认识,为后面的硬件调测和业务上线打好基础.

(2)数据采集:数据中心图书馆建立要依据现有软硬件信息和用户信息,我们需要在现有服务器和PC机上部署性能采集工具,主要采集现有设备的CPU、内存、硬盘使用率和存储的IOPS指标,这当中前面三项主要为后面的硬件采购做准备,而最为关键的IOPS指标则直接影响业务上线后的用户体验,必须在各种不同类型服务器和承担不同业务的服务器上部署工具,尽可能7*24小时采集一个月之内的用户数据,这样才会得到用户闲忙时的准确IOPS值,为后期SAN的购买和RAID划分打下基础.同时,还需要重点对业务系统使用的操作系统版本、软件列表、业务系统之间的关联关系以及中间件使用情况进行信息收集,数据库业务需要使用工具得出其每日数据增量和备份目录,以便后期制定备份策略.除此之外,还需要对当前DNS配置、网络流量、防火墙配置策略、VPN策略、防病毒系统、NTP时钟源、域控服务器等数据进行准确采集,为后期的数据中心和云平台建设获取最为关键的数据[3].

(3)性能分析:在数据采集的基础上,我们需要对性能数据进行认真分析,准确计算出每种服务器和每一种业务场景的性能指标,对于存储尤为重要,一定要根据IOPS峰值和均值评估当前规模用户需要的存储数量,在目前存储成本不断降低的背景下,存储配置原则建议IOPS优先,优先保证用户体验.对于数据库业务,需要准确评估重载、中载和轻载数据库,对于重载数据库,不建议云化,保持物理部署.如果存在Oracle RAC以及集群方式数据库,需要进行测试是否可以云化,如果不能云化建议物理部署[4].性能分析需要出具分析报告,给出可以云化的系统列表、每种服务器的性能指标、网络性能分析、忙闲时IOPS值等,为后期容量评估打下基础.

(4)容量评估:云计算用户分为两部分,一部分为桌面云,也就是后端虚拟机,前段为瘦客户端和显示器,目的是替代现有的PC机;另一部分为虚拟服务器,通俗讲就是高性能虚拟机,目的是替代现有物理服务器.容量评估的目的就是给出数据中心建设服务器、网络设备、存储、外设等的采购数量.例如通过性能分析,发现用于图书馆大厅的查询电脑CPU为intel Core 2 T6500、2G内存、120G硬盘,CPU使用率为5%、内存使用率为30%、硬盘使用率为20%、IOPS为20、读写比为7∶3.那么我们在设备选型时就可以考虑HP、华为、DELL等公司最新的四路八核服务器,开启CPU超线程之后,可以提供的物理核数将达到64个,16个内存槽插满16G内存,总计256G内存,存储统一采用FCSAN,配置15K转600G SAS盘,普通业务配置RAID5,单盘在容量和IOPS达到10台旧PC机性能总量没有任何问题.这样一台服务器完全可以替代200台老PC机,成本优势非常明显,而且采用FCSAN存储,性能和可靠性都提升明显.根据用户规模、投资成本和安全级别确定采购路由器、交换机、防火墙、VPN设备、负载均衡设备、备份设备、容灾设备等关键部分的数量和类型,是否采购高端设备需要经过多次评审才能得出结论.瘦客户端采购建议选取目前主流的升腾公司瘦客户端.

(5)硬件选型:服务器选用当前主流X86服务器,CPU需要支持虚拟化,按照用户数量配置完成之后预留10%冗余作为后期虚拟机迁移使用;接入交换机选用普通千兆以太网交换机即可,核心层交换机建议选取插槽式三层交换机,支持千/万兆以太网口和万兆光口,核心层交换机采用堆叠或者VRRP方式保证高可靠性;存储设备采用FCSAN,配置SAS盘,考虑到成本,目前国内厂商里面华为公司的存储系列性价比较高;防火墙和DDOS清理设备建议采购高端系列,由于高校图书馆接入用户众多,很容易被入侵,所以安全方面应当加强;负载均衡设备可以采购目前主流的F5或者Citrix公司的NetScaler; VPN和容灾备份设备选择面比较多,国内外众多厂商产品均可选择.

(6)数据中心方案制定:在硬件设备选型之后,我们就可以进行数据中心方案的设计,主要分为网络架构、云平台设计、终端设计、业务规划.图1简单描述了云化数据中心的设计层次.

(7)网络方案制定:根据业界网络最佳设计实践参考,高校图书馆内部网络层次结构建议按照核心层、汇聚层、接入层等分层结构,才能保证网络的稳定性、健壮性和可扩展性.同时使用防火墙和路由器设备实现内外网和不同访问权限的控制,对于需要远程接入图书馆办公的用户,我们可以通过SSL VPN技术实现.DDOS攻击也可以使用专门设备进行清理,从而保证网络的高可靠性和稳定性.通过VLAN技术实现不同区域用户的相互隔离,保证网络QOS良好.图2为高校图书馆的典型网络架构示意图.

(8)云平台搭建:数据中心图书馆的基础是硬件调测和云平台软件安装,硬件调测注意严格按照产品手册并协同厂家共同完成,云平台搭建由于是第三方产品,我们在整个过程中都处于一个学习的角色,在此不再赘述.

(9)业务迁移:云平台搭建完成之后,就可以进行业务迁移,将现有图书馆业务迁移到云平台之上.业务迁移需要按照从易到难、从轻载到重载的顺序迁移.业务迁移需要选取节假日或者凌晨进行,尽可能减少业务中断时间.

(10)业务上线测试:业务迁移完成之后,需要进行至少1周的观察,在此期间原先业务系统只是暂时关机,不能销毁,确保迁移无误后可以宣告迁移成功,老的服务器可以释放.

图2 图书馆网络架构典型设计

(11)压力测试:由于云平台和物理服务器毕竟存在差异,在网络架构、信息传输和处理方式都有所不同,极有可能出现性能问题,因此需要进行压力测试,确保云平台稳定运行.压力测试可以借助压力测试工具对虚拟机进行CPU、内存、网络流量等方面加压,测试业务系统是否可以健康运行.

(12)容灾演练:容灾演练主要应对图书馆在受到地震、火灾等极端情况下是否依然可以在短期内恢复,容灾的前提是需要建立两个数据中心互为主备,通过负载均衡器的智能DNS切换和虚拟机的冗余创建可以实现短时间内业务切换到备数据中心,从而正常提供服务.

3 云化数据中心图书馆和现有图书馆对比分析

图书馆基于数据中心建设,采用桌面云和服务器虚拟化,使IT资源统一调配,根据业务需求弹性伸缩,快速响应.办公的安全性和可靠性显著提高,之前个人数据分散在个人PC上,不能很方便地进行集中存储及备份,安全漏洞较多,云化之后,高级别的安全设备和统一的防病毒系统确保系统和数据安全. IT维护效率提高明显,端到端一体化云计算数据中心,有效降低了部署系统的复杂度和实施运维难度,便于IT技术人员统一运维管理[5].下面为笔者根据参与项目得到的数据.

表1 传统PC模式与云计算数据中心模式比较分析

4 结语

大数据和移动互联网科技对当代图书馆带来了极大的挑战,相信未来图书馆的建设必将和云计算和数据中心技术紧密结合.最大限度地发挥硬件性能、提高安全级别、提高用户体验、缩短图书馆建设周期、简化业务上线流程、降低功耗,以最有效率方式实现高性能、高稳定性的图书馆服务是新一代图书馆建设的正确之路.

[1] CHRISTOPHE A,DOMINIQUE C.The Strength of weak cooperation:an attempt to understand the meaning of Web 2.0[J].Communications&Strategies,2007(5):51-65.

[2] 洪澄,张敏,冯登国.AB-ACCS:一种云存储密文访问控制方法[J].计算机研究与发展,2010(增刊I):259-265.

[3] 杨振贤.基于云计算的安全数据存储研究与设计[J].信息安全与技术,2011(10):13-15.

[4] 陈全,邓倩妮.云计算及其关键技术[J].计算机应用,2009(9):29-30.

[5] 王继鹏.高等教育云计算服务平台构建策略初探[J].安阳师范学院学报,2011(5):82-86.

[责任编辑 马云彤]

On Library Construction Based on Cloud Com puting and IDC

LIANG Li1,WANG Tao2

(1.Library,Xi'an Physical Education University,Xi'an 710068,China; 2.Department of Computer Science,Xi'an Jiaotong University,Xi'an 710049,China)

With the development of large data and mobile Internet,librariesmustmeet not only the requirements of storing and processingmassive information but also the increasing personalized needs.Traditional construction methods can not cater to the current demands.The maximum integration of resources,improvement of computation,storage and reliability of the system,shortening of library construction duration can be achieved through the use of IDC computing virtualization technology.This paper examines the impact and function of cloud computing and the core data technology on the construction of library.A construction scheme of libraries based on cloud computing and the core data technology are also discussed.

cloud computing;digital library;virtualization;IDC

1008-5564(2015)01-0093-05

TP393;G250.72

A

伴随着大数据时代的到来以及移动互联网技术的飞速发展,图书馆在提供信息资源过程中呈现出愈发重要的地位,人们对图书馆在提供数据和用户服务方面要求更加苛刻.随着云计算技术的逐渐成熟,虚拟化和数据中心技术已经广泛应用于各行各业,现代图书馆基于数据中心建设,在节能、运维、性能等方面都将得到大幅提升.运用虚拟化技术之后,图书馆信息化建设周期和业务上线周期将缩短到几个月甚至几周,业务迁移、数据容灾备份、网络安全、防病毒、全局负载均衡、网络QOS、系统恢复RTO和RPO等指标都远胜现有方案,云计算和数据中心技术不失为图书馆建设的一个优良方案[1].

2014-06-03

梁 莉(1972—),女,辽宁瓦房店人,西安体育学院图书馆馆员,主要从事图书馆建设及信息化研究.

猜你喜欢
数据中心服务器图书馆
酒泉云计算大数据中心
浅析数据中心空调节能发展趋势
通信控制服务器(CCS)维护终端的设计与实现
关于建立“格萨尔文献数据中心”的初步构想
PowerTCP Server Tool
图书馆
得形忘意的服务器标准
计算机网络安全服务器入侵与防御
基于云计算的交通运输数据中心实现与应用
去图书馆