双机热备技术在财务系统中的应用

2009-03-19 01:59刘正伟
现代电子技术 2009年3期
关键词:安全性节点

李 峰 曹 中 刘正伟

摘 要:随着现代化信息技术的发展和企业信息化进程的推进,信息应用系统已经推广到企业日常办公的各个领域。应用系统的高度自动化为以往的工作带来很大的方便,同时也提高了工作效率,企业的运转已经离不开应用系统的支持。所以对于企业重要的应用系统而言,保证系统持续、可靠地提供服务是非常重要的。财务系统作为企业中最核心业务应用之一,对于稳定性、安全性和高可用性有着极高的要求,尤其是在财务部门月底做报表的时候,财务服务器是绝对不允许出故障的。

关键词:双机备份;安全性;节点;财务系统

中图分类号:TP309文献标识码:B

文章编号:1004-373X(2009)03-097-03

Application of Information Technology to Build Digital Enterprise

LI Feng CAO Zhong2,LIU Zhengwei1

(1.Science & Technology Agency,Dagang Petrochemistry Company,Tianjin,300280,China;

2.Information Conter,Dagang Petrochemistry Company,Tianjin,300280,China)

Abstract:With the development of modern information technology,information technology and business process forward,Application of information systems has been extended to enterprises in all areas of day-to-day office.Application of a high degree of automation in the past for the work of a great convenience,but also improved the efficiency of business operation has involved the application of the system.For important business applications,to ensure continuous,reliable delivery of services is very important.The financial system as a business in one of the most core business applications,for stability,security,high availability and has very high requirements,especially in the financial sector to do at the end of statements,the financial server is not allowed out of trouble.

Keywords:two machine back-up;security;node;financial system

1 服务器容错技术简介

目前主流应用的服务器容错技术有三类,它们分别是:服务器群集技术、双机热备份技术和单机容错技术。它们各自所对应的容错级别是从低到高的,也就是说服务器群集技术容错级别最低,而单机容错技术级别最高。决定使用哪种服务器容错技术,正确的方法是要分析一下系统的重要性以及用户对服务中断的容忍程度,即系统用户能容忍多长时间的服务中断,如果服务器不能尽快恢复会造成多大的影响。

1.1 集群技术

所谓集群就是共同为客户机提供网络资源的一组计算机系统。而其中的每一台提供服务的计算机,称之为节点。当一个节点不可用或者不能处理客户的请求时,该请求将会转到另外的可用节点来处理,而这些对于客户端来说,它根本不必关心这些要使用资源的具体位置,集群系统会自动完成。集群中节点可以以不同的方式来运行,这要看它们是如何设置的。在一个理想的两个节点的集群中,两个服务器都同时处于活动状态,也就是在两个节点上同时运行相同的应用程序,当一个节点出现故障时,运行在出故障的节点上的应用程序就会转移到另外的没有出现故障的节点上,这样一来,由于两个节点的工作现在由一台服务器来承担,自然会影响服务器的性能。针对这种情况的解决方案是,在正常操作时,另一个节点处于备用状态,只有当前活动的节点出现故障时该备用节点才会接管工作,但这并不是一个经济的方案,因为你不得不买两台服务器来做一台服务器的工作。虽然当出现故障时不会对性能产生任何影响,但是在正常运行时的性能价格比并不太高。

1.2 双机备份技术

双机热备份技术:是一种软硬件结合的较高容错应用方案。该方案是由两台服务器系统和一个外接共享磁盘阵列柜(也可没有,而是在各自的服务器中采取RAID卡)及相应的双机热备份软件组成。原理如图1所示。在这个容错方案中,操作系统和应用程序安装在两台服务器的本地硬盘上,整个应用系统的数据是通过磁盘阵列集中管理的。数据集中管理是通过双机热备份软件,将所有站点的数据直接从中央存储设备读取和存储,并由专业人员进行管理,极大地保护了数据的安全性和保密性。用户的数据存放在外接共享磁盘阵列中,在一台服务器出现故障时,备机主动替代主机工作,保证网络服务不间断。

双机热备份的工作模式即目前通常所说的active/standby方式,active服务器处于工作状态;standby服务器处于监控准备状态,服务器工作时将数据写入共享磁盘阵列(或同时向两台或多台服务器写入,通常各服务器采用RAID磁盘阵列卡),保证数据的即时同步。当active服务器出现故障的时候,通过软件诊测或手工方式将standby机器激活,保证应用服务在短时间内完全恢复正常使用。双机热备典技术型应用在证券资金服务器或行情服务器,这是目前采用较多的一种模式。

双机互备模式:是两个相对独立的应用在两台机器同时运行,但彼此均设为备机,当某一台服务器出现故障时,另一台服务器可以在短时间内将故障服务器的应用接管过来,从而保证了应用的持续性,但对服务器的性能要求比较高。

双机双工模式:是目前cluster(群集)的一种形式,两台服务器均为活动,同时运行相同的应用,保证整体的性能,也实现了负载均衡和互为备份,需要利用磁盘柜存储技术(最好采用San方式)。WEB服务器或FTP服务器等用此种方式比较多。

1.3 单机容错技术

单机容错技术则是在一台服务器上实现高性能容错的,它的容错能力要远比服务器群集和双机热备份中容错能力要高。容错服务器是通过CPU时钟锁频,通过对系统中所有硬件的备份,包括CPU、内存和I/O总线等的冗余备份,通过系统内所有冗余部件的同步运行,实现真正意义上的容错。系统任何部件的故障都不会造成系统停顿和数据丢失。

以往的集群系统在出现故障的情况下,需要中断服务器的运行,然后用一定的时间切换至备用的服务器才能进行维修和恢复,这在实时响应要求非常高的应用领域是不可容忍的。具有容错技术的容错服务器,最大的优势就在于它能够自动分离故障模块,在不中断运行的情况下,进行模块调换,对损坏的部件进行维护,并且在一切物理故障消除后,系统会自动重新同步运行,从而有效的解决了客户的后顾之忧。

双机热备份和容错服务器的定位稍微有些不同,这是由两者实现的可用性差别决定的。双机热备份一般可以实现99.9%的可用性,容错服务器却可以实现99.999%的可用性。双机热备份大多应用在业务连续性不是很严格的行业,比如说公安系统、部队系统或者个别的制造企业,这些行业的应用允许数据有一小段时间的中断。而如电信、金融、证券和医疗等要求高的行业则是容错服务器的天下。

2 双机热备技术在大港石化公司财务系统中的应用

结合石化公司财务处的需求及高可用性方面的考虑,按照财务系统的架构,对原有进行系统的全面升级改造,使用共享存储的双机热备形式来提高整个系统的可用性。应用服务器和数据库服务器分别采用双机技术,使用共享的光存储设备。两组服务器采用光纤通道同磁盘阵列相连接,SYBASE数据库文件及应用服务器数据文件保存在共享磁盘阵列中。两台服务器采用active/standby方式,在工作过程中,两台服务器以一个虚拟的IP地址对外提供服务,双机热备软件控制服务器的响应,将服务请求发送给active服务器处理。同时standby服务器通过心跳线(目前往往采用建立私有网络的方式)侦测另一台服务器的工作状况。当active服务器出现故障时,standby服务器根据心跳侦测的情况做出判断,并进行切换,接管服务。对于用户而言,这一过程是全自动的,在很短时间内完成,从而对业务不会造成影响。

2.1 硬件配置

本系统由4台IBMx3560服务器作为系统的硬件业务平台,其中2台为应用服务器业务平台,组成双机热备组,另外2台作为数据库服务器硬件平台,组成双机热备组;1台EMC AX4-5存储盘阵作为共享存储平台,数据库服务器及应用服务器的相关数据以共享的形式保存在盘阵上;2台Cisco 9124光纤通道交换机,同磁盘阵列、服务器一起组成SAN存储网络。

2.2 软件配置

在本项目中由于存在多条冗余路径,所以对多路径如何进行管理就成为了提高系统运行效率和系统稳定性的重要因素,基于稳定性和效率方面的考虑,采用了EMC的PwoerPath软件来管理多条I/O通路间的负载均衡。

EMC PowerPathTM软件用于增强存储环境中开放系统的运行性能,使服务器可以在较少的时间内完成更多的工作,并消除I/O通路中的单点故障。PowerPath工作原理如图2所示。

在PowerPath体系结构中使用的设备:PowerPath在逻辑设备和物理设备的可用通路之间提供一对多映射。如果不使用PowerPath,映射关系是一对一映射的,一个设备只存在一个有效通路。原理如图3所示。

PowerPath软件体系结构:PowerPath软件具有一个“强大的驱动器”,它放置在主机上,位于主机总线适配器(HBA)设备层之上。这个透明的部件使得PowerPath可以创建虚拟的“强力设备”,为EMC存储系统提供防止故障和负载均衡的通路。

双机热备的核心软件选择的是EMC AutoStart双机热备软件。在服务器上安装Autostart集群管理软件,通过策略脚本对热备组服务器之间的切换进行控制。

EMC AutoStart支持无限制主机数量的群集组合,EMC AutoStart能按客户发展需求增加EMC AutoStart群集服务器及所载应用程序数量;提供故障监察、修复、重新启动及排除故障功能;能单独修复个别故障应用,缩短系统复原时间;动态负载调节,确保故障出现时,应用程序能平均地分布在不同服务器上;灵活、可靠、可调的群集构造,为日后扩展作好充分的准备;模块构造和开放式APIs与现在系统的各个环节配合,确保端对端可靠性;协同数据库及RDBMS数据备份服务器;提供中央管理,监察群集组内不同的UNIX平台。EMC AutoStart的这些关键技术可以为系统提供高可用性,可管理性和扩展性。

2.3 系统实施

在这套双机系统中,为每台服务器配置2块千兆以太网卡,其中1块Ethernet作为HeartBeat(心跳)线接口,HeartBeat线通过交叉线相连。Heartbeat接口配置双机热备组的私用IP地址,用于相互监视对方的健康状况。另外1个Ethernet网口用于配置服务器实际IP地址,把服务器接入到财务专用网络上,原有的防火墙等安全设备配置不变。

在存储共享的实现上,为每台服务器安装2块FC HBA卡,2块HBA卡互为备份,通过两台光纤交换机同磁盘阵列进行连接,这样就可以组合出多条访问存储设备的通路。

在解决双机监控方面,在每台服务器上安装EMC AutoStar双机管理软件。通检测服务器的网络连接状态、服务器关键服务进程状态及双机与共享盘阵的连接状态控制双机的切换。EMC AutoStar双机软件支持虚拟IP技术,将active主机和standby的IP虚拟为对外工作IP。一旦active服务器的检测状态发现异常,AutoStar会立刻激活standby服务器,接管故障服务器上所有的服务,整个切换过程对用户不会造成大的影响,而且是对用户透明的。

3 结 语

整个系统在实施完成之后实现了以下功能:实现数据及应用的分离存储,整个系统的数据都保存在外部存储盘阵上,避免了由于服务器硬件损坏而导致的数据丢失;关键性部件和SAN存储通道均实现了冗余配置,基本消除了单点故障的可能性;服务器之间进行双机热备份,即应用服务器和数据库服务器都是有两台一样的机器组成的热备组,热备组中的一台机器发生问题(软件或硬件方面)服务后,另外一台机器会迅速接管故障机器的应用,整个切换过程是由AutoStart双机软件根据策略自动进行的,无需管理员手动干预,系统切换的速度快,简化了系统维护工作量。

参考文献

[1]马纪颖,朱力军,张颜.Web信息检索中信息分类计数研究[J].现代电子技术,2008,31(10):76-78.

[2]格巴斯.Sybase ASE12.5性能优化.张崇文,译.北京:电子工业出版社,2005.

[3]袁科萍,岑岗,攀庆红.Unix Shell编程.3版.北京:中国铁道出版社,2004.

[4]冯海军.双机热备技术的应用[J].科技信息,2008(14):27-28.

[5]杨锐,冷祥.三层交换技术在局域网中的应用[J].电脑知识与技术,2008,1(3):441-442.

[6]杜永春,张喜柱,陆长福.财务管理.北京:新华出版社,1996.

[7]郭永基.可靠性工程原理[M].北京:清华大学出版社,2002.

[8]黎邵平,李锡文.双机热冗余控制系统的可靠性分析[J].自动化技术与应用,2006(12):18-20.

[9]郑建立,路林吉.双机热冗余可修复容错控制系统的可靠性分析[J].中国纺织大学学报,1999,25(1):67-69.

作者简介 李 峰 男,1973年出生,天津大港人,信息工程师。主要从事网络信息通讯管理研究工作。

曹 中 女,天津大港人,主要从事油田网络信息化系统研究工作。

刘正伟 男,天津大港人,主要从事油田网络信息化系统研究工作。

猜你喜欢
安全性节点
CM节点控制在船舶上的应用
两款输液泵的输血安全性评估
Analysis of the characteristics of electronic equipment usage distance for common users
既有建筑工程质量安全性的思考
某既有隔震建筑检测与安全性鉴定
基于AutoCAD的门窗节点图快速构建
米氮平治疗老年失眠伴抑郁症的疗效及安全性
概念格的一种并行构造算法
结合概率路由的机会网络自私节点检测算法
ApplePay横空出世 安全性遭受质疑 拿什么保护你,我的苹果支付?