TFDS服务器双机配置模式及切换方案的优化

2018-07-23 06:33滕继明中国铁路上海局集团有限公司杭州北车辆段
上海铁道增刊 2018年2期
关键词:热备磁盘阵列拓扑图

滕继明 中国铁路上海局集团有限公司杭州北车辆段

就目前而言,动态检测设备车间自主维修能力明显偏弱,当TFDS(铁路货车运行故障动态图像检测系统)服务器出现故障时,自主完成服务器的维修、配置有很大的难度,这也是一直困扰动态维修部门的一大技术瓶颈。如服务器出现故障请厂方技术人员到现场进行处理,又会出现设备长时间停机情况,对运行部门的作业组织会造成极大的影响。针对以上问题,尝试优化服务器双机热备配置模式来实现TFDS服务器远程切换管理,以提高动态部门对TFDS设备故障应急处置能力,以及日常维护保障。

1 对目前采用共享磁盘阵列双机热备模式利弊分析

目前TFDS服务器一般都采用双机热备共享磁盘的模式,两台节点服务器同时接入磁盘阵列柜,共享一个Oracle数据库中的图片及其他程序,两台机器组成群集,利用集群管理软件对节点服务器进行管理,实现主从服务器与磁盘阵列连接切换,两台服务器交替读写同一个Oracle数据库内的数据。双机热备共享磁盘阵列模式拓扑图见图1。

图1 双机热备共享磁盘阵列模式拓扑图

1.1 优点

数据存放在共享存储设备上,当某节点服务器连接集群运行时,直接在存储设备上进行读写(列车数据、车号信息、图片信息、故障信息等)。而当主从机进行切换后,另节点服务器同样读写该存储设备上的数据,确保数据不丢失。该种模式对数据存储具有较好的连贯性,对使用部门查阅历史数据较为便利。

1.2 缺点

(1)如一旦磁盘阵列出现硬件故障、宕机以及Oracle数据库出现问题,也就意味着整组服务器集群崩溃,没有有效的补救措施来进行应急处置,需长时间进行维修。

(2)当一台服务器出现故障,另一台服务器可以短期内继续运行。但如果故障机器需要重新安装系统,整个群集系统也要重新部署,不但会丢失Oracle数据库原有存储的数据,也会造成整套服务器长时间停机的问题。

(3)两台服务器共享一台磁盘阵列,磁盘阵列必须处于不间断运行状态,势必给维护人员对磁盘阵列、Oracle数据库的日常维护带来极大的困难和风险。在实际工作中,维护人员为了减少风险,往往会采取不检、不查的方式来应对,也就造成了磁盘阵列长期处于脱检脱修的状态。

所以说,这种只注重数据存储连续性的配置方式,给设备日常维护、运行风险以及出现故障后的快速处置都存在较大的弊端。

2 双机服务器独立配置Oracle数据库优化方案

2.1 服务器配置优化方案一

图2 服务器优化方案-1拓扑图

选用IBM-X系列服务器,主服务器连接磁盘阵列,从服务器不与磁盘阵列相连,而采用增加磁盘的方式来增大存储容量。主从服务器单独配置Oracle数据库,两台服务器运行软件与Oracle数据库配置信息完全一致,日常两台机器热备运行,其中一台连接探测站设备与三级联网运行,另一台空载运行。服务器优化方案-1拓扑图见图2。

2.2 服务器配置优化方案二

如需节约设备投入经费,可取消磁盘阵列配置,主从服务器都采用增加磁盘的方式来增大存储容量,单独配置大容量存储盘。主从服务器单独配置Oracle数据库,两台服务器运行软件与Oracle数据库配置信息完全一致,日常两台机器热备运行,其中一台连接探测站设备与三级联网运行,另一台空载运行。该配置方案取消了磁盘阵列的配置,一是降低了设备投入的成本;二是降低故障节点,有效防止因磁盘阵列而引起的服务器故障,提高设备运行稳定性。服务器优化方案-2拓扑图见图3。

图3 服务器优化方案-2拓扑图

2.3 两台服务器切换方案

因目前技术条件限制两套服务器不能同时并网运行,主从服务器运行切换都需和工作网络进行分别隔离,如采用物理隔离法,切换时则需要人工到服务器机房插拔网线端口实施。考虑到人工到现场切换操作的不便,如杭州北车辆段乔司TF服务器机房离动态车间有将近一个小时的路程,一旦出现故障需转换工作服务器将会耗时较长,同时也会加大出行风险。针对该问题,采用远程切换管理是较为科学可行的方法。

华为S1720二层网管交换机具备网内远程Web登录功能,授权用户可远程管理交换机上所有电口、光口的开启、关闭以及限速。我们可利用这一功能,把各台服务器的主从机分别接入交换机的电口,并在管理配置中设置好管理组,定义好各电口的名称,就可采用远程管理手段轻松解决主从机间的切换问题。

该交换机带有四个光口,地面设备传输光纤直接接入交换机,废除原使用的光电转换模块。这样配置可减少故障节点,提升传输速率,提高系统运行的稳定性。

主从服务器采用双网卡配置,主用网卡上配置与地面设备相连的内网IP以及与三级联网连接的局域网IP,副用网卡上则只配置一个局域网(内网)IP。当某台服务器空载运行时,主用网卡已和网络隔离,副用网卡依旧能和网络相连,便于对服务器的远程维护和数据的调阅。

3 方案优化后的利弊分析以及应对措施

3.1 存在的弊端以及应对措施

因主从两台服务器Oracle数据库等程序单独配置、运行,数据的存储读写将独立进行,列车信息、故障信息则分别存入两台服务器的硬盘,打破了数据存储的连续性,给设备使用部门调阅列车信息以及统计相关报表带来困难。

(1)应对措施一:一是利用服务器副用网卡一直并网运行的这一功能,在Oracle数据库监听中添加附用网卡IP,增加一个3.0平台访问地址。如用户需访问调阅该服务器列车数据时,可登陆备用3.0平台网址浏览。二是根据运用部门全部使用集中平台进行动态检车的现状,主从服务器切换运行后数据都需集中平台连续处理的技术特性,以及集中平台能独立存储生成各项统计报表的这一功能,运用部门可查阅由集中平台存储生成的各项报表,只在必要时登录备用3.0平台调取空载服务器中的过车图片。

(2)应对措施二:方案优化后,每台服务器G盘的存储空间都达到了2.4T左右,列车存储量也增至6 000列。以沪昆线过车探测量进行统计,数据库已达到90 d以上探测列车的存储能力。根据这一特性,我们可按固定周期对主从服务器进行倒切并网运行,并做好切换运行记录。如运用部门需要查阅哪个时间段的列车数据,可根据切换记录方便的定位数据在哪台服务器上,利用浏览备用3.0平台进行查阅。

3.2 优点

主从两台服务器的Oracle数据库等程序单独配置,也就是完全独立运行,数据不存在共享。当一台服务器出现故障后,可迅速切换至另一台服务器,极大的保证了TF系统运行的可靠性。

因两台服务器按固定的时间周期并网运行,在日常维护时,可大胆的对空载服务器做彻底维护,也可要求厂家技术人员利用远程手段对空载服务器做全面的维护清理。这就极大地提高了服务器运行稳定性,将服务器故障发生率降至最低。

因配置了远程切换管理功能,极大地提高了应急故障处置能力,更有效地降低故障处置时间。

4 结束语

通过对TFDS设备双机服务器Oracle数据库配置方式在应用方面的分析,阐明了采用独立设置Oracle数据库的配置方式更适用现场需求。通过定期对两台服务器联网运行切换,有效地解决了原有配置方式给检修维护带来的困难,也极大地提高了服务器运行稳定性和应急故障处置能力。

猜你喜欢
热备磁盘阵列拓扑图
低压配网拓扑图自动成图关键技术的研究与设计
简单拓扑图及几乎交错链环补中的闭曲面
热备动车组配置方案优化模型
东海区实时海洋观测数据库双机热备系统解决方案
基于含圈非连通图优美性的拓扑图密码
一种应用于分布式网络的地址分配及热备技术
更换磁盘阵列磁盘
PostgreSQL热备原理研究及流复制运用
LSIRAIDBIOS实现磁盘阵列重建
基于拓扑规则Pb-S-O体系优势区图的绘制与应用