一例EMS磁盘阵列故障分析及改进

2011-03-05 05:56徐晓静
湖南电力 2011年6期
关键词:磁盘阵列株洲稳压

徐晓静

(湖南省电力公司株洲电业局,湖南株洲 412000)

一例EMS磁盘阵列故障分析及改进

徐晓静

(湖南省电力公司株洲电业局,湖南株洲 412000)

针对株洲电网EMS系统主数据库磁盘阵列存在的隐患故障进行原因分析,提出有效的解决和改进方案。经试验和实践结果证明磁盘阵列故障问题得以解决,可提高数据库稳定性,确保电网调度安全可靠。

株洲电网;EMS系统;数据库;磁盘阵列;UPS

EMS系统 (能量管理系统)是调度控制中心实时、准确地获取电网运行情况,并及时控制调整电网安全、经济、可靠运行的重要纽带〔1〕。随着株洲电网规模不断扩大,电网结构日趋复杂,特别是2007年,随着株洲地区220 kV及以下变电站全部实现无人值班,EMS系统在株洲电网运行调度中发挥出越来越重要的作用。数据库磁盘阵列是EMS系统的核心组成部分,存储了所有系统处理参数和电网数据,其稳定运行是调度控制中心对电网及时准确调度的重要保障。

1 株洲EMS系统及磁盘阵列简介

株洲EMS系统是2001年投入运行的,近10年的时间里,株洲电网飞速发展,接入EMS系统的厂站数已由2001年的36个扩展到了如今的60多个,在电网运行调度中发挥了重要的作用。该系统主要由前置服务器、数据库服务器、磁盘阵列、高级应用服务器、数据采集服务器、WEB服务器、交换机、路由器及各种终端应用工作站等设备组成,其主要功能部分都采用双机双网冗余配置〔1-2〕。

EMS系统核心部分数据库模块采用主、备数据库冗余配置。主数据库由2台数据库服务器和磁盘阵列组成,系统处理参数和电网数据存储在磁盘阵列中。备数据库建立在1台前置服务器上,前置机硬盘用来存储参数和数据。当主数据库出现问题时,系统自动切至备数据库,当主数据库恢复时,同步程序将备数据库的数据恢复到主数据库中,以保持磁盘阵列中历史数据完整性。

EMS系统设备的供电采用2路主、备市电通过并联式UPS稳压供电,其中主数据库的磁盘阵列因对电压波动很敏感,在并联式UPS后还增加了内置电池的UPS进行双重稳压。

2 磁盘阵列故障案例分析

2010年8—9 月,主数据库磁盘阵列先后2次出现不能正常读写数据,数据库自动切至备数据库的现象。造成此问题的可能原因有如下几点:

(1)机房温度、湿度短时间不符合标准,引起数据库磁盘阵列等敏感设备不能正常工作;

(2)主数据库容量超过正常工作容量,引起数据库读写异常;

(3)主数据库供电模块设备出现问题,稳压、持续供电作用失效。

检查分析机房相应检测及环境设备运行记录及对数据库事件日志进行排查:

(1)机房配置的空调、空气净化器等设备运行正常。运行巡视记录表明机房温度、湿度保持在正常范围,环境要素符合技术要求,数据库日志中无温度、湿度引起磁盘阵列异常的事件记录。

(2)数据库容量实时监测工具运行正常,当数据库已用容量为总容量的90%时,监测工具会正常报警提示。运行维护记录表明,数据库容量达到90%时,进行了及时清理,数据库日志中无数据库容量超过正常工作容量的事件记录。

(3)查看主数据库出现异常时间段内的数据库日志,发现有数据库服务器无法正常连接使用磁盘阵列的事件记录。同时查看这段时间电网开关线路的历史事项记录,发现异常现象出现时,机房市电供应的相关变电站有供电线路跳闸引起机房主、备电源切换记录。人工模拟机房市电供应主、备电源切换,主数据库出现了不能正常工作,切至备用数据库的现象。主数据库磁盘阵列供电模块的双重稳压结构,本身能抵抗市电主、备电源切换引起的电压波动,但现在双重稳压结构的稳压、持续供电作用失效,由此可确定主数据库磁盘阵列供电模块的设备出现了问题。

3 磁盘阵列故障处理

因主数据库的磁盘阵列是对电压波动敏感性高的设备,所以采用了并联式UPS和内置电池UPS3进行双重稳压,并联UPS由UPS1和UPS2并联组成。磁盘阵列供电流程如图1,市电稳定时,由市电主电源经并联式UPS和UPS3双重稳压后供电给磁盘阵列;当市电出现大的波动,市电电源主备切换的短暂瞬间,并联式UPS和UPS3会切为电池供电,进行双重稳压,保证磁盘阵列供电稳定性和持续性〔3〕。目前双重稳压结构的稳压、持续供电作用失效,问题设备应是图中虚线所示,即并联式UPS及电池组,或是UPS3。

图1 磁盘阵列供电流程图

分别对UPS1,UPS2和UPS3进行设备放电试验。对UPS1,UPS2及电池组进行放电试验,设备放电正常。对UPS3进行放电试验,发现内部电池老化失效。由测试结果可知:失效设备为后备式UPS3。找到问题设备后,购买新的内置电池UPS进行更换。

4 磁盘阵列供电改进方案

主数据库磁盘阵列供电采用了并联式UPS和内置电池UPS3进行双重稳压,但UPS3存在单点风险。为进一步巩固磁盘阵列供电稳定性,消除单点风险,增加内置电池UPS4与UPS3并联。如图2所示为改进后的磁盘阵列供电流程图。当UPS3和UPS4都正常时,负载均衡供电,当UPS3出现问题时,UPS4承担所有负载,不影响供电模块正常供电稳压。通过改进磁盘阵列供电模块,消除了单点风险,提高了磁盘阵列供电稳定性。

图2 改进后的磁盘阵列供电流程图

5 效果检验

实施处理改进方案后,人工切换机房市电主备电源,模拟市电波动,磁盘阵列运行正常,主数据库正常。2011年1月,机房市电供应相关变电站因天气原因开关线路跳闸,引起到调度大楼自动化机房的市电输入波动,市电电源由主切为备,主数据库磁盘阵列仍运行正常,未受影响。截止2011年10月,先后出现了3次市电供应波动情况,市电电源由主切为备,主数据库磁盘阵列仍运行正常。试验和实践结果证明,磁盘阵列供电模块的稳压作用可靠,消除了市电波动对主数据库磁盘阵列的影响,提高了数据库稳定性。

6 结束语

文中针对因磁盘阵列供电模块UPS稳压失效而造成磁盘阵列运行异常的故障进行了分析,实施了技术改进,经检验结果证明解决方法正确有效,消除了数据库磁盘阵列安全隐患,提高了EMS系统数据库稳定性,确保电网调度控制安全、经济、可靠地运行。

〔1〕龚强,王津.地区电网调度自动化技术与应用〔M〕.北京:中国电力出版社,2005:284-321.

〔2〕株洲地区电网2010年自动化年度运行方式〔Z〕.株洲:株洲电业局,2010:5-15.

〔3〕周志敏.UPS电路结构与工程应用〔J〕.UPS应用,2006(1):54-56.

TM734

B

1008-0198(2011)06-0051-02

10.3969/j.issn.1008-0198.2011.06.016

2011-09-27

猜你喜欢
磁盘阵列株洲稳压
株洲新时代输送机械有限公司
株洲新时代输送机械有限公司
中车株洲电力机车有限公司
株洲工业 与新中国一起成长的璀璨明珠
更换磁盘阵列磁盘
基于T型连接变压器的异步发电机稳压稳频控制
基于迟滞比较器的双阈值稳压供电控制电路
基于神经网络控制稳压系统在ICPT中的应用
基于DSP的稳压控制系统设计
电视播出机房磁盘阵列预防性维护