500 kV变电站计算机监控系统数据停止更新的故障分析

2013-05-31 03:04段建军杨晓滨
电力安全技术 2013年4期
关键词:操作员工作站变电站

卢 刚,肖 静,段建军,杨晓滨

(山东电力集团公司检修公司,山东 济南 250021)

0 前言

当前,随着我国电力工业快速、持续的发展,各省级电网也得到了长足发展,超高压电网500 kV变电站的容量和规模不断增大,变电站综合自动化技术得到了广泛的应用,其对电网的生产、运行、维护产生了积极而深远的影响,并且随着技术的进步而得到不断完善和发展。目前,山东省内正在运行的29座500 kV变电站全部采用了综合自动化计算机监控系统。2009年10月建成投运的500 kV闻韶变电站就采用了基于IEC61850标准协议的分层分布式变电站综合自动化系统。结合该站综合自动化系统的主要结构和功能特点,对该站发生的一起典型的数据停止更新的故障进行了深入分析,提出了反措和改进建议。

1 变电站概况与计算机监控系统结构

1.1 变电站概况

500 kV闻韶变电站是山东电网500 kV网架的重要组成部分,主要承担着与山东主网联系和功率交换的任务,是山东500 kV主网架中重要的枢纽变电站。该站500 kV电气主接线采用3/2接线,500 kV出线6回;220 kV主接线为双母线双分段接线,220 kV出线16回;35 kV系统采用单母线接线。该站主变容量为4×750 MVA,采用三相一体自耦变压器;500 kV,220 kV设备均采用GIS设备;35 kV设备采用敞开式设备;保护、监控及自动装置全部微机化并下放至就地保护室。

1.2 计算机监控系统结构

该变电站采用基于UNIX平台的NS2000变电站综合自动化系统。该系统在硬件架构上遵循面向对象的设计思想,采用分层、分布式网络结构,按横向分为500 kV,220 kV,35 kV以及主变压器部分,按纵向分为站控层、通信层和间隔层3层。在软件架构上,采用组件对象模型(COM)技术和面向对象技术进行系统设计,软件采用C++、TCP/IP、OLEDB、SQL、DCOM、ActiveX等,具有良好的开放性。

该变电站应用基于IEC61850的通信规约体系,实现保护信息和控制信息等的数字化通讯控制,使整个变电站的保护自动化系统提升到一个较高的水平,能满足未来系统全信息化和升级方便的需求,并适应未来若干年系统运行要求及电力系统信息化改造的要求,同时使系统易于扩展升级。500 kV闻韶变电站的综合自动化系统结构如图1所示。

2 500 kV闻韶站监控系统典型故障分析

2.1 故障概述

图1 500 kV闻韶变电站综合自动化系统的结构

500 kV闻韶变电站自2009年建成投运以来,其计算机监控系统一直运行正常。2012-08-31T01:03,变电站运行人员发现该站监控后台所有母线电压、线路负荷等遥测数据均为零,2号、3号主变及220 kV所有线路光字牌闪烁,实时告警报文停止上传更新。变电站运行人员重启工作站后,仍未解决问题。随后,联系监控系统厂家,在厂家指导下检查1号与2号服务器的通讯程序engine进程后,判断为2号服务器的engine无法启动。运行人员将2号服务器关机后,站内操作员工作站数据恢复正常刷新。2012-09-01 T08:30,厂家技术人员到达现场对2号服务器开机启动,发现engine启动时需调用到的libacsi.so文件丢失。将该文件恢复后,可以启动2号服务器的engine进程,启动后检测2号服务器的运行数据一切正常,站内所有监控恢复正常。

2.2 故障分析

该站计算机监控系统主网采用单/双10/100 M以太网结构,通过10/100 M交换机构建,SCADA功能采用双机冗余热备用,完成网络数据同步功能。在监控后台服务器主程序中,engine程序是服务器用于站内设备通讯的主进程。在engine启动过程中需要调用系统目录/NS2000/lib/中的libacsi.so文件,在engine启动之后则不会再调用该文件。

从2012-08-31凌晨闻韶站监控后台现场出现的情况来分析,2号服务器因为某些意外造成了engine进程的退出。这些意外包括机器意外掉电,或进程从网络上收到因误码等原因导致的错误报文等。而服务器的监护进程监测到engine进程退出后立即自动重新启动engine进程,此时engine进程因为读不到有效的libacsi.so文件导致启动失败,造成2号服务器实时数据无法正常更新。此前,1号服务器一直都是运行正常的,操作员站读取的是主服务器的数据。当2号服务器进程启动异常后,无法判断出网络中已存在主服务器,故运行状态由备服切为主服。操作员工作站随即去读取网络中新的主服务器(即2号服务器)的数据,从而造成了操作员工作站遥测遥信都不刷新的情况。

在操作员站数据不刷新的这段时间,1号服务器本身的数据一直都是正常的,且自己作为主服务器在运行,因此网络上出现了2台主服务器,而操作员站读取的是网络中最新升为主服务器的2号服务器的数据。故障情况发生后,运行人员在厂家技术人员的指导下,在关闭2号服务器,操作员站重新寻找网络中的主服务器即1号服务器,并正确读取到1号服务器的数据之后,数据更新就恢复正常。而2号服务器系统目录/NS2000/lib/中的libacsi.so文件的丢失,则有可能是由于系统程序错误或维护人员误删除所导致。

2.3 故障反措

闻韶站计算机监控系统2号服务器发生软件故障,导致运行人员在故障当日凌晨对全站设备失去监控,暴露出该站计算机监控系统本身在主备机切换机制方面存在设计缺陷以及变电站在运行管理上存在问题。因此,必须在对故障进行深入分析的基础上采取积极有效的预防措施。

(1) 闻韶站计算机监控系统主网双网配置的目的是完成负荷平衡及热备用双重功能。在双网正常的情况下,双网以负荷平衡工作,保证实时系统的可靠性,而SCADA服务器负责整个系统的协调和管理,保持实时数据库的最新最完整备份,负责组织各种历史数据并将其保存在历史数据库服务器中。理论上,当某一台SCADA服务器故障时,系统将自动进行切换,切换时间小于30 s。当出现闻韶站所发生的某台服务器进程启动异常后无法判断出网络中已存在主服务器并自动将运行状态由备服切为主服的情况时,监控系统应增加心跳机制的逻辑判断。一旦在网络中出现2台主服务器的情况,就自动打开终端窗口并启动STOP命令,强制停止其中1台服务器的进程,确保网络中始终只有1台主服务器。同时,系统还应增加自监测功能,提供相应的告警提示给运行人员,使其能对计算机系统的安全与稳定进行在线监测,能够在线诊断系统硬件、软件及网络的运行情况,一旦发生异常或故障应立即发出告警信号并提供相关信息。

(2) 闻韶站计算机监控系统的硬件布局方案,是按照《国家电网公司输变电工程500 kV变电站二次系统部分典型设计》要求设计的。计算机监控系统的服务器和操作员工作站采用机架式服务器,组屏(柜)布置,放置于计算机通信机房,服务器在屏(柜)上设置维护用机架式显示器,操作员工作站经KVM延长器的方式延长至主控室。这种方式下,运行人员在主控室只能查询和维护操作员工作站的内容,而无法掌握服务器的运行情况。当主控室内操作员站显示器数据不刷新时,站内运行人员就会误以为全站数据中断。如果运行人员能够在主控室监视到服务器的信息,就不会导致对监控系统的运行状况发生错误判断。因此,计划对该站计算机通信机房内的监控系统服务器屏进行改造,通过2台服务器KVM延长的方式,将其显示器放置于主控室,使运行人员能够全面掌握监控系统的运行工况,解决因服务器发生问题而操作员工作站不能监盘和及时消缺的问题。

3 结束语

变电站是电力系统中不可缺少的重要环节,它担负着电能转换和电能重新分配的繁重任务,对电网的安全和经济运行起着举足轻重的作用。随着数字化变电站技术的不断创新和发展,对变电站计算机监控系统的可靠性与稳定性、保障实时数据的准确性和及时性都提出了越来越高的要求。变电站综合自动化系统不仅要满足站内值班监控的要求,还要满足各级调度部门对信息的实时性、准确性的要求,以及“大运行”体系下集控建设对站内设备控制和操作的可靠性要求,所以监控系统的技术方案设计以及信息流的合理流向问题都是需要进一步研究和探讨的课题。

猜你喜欢
操作员工作站变电站
左权浙理大 共建工作站
美空军特种战术操作员正在进行军事自由落体跳伞
戴尔Precision 5750移动工作站
浅谈基于H3C云计算管理平台的系统管理功能
关于变电站五防闭锁装置的探讨
超高压变电站运行管理模式探讨
面向知识自动化的磨矿系统操作员脑认知特征与控制效果的相关分析
建立工作站 力促杂志健康发展
——《行政科学论坛》杂志工作站挂牌运行
220kV户外变电站接地网的实用设计
◆新疆青河:远教操作员“评星定级”激发远教工作活力