基于风险防控下的高校主机房监控系统智能化建设

2021-09-27 16:01张伟,王倚天
电脑知识与技术 2021年19期
关键词:监控系统风险智能化

张伟,王倚天

摘要:高校主机房监控系统的智能化建设意义重大。通过对影响主机房稳定运行的风险因素分析,提出了基于预判的设备自动开关智能系统规划,给出了应急故障响应流程图。

关键词:风险;智能化;监控系统

中图分类号:TP311      文献标识码:A

文章编号:1009-3044(2021)19-0093-02

Intelligent Construction of Computer Room Monitoring System Based on Risk Prevention and Control

ZHANG Wei, WANG Yi-tian

(Shenyang University of Chemical Technology,Shenyang 1101421, China)

Abstract: The intelligent construction of the monitoring system of computer room in the university is very important. Through the analysis of the risk factors that affect the stable operation of computer room, the intelligent system plan of automatic operation of equipment based on the prediction is proposed, and the emergency response flow chart is given.

Key words: risk; intelligent; monitoring system

随着高校信息化、数字化建设的不断发展,高校机房作为高校软件和硬件的系统匹配的数据中心,软硬件设施越来越多,种类丰富、系统繁杂,这就需要我们实时对应用系统和机房环境进行检测和监控。

1 主机房监控风险防控因素

1.1 长期开机状态

很多主机房服务器处于24小时常年开机状态,有两点不利影响,一是缩短服务器及其硬盘使用寿命,二是浪费电能,在凌晨至5点期间资源及其应用服务基本处于无人使用状态,可以考虑将机器暂时关闭,使用时再正常开启[1]。

1.2 非正常关闭

突然停电对电子设备尤其是硬盘的损伤比较大,有可能一次停电会造成硬盘损坏,数据丢失等严重问题,数据是业务运转的核心,是加工累积的成果,具有重要的价值和作用。减少非法关机次数,将会极大减少设备损失的概率,所以在停电后UPS启动供电时应及时关闭服务器,这对于保护数据丢失有很重要的意义。

UPS电池一年内放电两次,有效增加UPS电池使用寿命,放电可以是主动放电和被动放电,主动放电就是人为强制UPS电池工作,机房所有设备的供电来源于UPS电池,让电池完成自我充电运转,延迟电池使用时间。被动放电是市电偶然性停电,具有突发性,不可控性,停电时间过长导致电池电量彻底消耗干净后硬件设施非法断电,这样的后果是对硬件包括服务器、磁盘阵列、存储器、UPS、交换机的损害比较大,硬盘可能由于非法断电后数据丢失,甚至硬盘损坏。

1.3 主机房温湿度环境

主机房温湿度的差异对服务器、存储器等设备状态的影响非常巨大,常年温度和湿度不均衡,温度较高,湿度较高严重增加了机器设备的损害程度,加速机器设备的报废,缩短使用年限。

主机房温度一般控制在20摄氏度到24摄氏度之间,湿度控制在45%到65%之间,在数据中心电源会加热空气,除非热量被排除出去,否则环境温度就会上升,导致电子设备失灵。通过控制空气温度,服务器组件能够保持制造商规定的温度/湿度范围内。空调系统通过冷却室内空气下降到露点帮助控制湿度,湿度太大,水可能在内部部件上开始凝结。如果在干燥的环境中,辅助加湿系统可以添加水蒸气,因为如果湿度太低,可能导致静电放电问题,可能会损坏元器件[2]。

2 基于预判的设备自动开关智能系统规划

2.1 UPS剩余电量的预判和设备自动关机

停电后UPS供电系统自动启动,一般情况下UPS电池配备是根据设备数量、负载状况来考量的,如果停电时间比较长,超过了UPS电池的最大供电时间,那么我们就需要在UPS电池电量还未全部消耗完的情况下提前关闭设备,以防止设备突然停电的损坏,同时UPS也需要正常关闭。

在UPS电池电量剩余1小时的前提下,对设备进行自动关闭,设备关闭后再关闭UPS,这些操作都需要软件系统来自动执行,避免了人工现场操作,节省了人力和时间。

2.2 UPS和服务器等设备的自动启动

在停电后对设备和UPS进行正常关闭后,设备和UPS的安全得到了保障和维护。同时当正常供电后UPS和服务器等设备还需要开机启动,首先应该启动UPS供电设备,然后启动服务器等设备,UPS供电设备启动5分钟后再启动服务器,服务器全部自动开机,服务自动开启,应用智能系统完成上述操作,省时省力。

智能系统完成UPS和服务器等设备关闭和开启,如果顺利完成系统会发信息到管理员手机上,如果有问题也会发提示信息到管理员手机。智能系统会向管理员随时报告设备的运行状态,使得管理员随时随地就能监控设备、管理主机室环境。

2.3 应急故障响应流程设计

停电应急故障响应流程图如图1所示,停电后UPS自动启动供电,根据负载数量判断维持时间,一般UPS控制器前端都有液晶面板,液晶面板上可以看到负载情况,UPS在市电情况下是旁路供电,停电后是UPS电池供电。UPS管理系统安装到服务器上,与UPS串口相连,UPS管理系统会一直监视电池剩余情况,当电池维持时间降到1小时以下并且还未恢复供电,这时候启动智能关闭系统,将服务器和存储器逐一关闭,对于服务器上有运行的应用程序需要额外关闭的,例如oracle数据库,需要先将oracle数据库正常关闭后再关闭系统。服务器和存储器正常关闭后再关闭UPS,停止UPS电池供电工作。当UPS电池维持时间在1小时以上并且恢复供电则不启动智能关闭系统。

当市电来电后,UPS来电自动启动,对UPS充电,服务器和存储器设备依靠旁路市电供电,然后启动智能开机系统,服务器开机、应用系统运行等,如图2所示。

3 主机房监控系统智能化建设意义

3.1 主机房监控管理智能化趋势

服务器虚拟化技术的成熟应用,不仅节省电能,而且可以实现服务器系统快速重构,节省了双机冗余备份的负担,从双机到虚拟化,在风险上增加了安全系数,在管理上简化了管理方法。

3.2 主机房数据安全的重要性

数据是业务流程的核心,是长时间累积的信息和知识,长年工作的价值所在,它的重要性不言而喻。数据损坏或丢失都是对固定资产的严重流失,数据对于生产企业来说是无价的,对于金融行业更是极其宝贵的。

一般UPS控制器是工頻机,比较耐用,使用10多年都没有问题,服务器硬盘一般是SAS,转速1万转,信息传输速率快,使用寿命一般最长10年。当购置服务器或者存储器时,多买几块硬盘,一般服务器或者存储器磁盘按RAID5标准建立磁盘冗余阵列,如果RAID5中的某一块成员盘出现物理故障,服务器或者存储器还可以继续工作不会崩溃;如果出现两块成员盘损坏,则服务器或者存储器将不能正常工作而彻底崩溃[3]。

参考文献:

[1] 雷勇,张敏.高校计算机机房电能监控与节能研究[J].企业科技与发展,2019(8):153-154.

[2] 龚文涛,郎颖莹.基于安全视角下的高校机房监控系统规划[J].自动化技术与应用,2018,37(6):137-139.

[3] 董昶.论RAID磁盘存储技术[J].煤炭技术,2012,31(5):192-193.

【通联编辑:代影】

猜你喜欢
监控系统风险智能化
智能化战争多维透视
印刷智能化,下一站……
基于“物联网+”的智能化站所初探
无线广播电视安全优质播出的技术分析
县级区域雨量站观测设备监控系统的研究与设计
中国经济转型的结构性特征、风险与效率提升路径
互联网金融的风险分析与管理
基于Zigbee技术的煤矿井下通风机监控系统设计
企业纳税筹划风险及防范措施