电视播出机房磁盘阵列预防性维护

2014-07-02 00:29王皖春
电视技术 2014年22期
关键词:热备磁盘阵列液晶面板

王皖春

(阿勒泰地区电视台,新疆 阿勒泰 836500)

电视播出机房磁盘阵列预防性维护

王皖春

(阿勒泰地区电视台,新疆 阿勒泰 836500)

针对电视台节目播出的安全、磁盘阵列数据的安全,提出了磁盘阵列预防性维护策略。结合阿勒泰地区电视台播出机房使用的INFORTREND ES磁盘阵列实际,论述如何开展预防性维护,即正确理解磁盘阵列LCD液晶面板显示信息含义,正确操作选单;磁盘阵列正式使用前要做好预防性维护的准备工作,应注意预防性维护要点及技巧。

磁盘阵列;预防性;RAID;热备援盘

预防性维护就是为了延长设备的使用寿命和避免、减少设备故障而进行的维护,目的在于将设备的故障率降至最低,将周期中设备的可用性和可靠性增至最高。各地电视台现普遍使用硬盘播出系统,作为播出机房电视节目数据存储载体,磁盘阵列如果读取、写入无反应或瘫痪,将直接影响到电视安全播出。通过开展预防性维护来提高磁盘阵列使用寿命,减少故障,提前做好可能要出现问题的预防策略及相应动作,保证与播出节目存储相关的各磁盘阵列稳定工作[1-3]。

1 阿勒泰地区电视台电视播出机房磁盘阵列简介

各地电视台播出机房使用不同品牌的磁盘阵列,工作原理、操作模式大体相同,维护方法也类似。2010年,阿勒泰地区电视台播出机房使用Magi Stream3000硬盘播出系统,主备视频服务器Magi Stream3000各都外接INFORTREND ESA12U-G2421磁盘阵列;二级存储管理服务器1外接INFORTREND ESS16SG1030磁盘阵列。2013年初系统升级,增加1台二级存储管理服务器2及其外接的INFORTREND ESDSS16-G2240磁盘阵列。本文结合阿勒泰地区电视台使用的IN⁃FORTREND ES系列磁盘阵列,论述电视播出机房磁盘阵列预防性维护工作是如何开展的。

2 磁盘阵列预防性维护

1)做好磁盘阵列预防性维护,首先维护人员要正确理解本单位播出机房使用的磁盘阵列LCD液晶面板显示信息含义,另外还必须能熟练掌握选单各种常用操作。

INFORTREND ES系列磁盘阵列通过LCD液晶面板可察看逻辑磁盘和物理磁盘状态。按住Enter键2 s,进入磁盘阵列主选单,按上下键选择“View and edit log⁃ical driver”,进入后选择逻辑磁盘,显示如图1所示。

图1 通过LED液晶面板察看逻辑磁盘、物理磁盘状态

图2为同一时间磁盘阵列S16-G2240二组逻辑盘状态。第1组RAID5使用了6块2 Tbyte物理磁盘,逻辑盘有效容量为10 Tbyte(图2a)。第2组RAID5由5块2 Tbyte物理磁盘组成,逻辑盘有效容量为8 Tbyte,同时另配了2块2 Tbyte物理磁盘设置为全局热备援盘,其中SOLT1槽位物理磁盘设定为全局热备援盘(状态见图2b),由图2c可以看出第2组RAID5中1块物理磁盘出现故障,有1块全局热备援盘自动替换有问题的物理磁盘,并正在做重建数据工作,此时2组RAID5全局热备援盘只剩下1块,之前正常时图2a、图2c的SB值都应为2,现在2个逻辑盘的共用的热备援盘就只有1块,则SB值为1,若第2组RAID5重建顺利完成后,图2c中DRV值将变为5,RB位置字符变为GD。

维护人员应熟练掌握磁盘阵列建立不同RAID模式、通道映射、逻辑盘分区、磁盘损坏更换等操作,平时选单察看或执行每一步都要慎重,防止人为误动作。

通过磁盘阵列LCD液晶面板选单能监看、调整参数很多,当设备出现问题以错误信息通过LCD液晶面板显示出来,维护人员要正确分析,在快速找准问题的同时正确处置,以最短的时间使设备恢复常态。

图2 同一时间磁盘阵列S16-G2240二组逻辑盘状态(照片)

2)磁盘阵列正式使用前要做好预防性维护的准备工作。

(1)防震

阿勒泰地区电视台选用标准的42U机柜保证其固定机房地面牢靠,磁盘阵列均水平安放于有固定垫板的标准机柜中,并用镙丝紧固,使其与机柜连为一体,能有效保护磁盘阵列磁盘,减小震动带来的危害。

(2)良好接地及良好的电力环境

接地不仅是为了防止电子设备遭雷击而采取的保护性措施,同时也是保护人身安全的一种有效手段,再者播出机房大量设备之间信号的互连要求各设备都要有一个基准点——公共接地。在接地设计中,信号之间的电磁互扰问题必须引起注意,本文在磁盘阵列安装时就充分考虑了上述问题,同时做好了机柜机壳接地这方面的焊接工艺。因磁盘阵列内有多块物理硬盘工作,当突然断电时,高速旋转的磁盘容易受损,后果将直接影响阵列上的数据,因此必须要求不间断电源供电,同时要保证电力环境是干浄的,另一方面禁止纯容性、纯感性负载接入。

(3)设置好合理的RAID模式、热备援盘

播出机房磁盘阵列在频道正式使用前要根据本单位实际、根据节目播出存储需求,确定磁盘阵列RAID模式同时科学分配逻辑盘、建立分区。

为追求存储的数据安全,播出机房4台INFOR⁃TREND ES磁盘阵列均使用RAID5+SPACE模式(RAID5模式的扩展),能实现加N块热备援盘(N≥1,N为整数)。设置热备援盘可分为局部(本地)和全局两种模式,维护中发现当磁盘阵列里所有物理硬盘仅设为1组磁盘阵列时,设置热备援盘为局部(本地)或全局并没什么区别。当磁盘阵列里全部物理磁盘分设为2个逻辑盘,也就有2组RAID,且每组物理硬盘数量相同时,磁盘损坏机率均等,可以设每组有各自的热备援盘,这2个热备援盘设为局部的,各负其责,不能互换。当阵列里物理磁盘设为2组且每组磁盘阵列里的物理磁盘数量不相同时,这时可以将热备援盘设为全局,物理磁盘数量少的那组磁盘阵列如果单独拥有自己的局部(本地)热备援盘,则有些浪费,因为比较同一个磁盘阵列里的数量多的那组RAID中物理磁盘损坏机率小,总体上设热备援盘为全局相对科学。就是说这两组里任一磁盘阵列里有1个物理磁盘损坏,全局热备援盘都可以自动替换并重构损坏物理磁盘里的数据。

(4)做好物理磁盘备份

物理磁盘备份,原则是同型号。磁盘阵列自身机箱里的控制器、电源一般故障率很低,稳定性较高,4年来阿勒泰地区电视台还没有出现因控制器、电源引发的故障。但因磁盘阵列里使用的物理磁盘所引发的故障占90%,所以磁盘阵列使用的物理磁盘平时一定要有多余备份,原则上要使用同一型号同一批次。如果遇到同容量的硬盘市面上找不到,可考虑用同接口、同转数及同品牌、容量更大的硬盘做备份。

3)做好平时的预防性维护工作。

(1)保证空气环境正常

空气环境是指设备周围的温度、湿度及灰尘状况,长时间高温运行的环境中,磁盘阵列中各元件极易发生老化、磁盘故障易频发。阿勒泰地区电视台磁盘阵列所在的机房与播控操作室隔离,内部装有格力落地式空调,平时将制冷温度设定于19℃,要求值班员每班必须巡检磁盘阵列所在的机房温度及检查空调运转情况。湿度过大容易造成电路板短路而烧毁;湿度过小容易产生静电,也会击穿部分电子元件。因此,湿度过大、过小,都会给磁盘阵列带来潜在的威胁。每班人员用湿拖把拖地,降低灰尘对磁盘阵列工作的影响并保证机房湿度达到40%~60%RH标准范围。定期在检修时间除尘,若磁盘阵列通风口堵塞或物理磁盘上长期积有灰尘,会导致不断电工作的磁盘自身热量散不出去而出现损坏。半个月一次的前后面板除尘,使用小软毛刷;一年一次的磁盘阵列机身的除尘,使用吹风机、小软毛刷即可。机身除尘时所有物理磁盘取出后顺序一定要做好标记,除完尘后一定要安原位置放好,并确定插好槽位。

(2)保证电力环境正常

每班值班要巡检UPS供电输出参数。当出现停电时,巡查UPS蓄电池电量情况:阿勒泰地区电视台使用科华30 kV·A UPS,最高充电电压为392 V,当放电达到330 V时,UPS电量将耗尽,此时要及时切换到备份电源上供电。

(3)定期检查接地性能

每年春季气象局防雷减灾办技术人员到阿勒泰地区电视台播出机房通过专业测试仪器检查接地情况,保证机房设备接地电阻小于1Ω。

(4)数据备份、防病毒

为以防万一,平时上传到磁盘阵列的电视节目,重要的由总编室统一保存于全台媒资存储服务器里。服务器安装有网络杀毒软件、硬件防火墙,定期升级;另一方面严禁在物理磁盘播出系统里使用U盘及移动硬盘,若特殊情况要使用,必须经过台里专门配备的杀毒机杀毒方可使用。

(5)每天检查磁盘阵列运行状态

检查有无报警、巡视面板上各指示灯有无异常。针对报警信息,进入LCD液晶面板选单检查问题。

4)磁盘阵列平时预防性维护应注意的一些技巧。

(1)经常查看服务器日志,了解服务器及磁盘阵列运转情况,这样能为做好预防策略提供很大帮助。

(2)及时清理磁盘阵列无用垃圾文件、垃圾条目。这样可以提高磁盘利用空间,提高节目检索速度。

(3)磁盘阵列更换物理磁盘时做好标记:①何时换上,何时换下,有利于检查每个物理磁盘使用时长。②分类不同阵列使用的备份物理磁盘及好盘坏盘,防止应急更换物理磁盘时拿错备份物理磁盘,导致不必须要的问题发生。③可以通过标记统计,做出正确技术决策。如平时磁盘阵列S16S G1030使用有ST31000524NS和ST31000340NS这2种类型磁盘,在2年过程中有多块物理磁盘损坏,通过平时统计标记发现损坏的都是ST31000340NS,而ST31000524NS型号没有损坏,考虑到工作稳定,后续决定选备份物理磁盘时仅选择ST31000524NS型号。

(4)定期重启连接磁盘阵列的服务器,释放内存,否则长时间使用,操作系统会运转越来越缓慢,影响磁盘阵列数据正常读取。

(5)由单一传统磁盘阵列LCD液晶面板选单访问模式可以灵活转变为利用磁盘阵列自带网口其IP地址访问与前面的模式相结合去设置或维护磁盘阵列。

如删除磁盘阵列S16-G2240局部(本地)热备援盘,操作如下:

方法一,在LCD液晶面板选单操作界面,选中此局部热备援盘后执行删除,见图3。

图3 通过S16-G2240 LCD液晶面板删除热备盘状态图

方法二,利用磁盘阵列自带网口其IP地址访问界面执行删除,见图4。

图4 通过网口IP地址访问删除热备盘操作(截图)

何时用LCD液晶面板选单操作?何时通过磁盘阵列自带网口其IP地址访问?经验认为在更换出现故障的物理磁盘时,使用前LCD选单查看信息更快捷方便;在定期检查设备状态或RAID新建重新设置时通过磁盘阵列自带网口其IP地址访问更直观。

3 结束语

2010年至今,INFORTREND ES磁盘阵列已使用了4年,虽出现过问题,但在问题解决之后,越发认识到进行磁盘阵列预防性维护工作的必要性。在发现问题和解决问题的过程中,不断总结经验,使磁盘阵列预防性维护方法更科学更有效,通过预防性维护工作的认真开展,减少播出机房磁盘阵列设备出现的问题,安全播出得以顺利保障。

[1]徐元凯.电视台磁盘阵列的技术维护[J].中国有线电视,2011(9):1078-1080.

[2] 王宇明.磁盘阵列存储技术简析[J].现代电视技术,2006(7):140-142.

[3] 李有忠.良好接地是传输机房安全运行的重要保障[J].中国有线电视,2002(3):29-30.

TN948

B

�� 雯

2014-02-18

【本文献信息】王皖春.电视播出机房磁盘阵列预防性维护[J].电视技术,2014,38(22).

王皖春(1973—),本科,高级工程师,主要从事安全播出、制作网建设方面的工作和研究。

猜你喜欢
热备磁盘阵列液晶面板
液晶面板搬运机械臂结构及控制系统设计
热备动车组配置方案优化模型
东海区实时海洋观测数据库双机热备系统解决方案
一种应用于分布式网络的地址分配及热备技术
更换磁盘阵列磁盘
PostgreSQL热备原理研究及流复制运用
LSIRAIDBIOS实现磁盘阵列重建
国内首条LTPS液晶面板六代线试生产
液晶面板行业的市场现状分析
为何要发展高世代液晶面板生产线