RAID1在莱斯塔台自动化系统上的应用

2023-06-03 12:10关文俊
电脑知识与技术 2023年10期
关键词:磁盘阵列

关文俊

关键词:莱斯塔台自动化;RAID1;Linux;SSACLI;磁盘阵列

中图分类号:TP311 文献标识码:A

文章编号:1009-3044(2023)10-0099-03

0 引言

民航湛江空管站莱斯集成塔台自动化系统属于湛江机场迁建工程空管工程项目之一,是由南京莱斯信息科技股份有限公司自主研发的具备自有知识产权的集成塔台自动化系统。该系统是中南地区首套面向机场管制用户的业务集成系统,能够实现管制信息资源统一处理与显示,实现管制业务一体化整合,向用户提供一体化、集成式管制指挥平台。系统覆盖塔台管制全流程的电子化、数字化航班进程管理(EFS);一体化的机场场面和空中态势监控;基于监视趋势及管制意图的安全告警、停止排灯控制;先进的航空器滑行路由规划(人工、自动)功能;灵活显示的运行环境信息(气象、情报、流量等);高度信息关联、便捷的集成显示联动操作界面;与外部单位(系统)交互联动的一体化运行等功能。解决了塔台设备繁多、信息关联集成度低等问题,并着眼于塔台管制业务和系统整体规划,基于塔台管制流程,创新新模式、新格局,从物理、信息、功能三个层面,构建了基于塔台工作流的信息化集成框架,形成一体化、集成式塔台管制系统解决方案。莱斯机集成塔台自动化系统基于Linux 7.8操作平台,采用C/C++语言编程、QT图形工具开发的三网分布式系统。该系统中,服务器均采用双机热备份方式工作。终端均采用单机三网工作方式,由于终端没有双机冗余结构,所以终端配置RAID1显得更加重要。

民航湛江空管站莱斯集成塔台自动化系统的终端硬件型号为惠普Z4,所有终端配置两块设置了镜像RAID1的硬盘,最多可允许一块硬盘故障而不影响设备的运行。

1 RAID的介绍

RAID全称是Redundant Arrays of InexpensiveDisks,即容错式廉价磁盘阵列[1]。磁盘阵列分为软件RAID与硬件RAID,软件RAID主要是通过软件来仿真数组的任务,因此会损耗较多的系统资源。硬件RAID是通过磁盘阵列卡来达成数组的目的,磁盘阵列卡上面有一块专门的芯片在处理RAID的任务,因此在性能上会比较好。这也是目前湛江空管站所有终端及服务器所采用的方式。RAID根据类型的不同有着不同的功能,常见的RAID 类型有RAID0、RAID1、RAID5、RAID10等。

RAID0 称为stripe 即等量模式。这种模式的RAID会将磁盘先切出等量的名为chunk的区块大小,chunk 一般设为4k~1M 之间[2],当一个文件要写入RAID时,如图1所示,该文件会依据chunk的大小切割好,之后再依序交错等量地放到各个磁盘里去。由于数据已经先被切割并且依序放置到不同的磁盘上面,因此每个磁盘所负责的数据量都降低了,也就是RAID0的数据写入性能提高了。但是由于数据被等量分开存储,当RAID0 中的某一个硬盘故障了,在RAID0上面的所有数据都会丢失。

RAID1称为mirror即镜像模式。RAID1模式主要是让同一份数据,完整地保存在两个磁盘上面[3],当一份数据传送到RAID1之后,阵列卡会主动复制一份分成两股并分别写到各个硬盘上面,两个硬盘上面的内容一模一样。RAID1的特点就是磁盘容量一半在用,另一半备份,当其中一个硬盘故障时数据依然完整,不影响系统的运行[4]。此时插入一个新的硬盘后就可以进行数据重建。即RAID1最多允许1个硬盘故障,对于安全第一的空管行业而言,在塔台自动化系统上使用RAID1可以有效提高系统的安全保障级别。目前湛江空管站塔台自动化大部分对硬盘容量需求不高的终端、服务器所使用的就是RAID1。

RAID10,所谓的RAID1 0就是先让两个硬盘组成RAID1,这两组RAID1再组成一个RAID0。如图3所示,Disk A+Disk B 组成第一组RAID1,Disk C+Disk D 组成第二组RAID1,然后这两组RAID1 再组成RAID0。这样第一组或第二组RAID1中的一个硬盘故障了不影响数据的完整性,同时RAID的写入性能也得到的提升。

2 莱斯塔台自动化RAID配置

以莱斯的HP DL380为例,DL380的两块硬盘由阵列卡(HP Smart Array P408i-a SR Gen10)管理,在安装一台新主机时需要先设置阵列卡,将两块硬盘配置为RAID 1 模式,以保证系统运行的可靠性。具体步骤如下:

1)在主机开机引导的过程中,关注屏幕打印,当屏幕下方看到如图4 画面时,及时按下“F9”,按下F9 后,进入System Utilities 设置界面,然后选择Systemconfiguration进入系统配置界面[5]。

2)在系统配置界面选择“Embedded RAID1:Smart Array P408i-a SR Gen10”进入到阵列卡配置界面如图5所示:

3)在阵列卡配置界面选择“Array Configuration”,然后勾选需要创建RAID的两块硬盘,选择“Proceedto next From”回车然后再设置RAID级别为RAID1。

4)设置完成RAID 级别后点击“Proceed to nextFrom”进入如图7 所示的确认界面,点击“SubmitChanges”然后保存配置并重启即可完成RAID1 的配置。

3 惠普SSACLI 陣列管理工具

SSACLI是HP为Linux环境提供的一个磁盘管理工具,通过此工具,维护人员可以查看阵列的健康状态;配置RAID 阵列以及手动重建数据等一系列的操作。

3.1 安装SSACLI 阵列管理工具

首先将SSACLI管理工具拷贝至莱斯系统的home 目录下,然后进入超级用户,输入以下命令进行安装:“rmp -ivh SSACLI-4.21-7.0.x86_64.rpm”[6]。如图8 所示:

3.2 SSACLI 排查故障应用分析

湛江空管站莱斯塔台自动化EFS0所采用的机器是HP Z4 阵列卡采用的为MSCC 的SmartHBA 2000-4i4e。值班室在2022年的年维护中错误将其中一块硬盘接到EFS0主板的sata线而非阵列卡上进行启动,导致监控上有告警。值班员误以为该硬盘发生故障,将有告警的硬盘用一块同型号但非全新的硬盘替换,并接回阵列卡上。开机发现换上的新硬盘可以正常识别,但故障硬盘信息仍在而且数据无法自动重建。如图9所示:

进入SSACLI 管理界面输入“ctrl slot=5 pd allshow”命令来查看阵列的硬盘状态信息,经过分析发现,故障硬盘信息显示成unknown且未自动从阵列清除,导致新换上的硬盘能够正常识别硬盘,但是无法自动加入RAID1 的磁盘阵列,从而导致数据无法重建。

如图11所示将原硬盘正确接入阵列卡后通过下列命令操作可以在不丢失数据的情况下将阵列信息恢复。

1)通过SSACLI命令进入到SSACLI管理界面;

2)输入“ctrl slot=5 ld all show”命令查看该阵列的逻辑磁盘信息;

3)输入“ctrl slot=5 array A delete”命令来删除RAID1阵列信息;

4)输入“ctrl slot=5 pd all show”命令发现故障硬盘信息已经消失;

5)输入“ctrl slot=5 create type=ld driver=cn0:1:1-cn0:1:2 RAID=1”重新創建RAID1阵列;

6)输入“ctrl slot=5 pd all show”命令发现阵列已成功创建;

7)重启后监控恢复正常,再次通过“ctrl slot=5 pdall show”命令检查阵列情况,发现阵列已经恢复,如图12所示:监控告警消失且经检查系统数据未发生任何丢失。

4 结束语

本文介绍了常见的RAID种类及作用,以及在湛江空管站莱斯塔台自动化上的配置方法和通过SSACLI阵列管理工具解决运行过程中遇到的问题的案例分析。为RAID如何在终端、服务器配置安装提供了一个参考方法。湛江空管站莱斯塔台自动化系统的各服务器及终端均配置了RAID1,对于日志服务器等配置了RAID1+RAID5,由2022年3月24日正式转场使用至截稿日期,共发生2起硬盘故障事件,但两起故障发生过程中均未造成过任何因硬盘故障导致的数据丢失情况。证明RAID1能够正常有效地提高系统的保障级别。

对于空管行业而言,安全始终是放在第一位的。服务器和终端配置RAID1 是大势所趋,因为配置RAID1可以极大地提高安全保障等级,有效地减少因设备原因导致的不安全事件甚至是事故的发生。

猜你喜欢
磁盘阵列
更换磁盘阵列磁盘
电视播出机房磁盘阵列预防性维护
一例EMS磁盘阵列故障分析及改进