基于集群系统硬件监控技术的机房管理系统的改进策略

2014-02-23 09:02姚婷婷
教育教学论坛 2014年4期
关键词:机房集群远程

姚婷婷,周 琳

(湖南警察学院 a.信息技术系;b.培训部,湖南 长沙 410138)

基于集群系统硬件监控技术的机房管理系统的改进策略

姚婷婷a,周 琳b

(湖南警察学院 a.信息技术系;b.培训部,湖南 长沙 410138)

本文针对文献[4]、文献[5]中讨论的基于集群系统硬件监控技术的机房管理原型系统提出了两个方面的该进策略。

集群系统硬件;监控技术;机房管理系统;改进策略

我院基于集群系统硬件监控技术的机房管理原型系统已经开发并调试完毕,在文献[4]、[5]中主要描述了该系统的理论支撑以及具体实开发过程与调试效果。现从两方面讨论可以将来可以继续改进的方向。

一、IPMI与WMI的比较

在本文的特定应用目标指向下,IPMI规范和WMI规范似乎都离我们的目标不远。在文献 [4]中已经详细介绍了IPMI的技术细节。本节着重讨论IPMI规范和WMI规范各自的适用范围。

1.IPMI功能以及适用对象。1998年Intel、DELL、HP及NEC共同提出IPMI规范,可以通过LAN远端监控服务器温度、电压等电气设备。IPMI是智能型平台管理接口(Intelligent Platform Management Interface)的缩写,是管理基于Intel结构的企业系统中所使用的外围设备采用的一种工业标准,该标准由英特尔、惠普、NEC、美国戴尔电脑和Supermicro等公司制定。用户可以利用IPMI监视服务器的物理健康特征,如温度、电压、风扇工作状态、电源状态等。而且更为重要的是IPMI是一个开放的免费标准,用户无需为使用该

标准而支付额外的费用。其工作原理如图所示。

从上图可知,该规范的工作对象为服务器且该规范可独立于操作系统对服务器进行远程监控。基于该规范的监控模式是通过LAN远程监控服务器上的各电器元件的运转情况。随着版本的不断升级,还可以实现对多路电气元件(如多个CPU)的监控。我院的学生机房有建立了服务器的小型局域网网络,也有只是实现了局域网互联的无服务器网络。这给我院基于集群系统硬件监控技术的机房原型系统的开发增加了难度。

2.WMI功能以及适用对象。Windows管理规范(Windows Management Instrumentation是一项核心的Windows管理技术;用户可以使用WMI规范管理本地和远程计算机的软硬件资源。WMI规范通过编程和脚本语言为日常管理提供了一条连续一致的途径。例如,用户可以在远程计算机器上启动一个进程;也可以设定一个在特定日期和时间运行的进程;用户还可以远程启动计算机;或者用户也可以获得本地或远程计算机的已安装程序列表或者查询本地或远程计算机的Windows事件日志。WMI中的“Instrumentation”特指WMI可以获得关于计算机内部状态的信息,这与汽车仪表盘获得并显示引擎的状态信息非常类似。WMI对磁盘、进程、和其他Windows系统对象进行建模,从而实现“指示”功能。WMI的功能还包括事件触发、远程调用、查询、查看、架构的用户扩展、指示等。

由上可知,WMI规范也可以实现对计算机的软硬件资源的实时监控。但该规范与IPMI规范的最大区别是能否独立于操作系统单独工作。后者可以实现独立于操作系统单独监控软硬件资源的工作,这种不依赖于操作系统的特性更符合我院配置了服务器的学生机房的客观实际情况。WMI规范不需要部署和配置服务器的特性,相比之下更加简单、经济、实用。在文献[5]中实现了基于WMI规范的远程监控系统。

二、关于数据库所在位置的思考

在文献[4]和文献[5]提到的解决方案中,集群系统中各个计算机电器元件的运转数据被采集在服务器端的数据库中。通过第一节的讨论,我们可以知道,如果基于WMI规范做解决方案,整个集群系统中不存在服务器了,那么临时采集的各电气元件的数据放在哪里随时提供查询服务呢?本文提出两种关于数据所在位置的思路,在文献[5]中也是基于第一重考虑而开发设计的。

1.在特定计算机上存储监测数据供随时查询。基于WMI规范的解决方案中,由于没有特定的服务器,那么实时采集的计算机软硬件资源的运转情况的数据存储在什么位置,也是必须考虑的问题。本文提出可以任意指定一台局域网中的计算机为数据存储单位,在部署软件时额外加装数据收集模块。这台主机扮演的就是收集数据和提供数据查询的角色。在文献[5]中,就是采用的这种方法。

2.每台机器都收集自己的数据。事实上,基于2.1小节提出的解决方法相反的思路,是否有另外一种方法,解决数据存储问题呢?顺着这个思路,本文提出如果每台主机都采集本机的软硬件资源运转情况的数据,只在用户远程查询的时候在当前查询的机器做临时的数据组合,一旦查询完毕,数据即释放空间,也是可以解决问题的。类似于分布式数据库的数据装载和数据分布存储的思路。朝这个方向努力,可以发现这种思路具有更大的灵活性。一旦局域网中的某一个节点出现了问题,那么其他的某一个正常工作的节点马上能够担负起数据重组的任务,规避了2.1小节提出的解决方案中一旦作为数据库存储节点的机器不能正常启动,那么整个监控系统就会瘫痪的风险。

当然,这个方向,是以增加了每个节点上安装的程序的复杂度为代价的,但显然是值得的。

[1]许柯,郑明雪.基于WEB的大规模集群监控系统设计[J].网络安全技术与应用,2008,(9):78-79.

[2]李娜.基于IPMI技术的服务器管理系统设计与实现[D].北京:北京邮电大学,2009.

[3]马海东.基于互联网的远程监控系统的研究[D].大庆石油大学,2007.

[4]姚婷婷,许柯.基于集群系统硬件监控技术的机房管理解决方案[J].教育教学论坛,2013,(08).

[5]姚婷婷,贺永恒.构建学生机房硬件监控系统的解决方案[J].教育教学论坛,2013,(12).

G647

A

1674-9324(2014)04-0016-02

猜你喜欢
机房集群远程
让人胆寒的“远程杀手”:弹道导弹
远程工作狂综合征
海上小型无人机集群的反制装备需求与应对之策研究
远程诈骗
一种无人机集群发射回收装置的控制系统设计
Python与Spark集群在收费数据分析中的应用
N通信公司机房节能技改实践
新型有线电视机房UPS系统的配置
大功率发射机房冷却送风改造
谈有线电视前端机房的防雷接地