基于大数据环境下的计算机机房优化管理策略

2022-12-07 02:01刘洪军
中文信息 2022年1期
关键词:计算机机房机房运维

刘洪军

(哈尔滨市第十三中学校,黑龙江 哈尔滨 150090)

计算机机房在日常运行过程中,机房管理是保障其正常运行的基础,然而由于在机房管理中,管理体系不健全、管理技术落后等原因,引起机房发生断网、网速慢、服务器异常等现象,对计算机机房的服务与运行质量产生不良的影响。目前,大数据技术、人工智能技术、信息技术等的快速发展,为计算机机房管理的优化工作提供了技术支撑,尤其是大数据技术的应用,可弥补机房管理中的不足,促进计算机机房管理的精益化、规范化、智能化的发展。

一、计算机机房管理中常见的故障

1.断网故障

计算机机房是一个系统性的工程,几十台、上百台计算机安装在一个空间环境中,内部结构非常复杂,而断网是机房常见的故障,一旦发生断网,恢复网络一般需要较多的时间,对机房的正常使用产生影响。

2.网速慢

计算机机房聚集了大量的计算机,这些计算机同时运行,增加了机房网络的压力,尤其是在用网高峰阶段,机房网速变慢表现更为明显,直接影响到用户的使用体验。在计算机机房管理中,机房网络日常维护是管理的重点,以提高网速为目的,对机房的计算机系统结构、网络资源配置等进行调整与优化,防止网速慢现象的发生。

3.服务器异常

现阶段,机房中的计算机基于服务器运行,如果机房环境管理、网络连接管理、安全管理,以及日常运维管理不到位等,易引发服务器异常现象,一旦服务器突然退出,处于运行状态下的计算机立即关机,如果未进行数据信息存储,那么数据信息将丢失,对使用者造成困扰。从目前的运维技术来看,机房服务器出现退出故障,故障排查较为困难,需切实做好机房日常各项管理工作,以防止该故障问题的发生[1]。

4.软硬件问题

计算机机房中的所有计算机,运行在一个空间环境中,相互之间依靠网络、数据库、服务器、软件等关联在一起,也就是说计算机机房为一个有机整体,机房的各个组成部分之间存在着一定的关联,有直接的联系,也有间接的关系,增加了整体内部结构的复杂程度。那么其中任何一个软件或硬件发生故障,则有可能牵连到其他组成部分。所以在机房发生故障后,需第一时间确定故障的出处,查明故障的原因,利用最短的时间解决软硬件问题。但是计算机机房结构复杂,软硬件之间为依存关系,故障排查难度大,再加上管理不统一,运维工作跟不上,将进一步拖延故障解决的时间。

二、大数据环境下计算机机房管理中的不足

1.管理体系有待建设

计算机机房在管理工作中,存在管理资金不足、管理体系不健全、运维工作不到位等现象。以运维管理为例,部分计算机机房还未建立完善的运维机制,运维的覆盖面不够,如机房所处建筑的综合布线,或者是计算机桌面的日常维护等。以及计算机机房规模大,同时设有多名管理员,没有明确管理员责任,导致机房管理不够理想。计算机机房服务器中存储了大量有利用价值的数据信息,管理人员需具备良好的信息数据安全意识,在日常管理工作中,高度重视信息数据安全工作,并做好机房日常运行数据的收集工作,以为后续的管理工作提供方向[2]。

2.管理技术手段先进性不够

管理技术水平直接决定着机房的管理质效,尤其是在大数据时代,计算机机房采用了先进的计算机技术、网络技术,以及功能强大的软硬件设施,进而需要与之相配的机房管理技术,以保证机房中计算机的高质量运行。然而由于大智物移云的快速发展,计算机机房中设备种类多、数量多,计算机系统结构越加的复杂化,而机房管理人员还在延续以往的管理模式与管理方法,难以保证机房中所有计算机的运行质量,进而引发一系列的故障问题。因此,为了提高机房管理的成效,需积极引进先进的管理技术,借助大数据技术、人工智能技术、信息技术等,打造机房智慧化管理模式,安装全天候监测设备,自动化、实时化管理机房。但是从目前的机房管理现状来看,要想实现智慧化管理还存在一定的距离[3]。

3.管理基础不牢

计算机机房有着严格的管理标准,机房地面要平整光洁,专门设有通风设备,空间干燥整洁等。尤其是对环境有着较高的要求,机房中不可有水、气管通过,室内温度在15℃至25℃之间,相对湿度为40%至60%,微尘直径>5μm时,浓度<3×10粒/m3,室内噪音≤70分贝等,机房管理要求较为严苛,部分计算机机房管理工作还未能达到这一标准。此外,机房的软件需要定期更新升级维护,机房管理人员在日常维护中有所疏忽,更新维护不及时,会留下机房安全运行的隐患。在大数据时代,计算机机房安全风险增加,安全管理难度提升,网络黑客入侵、计算机病毒攻击时有发生,网络病毒带有隐蔽性,破坏力强,如果机房网络安全管理出现漏洞,将无法保证机房的安全运行,甚至是引发信息数据泄露、丢失、篡改等问题。

三、基于大数据技术构建计算机机房管理系统

1.系统结构

整个系统有三层结构,第一,基础层。主要用于机房日常运行管理,在机房中设置温度、湿度监测装置,实时采集机房环境信息,反馈给管理系统,并在机房各个角落安装摄像头,动态化监测机房中的计算机、服务器、部件,以及其他设备的运行状态。第二,平台层。该层为管理系统的核心,主要有人工智能引擎、数据采集、整合模块、开放接口等组成,用于收集数据的存储、处理、解析等,完整真实地反映出机房软硬件、设备的运行状况。第三,应用层。直接面向管理人员,进行机房管理系统的具体操作,由三层管理系统结构,完成计算机机房日常运行的实时化、有效监管与控制[4]。

2.系统优势

传统机房管理采用的信息化系统,管理功能有限,侧重的是事后管理,无法提前做出机房故障预判,管理的智能化、自动化水平较差。采用大数据构建的管理系统,充分利用了大数据技术的数据采集、分析、处理、整合、挖掘等功能,对收集的数据进行计算解析,分析机房是否存在运行异常现象,然后进行预警,最大限度地防止机房故障问题的发生。基于大数据的管理系统,不但采用了大数据技术,还融合了人工智能技术,系统交互性、可操作性、自动化程度得到提升,使数据价值发挥至最大程度,有利于机房管理成本的控制[5]。

3.系统功能性

机房管理系统采用了当下主流的高新技术,以数据作为机房日常管理的依据,管理的智能化水平更好。比如,使用大数据构建机房管理模型,分析机房内外状况,评估机房的运行状态与质量,使机房管理更为的精准。而且系统采用了人工智能技术,使系统具备了一定的自适应、自学习、自调整功能,实现柔性化管理,全面提高了机房管理的智能化水平。

3.1 系统界面友好。系统界面采用了人性化设计,符合管理人员的操作习惯,比如,在监控系统中应用了GIS技术,管理人员手机登录系统,就可在系统界面上查看机房动态。以及生成的各种报表,可在该界面进行查询、下载、存储等,方便机房管理人员使用数据报表。

3.2 数据驱动。系统通过在机房中安装的温度、湿度传感器、摄像头等,广泛采集机房的运行参数,然后对这些数据进行整合、分析、挖掘,梳理数据的逻辑关系与相关性,形成相应的分析报表,将机房运行状态进行数据化,直观展示出机房管理与运行中存在的不足,以为下一步机房管理工作提供参照,提高机房的运行质量。

3.3 延展性好。管理系统具备良好的延展性,设置了多个接口、模块,按照计算机机房管理的各项需求,进行功能模块的添加与删除。并设置了微服务功能,将一个管理应用程序,划分成多个管理小模块,每个小模块之间相互协调、配合完成管理工作。并且每个模块独立运行,围绕具体的管理内容开展工作,更好地满足机房管理的需要。

四、基于大数据优化计算机机房管理的对策

在大数据环境下,衍生出了新的管理技术与管理理念,为计算机机房管理带来了新的发展机遇,机房管理的大数据发展,可提高机房管理的智能化、现代化水平。大数据的应用,有利于机房软硬件的一体化管理。

1.机房硬件一体化管理

1.1 加强基础管理。计算机机房引发常见故障的原因之一是基础管理存在不足,一是要在日常运维管理中,定期开展巡查工作,对机房中的设备、服务器等,开展运行状态的检查,评估其运行质量。二是参照管理系统生成的数据报表,进行针对性的复核,及时检修硬件,避免小问题的扩大化,提高硬件的运行质量。三是加强机房空间环境管理,保持机房内环境的卫生,做好日常清洁卫生工作,督促清洁人员与运维人员及时擦除设备上的灰尘。四是做好日常检修工作,运维人员定期对机房硬件进行检修,维持硬件高质量的运行状态。五是做好五防工作,保持机房温度与湿度的适宜,并严格执行机房管理制度,机房硬件设施不可随意外借,保证机房资产的安全。

1.2 完善管理体系建设。为了实现管理的制度化、规范化,需进行机房管理体系的完善建设。首先,进一步完善管理制度的建设,明确细化机房管理责任、管理内容、管理权限、管理标准等,使机房管理工作的落实有完善的制度作保障。其次,制定运维操作规范,针对硬件日常维修、养护操作进行明确,规范运维人员的操作行为,防止人为操作失误引起的机房故障。再次,贯彻执行各项管理制度,切实将管理责任落实到人,防止出现问题后相互推诿的现象,增强人员的管理认识、规范操作意识,强化其责任感,使其以认真、负责的工作态度,高质量地完成管理各项工作。最后,分配好系统权限,针对不同的用户,分配相应的系统操作权限,配置相应的计算机服务,以降低计算机使用过程中的风险,确保计算机机房运行的安全性。

1.3 构建机房管理档案。机房管理是一项系统性、复杂性的工作,管理的硬件较为贵重,采取精细化的管理策略,需建立机房管理档案,详细记录系统测试、硬件检修、日常维护等信息。档案采用信息化管理,通过管理系统共享,管理人员使用手机就可查阅、添加、修改档案,在日常管理中,管理人员参照管理档案,就可掌握机房日常运行与管理的状况。

2.机房软件一体化管理

计算机机房处于网络的开放环境中,面临着网络攻击的风险,容易引起数据信息、计算机软硬件的损失。所以网络安全管理是机房管理中的重点内容之一,机房需制定完善的网络安全管理体系,运用最新的网络技术提高机房安全管理水平,形成对网络攻击、计算机病毒入侵等的有效防控。

2.1 明确管理要点。对机房计算机系统、服务器、网络系统等,进行深入的分析,确定系统中存在的安全风险与薄弱之处,然后结合机房现有网络安全资源,如入侵检测系统、漏洞扫描系统、网络杀毒产品、防火墙等,构建完善的安全管理技术体系,以确保安全防护的精准度。以及管理人员要具备学习意识,掌握最新的网络安全管理理论与技术,扎实网络安全管理的人力基础。

2.2 建立风险防范机制。定期对机房的防火墙、系统病毒库、操作系统等进行升级维护,并使用系统漏洞扫描系统,查找计算机系统、数据库、服务器、交换机等,是否存在系统漏洞,生成安全分析报告,以便于及时修补漏洞,防止遗留下安全隐患。还需使用杀毒软件定期对整个机房的计算机进行病毒查杀,及时发现隐藏在文件与系统中的病毒,防止病毒感染、传播、发作。

2.3 加强数据库维护。数据库是计算机机房的数据中心,在机房长期的运行过程中,形成大量的冗余数据,这些数据长期积累占用大量的数据库空间,直接影响服务器的运行效率。所以管理人员需注意数据库日常的清理与维护工作。可使用云计算技术,对数据库中的数据进行开发,打造出数据共享平台,机房中每台计算机都可使用该平台进行数据的查阅。使用云空间存储机房数据,节约数据库的空间,提高计算机的运行速度,减少服务器退出故障的出现。

2.4 加强网络协议管理。网络协议是计算机进行信息交互的规则,常用的协议有TCP/IP协议,是正式的网络协议,属于分组交换协议,规范化互联网信息交互行为,还有NetBEUI协议、IPX/SPX协议等。以上这些协议影响着计算机的上网体验,所以在机房管理中,根据机房的使用情况,定期进行协议参数的优化配置,保证机房计算机系统结构的顺畅运行。

结语

社会已经进入大数据时代,应用领域、范围变广,并且在实际的应用中,充分展示了大数据技术在数据收集、存储、处理等方面的优势,发挥出大数据应用的最大价值。而计算机机房管理工作具备应用大数据技术的条件,无论是设备还是技术方面,对大数据的应用接受程度较高。该技术在机房管理中的应用,切实解决了机房管理中的问题,基于大数据技术构建机房管理系统,为机房软硬件的一体化管理创造了有利条件,促进了机房管理的智能化发展。

猜你喜欢
计算机机房机房运维
计算机机房的管理与维护研究
计算机机房管理和维护的重要性及措施研究
运维技术研发决策中ITSS运维成熟度模型应用初探
基于ITIL的运维管理创新实践浅析
N通信公司机房节能技改实践
新型有线电视机房UPS系统的配置
大功率发射机房冷却送风改造
高校计算机机房管理系统的构建与实现
谈有线电视前端机房的防雷接地