智能化通信运维及运用研究

2022-07-01 02:47陈玕来方文祥
通信电源技术 2022年3期
关键词:日志子系统运维

陈玕来,方文祥

(华信咨询设计研究院有限公司,浙江 杭州 310052)

0 引 言

随着物联网、互联网、大数据等多元化现代技术的发展与完善,从数据智能感知、分析、融合以及业务集成等方面为通信设备的运行维护提供智能化、数字化支持,加快既有通信业务架构与运维模式的转型步伐。通信运维时需要注重智能化技术的科学运用,通过构建智能通信运维系统实现通信设备运行数据实时采集,从而大幅提升通信运维管理水平。

1 智能化通信运维要求及体现

1.1 智能运维要求

为保证通信运维体系稳定、良好运行,发挥出智能化应用优势,需要打造与智能化通信运维体系相匹配的通信一体化管控系统平台,为通信运维提供可靠支撑。管控系统建设与完善期间应始终遵循国家相关标准和行业要求,并在全国范围内构建分级体系,包括国家级、省级、市级等。通过对各级别进行细分,得到上、下级联动系统,赋予系统通信信息实时共享功能。此外,还需加大对通信系统的管控力度,为管理工作打造一体化实时监控平台,全过程监测通信设备运行状态。系统需设置预警功能模块,确保及时发现各类异常信息,并自动上传到通信运维管理中心,为通信运维检修工作提供数据参考,提高工作效率与质量。与此同时,全面整合通信资源管理系统中采集到的资源数据和通信网络中的资源数据,实现资源同步共享和通信运维流程实时对接[1]。通信监测系统体系结构如图1所示。

图1 通信监测系统体系结构

1.2 智能运维体现

利用可视化技术构建在线监控系统,全面采集系统运行过程中产生的各类数据,并自动将数据处理为通信所需的图形或图像,便于通信运维人员观察与分析,以最短的时间找出系统运行或通信期间存在的问题,确保系统运行稳定。此外,智能通信运维还体现在通信安全管理方面。通信电缆周围分布有电磁场,通信信号传输时极易受电磁场的干扰,无法保证通信信号传输的完整性、安全性。通过智能通信运维可实现带电检修,针对每个保护装置搭建相应的子系统,独立处理通信系统运行故障,且在故障处理过程中不会对其他继电保护装置的整体运行状态造成不良影响。此外,保护装置中收集的各类运行数据可以在通信系统的支持下传输至管理系统,通信运维人员可依托于可视化技术远程、实时监控相关设备运行情况。

目前,通信系统常作为辅助性系统为集控中心的指挥与调度提供服务,包括数据调度、安稳保护、语音调度等,应用到的通信设备种类较为多样。从业务生产角度进行分析,通信系统可细分为多个子系统,包括行政语音系统、应急卫星通信系统、视频会议系统、调度交换系统以及综合管理系统等。智能化通信运维的深层次探索可从4个方面进行:一是采用移动端管理模式或一站式管理方式,大幅提高通信运维人员作业效率;二是细致、多维度分析子系统运行数据,提高通信运维人员对设备运行实际状况的认知程度,再结合多年运维经验对设备可能发生的运行故障风险加以预判;三是加大对通信设备可视化的研究力度,使终端运维人员准确了解远端情况并做到全过程把控;四是依托信息技术研发、应用通信告警分析工具,构建完善的通信服务体系,推动通信运维工作智能化、规范化开展[2]。

2 智能化通信系统运维应用分析

2.1 智能通信系统数据采集

2.1.1 确定采集范围

智能通信系统需具备全过程采集各子系统设备运行数据的功能,包括子系统设备状态与告警信息。若发现运行故障,能够将故障点的范围缩小至相对应的系统子单元。通信系统运维智能化的应用主要表现在3个方面:一是依托智能化技术采集各类设备性能数据,如专用电话、专用无线传输设备等;二是实时采集用户终端多系统中的用户操作信息,包括广播系统、专用电话与无线系统等;三是监测采集设备运行环境,主要有电源、设备房环境、无线环境等。其中,电源有外电网、不间断电源、电源屏等;设备房环境的主要监测对象为室内烟感、粉尘、温湿度等;无线环境的监测包括区间场强、同频和临频干扰等。

2.1.2 确定采集类别

一些集成子系统的数据采集方式较为单一,无法满足多样化感知需求。基于此,通过智能化系统的应用可丰富数据采集方式与类别。

(1)日志数据。要想多维度分析所有通信子系统的运行状态,需要注重日志数据的采集。首先,采集系统运行日志。系统运行日志包括网络设备、通用主机设备、各类专用设备运行期间生成的硬件设备运行日志,同时还包括各业务系统运行过程中产生的软件日志,如中间件、数据库、核心进程以及应用业务程序等。通过采集与分析运行日志数据,可以实现对系统运行状态与健康程度的准确评估。其次,采集用户操作日志。用户操作日志指用户在操作使用通信系统时生成的日志,如操作设备、操作指令、操作时间等。通过深入挖掘、分析用户操作日志数据,评估通信子系统设备操作成功率、操作响应灵敏度等,以评估结果为依据实现对故障预判、系统配置优化的目的。最后,采集维护操作日志。维护操作日志主要记录运维人员针对通信系统所执行的运维操作,包括操作记录、查询记录、操作时间以及账户登录等。通过采集并分析维护操作日志,可以全过程管控通信系统运维质量与安全。在分析故障处理操作记录的基础上,可实现对通信系统故障排除程序的全面优化,提高故障修复效率[3]。

(2)告警数据。智能通信子系统产生的告警数据来源于第三方监测系统与网管系统,能够实时反映子系统运行状态和运行故障问题,如无线网络覆盖不良、终端设备离线、业务中断等。由智能运维系统分级处理通信子系统告警数据,为故障智能检测和处理提供数据支持,还可以实现智能故障排除逻辑的自动启动。与此同时,关联分析各通信子系统告警数据,预判、评估故障发生后的影响范围。

(3)状态数据。通信子系统的状态数据包括设备基础信息数据与性能数据等,其中基础信息数据包括设备生产厂商、型号、制造日期等。性能数据采集类型如表1所示。

2.1.3 确定采集机理

由于各通信子系统网管对设备各类数据的采集较完善,因此通信智能运维数据采集主要采用子系统网管对接方式实现。无线环境参数、机房状态数据等有着极高的分析价值,但不在通信子系统的网管数据监测采集范围内,可由通信智能运维系统直接采集[4,5]。

(1)系统对接采集。通信智能运维系统应兼容简单网络管理协议,还需设置多个主流协议与接口,如CORBA、Webservice等。对接各通信子系统接口,实现智能运维系统所需数据的实时采集。

(2)数据直接采集。基于超大规模网络化运维背景,依托传感技术、数字图像识别技术、大宽带无线通信技术赋予智能通信运维系统更高性能,可直接高效采集各通信子系统可监测范围外的数据。例如,可以在无人值守机房中安装各类传感器,实现对机房环境的监测与数据采集。

2.2 智能通信系统功能分析

2.2.1 设备状态预警

从设备“计划修”制定到“状态修”执行涉及大量数据的积累与应用,智能运维系统可对设备运行前后出现的故障进行归纳,在此基础上分析所有通信子系统本身以及与之相关联的子系统的数据特征,并打造故障状态数据库。同时,还应对故障预警的触发条件进行判断,防范设备故障再次发生。通信子系统中开展的业务类型较为多样,而且拥有多个内部接口和外部接口。排查设备故障时,为保证排查工作有效落实,通常会对子系统网管反馈的系统运行状态进行全方位观察,再以人工形式遵循“逐级逐层”原则开展排查。但这种排查方式效率低,而且无法做到全面排查,不能满足超大规模网络化运维要求。对此,应用智能运维系统构建跨子系统状态数据分析、排查策略库,通过“端到端”检测方法实现设备故障点的快速、精准定位,设计科学可行的设备故障处理方案[6-8]。

2.2.2 运维经验聚合

智能通信运维系统在长时间的运行后会积累丰富的运维数据,深入挖掘分析这类数据,横向、纵向比较通信子系统软硬件性能,明确同类子系统彼此间表现出的差异性特征。同时,还需关联分析系统运行状态与成本、各通信设备的运行环境之间的关系,对系统运行过程中可能存在的干扰因素进行总结归纳,帮助通信运维人员明确系统运维重点,推动后续系统优化。通信运维期间,智能运维系统会自动匹配存档设备故障状态、故障处理情况、近期维护信息等,实现数据信息的实时汇总,尽可能找出彼此间存在的关联性。除此之外,利用可视化技术构建排除设备故障的知识图谱,以此完善、优化故障排除流程。

2.2.3 运维平台优化

系统设计时应注重新设备、新技术的合理运用,深化通信设备运维研究,并打造智能通信运维平台,赋予平台扩展升级功能,同时采取模块化嵌入方法搭建全新且多元的应用模块,实现通信系统的持续完善。与此同时,通信运维平台可起到动态化管理通信设备运行情况的作用,管理对象包括业务配置、运行中设备、备件库存等。通过打通与生产管理的对接窗口,实现系统与平台中各类数据的同步更新,达到通信设备全生命周期管理的效果,有助于通信运维资源的合理配置[9-11]。

3 结 语

在大数据、人工智能等现代化技术高速发展的背景下,通信设备及系统也需顺应技术创新发展趋势。通过剖析通信系统运维管理需求,在此基础上合理运用智能化技术构建智能运维系统,充分发挥系统数据实时采集功能,并在技术的支撑下实现通信设备状态预警与运维平台全面优化,提升通信系统整体运维水平。

猜你喜欢
日志子系统运维
不对中转子系统耦合动力学特性研究
高速公路智能运维平台
一名老党员的工作日志
GSM-R基站子系统同步方案研究
扶贫日志
关键信号设备检修自动盯控子系统研究
运维技术研发决策中ITSS运维成熟度模型应用初探
雅皮的心情日志
雅皮的心情日志
配电线路的运维管理探讨