图1 IBM 黄卫
在数字化和云化转型时代,云数据中心的IT运维面临着挑战。IBM 认知IT运维能够基于洞察以提升效率、提前预判,基于Watson认知决策。IBM混合云顾问工程师黄卫告诉记者,IBM认知IT运维有三个指导原则,分别是持续学习、预测修正、推荐决策。持续学习以揭示海量数据内在特征和变化规律,认知分析以在重大故障之前揭示异常征兆, 跨混合云端到端的可视化、可控化、自动化和敏捷性,双模态深度集成、一致统一的IT运维平台, NLP辅助问题诊断和修复。并且机器自学习策略可设定强、中、弱关系学习,并且,机器学习自动识别事件间相关性可以显著提升IT运维甚至运营效率。
IBM认知IT运维由Netcool提供创新的大数据智能分析,提高运维价值并在整个IT环境降低成本。能够进行事件日志上下文历史挖掘和规律分析,事件日志周期性规律分析,事件日志成对成组出现分析和事件日志相关与因果分析。
图2 IBM 认知IT运维结构化数据认知学习和预测
而结构化数据认知学习和预测,能够使用统计学工具,和行为学知算法,揭示指标间的数学关系。
多KPI相关性认知学习和预警功能中,PI学习到“业务响应时间”与“用户请求”有正相关因果关系,且随着用户负载增加而变慢。如果这一正常历史规律被破坏,比如说由于內存泄漏,造成即便用户请求数下降了,业务响应时间还很高,异常预警信号将立即发出。尽管这时业务服务质量仍处于“好”的区间,问题已被发现。
同时,该功能具有强大的实时分析能力和伸缩性,普通刀片服务器上每一分析引擎支持多达500,000个指标每5分钟粒度的数据。一个全装备的关键业务应用可产生多达50,000个指标数据。
黄卫最后表示,IBM认知IT运维实现了敏捷运维与知识共享,提升了运维的自动化能力:日常操作自动化,交流与知识共享,以加速解决日常运维常见问题。