Dynatrace:从APM到AI智能监控运维平台

2018-08-21 20:46丁海骜
数字商业时代 2018年8期
关键词:运维监控性能

丁海骜

AI是否会全面代替人类?这可能不仅仅是一个科技伦理问题,很多时候也存在逻辑悖论:当智能化、自动化成为设备和技术发展的主流,以IT技术支撑的设备能够完成所有复杂、精密、繁琐的工作以后,人类唯一能做的工作,很可能就是保障IT系统能够正常工作。可见,运维的本质并非仅针对IT系统本身,更多是为了保障所有一切业务能够按照既定规则运行。

“我们安吉星致力于打造一站式互联车生活平台,打通产业链,构建‘人、车、生活智能生态链。如何实现呢?其实就是通过大数据,云服务等手段实现车与人、车与道路,移动设备,基础设施方面的智能化信息交换;改善驾乘体现,从人适应车变为车适应人;建立自主的智能网联汽车产业链与智能交通体系。然而实现如此庞大的项目是需要大量的人員、硬件、软件的相互的配合。这么庞大的软硬件整合在一块,特别是对我们IT部门保证整个系统的正常运行上产生了非常大的压力。因此我们急需一种从原来的被动管理模式转化为主动的介入前期管理模式。”茅烨隽,安吉星应用监控项目负责人所谈到的“泛车联网”,目前已经成为全行业对于互联网应用的经典模式——IT系统应用环境越来越复杂,数据量越来越大,流转和影响的范围越来越广,与现实业务的融合程度越来越难分彼此。这种情况下,对于系统的运维就不再是仅仅依靠人工能够解决,运维人员显然需要更有利的工具,才能应对这种必将一直持续下去的复杂局面。

7月中,Dynatrace在Perform 2018大中华区用户大会上,发布了面向企业云环境的人工智能全栈式监控运维平台,“六年前,Dynatrace预测到,云计算、物联网、微服务等引发的变革将对应用和基础设施市场产生巨大的影响,于是我们决定重塑监控,打造一个以人工智能技术为核心的性能管理平台。”Stephen Pace,Dynatrace全球销售高级副总裁在会上如是说。

传统的APM系统,就如同与企业IT相伴而生的感知触角,其在企业应用运转的同时,检测应用本身的运行状况,实时收集来自用户端的数据和操作,并即时对这些数据进行分析、判断,从而向一线运维人员提供最直接的数据结果,反映当前系统的健康程度。此次Dynatrace推出的人工智能全栈式监控运维平台,应该说是APM技术发展的第四代产品,也是APM系统应用方式的一次全面提升。

Dynatrace大中华区总经理琚伟认为,所谓全栈式监控模式,实际上就是将用户所有的业务形态、所有模块都可以被纳入到Dynatrace平台的监控范围,通过如Smartscape、PurePath等专利技术的处理,所有业务环节的逻辑关系,每一个用户、每一笔交易的数据,都得到了完整、清晰的梳理,并且通过图表等直观的方式,展示给用户的运维人员,帮助运维人员及时发现问题,并能够迅速处理问题。

从性能上看,Dynatrace官方发布的资料强调:相比传统的APM,Dynatrace人工智能全栈式监控运维平台尤其强调了四个方面的技术和应用突破:首先,由于对人工智能技术的深度应用,给用户带来的,是可解决性能问题的答案,而不只是性能数据;第二,由于用户得到的是一个平台化产品,因此可以通过单一代理的方式,得到涵盖全栈式应用,并提供实时依赖关系模型;第三,由于该平台提供了面向整个生态系统的应用编程接口,因此能够更大程度地推动和激发企业自动化IT管理 ;最后,该平台通过真实用户体验与回放技术,让用户可以洞察并掌控全程。

很显然,对于用户而言,将全栈式监控模式与AI、平台相结合,所带来的就不仅仅是能够更快递实现性能管理,用低成本实现大覆盖率,还意味这可以减少使用的工具种类、占用更少的资源、减少平均修复时间,以及真正实现部署一个可伸缩的智能监控。

“上一代的APM产品的业务交易是串联的,一个交易过来,就像顺藤摸瓜一样,都可以看得到,使分析问题简单了。现在的产品把这种关联进行了延伸:不仅横向交易层进行了串联,而且纵向也进行了串联,就形成了所谓的因果关联关系:一旦系统的性能出了问题,不仅能够了解到可能在交易层面的问题,还能在应用进程层面发现问题,比如内存泄漏、主机CPU等。Dynatrace实际是把所有相关影响性能的因素都纳入到了因果关系当中,这对我们的帮助是很大。”作为多年的用户,茅烨隽看来,通过部署在整个应用的Dynatrace,使得系统的每一个节点全部都连通起来了,因此对于运维人员来讲,就可以看到整个架构的运行情况,以及从硬件、软件、应用直到业务的整体关联情况,从宏观到微观,了解每一个结点的现状,“这比我自己去查找,自己去定义简单太多了。”

而事实上对于Dynatrace来说,从APM软件到融合AI全栈式监控运维平台,除了从功能、性能和应用模式的巨大提升,实际上也意味着产品理念发生了一定的调整。“现在我们不仅仅只看应用的本身,我们更多的重点是把数据给到客户,我们现在需要利用人工智能,帮助用户对业务做一个更明确的指引。因此很大程度上讲,这个平台不仅仅只是一个运维管理的工具,更多的是一个面向企业用户现实业务的商业智能分析平台。”Harris Loefti, Dynatrace亚太区市场总监强调,在整个数字化转型过程中,应用企业的现实业务都体现在越来越多的应用当中,因此对于每一个应用的监控都变得更为重要。

当Dynatrace将关注的重点从产品的APM技术层面提升到应用平台,用户关注的焦点也就从具体应用回归到现实业务,这实际上也是在引导IT运维管理的一种理念的升级。琚伟认为,与其他传统的SaaS应用不同,对于全新“面向企业云环境的人工智能全栈式监控运维平台”的应用效果,除了从平台产品层面的技术提升外,用户企业也需要更新自己的管理理念和解决问题的思路。否则“即便企业用户上了云,它的管理理念、实际操作的理念,还是原来的那套:有人负责基础架构的监控,有人负责操作系统的监控,有人负责VM的监控……那么你管理的依然只是机器,没办法管理到系统输出的结果。”他尤其强调,对于用户和市场的接受情况来说,不是能不能接受这种改变的问题,“而是等了很久了,有点久旱逢甘雨的感觉。”

猜你喜欢
运维监控性能
基于GPS的电力运维轨迹定位系统
生与死的尊严(散文)
IT运维管理系统的设计及应用
桌面端,GTX 1650并不是千元价位的显卡好选择
通信电源监控系统在电力通信中的应用
GPS/DR/GIS技术在基于GSM—R列车监控系统中应用
侦察兵
电子政务甲方运维管理的全生命周期
1-Wire在家庭监控网络中的应用