基于客户资源树的IPTV端到端智慧运维体系设计

2018-04-19 06:15张琳
电信工程技术与标准化 2018年4期
关键词:运维故障用户

张琳

(中国移动通信集团设计院有限公司河北分公司,石家庄 050021)

IPTV是互联网技术与电视技术相结合的产物,其整合了互联网丰富的内容资源,采用TCP/IP传输控制协议,将音视频等信息以IP分组的形式,通过IP宽带网络(包括骨干/城域网、宽带接入网、内容分发网等)不同的物理网络层传输和控制音频、视频、数据、图形等多媒体节目,并将其分发至用户机顶盒(STB),供用户进行个性化多媒体信息服务选择,为家庭提供交互式数字多媒体内容,IPTV作为电视新展现形态的数字新媒体,日益被用户所看重成为不可阻挡的大趋势。

1 IPTV业务网络

1.1 IPTV业务流程

主流的IPTV业务拓扑架构为3级架构,即由中心节点、区域节点和边缘节点组成的3级内容分发网络:中心节点主要负责节目源的引入、分发及用户管理等工作,区域节点和边缘节点为点播视频业务能力的主要提供者,直播业务一般采用组播方式。

IPTV业务按实时性进行分类,主要分为直播和点播业务。直播业务流程如下。

(1)中心节点获取直播节目源,并经组播地址转换、平滑码流等操作,以组播方式为用户提供直播服务。

(2)各区域和边缘节点通过组播方式获取直播节目流,进行直播节目录制,以便为用户提供即时时移、菜单时移等业务。

(3)用户通过组播方式获取直播节目流,进行直播业务体验。

直播业务流经的设备有用户终端、接入网、城域/骨干网、IPTV中心节点及直播源。

点播业务流程如下。

(1)中心节点获取点播节目源。

(2)中心节点将获取的点播节目源下发至区域节点与边缘节点。

(3)用户通过点播方式获取点播节目源,进行点播业务体验。

点播业务流经的设备有用户终端、接入网、城域/骨干网及IPTV业务节点。

IPTV典型网络架构如图1所示。

图1 典型IPTV网络架构

1.2 存在的问题

由IPTV业务流程及网络拓扑可知,IPTV业务存在网络结构复杂、业务流程复杂、业务环节多等问题,一个投诉或故障往往需要使用多个相互独立的系统进行查询分析,这就导致网络运行维护人员和客服人员工作量大、工作压力大,最终的服务效果不明显、客户满意度不高、客户体验差。

1.2.1 从客服角度

(1)对IPTV业务的报障几乎没有定位处理手段,导致故障单直接流转到维护部门,故障单处理时间长,用户满意度低。

(2)面对不同类型的故障申告,客服人员需使用多个独立系统进行查询分析,这对客服人员的投诉处理经验提出了较高要求。

1.2.2 从运维角度

(1)缺乏故障定界手段,造成维护人员浪费大量的精力进行故障不相关段落的排查,故障处理时间长、效率低。

(2)对于可能出现的已知或未知业务问题无法提前预知,缺少主动发现及联合分析的手段,导致日常维护及故障处理远远滞后用户的申告,总是被动的处理问题。

2 体系设计理念

2.1 端到端理念

IPTV业务承载在一个完全动态的网络基础上的,IPTV业务的故障处理也不是单一片面的问题,很难用简单统一的方法进行处理,需要的故障处理周期更长,处理方式也更加复杂,为了对运维、客服保障等工作提供进一步有效支持,需对IPTV业务提供从客户端到服务端的全流程测试诊断手段,以便具备对IPTV故障进行快速诊断、精准定位、主动发现及预防能力,将被动解决问题的处理方式变为主动预防式的处理,在这种背景下,端到端理念与IPTV业务故障处理的结合水到渠成。

“端到端”最初来自网络术语,表示网络上建立的逻辑链路,通常建立在传输层之上。但随着社会信息化程度的不断提高,“端到端”概念也得到了延伸和发展,即“端到端”全流程管控理念,“端到端”全流程管控是指为满足特定客户需求或业务目标的全流程管控,从客户业务质量出发,直到满足客户需求为止,提供“端到端”服务。

基于“端到端”的处理理念是提高业务质量及终端用户感知度的最好解决方案,它不仅仅考虑了网络环境对于业务的影响,基于业务会受终端、网络、业务平台及节目源等因素影响较大的特点,“端到端”优化理念将这4点同步纳入了优化的范畴,更加全面和科学地对数据业务进行评估和分析优化。

2.2 客户资源树

基于“端到端”的理念,从用户的业务感知出发,构建基于单个用户的客户资源树是实现用户业务感知管控的基础。

所谓客户资源树是指从用户终端开始至平台及节目源终止,包括业务流经的每一台设备、每一条线路。即从用户终端(STB、光猫等)到IPTV平台及节目源通过网络设备建立的链路,用户可以利用这条宽带网络使用通信运营商提供的IPTV业务。

客户资源树包含的基本信息如下。

用户基本信息:IPTV接入号码、接入类型、业务类型。

用户终端设备信息:机顶盒MAC地址、生产厂家、软硬件版本;家庭网关LOID、生产厂家、软硬件版本。

OLT设备信息:OLT用户端口、IP、名称、归属地、上联口。

BRAS设备信息(BRAS下联口、IP、归属地、上联口。

城域网出口设备信息:城域网出口路由器下联口、IP、名称、归属地、上联口。

IPTV业务平台设备信息:设备IP、归属地、名称。

客户资源树示意图如图2所示。

基于构建完成的客户资源树,通过对节目源、平台、网及终端提供的业务状态和质量进行全流程的监测、检查、统计、分析,从而实现对业务的全面监控与管理,使得业务质量可视、可管和可控,并最终实现业务的全面主动运维,实现先于客户发现并解决问题的目的。

图2 客户资源树示意图

3 端到端智慧运维体系

3.1 概述

为了对故障处理、客服保障等工作提供进一步有效支持,需为IPTV业务维护及投诉处理人员提供端到端的体系化测试诊断手段,以便主动发现IPTV业务运行的问题,同时为客服人员提供IPTV业务故障的快速诊断、精准定位能力。

端到端智慧运维体系原理图如图3所示。

图3 端到端智慧运维体系原理图

端到端智慧运维体系聚合了终端能力、接入层能力、承载层能力、业务平台能力,能够对IPTV节目源质量进行监测,对业务平台维护提供保障,对网络性能提供性能测试,还可通过远程方式对IPTV终端播放质量进行实时监控,并可提供IPTV业务的质量状态和告警的图形化呈现、端到端故障一键诊断定位等功能。该体系可有力支撑IPTV业务的客户保障以及网络运行维护工作,提高了网络运营管理效率,有效提升了客户感知。

端到端智慧运维体系架构如图4所示。

该体系中,业务质量检测主要负责用户机顶盒视频播放质量的数据采集,可对用户的感知进行量化评分,是用户质差的直接体现;IP综合网管整合了接入网与城域网/承载网的网络数据,另外还具备端到端信息采集能力,用于稽核用户资源树的准确性;业务平台网管对IPTV业务平台的业务性能、设备告警等进行实时监控,可及时发现影响用户感知的问题;节目源检测可检测节目源的质量,并对可能引起用户质差的片源进行阻断或告警,从节目源头保证用户感知;根据各个部分提供的多种数据,基于客户资源树,端到端智慧运维系统对业务流程进行整合分析,为维护人员和客服人员提供一键式故障诊断等功能,是体系的核心。

图4 端到端智慧运维体系架构

3.2 业务质量检测

业务质量检测系统从用户机顶盒处获取用户视频播放的实时感知数据,并根据相关视频体验衡量评价标准对用户视频体验进行量化评分,得分为1-5分(5:优秀;4:良好;3:一般;2:较差;1:差)。可用率表示一段时间内的视频质量好坏。

比如在5 min统计周期内用户播放了200 s,其中有180 s分值大于2.5,则该5 min内用户的视频质量可用率为180/200=90%。可把可用率分为3个档次,98%~100%为好,用户几乎察觉不到花屏和卡顿;95%~98%为中,用户偶尔察觉到花屏或卡顿,基本可以接受;0%~95%为差,用户察觉到频繁的花屏或卡顿,难以接受。

基于以上可用率分档,进行如下定义:

质优用户:可用率≥98%的用户。

质中用户:95%≤可用率<98%的用户。

质差用户:可用率<95%的用户。

可用率是构建端到端智慧运维体系的出发点和落脚点,从质差/质中用户出发,基于此类用户的客户资源树,对其进行端到端测试,定位引起质差的段落并进行整改处理,从而实现提高客户可用率,提升客户感知的目的。

3.3 IP综合网管

该网管可实时获取接入网及城域骨干网的网络数据,含性能数据、告警数据等,包含主要功能如下。

(1)流量采集分析:实时采集网络设备流量数据,可以实现流量的实时查看、流量预警、多维度分析,可提供城域网出口路由器、OLT单上行、等多业务分析。

(2)端到端信息采集:采集BRAS、交换机、OLT设备的配置、业务、互联数据,包含MAC地址信息、端口信息、聚合信息、VLAN信息、QINQ信息等,为资源树的计算、呈现和稽核提供关键网络数据。

(3)PON网光功率采集:采集OLT下挂所有ONU的光指标,包含OLT的收发、ONU的收发以及光模块的电压、电流、温度等,同时可以分析全网的劣化情况、ODN劣化情况等,为PON的稳定运行提供主要的数据支撑。

(4)数据报表功能:城域网出口流量分析、运行状态分析、故障分析、故障面板图呈现、网络设备分析、告警分析曲线图、BRAS综合分析等。

3.4 业务平台网管

实时采集并监控IPTV业务平台运行情况,包含平台出入流量、告警信息及健康情况等,通过提前确定不同告警对业务的影响范围来确定用户投诉与告警是否可关联。

该系统监控能力主要分为两大类:基础类监控和业务类监控。

基础类监控主要包含主机性能、设备端口、网络流量、业务端口、业务进程等的监控,此类监控主要保证业务及应用运行的基础环境正常。

业务类监控包括业务量门限、业务话单、业务日志分析、业务量分析等功能,此类监控可以实现对进程或应用正常但业务不正常的告警或故障进行实时监控。

此外,该系统还提供相关接口,可将采集的数据传送至其它系统,供其它系统调用该系统采集的数据。

3.5 节目源检测

分为直播检测和点播片源检测:直播检测实时记录直播信息,发现直播信号存在问题则产生告警信息,并及时通知信号源提供方进行处理;点播检测系统对于新引入的点播片源进行主动监测,若发现片源存在问题,则停止此片源的引入,对于前期已引入的片源则进行离线监测,发现问题片源后通过片源方处理,以保证点播片源的质量。

3.5.1 直播检测

直播监测系统可以实现以下目标。

(1)7×24 h不间断的监测直播节目的质量情况。

(2)探针通过XML格式的基于HTTP连接的API接口,实时响应其它系统的频道查询。

(3)可以基于业界通用的质量监测标准和规范提供视频质量的多种KPI指标。

基于RFC4445质量监测规范对每一个直播频道节目源抖动和分组丢失进行7×24 h的监测。

基于DVB技术标准TR101 290,对每一个直播频道节目源的MPEG TS流进行监测。

3.5.2 点播检测

点播视频检测结果包含的10个主要检测参数为视频名称、 视频大小(MB)、视频创建时间、视频时长(min)、平均码率(kbit/s)、帧率(f/s)、GoP(画面组)首帧是否全部是IDR(即时解码刷新)帧、 平均GOP值、最大GOP值、GOP值是否全部低于阈值(如小于50)。

在点播视频质量检测完毕后,系统会对检测结果进行自动分析并入库,及时发现存在问题的片源,同时为点播视频质量的进一步分析提供数据支撑。

3.6 端到端智慧运维系统

作为端到端智慧运维体系的核心支撑系统,该系统通过外围接口和周边系统的对接,对各系统的信息进行汇总,并根据IPTV客户资源树对客户业务流经的相关设备、链路等进行全流程管控,当用户感知差时可自行定位引起感知差的原因并提出相关建议,同时可对引起客户感知差的原因进行汇总分析,形成相关报表,为维护人员提供质差整改依据。

该系统可提供IPTV业务端到端的资源树信息查询、业务质量监测、故障诊断和统计报表等功能。主要功能如下。

(1)支持用户资源关联信息、终端信息及网络信息的查询。用户信息查询示例:通过输入客户IPTV账号可以一键查询客户资源树信息,含套餐、机顶盒设备信息、接入网VLAN及上下游设备互联端口信息,基于此信息,可进行疑难故障排查,可查询的信息如图5所示。

(2)支持对节目源、平台、网络、接入线路、终端以及IPTV业务典型故障进行一键诊断定位。

故障一键诊断示例:用户投诉直播与点播视频播放均卡顿。

判障流程:因是视频播放卡顿投诉,故从终端性能、网络质量、平台服务器出流质量及节目源等几个方面进行综合分析。即:

端到端系统首先根据用户账号查询出客户资源树,根据客户资源树涉及信息(用户终端性能信息、相关联的网络设备及端口、IPTV业务平台服务器及直播节目源等)进行端到端分析。

从业务质量检测系统获取机顶盒性能,判断是否在正常范围内。

从IP综合网管获取相关联的网络设备性能及端口性能、收发光、误码等信息,判断是否存在会导致视频播放卡顿的因素。

从业务平台网管获取用户所在点播视频所在服务器,查询一段时间内是否存在导致点播视频播放卡顿的因素。

从直播检测系统获取用户所观看的直播频道,查询该频道近一段时间的播出质量,进而判断视频卡顿是否是因直播节目源导致。

经以上综合分析判断后,最终定位该用户视频播放卡顿的原因为:线路质量差。

检测结果界面主要包括3部分:第1部分为拓扑呈现,可以动态展示用户拓扑及故障段落;第2部分为诊断结果展现;第3部分为详细诊断信息展示。

(3)支持对节目源、接入线路质量、网络质量的查询测试。查询与客户资源树相关联的网络质量:通过输入IPTV账号,即可查询用户相关网络质量,同时可查询出详细网络信息,包括出入口流量、利用率及网络设备性能等。

图5 客户资源树信息

(4)提供报表查询服务,从网络设备、片源等多维度进行用户质差分析并形成报表,运维人员根据报表数据可针对性地进行质差整改工作,以提升客户感知。

4 结论与展望

4.1 结论

未构建IPTV端到端智慧运维体系前,用户投诉定位时长约需180 s左右,且要求投诉处理人员具有一定的处理经验,在完成此体系构建后,投诉处理人员无需任何经验,且投诉定位时长下降至约13 s。

随着IPTV主动运维能力的提升,运行维护相关的用户投诉量也在不断降低,未构建完成IPTV端到端智慧运维体系前,平均万户投诉量约为41.69次/万户。

在IPTV端到端智慧运维体系构建完成后且经过一段时间的端到端优化后,万户投诉量下降至20.90次/万户,提升幅度明显。

由以上可知,所提出的端到端智慧运维体系能极大提高客户投诉的处理时效并大幅降低客户投诉量,可有效提升用户的IPTV业务感知。

4.2 展望

所构建的端到端智慧运维体系满足了维护人员及客服人员的当前需求,后续随着客户判障数据的汇聚,可运用大数据分析的理念,对相关数据进行建模,从数据中分析出影响IPTV业务感知的更深层次原因,可从如下几个方面进行拓展。

(1)通过分析质差用户的片源统计数据,分析出尚未发现有问题的片源,彻底解决因片源问题引起的质差投诉。

(2)通过对质差用户质差原因的分析,列出引起质差的主要原因,并进行针对性处理,进一步提升IPTV的业务感知。

(3)通过对引起质差体验的网络原因进行汇总分析,对网络进行总体优化,进而构建宽带承载精品网络,为其它业务的发展奠定网络基础。

此外,还可以对用户观看记录数据进行大数据分析,对用户行为进行预测,根据不同用户兴趣爱好针对性营销,对IPTV业务发展提供强有力的支撑。

[1] 胡兴军. 我国IPTV发展现状、存在问题及促进措施[J]. 智能建筑与城市信息, 2006(3):29-33.

[2] 谢质文, 杨滔. IPTV:产品、运营与案例[M]. 北京:电子工业出版社, 2008,09.

[3] 杨虎. 互联网端到端时延测量方法的研究与实现[D]. 西安:西安电子科技大学, 2010.

[4] 华为技术有限公司, 体验驱动的4K承载网白皮书[S]. 2016.

[5] 李学军, 李洪, 朱英军, 等. 宽带IP城域网的优化策略与实践[M]. 北京:人民邮电出版社, 2002.

猜你喜欢
运维故障用户
故障一点通
运维技术研发决策中ITSS运维成熟度模型应用初探
风电运维困局
杂乱无章的光伏运维 百亿市场如何成长
关注用户
奔驰R320车ABS、ESP故障灯异常点亮
关注用户
基于ITIL的运维管理创新实践浅析
关注用户
故障一点通