基于ITSS的铁路主数据中心IT资源运维服务方案

2021-11-06 08:21王晓莉李亚萍
铁路计算机应用 2021年9期
关键词:级别运维数据中心

向 晟,尹 乔,王晓莉,李亚萍

(中国铁路信息科技集团有限公司,北京 100844)

铁路信息系统建设的不断深入和完善,对信息技术(IT,Information Technology)资源运维服务提出更高要求。多年以来,参照信息技术基础架构库(ITIL,Information Technology Infrastructure Library)标准[1],铁路IT资源运维服务经过数年发展,已逐步建立起一套规范化、流程化运维管理体系。中国铁路主数据中心承担着铁路客货运输、客服服务和经营管理类信息系统的资源管理、弹性扩展和运行维护工作。目前,铁路主数据中心对信息系统的运维服务管理缺乏分级机制,各类信息系统运维服务均按照统一标准执行,运维保障资源存在分配不合理之处[2]。

信息技术服务标准(ITSS,Information Technology Service Standards)是一套体系化的信息技术服务标准库,是对我国IT 服务行业最佳实践的总结和提升。ITSS 全面规范了信息技术服务产品及其组成要素,用于指导实施标准化的信息技术服务,以保障其可信赖。当前,国内大中型金融机构、央企已经有许多成功运用运维服务分级管理方案的案例,引入服务级别管理理念,运维服务质量和运维成本取得很好的平衡,可为铁路主数据中心IT 能力建设提供科学的理论、技巧和实践指导[3]。

为进一步提高铁路主数据中心IT资源运维服务交付质量,参照ITSS 体系标准,提出铁路主数据中心IT资源运维服务能力提升方案,以完善铁路主数据中心运维服务目录为核心,对各业务信息系统运维服务进行分级,对签署服务级别协议等事项进行规划,以有序推进实施工作,确保铁路主数据中心按需提供优质的差异化IT资源运维服务,有效提升维护资源利用率,控制运维服务成本。

1 铁路主数据中心运维服务现状及能力提升需求

铁路主数据中心是铁路一体化信息集成平台的核心,是国铁集团业务信息系统的生产运维中心,承担着铁路信息资源、关键业务计算、数据存储备份等重要任务[4]。随着《铁路信息化总体规划》的逐步落实和国铁集团CR1623 标志性工程的推进,拟新建项目、待优化完善项目和待升级项目已超过30 多个,运维服务需求快速增长[5]。特别是智能京张、智能京雄、智能蒙华、电子客票、公安综合管理、物资采购平台、煤炭交易平台等重点工程和重点项目的推进,以及铁路局集团公司信息系统的集中迁移,铁路主数据中心的运维服务亟需进一步扩充范围和提高能力,现有运维服务目录也无法满足新增业务需求,需要对其进行重新规划和完善。

目前,铁路主数据中心对所有业务信息系统均按照最高标准提供运维服务,无论是客票系统、电子支付系统、票据电子化系统等对业务连续性和实时性有严格要求的关键业务系统,还是像资金结算等在业务重保期、正常期和低谷期有不同可靠性要求的路内统建系统,均按照统一运维标准提供服务,包括:7×24 h 日常值守、节假日备班备勤、重要时期联合保障、一线团队现场处理故障、二线专家团队远程维护、三线厂商技术支持等。由此造成铁路主数据中心运维服务投入成本过高,而运维资源利用率却相对较低,部分业务信息系统运维资源不足和运维资源过剩的情况并存。

为此,应根据各业务信息系统特有的业务连续性和实时性及可靠性要求,统筹分配铁路主数据中心的运维服务资源,为其提供差异化、按需分配的IT资源运维服务,有效提升铁路主数据中心IT资源运维服务能力。

2 ITSS 标准体系简介

ITSS 是一套成体系和综合配套的信息技术服务标准库,全面规范了IT 服务产品及其组成要素,用于指导实施标准化和可信赖的IT 服务。ITSS 标准体系不仅是我国IT 服务行业最佳实践的总结和提升,也是我国从事IT 服务研发、供应、推广和应用等各类组织自主创新成果的集中体现。

2.1 IT资源运维能力模型

IT资源运维服务的内容是服务供需双方根据服务级别要求,围绕运维服务内容进行服务交付[6]。为确保服务质量,服务提供方应具备相应的运维服务能力。按照ITSS 面向能力建设的原则和框架,GB/T 28827.1 标准提供了运维服务能力模型,以图形化方式,概括基于运维能力体系建设的必要内容,刻画了IT资源运维能力建设中人员、资源、技术和过程4 类要素及其关联关系,用于指导IT 服务提供方进行IT资源运维能力建设[7],如图1 所示。

图1 IT资源运维能力模型

IT资源运维服务提供方参考该能力模型开展自身能力建设,一般包括:调研现状、分析差距、优化体系等工作环节;在评估当前运维工作现状后,找出与服务对象期望的差距,不断改进运维服务工作。

2.2 服务级别管理

服务级别管理过程的任务是定义IT资源运维服务的基本要求,作为其它运维服务过程的输入,通常包括服务级别定义、级别识别、服务级别协议签署和服务级别协议监控改进。

服务目录是服务级别定义的关键输入和参考依据,以列表形式,明确IT资源运维服务范围和内容,包括服务项名称、服务类别、服务代码和服务简介[8],每项服务均列出相应的服务详述,并明确定义各项服务的可量化指标,用于服务定级评估。

服务级别协议(SLA)是服务供需双方就IT资源运维服务内容达成一致后签订的书面协议,明确了双方职责和未来服务交付内容[9]。服务级别协议(SLA)全生命周期管理可驱动IT资源运维服务过程形成“计划-实施-评定-改进”的良性循环,确保IT资源运维服务安全、健康、稳定地发展。

3 铁路主数据中心IT资源运维服务能力提升方案

3.1 铁路主数据中心IT资源运维服务能力提升目标

(1)遵循ITSS 运维体系标准,对照运维服务能力模型,从服务级别管理入手,聚焦于铁路主数据中心运维服务工作中当前存在的问题,在保障高质量交付运维服务的前提下,实现运维资源动态调配和按需供给,降低运维服务成本,将PUE 值控制在1.5 以下,全面提升铁路主数据中心IT资源运维服务能力,确保各业务信息系统连续、稳定运行。

(2)遵循以用户为中心的原则,以流程优化、风险降低和效率提高为目的,在成本约束下,提升铁路主数据中心IT资源运维服务能力。以用户为中心指的是铁路主数据中心IT资源运维服务是在充分了解各业务信息系统需求的基础上,确定运维服务的范围和内容,发布铁路主数据中心IT资源运维服务目录。通过对运维服务行分级,按需为各业务信息系统提供不同等级运维服务,实现精准运维,优化运维投入产出比。签署SLA 协议后,开展具体的运维服务,对服务过程进行监控记录,在运维服务完成后,对服务质量进行评价和反馈,用于指导持续改善运维服务流程[10]。

3.2 铁路主数据中心IT资源运维服务目录

铁路主数据中心承载国铁集团级应用系统部署、全路集中应用系统部署及数据资源存储,制定清晰的铁路主数据中心IT资源运维服务目录,能够完全覆盖铁路主数据中心IT资源运维服务项目的总体范围,真实地反映铁路主数据中心当前以及预计今后较长一段时间内能够支撑的运维服务项目,并考虑为未来的服务扩展提供一定支持。

铁路主数据中心IT资源运维服务目录从运维资源角度进行制定,包括2 部分内容:服务目录列表和服务详述。服务目录列表对运维对象进行分类,细化其服务需求,包括服务类别、服务对象、服务名称、服务代码和服务简介;其中,服务代码采用层级代码结构,便于展示服务的分类和结构;服务类别是铁路主数据中心运维资源的基本类别划分,包括3 个大类:

(1)基础设施类,包含服务器、网络、存储、安全、机房环境等;

(2)系统支撑类,包含操作系统、数据库、中间件等;

(3)网络安全类,包括传输平台、堡垒机、安全平台等。铁路主数据中心IT资源运维服务目录列表如表1 所示。

表1 铁路主数据中心IT资源运维服务目录列表示例

服务代码编码规则采用层次结构,每层代码用数字表示;第1 层代表服务类别代码,第2 层代表服务对象代码,第3 层代表服务项目代码。

每项运维服务均对应一个服务详述,详细描述服务内容和评价服务质量的若干关键指标,为每个指标设定不同的标准值,反映服务质量的差异程度;每项运维服务的质量由全部单项指标的标准值共同定义。铁路主数据中心IT资源运维服务目录详述如表2所示。

表2 铁路主数据中心IT资源运维服务目录详述示例

以表2 中操作系统定期巡检服务为例,该服务有服务频度和服务时间2 项指标;其中,服务频度指标一般设定为1 次/月、1 次/周或1 次/天,分别对应于3 种不同级别服务。

3.3 铁路主数据中心运维服务分级管理实施

铁路主数据中心运维服务采用分级管理方式,为每项运维服务设定不同服务级别,用以匹配各业务信息系统针对不同服务项目的差异化需求。例如,客货运输、客户服务类信息系统运行时间指标一般是7×24 h,而经营管理类信息系统一般要求工作日内5×24 h 连续运行。对运行时间指标设定不同级别,可规范运维资源的合理分配,明确不同级别的服务应投入的运维成本和所采用的运维方式。

每项运维服务的级别依据该服务的所有质量指标进行判定,单项服务质量指标的不同标准对应不同级别,用户选定服务的各项质量标准后,将所有指标的最高级别作为该项服务的服务级别。图2 是某业务信息系统的运维服务分级方案示例,该业务信息系统选用多项运维服务;其中,服务A 有多个质量指标,若单项指标有不同级别,则服务A的级别设定为所有质量指标中的最高级别。

图2 铁路主数据中心IT资源运维服务分级示意

IT资源运维服务分级体现各业务信息系统的运维服务预期,并通过签署基于服务的服务级别协议,对服务内容和相关考核指标进行记录。一个SLA 涵盖针对某个服务对象的全部服务要求,充分体现业务信息系统对不同服务的多元化需求,用于指导运维服务的具体开展方式、成本投入计划和服务计价。

在服务级别协议的实施过程中,需要持续监控和改进。铁路主数据中心运维管理平台提供综合监控管理、运维流程管理、运维操作自动化、运维智能分析等功能,使运维服务可追踪、可回溯,为不同层级运维服务管理团队回顾服务过程提供了强有力的辅助技术手段,方便其实时掌握运维服务情况,快速检查服务过程中存在的缺陷,并提出改进措施,以优化下一阶段的运维服务。

服务级别协议的全生命周期管理,有助于各业务信息系统用户方体验不同等级运维服务的差别,选择适合自身业务特点的服务,消除服务供需双方沟通壁垒。今后,铁路主数据中心面向路外用户提供经营类服务时,可以基于服务级别协议的实施经验,制定灵活、可协商的差异化服务价格,有助于在满足用户需求、降低运维成本和提高运维效益之间达到合理平衡。

4 结束语

统筹管理铁路主数据中心的运维服务资源,根据各业务信息系统特有的业务连续性和实时性及可靠性要求,为其提供差异化、按需分配的IT资源运维服务,是保障铁路信息化规划高质量落地实施的必要举措。

基于ITSS的铁路主数据中心IT资源运维服务能力提升方案,从铁路主数据中心运维实际情况出发,引入服务级别管理理念,形成适应当前铁路主数据中心运维发展要求的可实施方案,实现运维保障资源的规范管理和合理分配,有效改善IT资源运维服务投入产出效率,有助于提升铁路主数据中心IT资源运维服务能力。

猜你喜欢
级别运维数据中心
关于间接蒸发冷机组在数据中心中应用的节能分析
浅析数据中心空调节能发展趋势
中国第一个中级别举重奥运冠军
———占旭刚4
基于BSTL与XGDT算法对多级别心理压力的评估
基于GPS的电力运维轨迹定位系统
IT运维管理系统的设计及应用
级别分明
2017第十届中国数据中心大会榜单
中网级别联赛武汉站打响头炮
电子政务甲方运维管理的全生命周期