神东煤炭生产数据标准化规划初探

2018-03-22 02:46王海军丁剑明白明亮
中国煤炭 2018年2期
关键词:神东架构标准化

王海军 丁剑明 白明亮 马 涛

(1.神华神东煤炭集团有限责任公司,陕西省榆林市,719315;2.中国神华能源股份有限公司神东煤炭分公司信息管理中心,陕西省榆林市,719315)

随着互联网、云计算、物联网等为代表的信息技术的不断发展和应用,当前已经步入大数据时代。数据将成为或已经成为企业独立于人、财、物、技术以外的重要资产,数据获取及分析应用能力将成为或已经成为企业的生产力及核心竞争力。在工业领域,工业大数据技术及应用将成为未来提升企业生产力、竞争力、创新力的关键要素。

神东通过《数字矿山关键技术及应用研究》(863计划)项目和《区域中央集中自动控制》项目的实施,初步建成了两种数字矿山平台框架,数字矿山已具雏形。但是,还存在数据多标准、多源头、不准确等问题,要建成真正意义上的数字化矿山,还需要实施数据标准化建设。

数据标准化建设是煤炭企业做工业大数据分析应用的基础,要实现物联网、大数据、云计算及人工智能技术在煤矿安全生产等场景中充分发挥出应有的作用,就必须先在“硬件”和“软件”两个方面的基础设施领域开始做好准备工作,而数据标准化就是“软件”方面的基础实施建设,因此具有重要意义。

1 神东数据现状及存在的问题

由于神东早期的信息化建设缺乏信息化总体规划的指导,因此积累了一些问题,比较突出的是信息系统主要依据各部门和各业务模块需求独立建设,信息孤岛现象严重,具体体现在以下几个方面:

(1)数据分散。神东煤矿生产数据信息分散,同一物理对象在不同部门、不同系统中的描述不同,无法贯通生产管理调度管理等业务,数据分散设计导致数据的准确性和完整性降低,必须花费大量精力对数据进行重新整合才能分析运用。

(2)数据共享程度低。生产数据涉及多个部门和多个系统,但系统间往往缺乏映射,部分数据还存在无系统支撑的情况,一旦出现数据不一致的情况,多依靠手工核对,工作量大且容易出错。同时,由于数据共享程度低,针对业务要求需对每个业务系统进行数据提取并进行匹配,然而却很可能出现信息不一致的情况。部门之间往往需要共享信息,数据共享程度低,最终将导致需求部门为了获得所需信息不得不进行重复的投资建设。

(3)数据标准不统一。早期的信息化建设缺乏宏观层面的总体规划,大部分应用系统的数据标准不统一。目前,神东的管理类数据标准已由集团统一制定,但生产类数据标准尚未制定,没有形成企业级的统一数据信息视图,难以保证数据的唯一性和准确性。数据收集、系统处理、报表编制缺乏规范和统一的数据标准体系。

基于以上现状,神东迫切需要将各类数据进行标准化,把数据整合起来,建立共享交换平台和综合分析平台,提升整体业务效率,提高信息共享程度,改善各种数据在跨部门间的运用和分享,为安全高效生产提供坚实的基础。

2 数据标准化实施原则

在企业数据治理过程中,宏观层面上要有统一的标准和原则。在神东数据标准化实施过程中,整体按照统一规划、整体部署、分步实施的大原则进行,除了遵循国内外相关标准外,为了确保生产数据标准体系与神东业务发展方向的一致性,主要遵循以下几点原则:

(1)全面性。从数据标准体系内容来看,规划制定对矿井生产业务数据管理的各个领域进行了全面的梳理和描述,力争促使神东生产管理的基础数据管理和应用服务能力上一个新台阶。

(2)前瞻性。结合神东的战略发展需要,并充分借鉴国内外同行业的先进实践经验,向国内外领先水平看齐,使生产数据标准体系建设具备一定的前瞻性。同时,生产数据标准化要瞄准建设企业数据仓库以及神东大数据平台的目标,确保数据标准化相关内容将能够服务于未来神东生产管理业务的发展。

(3)可执行性。生产数据标准体系建设基于对神东生产业务及数据管理现状的深入调研和分析,优先考虑神东在生产管理领域以及相关系统建设上面临的难题,确保数据标准体系切实可行。

3 数据架构及标准化体系规划

3.1 数据架构规划

数据架构描述了技术和应用视角下的核心组件,以及这些组件之间的分层关系和应用逻辑。企业数据参考架构以业务需求为导向,基于业务架构和企业流程来规划数据架构,架构设计以业务应用需求为先导,将数据作为企业核心数据资产之一,与业务流程相互融合,多视图对业务、数据、技术和平台进行建模,实现企业人流、物流、资金流和信息流等各业务线的贯通。

中国电子技术标准化研究院和全国信息技术标准化技术委员会大数据工作组联合发布的《工业大数据白皮书(2017版)》中,给出的大数据架构参考模型和工业大数据架构参考模型如图1和图2所示。参考上述模型,遵循神华集团的数据架构模型框架,结合神东业务和IT架构,设计规划的神东大数据架构参考模型如图3所示。

在神东大数据架构参考模型中,从下至上共分为七层,分别是数据标准化层、数据源层、数据采集层、数据治理层、数据管控层、数据存储层、数据展示及应用层,其中本期工程主要完成最下层的数据标准化层。

3.2 标准化体系规划

从业务系统、数据共享和业务主题3个数据管理层次建立数据标准、数据标准管理和数据质量管理,明确数据的定义,规范数据的质量。从神东整个企业的角度出发,建立统一的数据标准,结合数据治理工作成立技术标准工作组,制定工作计划,组织完成各类标准制定,主要包括技术标准、业务标准、管理标准、数据质量标准等内容。

图1 大数据架构参考模型

图2 工业大数据架构参考模型

图3 神东大数据架构参考模型

4 数据标准化路线规划

4.1 需求调研

目前的生产数据运作流程为产生→转码→传输→储存→分析处理→展现,对煤炭生产过程进行全流程、多维度的调研,了解煤炭生产过程中涉及到的业务实体,从数据生命周期的视角来了解和分析生产数据在生产业务过程中如何产生和如何终结。熟悉煤炭生产业务流程,再进一步分析信息化现状,总结出各个业务实体在哪些信息系统中存在,各个信息系统在使用这些业务实体参照数据过程中使用了哪些属性值,哪些属性值是在哪些信息系统中进行维护和更新。 从长远发展的角度来看,还要了解下一步生产相关业务的信息规划,了解哪些基础数据目前可能没有共享的需求,但在未来有可能需要共享,需要系统分析和管理。数据的分类、数据的标准化是一项立足长远的工作,必须保证标准体系的易扩展性和易维护性。

4.2 生产数据的梳理和规划

需求调研结束后,列出重要的数据管理清单。有些生产数据被一个系统多次引用,或者被多个系统同时引用,则这个数据项必须作为主数据优先标准化。把这些主数据在各个系统中使用到的所有属性汇在一起就初步形成一个生产主数据完整的指标体系。生产主数据梳理完毕形成完整的指标体系后,还必须将生产主数据划分层级,这些主数据并不是每一个业务系统都要使用,按照决策层、管理层、执行层分配权限,主数据运用范围越广,越贴近具体业务的数据项越具有专业性。

4.3 生产数据指标体系的建立

定义好每一个生产数据需要哪些属性值以及每个属性值的域,只有这样才能避免各个信息系统中数据口径不一致或者数据定义不一致的情况。 定义好每一个生产数据的所有属性值的约束性规则、完整性规则以及数据质量审核流程,生产数据的使用必须进行规范化,特别是对煤种、产量、产率和效率等敏感数据,定义好哪些部门可以看生产数据的哪些属性值,以及各个系统之间的数据使用接口。 所有的数据统一用一套编码规则,方便后续储存、转换和分析。

5 生产数据的管理运营

通过数据标准化项目建立神东煤矿生产数据的分类体系,制定神东煤矿生产相关的主数据及共享数据标准,实现数据定义和使用的唯一性与一致性,改善数据质量,减少数据冗余,保障信息化建设成效。

(1)建立数据共享交换平台。基于数据必须作为一种资产进行管理的理念,为了充分管理和应用数据,进一步发挥数据的价值,仅有标准化的数据还远远不够,还需要建立数据共享交换平台,以扭转目前神东信息化建设过程中各个信息系统间网状关联关系不断增长的局面,逐步构建信息系统间星形关联关系,实现共享数据资源的集中共享和有序分发,从而实现企业内部数据横向贯通。

(2)建立大数据平台。建立企业大数据平台也是解决企业数据全面充分开发利用的有效途径。神东现有约100 TB的生产数据,随着神东矿井数字化建设、井下3G和4G移动网络的投入以及物联网技术的应用,采集到的生产数据正以几何级数增长。但是这些数据本身混杂,难以辅助生产活动分析和决策,只有将这些数据进行挖掘和分析,并将结果以友好的形式展现,才会被用户接受并加以利用。所以可以通过建立神东大数据平台来实现对这些数据的开发利用,最大程度地挖掘数据资产的价值。

6 结语

煤炭生产数据标准化建设是煤炭生产领域实现信息化的先驱工程,是建设数字矿山、智慧矿山、数据驱动型企业的基石。神东在数据标准化建设过程中以信息工程方法论为指导,以神华集团信息化总体规划和神东信息化总体方案设计为基础,以企业战略为导向,业务、应用、数据、集成和基础设施架构相互支持,成为一个有机整体。遵循业界主流标准和神华集团信息化标准,各系统相互集成,确保流程衔接和数据共享。

数据共享交换平台和大数据平台作为数据标准化项目的两个后续建设项目,可以检验数据标准化的成效,是数据标准化项目的落脚点,可以实现其成果的有效落地。数据标准化是企业数据治理的开始,随着业务和数据的梳理,可能会发现一些问题,同时提出改进,涉及业务变革以及组织架构调整等复杂因素,需要企业高层统筹协调推进,是一把手工程,需要结合企业自身实际深入研究。

[1] 刘海滨,刘浩,刘曦萌.煤矿安全数据分析与辅助决策云平台研究[J].中国煤炭,2017(4)

[2] 张绍华,潘蓉,宗宇伟.大数据治理与服务[M].上海:上海科学技术出版社,2016

[3] 张明英,潘蓉.《数据治理白皮书》国际标准研究报告要点解读[J].信息技术与标准化,2015(6)

[4] 中国电子技术标准化研究院,全国信息技术标准化技术委员会大数据工作组. 工业大数据白皮书(2017版)[EB/OL],2017

[5] 张一鸣.数据治理过程浅析[J].中国信息界,2012(9)

[6] 王海军,武先利. “互联网+”时代煤矿大数据应用分析[J]. 煤炭科学技术,2016(2)

[7] 马小平,胡延军,缪燕子. 物联网、大数据及云计算技术在煤矿安全生产中的应用研究[J]. 工矿自动化,2014(4)

[8] 申琢,谭章禄.基于数据挖掘的煤矿大数据可视化管理平台研究[J].中国煤炭,2016(12)

[9] 常朝娣,陈敏. 大数据时代医疗健康数据治理方法研究[J]. 中国数字医学,2016(9)

[10] 李鸣,郝守勤,何震. 数据治理国际标准研究[J]. 信息技术与标准化,2017(Z1)

[11] 孙金凤. 中国石油企业源头数据资源建设架构及对策[J]. 大庆石油学院学报,2010(8)

[12] 刘婵,谭章禄. 大数据条件下企业数据共享实现方式及选择[J]. 情报杂志,2016(8)

[13] 巨克真,魏珍珍. 电力企业级数据治理体系的研究[J].电力信息与通信技术,2014(1)

[14] 张科利,王建文,曹豪. 互联网+煤矿开采大数据技术研究与实践[J]. 煤炭科学技术,2016 (7)

猜你喜欢
神东架构标准化
基于FPGA的RNN硬件加速架构
标准化简述
传承弘扬神东精神,为企业安全高效发展提供源动力
功能架构在电子电气架构开发中的应用和实践
基于云服务的图书馆IT架构
标准化是综合交通运输的保障——解读《交通运输标准化体系》
VoLTE时代智能网架构演进研究
陕西神东总医院赏析
以标准化引领科技创新
论汽车维修诊断标准化(上)