大型煤炭企业数据中台设计方法探究

2023-12-16 08:01郝志伟
山西焦煤科技 2023年11期
关键词:数据管理煤炭企业架构

郝志伟,郭 超

(山西焦煤集团有限责任公司 大数据中心, 山西 太原 030024)

大型煤炭企业多数存在以下问题:总部业务部门需求不明晰、数据标准不统一、数据质量不规范、数据安全不可控,各业务系统独立运行、异构不兼容,像一个个烟囱,很难统一和打通,无法实现数据的有效共享、业务的流程联动和系统的全面协同,导致集团对人财物、产供销等业务的管控力度不足,使安全生产经营等过程存在风险、隐患和漏洞;子分公司及厂矿单位多存在采掘机运通等专业业务系统多,数据孤岛现象严重,且业务系统数据填报不准确、信息输入不及时,甚至不愿上报真实数据等。

为解决上述问题,需要构建各业务系统数据共享和流程互通的共同底座,以打通各业务系统,促进企业大数据的融通共享、协同联动,提升集团管控能力。数据中台作为全新的企业管控理念,以服务企业业务运营为目标,汇聚、整合、存储煤炭企业安全生产经营业务大数据,经加工整理后的有用数据可通过挖掘、分析直接应用于具体业务,帮助优化业务流程,打通业务系统间的“部门墙”,促进业务流程标准化、工作标准信息化、企业信息智能化,为煤炭企业实现减人提效、对业务系统扁平化和人财物产供销等核心资源的精益化管理奠定数据架构基础。

1 国内外研究现状

国内外多个研究者对数据中台技术进行了相关研究。苏萌等[1]总结了数据中台技术的相关进展,提出数据中台通用技术架构。艾瑞咨询[2]从市场规模、适用行业、发展路径等角度总结整理了2019年数据中台在中国的发展情况。周纲等[3]介绍了一种应用于电力营销服务业务的数据中台设计方法。李炳森等[4]设计了适用于电网企业的数据中台贴源、共享、分析三层服务架构,并研究了关键技术。罗薇[5]提出了一种应用于通讯行业的中台一体化生产体系,强化了生产协同,提升了用户体验。于浩淼等[6]基于数据中台的一般体系架构,提出中国联通国际公司中台建设方案。李广乾[7]、刘童桐[8]探讨了数据中台的内涵和外延。刘颖慧等[9]分析了不同企业的中台战略和架构,提出了通讯运营商的数据中台建设方法和类型。PTC[10]从体系架构、建设架构、落地思路等方面探讨了工业企业建设数据中台面临的关键问题。谭虎等[11]阐述了阿里云数据中台的一些建设思路。刘俊良[12]研究了数据中台架构设计、关键技术。陈小勇等[13]论述了数据中台设计思路、总体方案、关键技术等。但上述研究多为通讯、电力等行业的数据中台建设探究,尚未发现针对大型煤炭企业建设数据中台方法的相关研究。

针对大型煤炭企业普遍存在的问题,设计了一种数据中台技术架构,从数据标准体系建设、数据采集处理、数据库选择、数据管理、大数据分析应用、新技术应用等6方面研究探讨了数据中台建设中的关键技术,为建设适用于大型煤炭企业的数据中台,推进各业务大数据协同联动和深度分析应用提供可借鉴的解决思路。

2 数据中台技术架构

结合大型煤炭企业特点,数据中台建设可遵循以下流程:采集集团人力、财务、设备、生产等核心业务数据,基于规范统一的数据标准,在保障数据质量的前提下,对数据进行清洗加工等处理,存储到数据仓库,形成可以复用的元数据,沉淀共性数据及服务,实现一次录入数据,在数据控制权限内所有业务系统共享,构建业务共享和流程互通的共同底座;对数据进行建模,利用大数据建模、算法等开展主题分析等大数据挖掘、分析应用,实现利用大数据对企业人员流、资金流、物资流进行在线监控,防控企业风险,研判安全生产经营趋势,充分支持各层级领导决策的目的。同时,通过提供统一应用展示门户,对内支撑集团安全生产经营等业务数据应用,对外统一构建与政府监管部门、客户、供应商等的安全可控数据交换出入口,由集团统一、安全、高效地把控对外交换数据,支持集团多维度的精益化管理,实现全方位、全链条、全域赋能全集团管理升级。典型的数据中台架构见图1,主要包括数据源、数据采集处理、数据库、数据管理、大数据分析、应用展示等6部分。

一个典型的数据中台的数据流见图2,通过对集团业务系统中数据的抽取、清洗、转换等工作,存储进集团数据库,根据各层级领导对不同主题数据分析的需要,利用相关建模和算法对数据仓库中的相关数据进行主题分析、展示,支持各层级领导决策,并将分析结果及时应用到集团相关业务部门,保证领导决策的快速高效执行。

3 关键技术分析

数据中台建设的关键技术主要包括数据标准规范体系建设、数据采集处理、数据库选择、数据管理、大数据分析应用、新技术应用等6方面。

3.1 数据标准体系建设

围绕大型煤炭企业生产、运输、销售全链条,人力、财务、设备、生产、供应、销售、法务、投资、办公全业务,通过制定数据源输入标准、主数据企业标准、编制并出台相关数据标准管理办法、开展集团相关业务数据清洗等方式,推动集团各业务系统数据标准统一、规范使用,逐步构建包括规范定义、术语、模型架构、元数据命名规范、编码规范等在内全集团统一的数据标准体系。同时,通过加强对各子分公司的督导管理,规范集团公司数据标准体系的统一应用,为数据存储、管理、分析应用和展示奠定标准基础。

3.2 数据采集处理

建设大型煤炭企业全集团统一的数据采集平台,根据数据源输入标准,对人力、财务、设备等各分散、凌乱的业务数据进行采集汇聚,通过ETL等技术,形成清晰有序的有用数据,存储到数据仓库中,形成元数据,实现数据一次采集或录入、所有业务共享共用,满足企业对煤炭安全生产、经营管理等业务数据管理要求的同时,为集团级的大数据分析提供统一的标准数据保障。

3.3 数据库选择

相比于Mpp数据库,Hadoop拥有更多的计算节点数、更大的数据量,适用于存储关系型、半关系型、无结构化、语音、图像、视频等多种数据类型,因此,Hadoop数据库适用范围更广泛,但当面对需要大规模并行处理的场景时,Mpp更有优势。大型煤炭企业涉及人力、财务、设备、销售、投资、办公等多业务复杂的应用场景,应选择Mpp和Hadoop混合型数据库作为存储媒介,以构建一套既能管理全域业务数据、又能支撑上层应用需求的新型数据库,为实现快速高效的数据挖掘、分析提供数据存储支持。

3.4 数据管理

数据库中数据按照一定的数据标准和质量规则汇集形成元数据和主数据,高质量的元数据和主数据可形成不同的主题数据库,有效支撑大型煤炭企业进行安全生产、销售管理、设备资产盘活等不同主题的大数据分析。同时高质量的元数据和主数据可对企业不同业务提供全集团统一的数据共享和服务,从而实现各业务信息互通、数据共享和全面协同,增强企业竞争力、管控力和抗风险能力。

3.4.1 元数据管理

元数据可以让企业数据资产用清晰直观的方式进行呈现,对元数据的管理包括元数据基础管理、元数据质量管理、元数据分析等。其中,元数据基础管理包括对元数据添加、删除、修改,元数据间关系建立、维护,元数据自身质量的核查,元数据查询、统计等;元数据质量管理包括对元数据属性、关系及安全性和一致性的检查等;元数据分析主要指通过血缘分析、影响性分析、实体关联分析、全景分析等,直观了解元数据来源、流向、被引用次数等重要信息,以实时掌握元数据真实状况。

3.4.2 主题数据管理

对大型煤炭企业财务、采购、科研等不同主题域数据的管理能有效支撑不同主题的大数据分析,同时,各主题域内部,不同来源的数据可通过统一的标准基础数据实现相互的关联,例如,采购主题的供应商信息、合同信息等可通过客户编码、合同编码等,实现互相联系、互相融合;各主题域之间,来自于同一数据源的同样数据是互相共享的。采购主题中对供货、质检、合同分析的数据管理流程见图3.

图3 采购主题中对供货、质检、合同分析的数据管理流程图

3.4.3 数据质量管理

通过建设包括质量规则、核对校验、监控诊断、质量报告在内的数据质量体系,能有效保障数据的完整性、一致性、合法性、关联性、唯一性。在大型煤炭企业的实际应用过程中,一个典型的数据质量管理流程如下:利用数据质量规则,对数据进行校验筛查,判断出的数据质量问题,反馈给相关业务部门进行确认、调整,以有效提升数据质量。

3.5 大数据分析应用

针对大型煤炭企业存在的痛点、难点问题,可以选择一个或者多个应用场景,通过数据建模、算法等,开展多业务协同的主题分析,对内支撑领导决策分析和提升各业务精益管理水平,对外赋能客户、供应商等产业链数据,同时支持政府决策和服务社会关切。例如,针对企业各业务存在的信息孤岛严重,无法实现数据的有效共享、业务的流程联动和系统的全面协同问题,可开展产洗运销协同联动等大数据分析,让数据为管理赋能:对大型煤炭企业所属煤矿各类数据进行针对性建模、多维度分析和综合集成展示,并援引集团外部相关数据研判煤炭价格,预测市场走势,通过抓产销、带中间、堵漏洞,促进集团公司精益化管理水平的提升,辅助集团领导科学决策。

3.6 新技术应用

在大型煤炭企业的数据中台建设中,加强对视觉识别、语音识别和RPA流程机器人等新技术推广应用,能有效提高数据利用率、降低劳动强度、提升业务服务能力、实现业务技术创新。例如,利用语音识别技术,将原来需要通过PC端手动操作的方式转化为直接通过语音实现系统控制,并利用语音播报自动直观展示需查询、分析的结果;利用视觉识别技术和RPA流程机器人,通过对网页或PDF等非结构化页面的采集或OCR识别,智能将所需数据实时、准确、高效自动填入表格,并生成汇总表,有效提升集团业务准确性、合规性和工作效率。

4 总 结

针对大型煤炭企业普遍存在的业务系统庞杂、信息孤岛和数据壁垒严重,导致集团对子分公司管控能力不足、存在安全生产经营风险等问题,设计了一种数据中台技术架构,并从数据标准体系建设、数据采集处理、数据库选择、数据管理、大数据分析应用、新技术应用等6方面探讨了数据中台建设中的关键技术,为建设适用于大型煤炭企业的数据中台,实现全集团数据的标准化、资产化、价值化、服务化、自主化和开放化提供一种可借鉴的参考。

猜你喜欢
数据管理煤炭企业架构
基于FPGA的RNN硬件加速架构
企业级BOM数据管理概要
定制化汽车制造的数据管理分析
海洋环境数据管理优化与实践
功能架构在电子电气架构开发中的应用和实践
CTCS-2级报文数据管理需求分析和实现
煤炭企业走好走实群众路线的制度思考
LSN DCI EVPN VxLAN组网架构研究及实现
煤炭企业档案管理的创新
一种基于FPGA+ARM架构的μPMU实现