“精准治理”在统计监测平台中的运用研究

2019-11-28 17:26张芹娥陈曙光王鸿泉
互联网天地 2019年9期
关键词:监测质量

□ 文 张芹娥 陈曙光 王鸿泉 马 薇

在大数据时代,数据治理已逐步成为政府进行智慧决策的重要基础,能够帮助政府在复杂的市场活动中,快速高效地处理分析海量的数据信息,针对各种情况制定切实有效的政策。基于此,本文以河北省工业和信息化厅统计监测和信息管理平台(以下简称“统计监测平台”)为探讨对象,阐述数据治理运用于其中的重要意义,集中分析如何通过数据治理,提高数据质量,并且为如何保障数据有效治理提供了一定的应对策略。

河北省工信厅统计监测和信息管理平台已经实现了省、市、县、乡、企业及机构数据一体化分平台管理,进行数据统一记录、归纳和整理,实现了数据快速、有效、高质量采集和汇总,解决了基层单位和企业多头报送、负担重的问题,为了解企业运行情况提供了有力的技术保障,进一步节约了人力和物力资源,提高了监测管理的总体效率。

伴随统计监测平台的广泛运用,对其中存在潜在的数据问题,如何正确理解这些数据?如何行之有效地对汇集的数据进行“精准治理”,提高数据质量,使数据可用、可信,提升对数据的管理和运用能力,成了日常工作中的要点、难点。

一、统计监测平台概述

(一)统计监测平台的涵义

统计监测平台是建立在互联网和云上的综合监测管理网络平台。具体来说,是以企业自行报送为基本需求的数据采集、处理、查询、汇总的平台软件。通过互联网信息采集和处理,实现报表的定义、发布、填报、审核、汇总和查询等管理的一体化业务处理,通过控制系统功能权限,实现不同级别用户的报表需求和数据管理。该系统将信息采集、处理、分析和内容整合等多种先进科学技术用于统计监测工作,为全面掌握企业发展情况、及时反映企业运行动态、科学研判发展趋势和领导决策提供数据支撑;为加快企业转型升级、破解社会经济发展难题提供科学依据;为全省政府主管部门的工作提供全面数据和信息支撑,从而提高工作效率,不断提升服务经济发展的水平和能力。

(二)统计监测平台的特点

在当下数据已成为政务部门、企事业单位的宝贵资产,随着互联网技术的迅猛发展,数据的采集、传输、分析、展示等问题越来越重要,在企业和政府日常生产和工作过程中,会产生海量的数据,但这些数据往往没有统一的记录、归纳和整理,或者录入了系统却分散在不同部门而未持续归集,无法为后期的数据应用和分析挖掘提供服务。

为能处理复杂的报表格式及采集流程,满足当代社会数据来源多样化的特点,支持多种报送方式,统计监测平台主要解决以下问题:

■ 数据来源的形式不统一,支撑人工填报、文件导入等多种数据采集方式,支持C/S、B/S多种应用架构体系;

■ 对数据时效性高,管理人员应能快速编辑报表、发布报表、快速回收数据;

■ 对数据的质量要求较高,应提供强大的运算和审核引擎、二次审批、数据锁定等多种质量控制措施;

■ 对工作的效率要求较高,应能由系统自动完成大部分审核、汇总、退回、导入、催报、导出等数据管理工作;

■ 业务的需求变化较快,采集的指标口径、流程应能随着业务需求变化快速适应和调整,并能自动完成系统和数据的动态升级;

■ 对数据的安全性要求高,能够严格控制数据的访问权限。

统计监测平台采用报表来归纳、整理和统计数据信息,它将面向技术的数据库表以业务的形式呈现给用户,并通过业务的方式进行数据查看、操作和管理。

二、数据治理的必要性

2016年4月19日,习近平总书记在网络安全和信息化工作座谈会上进一步指出:“信息是国家治理的重要依据,要发挥其在这个进程中的重要作用”;要“统筹发展电子政务,构建一体化在线服务平台,分级分类推进新型智慧城市建设,打通信息壁垒,构建全国信息资源共享体系,更好利用信息化手段感知社会态势、畅通沟通渠道、辅助科学决策”。在大数据时代,数据正在呈指数级增长,世界上的许多国家都把大数据上升到国家战略的高度,实施国家大数据战略,为政府治理的变革和创新开拓新局面。以“精准”为口号的数据治理为提升各政务部门的公共服务、市场监管、宏观调控、科学决策、资源配置等提供了契机。在这种现实的需求下,探寻统计监测平台数据治理具有十分重要的意义。

信息汇集是省工信厅重要的基础性工作。面向重点联系企业开展企业主要经济指标月度调查、年度调查、企业经济效益指标完成情况、企业产销存情况、企业出口情况的调查等,对掌握企业生产、节能、节水、环保、装备水平、研发水平等与企业生产经营、转型升级发展密切相关的指标,了解这些情况对掌握企业发展情况具有重要意义。但有许多因素会导致这些数据出现“真实性”问题,比如脏数据、错误数据、异常值数据、重复数据,数据精度不够、数据前后逻辑不对、数据标准没有统一,编码不统一、缺少相关规范、对数据理解的不充分等等。这导致我们对数据进行汇总分析和数据挖掘时,分析的结果有很大的偏差,为决策者带来了负面影响。

三、数据治理的研究

IBM对于数据治理的定义是:“数据治理是一种质量控制规程,用于在管理、使用、改进和保护组织信息的过程中添加新的严谨性和纪律性。”。

数据治理的目标总体来说就是提高数据质量、在降低风险的同时实现数据资产价值的最大化。由此,数据治理从本质上看就是对一个机构(政府部门或企业)的数据从收集融合到分析管理和利用进行评估、指导和监督(EDM)的过程,通过提供不断创新的数据服务为企业创造价值。

数据治理的处理对象是海量的分布在各个系统中的数据,这些不同系统的数据往往存在一定的差异:数据代码标准不一样、数据格式不一样、数据标识不一样,甚至可能存在错误的数据。这就需要建立一套标准化的体系,对这些存在差异的数据统一标准,符合行业的规范,使得在同样的指标下进行分析,保证数据分析结果的可靠性。

统计监测平台以建立数据标准规范为基础,运用数据处理、数据清洗、数据分析、数据可视化等技术建立数据综合治理体系,从前期数据调研规划、到中期建立数据标准、后期持续数据质量改进管理等工作,来逐步提高数据的真实性、完整性、规范性、一致性、逻辑性,来降低数据管理成本,减少因数据不可用导致的分析挖掘的偏差和损失,实现数据的“精准治理”,为深度挖掘数据的价值奠定坚实的基础。

(一)数据调研

首先针对统计平台各业务系统的数据资源进行调研,了解数据情况,梳理数据调研报告。随后根据数据调研情况,从数据标准规划、元数据管理和数据质量管理等方面着手逐步开展数据治理工作。

数据标准规划工作主要包括:标准设计定义、标准设计发布、标准查询等。

元数据规划工作主要包括:元数据定义、元数据采集和查询、来源和影响分析等。

数据质量规划工作主要包括:质量检查规则定义、质量检查方案定义、质量检查评估、质量问题分析及报告等。

通过上述工作,可以从整体上对平台中的数据概念、标准和质量进行全面梳理规划,并能够确保后续的数据治理清晰、有序。

(二)标准规划

统计监测平台涉及的业务面众多,比如电子信息、中小企业、民营经济、融资担保等企业运行数据,如果缺少统一的标准进行约束,容易导致在数据计算、处理和整合的差异,从而导致不可信数据的产生。

数据标准工作就是对资源信息进行定义、评估、分析,实现信息的描述和格式化,达到对数据标准管理工作,为元数据管理提供相应的业务元数据信息,为数据治理提供相应的治理标准,大大降低数据治理人工成本。

先以元数据为基础,构建数据资源管理体系。从数据应用的角度说清楚统计监测平台数据有哪些,哪些数据能够使用。基于第一步形成的数据资源管理体系,梳理、整合各业务系统的数据资源,建立了数据资产目录树,对不同数据类型制定相应的规范约束,对相应的数据指标项行梳理和制定规范要求。

(三)质量管理

在数据治理过程中,最重要的是要建立数据质量管理体系,来有效识别统计监测平台的各类数据质量问题、找出数据质量原因、监控问题发展趋势,并提供问题明细查询和质量改进建议,全面提升数据完整性、准确性、及时性,一致性以及合法性等方面的问题。

首先我们基于数据资产目录建立数据质量规则,定义关键数据项的质量检测规则,依据对业务的理解对不同数据项建立完整性评价、规范性评价、逻辑性评价、及时性评价、重复性评价、外建关联性、波动分析、平衡分析等不同的质量检查规则。

然后依据质量规则制定数据质量检查方案,包括检查的范围、检查的时间、检查的规则、评分的规则、检查的责任人等,对统计监测平台汇集的数据按照制定的方案进行检查。

最后根据检查结果、数据质量管理和监控要求,对问题数据进行统计分析,并对检查产生的结果通过界面、邮件、短信等方式告警,找出问题数据出现的原因,采取手段持续改进,避免问题重复出现,周而复始,逐步提高数据质量。

四、确保数据“精准治理”的有效措施

(一)建立组织

想要开展数据治理工作,就必须先建立相应的组织机构,开展统一的治理工作,组建治理委员会,制定监管政策,明确如果数据出了问题是谁负责,在各部门、各应用系统中落实责任,保障组织间高效的沟通。

(二)制度建设

制定数据管理的办法、管理的流程、治理的规则、治理的要求、岗位要求、角色人员、奖惩措施、保密措施等,保证支撑治理工作正常、有序、有效、及时的开展。

(三)规范约束

加强数据的规范约束,能有效提高采集数据的质量,对核心业务数据项定义完整性、规范性、可度量等标准规范约束规则,主要针对元数据、主数据等制定相应的数据规范。

(四)系统保障

采购和开发相应的数据管理软件系统,解决数据治理过程中遇到的问题,通过系统,提高元数据管理、数据资产管理、数据标准管理、数据质量管理、数据问题分析等能力,来保障数据治理工作的顺利开展。

总之,在各类政府服务数字化转型过程中,越来越多的数据被汇集整合,统计监测平台有效的保障了各类数据信息汇集和处理,符合管理的实际需要,应长期推广。

数据治理的核心目标就是在降低风险的同时增加价值,合理的数据治理能够建立规范的数据应用标准,消除数据的不一致性,提高数据质量,推动数据广泛共享,充分发挥数据对政府及企业的业务、管理、以及战略决策的重要作用。

未来数据的“精准治理”将为各政务部门提供更及时更准确更全面的数据,在及时了解情况、惠企服务、科学研判等方面提供的数据支撑,更好支撑政务工作的开展。■

猜你喜欢
监测质量
陆地生态系统碳监测卫星发射成功
夏季高血压的困惑及自我监测管理
质量守恒定律的应用
居家监测血糖需要“4注意”
特色“三四五六”返贫监测帮扶做实做细
二年级下册期末质量检测(一)
大规模应变监测值获取技术研究
提高审议质量 强化人大监督
学习监测手环
睡个好觉