大数据在政府统计工作中的应用

2018-09-05 01:07于会永
党政干部学刊 2018年2期
关键词:大数据信息化

于会永

[摘  要]当今信息技术的高速发展,使我们进入了一个新的时代——“大数据时代”,大数据本身具有数据大量化、类型多样化、快速化、价值高等特征。人们利用互联网等新型技术手段,全方位、多视角地来挖掘数据,以及分析、梳理相关信息。正是大数据时代的到来,使政府的统计工作发生了变化,力求通过规范和优化、流程再造等手段,拉近社会经济生活的原始数据与最终的结果数据之间的距离,从而利用大数据为政府统计的创新寻找出路。同时,正是基于大数据自身的特点,并随着这些特点的凸显,政府统计工作也出现了很多不适应的地方,这就给政府统计工作带来了机遇的同时,也带来了新的挑战。

[关键词]大数据;政府统计;信息化

[中图分类号]C829  [文献标识码]A  [文章编号]1672-2426(2018)02-0066-05

当今时代,信息爆炸正在推动着社会变革,导致目前世界的信息比以往任何时期都多,而且数据增长的速度也在加快。大数据这个概念是从天文学和基因学两门学科中诞生的。如今,这个概念几乎应用到了所有与人类智力与人类发展的领域之中。[1]大数据不是一种普通的、使用抽样调查的方法而产生的信息数据,它是一种运用新的处理模式,为更强大的决策力、发现力和流程优化能力服务的信息资产。大数据具有数据大量化、类型多样化、快速化、价值高等特征。大数据所体现出的战略意义并非是拥有海量的数据信息,而是对数据采取专业化处理。人们借助互联网等技术手段,依托于大数据的特点,多视角、全方位的挖掘数据,梳理、分析相关信息,为科学研究和各种决策服务。政府统计是根据国家统计的统计方法和手段,依法对国民经济和社会发展进行统计调查和分析的活动,为各级政府提供统计数据和咨询意见,并进行统计监督。政府统计的功能中,其信息功能是政府统计中的最基本功能。只有采用科学的统计指标体系,运用科学的统计调查方法,才能采集、处理、传递、存储和提供以数据描述为基本特征的社会经济信息。现代社会出现的信息爆炸,使政府的统计工作面临着巨量信息束手无策的局面,这不仅对政府的各种决策带来了风险,而且对政府自身的管理也带来了非常大的影响。

由于信息技术的发展,使社会、经济的信息流、物资流和资金流不断地去整合统一,特别是网上电子商务发展速度逐渐加快,如果政府统计报表的起点不在这个三个流当中,就会无限地贴近经济社会的原始记录,那么社会的不正当行为、寻租行为就会在流转税的空间中出现。再者就是政府统计讲究一个全社会、全口径的工作模式,但是网上电子商务所产生出的各种统计数据,尤其对GDP数字形成的统计数据,在一定时间存在着不小的漏洞。例如,2016年政府统计的相应公报里,已经发表了对電商的统计,以及其对社会商品零售总额的贡献,但是过去这么多年电子商务这一块一直是真空地带。这就要求政府通过对统计工作的规范、优化,以及流程再造,不断地前移统计报表的起报点,拉近社会经济生活的原始记录与最终的结果数据之间的距离,使其精准化、精确化。这是政府统计工作改革创新之路。

一、政府统计工作的发展历程

“政府统计报表的数据,是生活中最初期的记录和社会管理、社会公共服务产品三者之间的有效载体。它的运行体系的设计与实现,是记录生产力与生产关系发展水平的一种标志。”[2]通过统计报表这一标志,可以总结出我国政府统计的发展历程,也可以使我们从政府统计数据的历史脉络中,寻求契合大数据为政府统计工作提供服务的结点。

(一)第一代统计数据

手工和早期电子计算器时期,政府的管理需求与原始生产单据记录,以及综合汇总效率的提高,催生出了政府统计的综合报表,简称“统计报表”。统计报表作为各机构之间中间结果数据的传递载体,这样以道德、诚信为基础的综合报表模式,是对面向数据使用者、面向综合分析者的功能定位;一个问题使用一张表、同期报送基期对比数据是其烙印性标志;统计报表层层汇总,级级上报的工作方式形成分级叠加汇总,分级叠加汇总的工作方式契合了计划管理体制的分级管理需要,也迎合了近些年来对各级政府以GDP挂帅的政绩考核的分级管理需求。[3]从人工计算工具到初级电子计算机的过渡,所承载的数据是迈进信息时代的第一代统计数据。那么这一类的数据已经按信息公开要求,基本实现了全部公开。

(二)第二代统计数据

现代计算技术的发展和应用推动了政府统计报表结构的变革,从以往的分层次叠加的汇总过渡到了超级汇总。“超级总结”催生了基层政府基层调查问卷和数据结构的变化。建立了属性指标和统计指标。大部分统计数据将基层问卷的二元结构形成综合汇总表,更接近经济社会活动的原始记录。[4]由于互联网在社会上的普及,联网直报已经成为超级汇总的网络化延续,为实现“下去一把抓,上来再分家”的网络化统计方式提供了技术支撑,进而推进了统计工作的网络化进程,使其让数据与应用更进一步集中;超级汇总及联网直报模式下的基层调查表,所承载的数据是信息时代里政府的第二代统计数据的主成部分。目前,我们国家因为缺乏对政府统计法规制度的设计和机构职能的配套,这一类数据目前缺少的是数据整理的环节,从而会影响总体设置,在其他一些国家中,能够公开性的整理,进而形成的主题化、时间序列化的基础统计数据资源。

(三)第三代统计数据

第三代统计数据是以大数据深化应用为主要形式,即在互联网商务平台、互联网金融发展的大数据广泛应用下,使个人社会活动、社会中交互活动、各种交易活动、企业生产当中现场的监测记录等,轻松跨过基层调查表和综合调查表,直接生成一种政府可以进行综合管理或监管所使用的数据。所以,大数据的应用,以及快速的发展正在改变政府主流统计数据的结构和流程的规范。

在大数据应用里,结构化的基层调查表已经开始退居二线,随之而来的是大数据、基层调查表和综合汇总结果的一种三元结构。在一些行业特别是在电商的行业当中已经悄然出现,代表了统计数据三元结构发展的一种趋势。现阶段政府统计的大数据有一个明显的特征,首先是名录化,也叫样本化,比如个人买东西,商业机构的电子商务买东西;其次是目录化,你关心的是哪些指标,比如说销售、价格、销量等等,还是整个产业机构的产销存这一类的指标;再次是平台化,我们不可以设想中国只有一个平台,就国家的整合能力来看,一定是众多个平台,所以中国的大数据一定是名录化、目录化、平台化。其“三化”可以成为我们所说的第三代统计数据的一个主要表达形式,进而使数据更加贴近社会经济活动的原始记录,并与这种记录基本合体,按照“十三五”有关新的信息法规来说,这一类信息不是有关机构动员公共财政,使用一定的规章制度来搜集的,而这些记录都是在大数据这个平台上可以产生的。相信这类数据如果不包含必要的个体属性指标和个人隐私指标,可以在依法依规的基础上向社会公开并共享。

二、大数据在政府统计工作中的影响

(一)大数据可视化技术在政府统计工作中的影响

大数据可视化技术对统计工作来说有五个显著的变化:一是变量类型拓宽了,大数据不能光谈它的大,还要讲它反應的问题和产生数据后,增加的统计数据的种类;二是获取的渠道增加了,不仅是传统的部门行业,还是去行政化的互联网应用平台,都是数据的来源;三是游戏规则发生了变化,通过“十三五”发展纲要去规范相应的数据收集。例如,如何取得数据,如何拥有数据,如何使用数据等都发生了变化。目前,经许可介入大数据平台的一些实施应用,这就需要有法规来保证,并不是每个部门,都可以直接接入到像阿里平台等一些民间数据库获取数据。四是一个分析模型形成一种职业,这就是大数据分析师的出现,他把大数据变成了BI,即商务智能,变成了营收的发动机。五是信息安全威胁上升了,大数据改变了传统中IT架构体系的同时,也改变了信息安全体系的基础框架。

(二)大数据补充了数据调查途径和拓宽了数据来源

大数据可以说是全面数据,进而代替了传统统计中的抽样数据,可以说提高了政府统计数据的精确性和及时性。例如在电商数据中,按时间、按地域、按商品种类去了解情况,如物流情况,都能帮助各相关地区对产业结构、优势产业、经济水平、流通脉络、市场需求做出及时全面的判断。从而对经济管理、社会管理带来根本性的变革。

政府的各种统计机构可以利用大数据,来补充调查途径和数据来源,评估结构化数据的质量,提高或改变传统统计分析的方法。具体方法如下:第一,做接口、打补丁。政府可以跟一些大数据平台进行小数据的交换,拼盘形成了线上线下O2O的所谓全口径数据,所以上半年政府的统计公报显示,社会商品零售总额当中有百分之九点几是电子商务平台做的贡献,而且增加的幅度比传统的商业模式增加的速度还快。第二,利用大数据的手段提高分析能力,优化统计服务,鼓励平台厂家去做。第三,推进统计调查对象,包括统计的内容和手段的升级,建立统计大数据的体系。迎合“互联网+”,积极推进统计手段走“互联网+”的升级模式,大力探索并建立政府统计的大数据体系。建立新的相关法律法规,挖通接入式大数据计算分享渠道,从而提高大数据的实时利用能力。比如对住户调查的统计,可以探索进行“互联网+”或者是大数据化的改造来提升统计方法。第四,形成数据合作伙伴机制。包括平台提供商、内容、方法研究的合作伙伴。既要进行大数据基础设施交换体系的建设,又要发展行业性大数据,要建立行业性大数据分析的落脚点,这个落脚点就得需要数据和大数据分析师来引领,培养大数据分析师也是目前统计工作的一项重点内容。

(三)大数据时代,各项统计工作都能实现自动化及网络化

传统的统计调查,就是发给你一个指示的账本,每天或者是每周记一下你的收入和支出项,完成当地的统计。政府统计部门有调查总队,每个月到调查对象家收账本,然后录入到计算机里,算出来我们的家庭收支。因为这两个收入,即城乡住户的两个收入,是各级党委政府的考核指标。考核两个收入也是国家统计局和国家保密局规定的47项保密指标之一。由于大数据的出现,这项工作可以计算机化,甚至可以互联网化。

比如有些地方就是统计人员的账本还在,但是账本不用手工一笔笔去记。对每个人的每一笔收入,每个人的银行卡系统,现在都有电子信息的来往记录。每个人的每一笔支出,超市里有条形码扫一扫便知,每个人的网购记录都可以到电商后台查到,这样就把每一笔收入,每一笔支出,都像电商平台一样来进行处理,生成个人的记账大本和综合记录,这就是典型的统计大数据的三元结构,在这个领域,它的特征表现的淋漓尽致。通过这种方式可以做到易推广、易应用、易管理。

特别是经常性记账可以自动化,住户消费可以团购化,生活的行为可以可视化。比如鱼肉蛋菜,一个月或两个月的消费情况,就可以接口任何一个医院营养科的某主任医师,按照营养的比例关系,给消费者还原出一个得分,说出消费者可能是高脂肪的东西吃得多或少,是否利于健康等,可以给他一个指数还原,可以给出一个可视化的分析,另外疑难解答可以众包化,并用到互联网上。要到达上述要求,网络就要做到开放、安全和规范,综合管理平台要做到名录的管理、任务的管理、设备的管理,特别是安全的管理,因为这是一个垂直的应用系统,所以要确保终端的安全,网络的安全,云平台的安全,并且其他的基础设施建设都要有综合的配套。

三、大数据在统计工作中的局限性

大数据可以帮助政府统计部门了解各种所需的信息,为政府制定公共政策提供服务。例如通过对住户电表的读数,通过住户家里亮灯的情况来探索房屋的空置率;也可通过电信三个运营商的手机分布看外来人口及本地人口的情况。另外对交通的拥堵情况,也可以通过手机点的分布,做出一些有效的判断。总之,大数据通过集成各路的信息,各纬度的信息,它的作用和价值远远超出了人们的想象。通过万物互联,带动了产业互联,进而推动经济新常态下社会的万众创新。为各级政府制定决策提供可参考的依据。

但是就大数据本身而言,不能因为它有全面性而忽视它的局限性,正是由于大数据代表性和样本的偏差,使得我们不能在制定政府决策中全盘依赖大数据。

(一)大数据无法保证可靠的数据资源

因为大数据与结构化数据之间的使用是相辅相成的,使大数据从过去20多年前烧钱的工具,到现在衍变成一些机构和企业增值的发动机。孤立地看大数据,有很多好的地方,但也存在一些弊端,尽管体量大,由于受到技术和人员的限制,它还是小众的。在一些新领域,结构化数据虽然小,但仍然是政府管理的一种决策依据。从大数据的出现到发展,对政府统计科学产生了一定的影响,并带来了很多变化。如大数据对现行的法律体系、法规体系也提出了挑战,特别是大数据的互联网之后,数据的数权、隐私权、网络行为等,如何去界定,如何去保护,已经成为世界各国政府的新课题。面对大数据的所有权、使用权、治理权的问题,数据采集的责任问题,数据的真实性问题,个人隐私问题,国家安全问题等,如果这些问题在立法上不予以规范解释的话,政府统计工作中的一些数据来源就得不到保障,所有权、使用权、治理权就不明确,所以政府统计全口径的数据支撑就得不到保证。

(二)大数据替代不了结构化数据

统计学常用的功能有两个,一个是解释过去统计指标的变量分布,再一个就是预测经济、社会、民生等领域的未来走向。

解释过去统计指标变量分布这一功能是数理統计的强项,因为数理统计在人口统计、社会调查等诸多方面可以回顾历史。虽然大数据也能解释过去统计指标变量分布,但是由于大数据自身具有非结构化的特点,对解释历史数据不是强项。

在预测性上,虽然大数据对情报分析、个人情况分析、事物关联关系的分析、问题解析上确有所长,但是大数据有它的局限性,由于大数据具有实时性和纪实性的特点,大数据通过已获得的数据建立起来的模型,不具备必然性和可重复性,一旦获得的数据中有变化,这个模型就会被否定,不像数学公式或物理定律,无论数据怎么变化,公式、定律都是不变的。但是在大数据模型中,数据随着时间、对象的变化,模型也会发生变化,具有不定性,所以大数据还不能全归统计工作所用。

(三)我国政府大数据全方位应用上存在不足

对于大数据,我们既要面对问题又要谋求需要。我们国家在大数据的应用问题上,首先就是国家对大数据的控制力存在不足。这不仅有技术实力上的不足,还有国内大数据支撑的商务模型、模式的把握上也是不足的。总所周知,社会上的的大数据平台都是市场经济的产物,具有典型的非国家行为体,属于民间机构。与美国斯诺登的“棱镜”计划项目比,我国在大数据应用体系、应用平台的控制力确实有所不足。第二,存在政府各部门之间共享的壁垒。在我国的电子政务建设的过程中,纵向垂直管理部门电子政务建设已经达到较高水平,但不同层级、不同部门政府横向电子政务水平比较滞后,政府各不同部门之间信息不通,形成不了网格化,信息得不到共享和业务协同。第三,收集上来的大数据真假难以控制。另外,大数据还有一个时效性问题。

四、对策

大数据时代的来临,不仅给政府统计带来了挑战,同时也带来了机遇。随着信息技术的加速,政府统计工作在大数据浪潮中如何占据有利地位,在很大程度上取决于政府统计自身的转变。

(一)打造与大数据要求相适应的统计机构体系

由于大数据的出现,对政府统计工作也提出了更高的要求。大数据的使用主要分三步——即数据搜集、数据分析和数据挖掘,所以统计部门就要建立相应的配置机构来满足大数据的使用。

首先,数据的搜集一是利用物联网进行前端数据抓取,二是从其他网络数据库中提取的方法来获得数据,并且需要对所获得的数据进行必要的数据清洗,以确保数据具有真实性。

其次,专业的数据分析部门对收集的数据进行数据分析,利用数据分析工具挖掘出有价值的数据资源。

最后,数据公布部门对其数据进行发布,为社会、政府、研究机构提供参考。为此,还要加大力度吸引人才,引进一批拥有技术精湛的、专业的大数据分析人士加盟政府统计系统,充实统计队伍,提高统计系统的专业水平。

(二)打造满足大数据要求的公共数据平台

目前我国互联网上有大量的数据可供参考,但不同企业、不同部门之间互不相连,数据与数据是孤立存在的,完全处于隔阂状态,甚至在政府部门也谈不上共享所有的数据信息。由于大数据时代的到来,使云计算得到了充分的发展,借助于云计算技术为政府建立足够大的云平台,来接收、存储以往、当前和未来所产生的数据,并对其整理和分类,打破数据孤岛,结束信息壁垒的局面,建立大一统的平台。这一平台不仅可供政府使用,同时对其他商业、交通、金融等各行业进行开放,以实现资源共享。

(三)打造与大数据要求相匹配的统计分析系统

目前,数据处理和数据挖掘已有比较成熟的模型和算法,这些模型和算法已应用于行政记录和商品统计中。但是这些数据是结构化数据。然而,网络和互联网信息的数据采集,不仅包括结构化数据,还包括图像、视频和其他形式的半结构化和非结构化的数据。这些数据的处理,需要从这些半结构化和非结构化的数据中,利用数据分析、挖掘、数据可视化等方法来提高数据提纯的处理能力。加强数据的预处理能力,增强智能处理和实时分析、相关分析、可视化分析能力,提高统计分析的趋势性、直观性和及时性,最终提高统计分析水平的预警级别,从而有利于政府治理,促进经济发展。

(四)打造与大数据要求相符合的数据发布模式

在激烈的竞争中,为了更好地体现大数据的数据统计在政府统计中的主导地位,就必须依托完善的统计“信息产品”发布模式赢得市场竞争主动权。具体应从两个方面完善:一方面在于完善数据的统计范围,提升“信息产品”的精确度。大数据背景下,政府的统计部门能够基于用户的数据需求统计相关数据信息,打造统计的“信息产品”进而满足多层次、多维度用户的需求。另一方面,对于统计“信息产品”的形式上要力求多样化。政府统计部门在提升数据分析能力的前提下,丰富统计数据的发布形式与内容,增强数据发布的频次与实效性,实现对社会各个领域统计数据的多样性需求,提升数据的价值。

目前,我国的政府统计部门针对数据统计方法,已经提出了一个“二轨”的策略。即传统的统计是一轨,大数据的利用是二轨;完善基础的统计数据的资源,提升统计能力,提高数据质量;通过建立相应的标准,广泛的与大数据应用平台加强战略合作,取得一些小数据。现在看,只有构建适应大数据要求的统计机构体系、满足大数据要求的公共数据平台、打造与大数据要求相匹配的统计分析系统、构建符合大数据要求的数据发布模式,才能紧跟国家“十三五”立法的规划,明确统计数据资源,明确社会性大数据的利用规则,保证统计工作的现代化进程。

参考文献:

[1]袁鹏飞,任旭.大数据时代引领思维与商业模式的大变革[J].现代商业,2015,(4).

[2]胡帆.完善政府统计部门信息化管理职能[J].中国统计,2015,(5).

[3]胡帆.统计报表的前世今生[J]中国统计,2015,(2).

[4]胡帆.大数据与政府统计[R]国家统计局,2015,(8).

责任编辑  张小莉

猜你喜欢
大数据信息化
“云会计”在中小企业会计信息化中的应用分析
大数据环境下基于移动客户端的传统媒体转型思路
基于大数据背景下的智慧城市建设研究
信息化是医改的重要支撑
信息化