由“数据大”迈向“大数据”深度服务警务实战

2018-09-10 03:15
现代世界警察 2018年4期
关键词:数据量警务公安

记者:作为一名从事警务大数据技术研发和应用服务的专业人士,您怎么看目前的警务大数据现状和未来?

杨再飞:作为从事警务科技和服务的企业,我们深刻感受到了近几年来公安信息化建设的飞速发展,前端感知数据快速膨胀,实战应用需求日益增加,民警应用技能也明显提升,可以这么说,科技正在引领整个警务流程再造。随着国家大数据战略的确立,警务大数据正逢前所未有的历史机遇,以“智慧公安”为核心的大数据应用正蓬勃发展,公安机关在维护稳定、打击犯罪、治安防控、民生服务、风险预测等方面的能力将明显提升,更将催生警务模式和运行机制的深刻变革,推动传统警务向现代警务的快速发展。但总体来看,目前很多地方还处于“数据大”的起步阶段,离充分实现“大数据”的规模效益还有很多路要走。

记者:“数据大”和“大数据”的区别在哪里?您怎么理解“大数据”?

杨再飞:从IT时代进入DT(数据科技)时代以来,大数据技术已经从前沿概念阶段进入到了落地应用阶段。纵观各行各业的大数据应用探索,普遍对大数据定义为:“大数据”是一种规模大到在获取、管理、分析方面超出传统数据库软件工具能力范围的数据集合。综合来看,“大数据”应该具有以下六大特征。

一是多类型。指数据种类多、涉及面广、数据源丰富、数据结构复杂。二是大规模。指存储量巨大、单一数据或总体数据量大。三是快速度,指数据更新频度高、传输实时性强、采集预处理速度快。四是低密度。由物联网采集和各种社会数据汇总而来的数据,相对传统数据而言,价值密度一定是非常低的,数据本身质量也较差。五是强治理。正因为数据量庞杂而价值密度低,因此数据治理和分析挖掘的能力,决定了大数据究竟能在实战中发挥多大、多深的价值。六是多应用。只有越来越多地应用运行在大数据系统之上,才能不断促进数据的采集和治理臻于完善,形成良性循环,否则大数据将只是一种负担而不是财富。

如果数据类型单一、关联程度低、更新速度慢、数据质量差、没有数据治理、没有分析挖掘,哪怕一类数据量有几千万甚至是上亿条,也只能是“数据大”而已,而不是真正意义上的“大数据”。规模和价值是“大数据”核心所在,同时,“数据大”是“大数据”的前提和基础。

记者:在警务大数据建设工作中找到痛点很重要。目前你们在服务客户过程中,发现在数据方面的主要痛点有哪些?

杨再飞:各个公安机关单位实施大数据建设的过程中,所遇到的问题和挑战不尽相同,发展水平也不同,但有一些共性的东西值得进一步研究加强。一是数据种类偏少:主要来自科信数据资源平台和情报平台的数据,部门业务系统如交警、出入境、经侦、禁毒等的数据没有完全融合,政府共享数据和互联网数据接入量较少,已建的智能门禁、WIFI、水电煤气、人脸识别、车辆卡口等数据又因数据量巨大而不能全量接入。数据种类偏少对建立人、车、物、案、事的全息档案和特征画像会产生较大影响。二是数据实时性差:数据延时情况比较突出,很多数据不是热数据,实时更新、动态更新量不大。三是数据质量偏低:即使是已经接入的数据,其数据质量方面也常常存在问题,如系统字典缺失(没有统一的数据标准字典)、数据录入不规范(如数据缺失部分字段,甚至录入字段错位)、关联性缺乏(如消费类数据只有卡号,缺少卡号与具体个体或家庭的对应关系)等。

记者:您前面讲“数据大”是“大数据”的前提和基础。那如何才能做到“数据大”?

杨再飞:从我的角度来理解,公安大数据主要来自于三个方面:首先是公安内部的大数据。仅各种公安业务系统处理、采集、汇聚的结构化数据,就已经构成了海量级的数据,再加上半结构化数据以及非结构化数据,总体数据量非常可观。这些数据来源于各类业务、各个警种,比如人口数据、指纹数据、机动车驾驶员数据,等等。第二个方面,是互联网相关数据。由于互联网得到了广泛的应用,网上网下的互动就产生了大量的数据。互联网相关数据处于公安大数据应用的前沿,包括用户行为数据、用户消费数据、用户地理位置数据、互联网金融数据等在内的一系列互联网大数据,都可以为公安警务大数据所用。第三个方面,是政府部门数据。随着智慧城市建设力度加大,各地政府部门汇聚了海量数据资源。通过有效整合、多种方式共享服务,公安可以接入更多的政府部门数据,如工商、税务、医疗、交通、国土等。

“数据大”是社会发展、科技进步、民生改善的必然产物。“数据大”将是一种常态并会继续发展,应该用一种开放、乐观、冷静的心态来主动拥抱大数据、借力大数据、融入大数据。

记者:如果将“数据大”转化为“大数据”,有效途径有哪些?

杨再飞:科技改变未来,大数据应用为新时代勾勒出美好图景。对公安机关来说,利用大数据全面提升打击犯罪整体效能、助推社会治理迈向精准化和规范化、全力提高人民获得感、幸福感、安全感,正是这幅图景的最好呈现。我们在与客户交流和应用服务的过程中,深刻感受到以下几点。

首先,要全力丰富数据种类。无论是海量级的WIFI、人脸、视频、卡口数据,还是几百条的企业工资明细表、暂住人口登记表、二手交易信息,都要悉数整合接入。有些种类的数据量虽小,但丰富了种类,完善了整个数据体系。

其次,要提升传递速度。分类型、分类别、分层级明确数据传递时限标准,公安自建业务数据要实现分钟级更新;省内共享数据实现小时级别的更新;省外数据实现2小时更新。最大限度地提升预警和分析比对的时效性。

第三,要加强数据治理。一是制定数据采集标准,明确必录项、加强系统间的互通,建立关联关系,减少基层重复采集工作量,从源头上规范数据录入质量。二是严格数据清洗,对接入的数据,按照冷数据和热数据的分类,分别进行预处理,对重复字段去重,对无效、垃圾数据进行清洗隔离,对多表建立关联翻译。三是加强数据处理,通过语义分析、文本分析、数据标签、图数据库等技术,对数据进行结构化、标签化、图谱化、专题化处理。为数据分析提供数据保障。

最后,要高度重视数据的分析应用。没有分析应用的大数据只是一种资源,而不能提供高价值,只有通过分析挖掘转化成警务行动指令、服务实战的数据情报,才能体现大数据的核心价值。遗憾的是,很多地方非常重视前端感知采集的投入,但在后端数据分析方面却基本没有投入,导致海量数据处于流失和沉睡状态,这是需要引起重视的。

记者:您提到没有应用的大数据不是真正的“大数据”,你们在服务实战中有哪些体会?

杨再飞:大数据实战应用的最终落脚点是应用。在为全国数十个省区市公安机关服务的过程中,每个单位都有十分经典的案例和故事,如武汉市局的大学生落户政策分析项目、宜昌市局的嫌疑对象分析、南昌市局的预警分析、十堰市局的综合预警、上海市局在涉黄涉毒场所整治中的分析应用等,都发挥了大数据的核心价值和驱动作用,利用大数据平台,提高了对风险因素的感知、預测、防范能力。

新故相推,日生不滞。汹涌澎湃的大数据浪潮,撞击着公安工作的传统思维和方式。大数据在公安领域一定会得到迅猛发展,我们也希望在这个过程中,发挥大数据企业的优势,更好地研发民警爱用、好用、实用的大数据分析产品,更贴心地服务公安客户。

猜你喜欢
数据量警务公安
博物馆:上海公安史图片展
博物馆:上海公安史图片展
高刷新率不容易显示器需求与接口标准带宽
“一带一路”背景下涉外警务人才英语口语提升研究
浙江省嵊州市公安局甘霖派出所:推进警务管家+警务助理模式
湖北省武汉市公安局东西湖区分局:警务技能教官深入派出所培训实战技能
市公安采风咏
AMAC
问题与主义:近十年公安警务改革理性反思
电力营销数据分析中的数据集成技术研究