基于积木思维的警务数据应用中台设计与研究

2021-01-16 06:00金玲春吴立选
关键词:中台算子警务

金玲春 ,陈 波 ,吴立选 ,李 岚

(1.浙江省台州市公安局, 台州318000;2.浙江省公安厅, 杭州310009;3.哈尔滨商业大学 计算机与信息工程学院, 哈尔滨,150020 )

1 数据中台概述

中台其实是个外来概念,在英文中,它所对应的单词和“平台”是相同的,都是platformm,作用主要是连接、沟通.最初,中台主要被用在军事指挥上.美军率先发明了指挥中台,对前方作战单位进行统一协调.在国内企业中,阿里巴巴是最早采用数字中台的.2015年,该集团创始人马云参观了著名游戏公司Supercell(超级细胞).在参观期间,它被这个仅有200人公司的高效所深深震撼.于是,他决定学习Supercell的做法,对阿里巴巴进行中台化改造,组建了共享业务事业部(Shared Services Platform),通过这一部门沟通前端的业务部门和后端的云平台,极大提升了阿里巴巴内部各部门间的协调能力.阿里巴巴的做法,很快被其他企业所效仿,由此催生了现在的“中台热”[1-2].

在传统的企业组织架构之下,企业各部门之间的数据往往是不流通的,甚至数据的搜集和存储也各有各的规矩,“数据孤岛”现象十分明显.这样一来,企业就很难综合利用自己搜集到的数据信息来进行决策.而数据中台的建设以如何简单快速地使用数据为中心,通过数据治理,消除编码不一致、数据冗余、业务逻辑错误等问题,从而打破内部壁垒,盘活数据资产,深挖数据价值,对内对外提供统一的数据服务.

数据中台更多的是业界在大数据平台发展到一定阶段后的一种思维升级,大数据平台是一种“技术优先”的思维,而数据中台则是“数据优先”的思维[3].数据中台是指通过智能数据技术对海量数据进行采集、存储、计算、加工、应用的数据“大脑”生态系统,具有服务重用、服务进化、数据积累、快速响应、降低成本、效能提升等优点,通过统一数据形式来形成标准数据,提供高效能数据服务[1].

数据中台有狭义和广义之分.狭义的数据中台是指通过数据技术,对海量数据进行采集、存储、加工、服务.数据中台依据数据标准进行存储,形成数据资源池,进而为客户提供高效服务.广义的数据中台除了拥有一系列数据技术栈之外,还包括数据模型、算法服务、数据产品、应用管理等能力[4].

2 警务数据应用背景

随着大数据、物联网、5G、人工智能等新技术的不断发展应用,公安机关拥有的数据量大幅增加,特别是感知类数据量呈井喷式增长趋势,如何有效应用这些实效性高、更新快的海量数据,以及对现有的业务数据进行融合应用,公安机关进行了大量的探索,成效明显.但在数据应用过程中,还存在不少问题,一是感知类数据未和已有公安业务数据充分融合,导致无法深度刻画业务对象属性;二是各类应用可能由不同单位单独建设封闭应用,造成一定程度上的重复建设和资源浪费;三是数据应用模型创建的复杂程度高,决定了只有技术型民警才能灵活创建模型,而业务型民警难以在应用中将业务经验快速转化为模型来求证;四是大量模型的应用成果没有转换为全警共有的应用资产,开发成果不能很快形成可对外提供共享服务的资产.

针对上述警务数据应用中存在的难点,本文提出基于积木思维的警务数据应用中台设计思路,为更好地应用警务数据提供一条可行路径.类似风靡全球的乐高积木搭建做法,数据应用中台让数据应用模型创建像搭积木那样简单快捷,围绕海量警务数据,可以随需而动快速配置实战应用模型.

3 警务数据应用中台设计与实现

3.1 总体架构设计

应用中台在整体架构上分为四层,如图1所示,分别是数据接入层、原子算法层、业务模型层和前台展示层.数据接入层是基础,接入各类数据,经数据治理后形成数据资产,这是业务数据化的过程;原子算法层和业务模型层构成应用中台的核心,是数据业务化的过程,前者用于定义、编排算子,后者通过算子的组合来构建应用模型;应用展示层通过可视化服务调用、API调用等形式为第三方应用提供服务[5-8].

1)数据接入层:整合包括感知类数据、公安业务数据和其他数据等在内的所有警务数据,为原子算法层提供基础数据支撑.在数据的组织及定义上,将把数据资源划分为感知类数据、业务类数据和空间类数据.在数据接入层,关键是做好数据治理,让数据更加准确完整,并且安全合规,才能释放出大数据的无限潜能,挖掘出更多有价值的数据应用.通过数据治理,从设计、开发、部署和使用上保障数据口径的规范和统一,实现数据资产全链路管理,并提供标准数据输出[9-12].

2)原子算法层:原子算法层以数据接入层的数据资源为数据基础,根据各类数据特性及算法场景要求构建不同类型的数据基本算法集,形成原子算法池.算子犹如积木,为业务模型搭建提供最小引用单元.在算法上,通过对算法共性应用需求的精准分析,并对各类数据资源的感知属性、时间属性、空间属性等方面进行规则定义,生成可被模型引用的共性特征算法.

3)业务模型层:提供模型定义功能.根据具体业务需求,从原子算法层的算法集中选取合适算子进行交、并、差等数据集合操作或数据清洗、过滤、分组等数据操作,以得到最终所需的数据.业务模型层通过各原子算法的灵活组合运算,可按需定制并封装成可对外提供服务的业务模型集.

4)前台展示层:业务模型集通过开放可视化服务调用或API服务调用接口,为第三方应用提供业务模型服务.第三方应用侧重于最终数据展现,复杂的逻辑判断规则不再是模型实现的技术壁垒,同时敏捷的开发及应用模式也避免了同类算法同类模型的重复建设[13-15].

3.2 原子算法设计

根据各类业务目标整合所需数据资源并根据业务逻辑判断规则构建数据间的关联关系,使之成为可被引用的业务模型最小单元.原子算法除具备通用模型工具共性的数据实体关联、交差并运算、相关性运算等通用算法外,还具备可视化编辑、拖拉拽配置连线、各模型因子准确性测试与验证等功能.在应用中将各类业务目标对应的最小数据分析单元进行业务提取并生成可组装、可配置、可构建的原子算法,最终用户可通过组合原子算法来构建符合业务需求的分析模型.

3.2.1 原子算法构建过程

原子算法构建过程包含四个方面,如图2所示.

①确认算法应用场景.根据感知类数据的最小算法单元对应用场景进行分析,以切片化构建应用场景算法需求.

②明确接入数据资源.根据算法应用场景,明确需要哪些数据资源进行支撑,按照数据资源进行定义,如没有标准则通过创建数据模板进行标准化数据导入.

③明确分析规则.根据算法应用场景需求、数据资源范围对算法的规则进行输出,明确算法规则,保证业务分析的唯一性和准确性;

④明确输入输出参数.根据算法的应用场景要求,明确算法的输入参数及输出结果信息.

3.2.2 原子算法创建方法

利用“五度法”来构建一个原子算法,即从感知的维度、时间的精度、空间的纬度、活动的密度和关联的集成度等五个角度来进行设计.如图3所示.

图3 “五度法”设计原子算法

①感知的维度:由各类感知设备采集的数据构成多感知的数据维度.

②时间的精度:由各类数据的时间属性构成时间的精度,这些时间因素按照区间段及特定时间段等方式进行规则制定.

③空间的纬度:由各类数据采集地点构成空间的维度.这些空间因素按照指定区域或特定采集点进行规则制定.

④活动的密度:由各类数据的特性相关联的行为构成活动的密度,按照人、车、物等不同数据属性进行定义,如出现、消失等行为活动因素.

⑤关联的集成度:由感知数据、业务数据和其他数据等构成数据融合的集成度.

3.2.3 原子算法设计说明示例

下面以“车牌号码相同却不同车辆”的算子设计为例进行说明.

算法简要描述:针对卡口通行数据中相同车牌号码但是不同车辆特征的车辆进行比对分析,查找出车牌号码相同却是不同车辆的通行及基本信息.

使用数据资源说明:车辆卡口通行信息、车辆基本信息

算法分析规则说明:通过对相同车牌的卡口通行数据进行比对,在车牌号码、车牌颜色相同的基础上而其他数据项不匹配则视为相同车牌不同车辆.并同车辆基本信息进行比对,输出车牌号码和车辆特征信息匹配和不匹配的通行记录和车辆信息.

输入参数说明:两种方式,一是输入车辆通过卡口的起止时间;二是输入车辆通行卡口起止时间和车牌号码.

输出结果说明:针对输入参数两种方式输出结果,第一种输出在通过卡口起止时间的所有存在车牌号码相同但车辆特征不同的通行记录并标识是否登记车辆;第二种输出特定车牌号码是否存在车牌号码相同但不同车辆特征的通行记录.

这个简单示例采用“五度法”设计,即从感知的维度、时间的精度、空间的纬度和关联的集成度等四个角度来考虑的.

3.3 基于场景的业务应用模型构建

建原子算法集的目的是为了快速便捷地组装实战应用模型.模型应用管理具备可配置可定义的全可视化编排、调试、运行和发布功能,以及业务模型API接口封装功能,以便上层应用调用展示.原子算法管理将各个业务逻辑进行语义级的封装,模型应用管理则通过面向业务人员的人机交互界面,快速组装生产业务模型做数据分析.

在业务模型构建过程中,警务工作人员可以根据业务应用需求,选择合适的原子算法,并利用与、或、非等运算算子进行关联运算,对中间结果或最终结果数据可做各种数据处理操作,如分组、过滤、增加字段、增加正则表达式等.已注册发布的业务模型,通过可视化界面、API等接口服务开放给第三方平台,第三方平台根据业务模型使用说明开展应用.

用户定义的算子和创建的模型要能支持复制式共享,其他用户可以克隆这些算子和模型,然后根据需要进行再编排、再组装.这种克隆功能实现了共建共享,有效解决了经验传承和应用创新的问题.

4 结 语

以积木式思维实现的警务数据应用中台已在警务工作实战中发挥了重要价值.其特点有:1)中台式管理,串连应用前台和数据后台,使复杂多样的前端通用业务和技术能力下沉到中台层,赋予前端应用更高的灵活度和更强的能力支撑;2)积木式建模,降低技术门坎,在画布上拖拉拽算子即可组装模型,构建模型随需而动,业务经验可以得到快速验证,适于推广;3)克隆式共享,各类算子和模型共享后可被其他用户克隆,进行再编排、再组装,充分体现众智、众创、众惠理念,避免建设上的重复投资浪费,最大化提升应用成效.

猜你喜欢
中台算子警务
与由分数阶Laplace算子生成的热半群相关的微分变换算子的有界性
中台是媒体转型必经之路吗?
——媒体中台建设的特点和误区
新形势下警务战术指挥
关于零售企业“中台”建设的研究
Domestication or Foreignization:A Cultural Choice
汽车制造企业质量中台研究
以技术开发中心为中台,数字化转型之见解
探究警务战术的本质、知识生成与运用
QK空间上的叠加算子
警务训练中腹痛的成因及预防