大数据可视化分析平台的构建与铁路公安应用实践

2020-07-26 14:16童琳刘旭
网络空间安全 2020年5期
关键词:数据挖掘可视化大数据

童琳 刘旭

摘   要:从公安大数据技术的发展和应用入手,探索如何有效地利用海量信息并挖掘内在更大的价值,以便提升公安实战应用能力、建立立体化综合防控体系。设计了一个应用灵活的大数据可视化建模工具,将业务经验、研判思路与海量数据融合为符合实战需求的数据模型。对典型模型的应用效果进行了说明,对下一步公安大数据的建模和挖掘方向进行了展望。

关键词:大数据;可视化;数据挖掘;数据建模

中图分类号: TP319          文献标识码:A

Abstract: Starting with the development and application of public security big data technology, this paper explores how to effectively utilize massive information and tap the inherent greater value, so as to enhance the actual combat application ability of public security and establish a three-dimensional comprehensive prevention and control system. A flexible big data visualization modeling tool is designed, which integrates business experience, research and judgment ideas and massive data into a data model that meets actual combat requirements. The application effect of typical models in major event security, epidemic prevention and control and other fields is explained, and the modeling and mining direction of public security big data in the next step is prospected.

Key words: big data; visualization; data mining ;data modeling

1 引言

近年來,随着大数据技术和应用的不断发展和演进,以数据集中和共享为途径,建设全国一体化的国家大数据中心已成为国家级战略决策,以技术融合、业务融合、数据融合为特征,实现跨层级、跨地域、跨系统、跨部门、跨业务的协同管理和服务,提高社会治理社会化、法制化、智能化、专业化水平,提高预测、预警、预防各类风险的要求也不断提升。如何完善社会治安综合治理体制机制,加快建设立体化、信息化社会治安防控体系,用信息化手段更好的感知社会态势、畅通沟通渠道、辅助决策施政成为摆在政法系统面前的挑战。从公安行业的建设与应用实践来看,不同警种间的壁垒正逐渐被打破,全量互通的数据中心初步形成,信息数据作为新型核心资源的重要性也不断凸显。为了有效地利用海量信息并挖掘内在更大的价值,提升铁路公安实战应用能力、建立立体化综合防控体系,设计并建设了武汉铁路公安局大数据可视化分析平台(本文简称PDP)。

2 平台架构及关键技术

PDP平台的主要特点有三个方面:一是面向各警种、各层级用户的可视化、拖拽式的大数据可视化建模平台,无需建模人员拥有计算机编程基础,通过简单培训就可以通过拖拽搭积木的方式实现自由配置数据源、数据处理融合、数据逻辑关系和模型展示方式以及模型钻取、联动、跳转等功能,降低数据建模门槛,提高数据建模的效率;二是通过提供自助式、个性化的大数据可视化建模功能,形成灵活的面向个人、面向业务、面向场景的大数据分析服务能力;三是通过开放基于规则的数据分析、挖掘接口,允许业务警种基于大数据平台的数据资源和基础服务能力,自定义配置出本业务部门所需的数据分析及应用需求。最终让业务警种及民警个人能够按照自己的分析研判思路,自定义数据分析流程,交由大数据平台自动运算并获得结果,通过多次尝试性分析及观察结果最终实现自助式优化并确定大数据分析研判方案。

2.1 平台整体架构

如图1所示,PDP系统总体框架在纵向上分为数据接入、数据处理、模型应用、模型展现四个层级,并辅以监控和运维管理、用户和权限管理作为平台的管理支撑。

(1)数据接入

考虑到数据来源的多样化,数据接入模块提供了多种数据的接入方式,包括数据库直连、API数据接口以及Excel/CSV文件导入,系统底层任务调度模块依据系统目前的运行情况和各服务器当前计算能力集中调度平台内的资源,协调服务之间的协同运行,确保平台的高效运行,实现资源最大化利用,保障快速准确接入数据。

(2)数据处理

主要通过ETL工具实现数据在ODS、BAS、DW数据仓库三层流转,对接入原业务系统数据进行标准化、规范化清洗和梳理。其中,ODS为接入到本系统的原始数据,BAS是经过代码翻译、计算字段、去重等处理之后的数据,DW数据仓库则是根据应用需要建设的一些计算结果专题库。数据层主要由数据处理子系统来完成数据的抽取、清洗和转换,保证数据的质量。

(3)模型应用

主要依据实战模型应用系统中的数据在线分析、模型搭建工具、模型展现工具实现辅助决策、实战应用、内部管理等三大类各细项应用模型开发建设,并支持对实战应用模型提炼出来的关键数据指标进行预警条件设置,实现重点关注指标、重点关注对象及轨迹预警展示和预警推送。

(4)模型展现

应用模型分析结果根据不同用户的需要,可在PC终端、大屏终端使用,并支持用户对于汇报需求及专题展示需求定制化设计开发和建设智慧大屏。

2.2 系统主要功能

为了使数据更快、更好地贴合警务实战需求,PDP设计了多数据源接入、数据精加工、数据在线分析建模、数字化大屏定制开发、自动预警中心等功能,同时完成了模型建设和大屏可视化工作。

(1)多源数据接入及数据处理

考虑到公安数据来源的多样化,数据接入汇聚子系统支持多种数据接入方式,包括本地数据上传、数据库直连、API数据接口等方式。

(2)数据权限灵活控制

结合日常工作流程,构建了一套数据权限控制体系,由局一级研判人员按照需求搭建数据分析模型,管理员将其分发、共享至处、所使用人员,并根据其业务警种、部门区域展现不同的分析模型和分析结果。例如,某一个铁路公安处的治安部门只能看到本辖区治安数据分析的结果,同样,刑侦部门也只能看到辖区刑侦数据的分析结果。同时,数据权限操作还支持数据隔离、角色分离等功能,实现对数据做到行列级别细粒度控制分离。

(3)数据在线分析建模

为了保证平台的稳定性,采用分布式存储和计算。数据分析子系统支持拖拽式可视化建模,可实现多源数据间的比对、分析、碰撞。数据可视化子系统还支持丰富的图表展示、数据钻取和联动。

(4)大数据模型应用

根据需求的不同,在设计平台应用主题时也相应的分为三大类:辅助决策、实战应用及内部管理。辅助决策方面,可以进一步分为案件分析、警情分析、人流分析等专题分析,提供全局的宏观决策支持;实战应用方面,可以将原有的优秀技战法固化为数据模型。例如,铁路追逃人员分析、重点人员预警等;内部管理方面,可以分为考勤管理、出差及休假分析、缉逃成果分析等。目前,基于大数据可视化平台基础上的专题应用建设具备了一定的可扩展性,基本可满足各个业务部门的数据分析需求。

(5)数字化智慧大屏

根据实际作战指挥需要,针对重点区域,进行专业化的人流监控预测分析,可以在系统中配置专题指挥调度大屏,包括所有关键节点、关键指标以及人流趋势情况,为指挥调配警力提供应用支撑,还可以基于专题应用分析的结果,通过数字大屏的形式进行展示。

(6)分析结果可视化展现

平台数据分析及实战应用模型的结果可以通过数字大屏、系统专题分析页面、警务通等方式展现。

一是网页和移动客户端界面展现,网页支持IE/FireFox/Chrome等主流浏览器展现,并能一定程度的向下/向上兼容;客户端支持主流警务通设备,并能一定程度的向下/向上兼容。

二是展示界面支持丰富的可视化分析方式,包括但不限于以GIS地图、词云、双轴图、桑基图、瀑布图、散点图、曲线图、柱状图等形式的分析图表展示;支持数据与地图的交互展示,可以在地图上标记点位,并对点位信息进行继续钻取、关联。

三是支持拖拉拽等自助式、探索式的简单交互方式和数据拖拽、钻取、切片分析,大量数据也能够快速切换不同模式的数据视图来展示。同时,还设计了自定义报表设计需求、配色文字、报表大屏模式显示、图中注释说明、从图表中导出图片/数据等功能。

四是支持内置外置筛选器、自定义筛选器、全局筛选器、图表联动等多级别筛方式,可以筛选同一模型不同层面的分析结果,如警情分析结果可以按照单位条件筛选,展示上至全局总体、下至某个派出所的具体情况。还可以根据实际需求屏蔽关键词或通过编写SQL语句等方法实现一些自定义需求。

五是数据大屏功能可以根据需求实现大屏配置的功能模块,根据大屏尺寸和分辨率进行适配,展示内容可灵活配置,数据实时更新,多维动态滚动展示,具有灵活配置、实时更新、创新交互、视觉直观的特点。

2.3 平台关键技术

(1)实名制数据抓取、解析和入库

为了确保各项重点安保工作期间情报研判工作的有序开展,重点研发建立了Mysql数据库,用于各单位FTP传输数据的抓取、解析和入库工作。

(2)模型庫

根据需求调研情况设计的分析研判应用模型主要分为三类:

一是辅助决策类,主要包括案件专题分析、警情专题分析、隐患专题分析、乘务工作专题分析等;

二是实战应用类,主要包括重点人员模型、毒品查缉模型、安检查危模型等;

三是内部管理类,主要包括考勤管理、出差分析、休假分析、民警队伍分析、反恐演练情况分析、宣传报道情况分析、工作评估分析等。

比如,为了提升整体态势感知和预知预警能力,确保“建国70周年大庆”“军运会”等各项安保工作顺利完成,针对站车防控、警力部署、线路巡防等工作,构建了“军运会”警力部署分析、到汉旅客分析、违法人员血样采集分析、在逃人员购票分析、买短乘长专题分析、乘务工作数据分析、中铁快运发件以及发件人分析、路外伤亡情况分析、铁路交通事故分析、闲杂人员入网分析等30余个分析模组、300余个分析模型,为各项安保工作提供情报支撑。尤其在此次新型冠状病毒肺炎防疫工作中,深入开展涉疫情报分析,对铁路流出旅客专题建模,为科学防疫奠定了良好的基础。

(3)移动警务平台APP应用端建设

为保障局、处、所三级整体联动,实现随时随地办公应用和数据可视化分析便捷化、移动化、前端化的需求,研发建立了大数据可视化平台APP应用端,通过不断优化改造APP程序功能,保障了大数据可视化分析移动端在军运会期间顺利投入使用。同时,为提升APP应用端查看平台分析模块的使用体验,对原用于PC端查看的分析模块进行了针对性调整,建立了适应在APP应用端钻取查看的多层模型架构。

3 应用成果

经过将近一年的运行,平台汇聚16亿6千余万条多源异构数据,数据总存储量到达336G,接入数据库表单279张,建立数据同步任务59个、专题模组50余个、各类分析模型500余个、数据化智慧大屏15个。涉及59个数据库、94张数据表单,并以此为基础构建了50余个具有实战需求的数据模组涉及400余个数据模型,在技术上实现了局、处、所三级整体联动,为各项公安实战提供了有力的支撑,取得了一定的应用成果。

3.1“平安站车路、金盾护你行”专项行动大数据模型

近年来,“买短乘长”现象频频成为舆论的热点和社会的痛点。2019年4月7日,G7192次复兴号列车因不少旅客“买短乘长”造成列车超出承运能力,出于行车安全考虑,被迫停车致使列车晚点1小时12分。同年“五一”期间,由于部分“买短乘长”旅客“强行”坐到预期目的地,导致5022次列车途径淄博火车站、K8372次列车途径南京火车站超载,正常购票乘客无法上车,引发网络热议。

“买短乘长”人员严重破坏了铁路的乘车秩序和列车的运行安全。一是破坏乘车秩序。铁路部门和旅客的关系从法律上讲是合同关系—旅客购买车票,铁路部门负责把旅客及时安全运送到目的地,相互遵守合同义务,这就是最基本的规矩,更是规则。“买短乘长”的旅客破坏了这个规则,到站不下车,影响其他人的乘坐。如果先上车后补票得不到有效禁止,对规则的破坏一再纵容,将破坏有序、良好的乘车环境,引发霸坐、占座等一系列问题;二是影响运行安全。正常时速200~300千米/小时的列车,紧急制动距离约为6500米,牵引电压25~29千伏。在客运高峰期载重行车,随着车身重量的增加,惯性加大,列车制动距离将增加10~20%左右,超出列车运输能力,严重影响列车运行安全。

在以往的“买短乘长”案件查缉中,铁路公安部门通常都运用现场查卡堵截的方式,通过加大对车站出站口的巡查力度,对可疑人员加强盘查,对查获的无票人员、持有多张短途票等人员严格审查,警力耗费较大。对那些在客流高峰期间或者专门夜间“越站乘车”的人员的查获难度更是非常巨大。

在此次“平安站车路、金盾护你行”专项行动中,将滋扰站车秩序、侵害旅客权益的行为作为信息研判的重点,针对恶意买短乘长、越站乘车、一坐到底等违法行为开展专题研判分析,积极探索利用大数据可视化分析平台,创建了越站乘车专题大数据分析研判模型应用于实战。

通过向平台汇入实名制购票数据进行数据钻取、关联等操作,对4亿3千4百余万条实名制购票信息进行深度挖掘,共分析获取异常人员1000余人。再结合全路售票信息、全国公路信息、全国公共汽车信息,对异常情况达到300次以上的100余人进行深度挖掘,共发现61人情况特别突出,并制定方案通过派员跟踪落地、越站所在地调取出站监控视频、人脸识别信息来验证信息研判的准确性。

为了方便一线民警实时应用数据分析结果,摆脱以往依赖派出所指挥室提供支撑的情况,实现随时随地查看辖区隐患情况可视化分析结果,利用大数据可视化分析警务通APP应用端,与PC端同步显示模组、模型分析情况。一线民警可以通过查看手机APP实时掌握“越站乘车”嫌疑人动向,从而有目标性、有针对性地部署查控工作,使得盲目查堵核验的被动执法转变为后台数据精准分析支撑前端落地打击违法犯罪的模式。为打击恶意“买短乘长”行为强推助攻,让违法犯罪行为得到有效地震慑和遏制。整治行动开展以后,后臺数据显示,部分以往购票轨迹不正常的人员都恢复了正常购票,让遵守法律法规、遵守社会秩序、遵守社会公德成为一种文明自觉。

3.2 高铁安全隐患分析大数据模型

为了全面加强高铁环境安全治理工作,通过搜建全局治安隐患数据,进行大数据分析建模开发,形成4个专题分析模组、50余个分析模型,建设一套同步应用的警务通APP应用端,为辅助治安部门评估安全态势、研判重点隐患、针对解决难题、促进行动纵深,提供了多方位、深层次、全面性的数据分析支撑,有力确保了高铁治安平稳,取得了良好成效。

一是通过对接全局治安风险管理系统及治安部门搜建的隐患排查数据,接入线路隐患排查情况、路外伤亡情况、防撞网内行人情况、危及行车安全案件等多类数据,运用数据质量评估、缺失值处理、异常值处理、均值增补处理、热卡填补处理、多维去重处理、噪音数据处理等技术,将原本碎片化、低质量、难关联的多源异构数据清洗、整理为结构严谨、格式标准、量纲统一的标准化数据库。

二是以固化线隐患排查防控工作思路为模型核心架构,围绕武汉局管内7条重点高铁线路(京广高铁、武孝城际、武冈城际、武咸城际、武九客专、合武线、汉宜线),利用大数据智能建模、深度数据挖掘、多维统计比对等技术,对标准化数据进行便捷的关联、合并、聚合以及SQL操作,建设高铁安全隐患分析大数据应用模组4个(隐患排查数据分析模组、路外伤亡分析模组、防撞网内行人分析模组、危及行车案件分析模组)、分析模型50余个,为辅助治安部门评估安全形势、研判重点隐患、针对解决难题、促进行动纵深,提供了数据分析支撑。

三是利用警务通APP端,实现移动办公应用。利用大数据可视化分析警务通APP应用端,与PC端同步显示模组、模型分析情况。同时,对原用于PC端查看的分析模块进行了针对性调整,建立适应在警务通APP应用端钻取查看的多层模型架构,提升了警务通APP应用端查看平台分析模块的使用体验。

4 结束语

经过一期大数据可视化分析平台的建设,已经形成了对海量数据的分析计算能力,在打击违法犯罪中取得了一定的成效。然而,在建设与应用过程当中,也显露出了一些亟待完善的问题,如缺乏前端信息采集和后端模型计算结果输出环节,没有形成大数据应用闭环;缺乏对数据的掌控能力,不稳定风险高;缺乏完善的移动端警务应用等。未来还将努力实现“纵向到底、横向到边”的数据联通、情报共享、全域感知、全时预警,将铁路公安工作由传统被动型应对处置向主动预判、预警、预防转变,实现铁路公安基础业务信息采集管理、线索梳查、铁路风险分析研判和情报预警、指挥调度支撑等实战应用,融合云技术、人工智能和大数据分析等新技术,真正做到“平安铁路、智慧铁警”。

参考文献

[1] 张震.铁路公安大数据建设及分析应用探究[J].法制博览, 2020(04):171-172.

[2] 李曦,周嵩岑.等保架构下移动警务系统安全评估研究[J].网络空间安全,2017,8(12):13-16.

[3] 王生玉.构建网络智能安全运维平台承载智慧警务未来安全发展[J].网络空间安全,2016,7(Z1):82-87.

[4] 马克.破坏铁路案件侦查要点实证研究[J].铁道警察学院学报,2019,29(02):97-103.

[5] 韩明洋.高铁霸座事件的法律问题浅析[J].中国新通信, 2019,21(03):219.

[6] 潘辉,张千洪,马亚洲.浅谈数字IP互联无线通信技术在铁路公安中的应用[J].数字通信世界,2018(11):27+142.

[7] 陈亚蕾.浅谈高铁时代铁路治安防控体系的构建[J].公安教育,2018(10):30-34.

[8] 刘瑶.依法惩治“座霸”公德缺失综合征[N].北京日报, 2018-08-29(014).

[9] 桂杉.大数据背景下深入推进基础信息化建设的思考—以合肥铁路公安处为例[J].鐵道警察学院学报, 2017,27(03):9-12.

[10] 安柏荣,郭洁,郭佳宁,黄业峰,杜坤琳.铁路公安机关扁平化警务指挥模式建设研究—以沈阳铁路公安处为视角[J].铁道警察学院学报,2017,27(02):19-23.

[11] 刘燕生.铁路公安机关应急调度指挥工作的现状调查与对策思考以南京铁路公安处为例[J].铁道警察学院学报, 2017,27(01):70-73.

作者简介:

童琳(1983-)女,汉族,湖北武汉人,中国人民公安大学,本科;武汉铁路公安局,警务技术二级主管;主要研究方向和关注领域:数据挖掘、数据建模、刑事侦查、缉毒、警用航空、无人系统。

刘旭(1993-)男,汉族,河南驻马店人,河南警察学院,本科;武汉铁路公安局,一级警员;主要研究方向和关注领域:数据建模、数据分析、刑事侦查、警用航空。

(本文为“2020年429首都网络安全日”活动征文)

猜你喜欢
数据挖掘可视化大数据
数据可视化设计在美妆类APP中的应用
思维可视化
复变函数级数展开的可视化实验教学
复变函数级数展开的可视化实验教学
复变函数共形映射的可视化实验教学
复变函数共形映射的可视化实验教学
数据挖掘综述
软件工程领域中的异常数据挖掘算法
基于大数据背景下的智慧城市建设研究
基于R的医学大数据挖掘系统研究