基于JavaEE与APRIORI算法的公安情报分析

2020-11-10 04:38徐雪飞
电脑知识与技术 2020年27期
关键词:盗窃案字段置信度

摘要:随着社会的发展,信息技术的进步,与大数据技术的广泛应用,公安系统的信息化建设也得到了长足的发展,从各类案件卷宗信息、身份证信息、户口信息、交通信息、住宿信息、通信信息、天网数据监控数据等各类信息的电子化,为我们从这些海量数据中分析出某类案件产生的各种背景因素、各类因素之间的关联关系,提供了数据基础。而通过分析这些关联关系,能够为特定案件的侦破,提供方向指导的数据支持。

关键词:JavaEE;apriori

中图分类号:TP311 文献标识码:A

文章编号:1009-3044(2020)27-0097-03

开放科学(资源服务)标识码(OSID):

1 背景

利用大数据技术,开展公安情报分析,如今已经成为公安系统信息化建设的核心。根据统计年鉴分享平台的数据分析,从2016年到2017年公安机关刑事案件立案数据如下:2016年,公安机关刑事立案总数为642.75万起,其中盗窃案430.43万起,占比66.97%;2017年公安机关刑事案件立案总数548.26万起,其中盗窃案345.97万起,占比63.1%。2016年盗窃案中人室盗窃立案1184052起,占比18.42%;盗窃机动车立案435221起,占比6.77%。如此之多的盗窃案,其中大部分都不能破案,因此,本系统试着通过运用APRIORI算法,来分析盗窃案中各类字段之间的关联性,为案件的侦破提供数据支持。

2 技术介绍

2.1 关联规则

关联规则是形如X—Y的蕴涵表达式,在数据库表中,可以将X与Y看成表中的字段,通过迭代算法,分析出各个字段出现的次数,然后根据贝叶斯算法,计算字段值出现的关联性概率,关联规则的强度可以用它的支持度(support)和置信度(con-fidence)来度量,Support(支持度):表示同时包含A和B的事务占所有事务的比例。如果用P(A)表示使用A事务的比例,那么Support=P(A&B)。Confidence(可信度):表示使用包含A的事务中同时包含B事务的比例,即同时包含A和B的事务占包含A事务的比例。公式表达:Confidence=P(A&B)/P(A),通过合理设置置信度,能为公安破案提供侦破方向的数据支持。

2.2 JavaEE技术

为便于民警进行数据的实时查询,本系统通过B/S架构的JavaEE技术来实现,JavaEE是一个开发分布式企业级应用的规范和标准。通过JDBC技术实现平台无关的与各类数据库的连接,通过STRUTS技术实现前端页面与后台技术的分离。

3 数据字段设计

根据盗窃案结案录入的内容,审讯内容,破案经过,本系统着重分析盗窃案的如下字段数据,盗窃物品:分类为A1现金,A2手机,A3贵重物品,A4家电,A5古董字画,A6含重大价值的文件(科技类,遗嘱)。同理方式处理作案手段(Bl撬锁,B2翻窗,B3冒充户主开锁,B4未关门,B5自己家),地点(C1小区,C2普通民房,C3出租屋,C4店铺),對象(D1独居老人,D2单身女性,D3单身职员,D4家人外出的空屋),动机(El购买毒品,E2赌博,E3补贴家用,E4获取重大遗产,E5售卖获利,E6还债,E7其他),团伙人数(2人团伙,3人团伙,4人团伙,其他),联系方式(G1手机联系,G2 QQ联系,G3微信联系,G4其他),案发前后去向(H1回住所,H2网吧,H3宾馆,H4麻将馆,H5 KTV),是否前科(I1是,12不是),时间(J1受害人上班,J2受害人睡着,J3受害者外出)学历(KI小学,K2初中,K3高中,K4中专,K5大专,K6本科,K7硕士,K8博士),作案者年龄(11 15-20.L221-25,L326-35.L4 36-45 L5 46-50)踩点时间(M1案发前一周内,M2,案发前一个月,M3案发前很久)。作案者职业(N1学生,N2无业人员,N3临时工,N4薪水<3000,N5薪水<5000,N6个体户)

具体数据如表1:

4 主要功能模块

案件统计分析:通过当前报案信息,选择某个报案进行数据分析。

关联字段的筛选:根据案件已有的线索,选择数据分析的字段内容。

可信度与置信度的设置:根据同类案件的数量,设置可信度与置信度。

关联规则显示:显示关联分析结果数据。

5 案件统计分析

进入情报分析系统,首先根据不同查询条件查询报案案件类别,效果如下:

通过struts配置文件:

if (session.getAttribute(" daoqielist")!="nully*将统计查询数据,放到session中的daoqieList中,如果有删除旧的。*/

session. removeAttribute("daoqieList"); session. setAttribute(”daoqieList",tj DAO.query2(tj Form》;

public List query2( tongjiForm tjForm)(

List daoqieList= new ArrayList0;

String sql= "select 8from tongji where”;

if(! tj Form.getAO.equals(”0"》

sql =sql+ "and A=”+”¨+tj Form.getAO+”¨;

if(! tj Form.getB O.equals(" 0"》

sql=sql+”and B=”+”¨+tj Form.getB0+”¨;

……….‘

ResultSet rs= conn.executeQuery(sql2);

try{

while (rs.next0){

tjForm= new tongjiForm0;

tjForm.setIDcard (rs.getString(l》;

tjForm.setA(rs.getString(2》;

tj Form.setB (rs.getString(3》;

……..

daoqieList.add(tjForm);

…...

return daoqieList;

7 可信度与置信度的设置

通过点击统计分析:进行字段筛选与置信度,支持度的选择。

List tjlist = (List) session.getAttribute("daoqieList");

ArrayLisKString> dataList = new ArrayList ();

for (int i = 0; i < tjlist.size(); i++) {

tjForm = (tongjiForm) tjlist.get(i);

for(int j=O;j

if (str_cond[j].equals("A "》

condition = tjForm.getAO + ";";

if (str_cond[jl.equals("B "》

condition = condition + tjForm.getBO + ";";

dataList.add(condition);

//关联分析代码

Map relationRulesMap = apriori2.getRela-tionRules(frequentSetMap);

SeKString> rrKeySet = relationRulesMap.keySet0;

for (String rrKey : rrKeySet) {

String s = rrKey;

System.out.println(s.replaceAII(";", " ") + " : '1 +“概率為 :"+ relationRulesMap.get(rrKey》;

}

9 结束语

本系统通过分析盗窃案的各类字段之间的关联关系,在收到的报案信息中,根据已有的线索信息,可以设置字段筛选内容,从而分析出个字段之间的出现概率,为案件的侦破提供方向指导。

参考文献:

[1]陈鹏,瞿珂,胡啸峰.犯罪情报分析中的数据挖掘应用[J].计算机系统应用,2017,26(2): 249-253.

[2]李乐亮,李桂峰.论盗窃案件的特点及侦查方法[J].市场周刊(理论研究),2008(12): 92,115-116.

[3]刘智明,廖艺.入室盗窃案外围现场勘查的几点启示[J].法制博览,2017(5): 152.

[4]梁凡,赵丽.基于中智模糊关联规则生成的大数据挖掘分析算法[J].计算机应用与软件,2019,36(10): 285-292,298.

[5]雷宇.面向大数据的高维数据挖掘技术研究[J].企业科技与发展,2019(7): 166-167.

[6]罗乐,葛启东,周永学.基于Apriori算法的装备数据关联规则挖掘[J].指挥控制与仿真,2020,4(10):2.

[7]王彬.盗窃案件侦查的数据碰撞问题研究[J].辽宁警察学院学报,2019,21(5): 34-40.

【通联编辑:谢媛媛】

作者简介:徐雪飞(1977-),男,江西南昌人,讲师,硕士,主要研究方向为软件工程。

猜你喜欢
盗窃案字段置信度
图书馆中文图书编目外包数据质量控制分析
雨夜盗窃案
硼铝复合材料硼含量置信度临界安全分析研究
正负关联规则两级置信度阈值设置方法
喇叭盗窃案
置信度条件下轴承寿命的可靠度分析
CNMARC304字段和314字段责任附注方式解析
无正题名文献著录方法评述
关于CNMARC的3--字段改革的必要性与可行性研究
多假设用于同一结论时综合置信度计算的新方法✴