美国警务大数据:实践进展、风险议题与政策启示

2019-11-20 06:54王超宋向嵘
图书与情报 2019年4期

王超 宋向嵘

摘   要:作为提高执法和问责效率的一种手段,美国警务大数据推动警务实践从传统执法活动向现代情报活动转变,但其在多大程度上改善了警务实践效果仍是一个开放的经验问题。文章探讨了数据驱动警务实践的历史沿革,并从兴起背景、数据特征、技术工具以及现实应用等方面阐述了美国警务大数据的实践进展,考察了美国警务大数据实践中的四个风险议题,并从数据质量控制、数据安全管理与数据分析技术三方面阐述了其带来的政策启示。

关键词:警务大数据;实践进展;风险议题;政策启示

中图分类号:D712.3;G203   文献标识码:A   DOI:10.11968/tsyqb.1003-6938.2019056

American Police Big Data:Practical Progress, Risk Issues and Policy Implications

Abstract As a means of improving the efficiency of law enforcement and accountability, the American police big data promotes the transformation of police practice from traditional law enforcement activities to modern intelligence activities, but to what extent it improves the effectiveness of police practice is still an open empirical issue. This paper discusses the historical evolution of data-driven police practice, and introduces the practical progress of big data in American police from the aspects of its rising background, data characteristics, technical tools and practical applications. The paper examines four risk issues in the practice of American police big data, and then expounds the policy enlightenment from three aspects: data quality control, data safety management and data analysis technology.

Key words police big data; practical progress; risk issues; policy implications

大数据的快速兴起和广泛应用为传统的情报主导警务(intelligence-led policing)注入了新的活力,并正在重构全新的警务实践模式。面对复杂多变的城市环境,大数据不仅拓展了警务运行的新思路,创新了犯罪预测的工具,促进了多警务一体化,而且提高了警务决策运行的有效性,发展了相关分析和多角度犯罪控制方法[1]。然而,迄今为止国内外警务系统能否有效利用大数据在实践证据方面是不一致的[2]。现有研究更多基于“技术导向”和“资源视角”去强调政府大数据的开放性和共享性,围绕警务大数据的变革性影响和应用价值进行学理阐释或案例分析,缺乏基于“价值导向”和“风险视角”的警务大数据实践中风险议题的归纳,以及聚焦于大数据本源风险防控的政策需求的考察。那么,警务大数据究竟在何种程度推动了警务实践的进展?同时,警务大数据实践过程带来了哪些不可忽视的风险议题?而这些风险议题又给警务大数据发展带来了哪些迫切的政策需求?这些问题的解答对推动警务大数据实践的良性发展是必要和现实的。为此,本文通过对近年来美国警务大数据实践的综合考察来回应以上问题,也为公共安全数据管理理论框架完善和政策优化提供案例洞察和启发性思考。

1   美国警务大数据的发展与实践

1.1    美国警务大数据的历史沿革

1967年,美国总统执法与司法委员会在发布的《自由社会中犯罪的挑战》(The Challenge of Crime in a Free Society)报告中,敦促警务部门在内的刑事司法系统迅速采用信息技术,以提高其执法的效率、效果和公平性。他们预言“只要我们能在适当的时间向有需求的警官提供适当的信息,我们就能在犯罪挑战方面取得重大进展”[2]。20世纪60年代以来,美国警务主要是以随机巡逻、快速反应和事后调查[3]为基本特征的执法模式。但后来人們愈发意识到,被动式的警务战略对犯罪控制几乎没有影响[4]。在接下来的十年中,研究人员积极发展数学模型和拓展数据需求,以实现警务资源与犯罪时空数据的合理配置。这表明警务部门开始探索利用数据和计算等新的方式来提高警察的执法绩效。然而,这一时期的数据太粗糙,存储成本高,跨数据库不可访问,无法完全实现数据驱动的警务愿景。20世纪80年代早期,面对被动战略在减少犯罪方面的无效证据,逐渐发展起来一种更积极主动的、以问题为导向的警务战略,即“热点警务”(hot spots policing)。尤其是1994年,CompStat——一个将犯罪和执法统计数据联系起来的警务管理模式在纽约市出现[5],意味着以数据驱动为显著特征的美国警务新模式的初步形成。但是这种模式仍然是低效的,难以实现警务活动的犯罪预测、快速响应和信息实时共享。其中,“9·11”事件就被广泛视为公共安全界情报共享失败的一个案例,这推动了“情报主导警务”的进一步发展[6]。它促进联邦、州和地方执法官员联合起来改进刑事司法数据收集和信息共享的方式,加速了过去相互独立的监视系统融合为“监视组合”,同时也推动了监视的扩大化和合法化[7]。2008年美国开始探索“预测警务”(predictive policing)这一新的执法理念,旨在以“先发制人”式的干预措施来实现警务活动的基本目标。其中,犯罪情报分析就是一种典型意义上的基于大数据的情报应用,是在预测模型中使用大数据技术以更高的分辨率和更高的精准度来预测和预防犯罪。自2012年美国政府正式启动“大数据研究与发展倡议(Big Data Research and Development Initiative)”计划以来,美国预测警务得到极大的重视与发展。同时,警务大数据在问题导向、警力资源优化配置、风险因素主动预测、警务决策科学等方面也表现出巨大的潜力。

1.2    美国警务大数据的兴起背景

大数据驱动新一轮美国警务系统的改革与发展有其必然性。从警务实践来看,财政约束、执法效率不足与问责制是促使美国警务采取大数据驱动的重要原因。首先,在2008年之后,金融危机导致的预算削减压力,迫使美国多个地区社区警务的执法行动面临停止。在执法资源有限的情况下,有效解决犯罪问题并合理控制成本就变得尤为重要;其次,对犯罪行为的情报需求刺激了可以满足需求的信息技术的创新[8]。面对传统执法低效的长期困境,大数据监测的大规模实施推动了美国警务部门以前所未有的广度和深度去监测个体、组织和环境中的潜在风险。如,最大的预测性警务公司Predpol采用的算法中运用来自警务部门信息管理系统的犯罪地点、类型和时间数据,以预测可能的犯罪行为[9];再者,密苏里州等地警察的执法暴行和种族歧视行为导致公众对警察的不满情绪日益高涨。数据驱动的警务有可能成为一种问责机制,以应对组织行为可能面临的批评,其作用在于承诺减少自由裁量和执行更客观的决策,并增加执法过程的透明度[7]。如监督人员可以跟踪警员的绩效指标,包括暴力率、受伤率、与少数群体的接触率和投诉率,并将异常值标记出来[2]。因此,美国政府发布的《白宫警察数据倡议(2015)》(White House Police Data Initiative(2015))认为,数据驱动的警务是应对公众对全国各地警察部门种族歧视行为指责的一种解毒剂。另外,社会媒体工具承载的大量数据正在改变政府机构与公众以及新闻媒体之间的沟通模式。如警务部门可以借助Twitter来传播犯罪和事件信息,并分享有关部门的活动或会议、交通更新和安全信息,甚至使用Twitter直接与公众互动[10]。可以说,公开的警务数据有助于促进社区犯罪分析,产生创新性观点,提高社区公众对警察工作的理解,并减轻了信息回应的负担[2]。

1.3    美国警务大数据的数据特征

警务大数据体现了当前城市公共安全大数据多源海量异构的基本特征,即体量大、传速快和多样性。首先,警务大数据几乎都是基于区域的全量数据进行的预测分析,涉及到数据采集、存储和计算的体量都远超于传统数据规模。而且,各种传感器和警用摄像头等每天都实时产生海量数据,如100台摄像机每天产生约1 TB的数据;其次,存储技术的进步和高速无线网络的融合意味着数据的高速传输。一方面传感技术、云存储技术的采用使得获取数据的成本显著降低,数据访问更容易,使用更复杂更准确的模型去分析大型数据集成为可能[2];另一方面长期演进(Long Term Evolution,LTE)无线网络技术对警务数据产生了变革性的影响,它提供高传输率和支持设备以每小时220英里的速度移动[11]。有了这些技术支持,警务部门就能够部署更多的数据设备以实时收集和传输数据;再者,美国警务部门获得了前所未有的新数据源,不仅包括社会个体数据、团伙数据、历史犯罪数据、地理环境数据,还有网络媒体数据以及私人购买数据等。正如成本下降促进了警察存储和传输数据的能力一样,数据标准的出现也促进了警察从多个来源融合数据的能力。美国警务大数据基本实现了整合不同机构的数据系统,促使警察能够访问和使用的数据大幅增加。如帕兰蒂尔(Palantir)警务平台集成了不同的数据源,甚至包括购买的私人收集的资料,使跨数据库快速搜索成为可能。另外,社会媒体得到了普遍重视,成为警务部门分析人们习惯、观点和行为的重要数据来源。除此之外,警务大数据还具有分辨率高、系统的可扩展性好以及价值密度低等特征。

1.4    美国警务大数据的技术工具

为了在适当的时间将有关人员和地点等信息呈现在有需求的警察面前,警务大数据技术要支撑多源数据采集、传输、清洗和整合,建立数据挖掘分析模型,实现信息的聚类、关联等分析,并以时空序列、热点分布、关联关系等可视化的形式展示。这里重点介绍警务大数据在数据采集和分析方面所应用的重要技术工具。

(1)数据采集技术工具。根据数据的来源不同,警务大数据技术大致可分为三类数据采集工具:一是自动采集物理环境数据的系统,即一系列用于实时信息访问和大规模跟踪的技术,包括各类摄像头、自动车牌阅读器、射频识别、智能终端、传感器等泛在网技术,实现对监测目标的信息采集与状态识别,并通过云技术将数据传送到远端数据库[12]。如自动车辆定位(AVL)系统是一种定期、频繁地传输车辆位置信息的技术。而且,总统21世纪警务工作组建议执法部门扩大视频采集程度,特别是利用随身携带的摄像头[2];二是警务部门主动搜集的数据,主要包括现场采集卡、点系统和社会媒体分析等。其中,点系统(point system)是一种量化警务形式,它在很大程度上是对传统监测做法的量化概括。分析人员每天从巡逻队、假释合规部门、现场采集卡、交通引证、释放拘押表格、犯罪和逮捕報告以及历史犯罪数据中收集情报,以生成“慢性罪犯”列表,每个人都被赋予一个点值,并给出一个排名。另外,警务部门还将话语分析和情感分析应用到Twitter和Facebook等社交媒体数据中,以发现社会中持续或潜在的威胁[13];三是警务部门还通过信息化手段采集来自于其他行政系统的调查数据以及获取涉及违法行为的网络数据。

(2)数据分析技术工具。美国预测警务中的犯罪情报分析主要运用统计学的基本知识和技术方法,将犯罪数据与社会人口统计、时间、空间等数据进行关联分析,来发现犯罪数据中的“非线性关系”[14]。也就是说,大数据方法不是依靠个人经验,而是通过查看几乎所有现有数据,并使用计算机算法识别可疑的活动模式,或者揭示犯罪嫌疑人之间未知的联系[13]。当前,美国预测警务主要采用机器学习算法对采集的数据进行分析,汇聚概率、统计等多学科知识来实现犯罪预测的目标。在具体实践中,警务部门与专业企业建立了深度合作关系。如成立于2004年的大数据分析公司Palantir已经发展成为执法和情报机构汇编和分析海量多源数据的主要平台之一。Palantir平台允许警察通过标记过程对结构或非结构的数据内容(如电子邮件、PDF和照片)进行可视化展示,链接对象和实体以识别新出现的关系,如人员、电话号码、地址、执法报告以及呼叫服务数据等。同时,通过时空维度数据的社会网络分析来展示不同时间段犯罪集群的分布变化已成为警务实践的普遍手段。社会网络分析的基本分析单位包括两个人之间的联系,其关系包括多种形式,如毒品交易关系、受害者与罪犯之间的通话记录等。在具体执法活动过程中,这些技术工具可以组合使用,如将车牌识别系统与社会网络分析结合,可用于发现与警察关注的目标汽车在时间和空间上相关联的其他车辆[13]。

1.5    美国警务大数据的具体应用

(1)纽约警察局(NYPD):区域感知系统。纽约市警察局成立于1845年,是目前美国最大和历史最为悠久的警察局,负责纽约市5个区的警力部署及案件调查。纽约警察局所运用的区域感知系统(Domain Awareness System ,DAS)是大数据警务应用的典型例子。该系统采用先进的监测技术,整合了国防部的大量数据源,并将这些数据提供给一线警员用于制定预防犯罪的战术。该系统包括音频枪击探测器和环境传感器收集的大量数据,还有20亿个车牌读数、1亿次传票、5400万次911电话、1500万次投诉、1200万份侦探报告、1100万次逮捕、200万份逮捕令和9000台摄像机30天的视频等[15]。警察通过DAS可以直接与911呼叫者联系,而不是通过调度员作为中间人进行传递。警察还可以针对与其职责相关的问题定制警报,提取有关他们前往地点的历史信息,以便提前了解有关限制令、精神健康问题和逮捕令等信息[2]。

(2)洛杉矶警察局(LAPD):自动车牌阅读器。洛杉矶的战略提取和恢复计划(LASER)项目始于2011年,由“智能警务倡议”资助。作为一项国家倡议,它鼓励地方警察部门和研究人员使用循证和数据驱动的策略。其中,自动车牌阅读器(ALPR)作为一种常规性监视工具,它读取每个人的数据,而不仅仅是那些受到怀疑的人。安装在巡逻车上的摄像头和交叉路口的固定自动车牌阅读器摄像头为每辆通过其视线的汽车拍摄两张照片,一张牌照照片和一张汽车车体照片,每秒可读取多达50个牌照,并记录日期和GPS坐标。ALPR数据可以为警方提供一张城市车辆分布的直观地图。ALPR系统读取扫描结果,并将其与“热门列表”进行比较,“热门列表”是包含有关被盗车辆、违规停车和恐怖分子监视列表等信息的车牌数据。

(3)芝加哥警察局(CPD):热点名单。芝加哥警察局利用社会网络分析产生一个备受争议的主题清单,其中列出了被认为有可能成为暴力犯罪的受害者或犯罪者的群体。根据过去五年中是否与某个凶杀案受害者共同参与行动,芝加哥警方预测某个人成为凶杀受害者的可能性[2]。芝加哥警察局使用“热点名单”来集中其预防性警务工作。计算机分析会权衡与此人相关的风险因素,如一个人的犯罪记录表、他的逮捕令或假释状态、使用武器或毒品记录,以及可能的暴力伤害等。在“热点名单”上的人会被警告如果他从事犯罪活动,将导致法律后果。名单上的人还被告知,他们也有可能成为受害者,而不仅仅是犯罪者。但事实上,那些收到“定制通知”的人并不总是明显的暴力犯罪者,这可能是他们与凶杀案受害者的社会联系密切提高了警方对他们的风险评级。

2   美国警务大数据实践中的风险议题

当前,公共部门的挑战在于如何理解、管理和有效利用这些价值与风险并存的数据[16]。根据风险社会理论的观点,由于现代性具有自反性(Reflexivity),大数据的出现也可视为一种新兴风险[17],其应用过程中伴随着由数据本身所产生的本源性风险。2019年1月,世界经济论坛(WEF)发布的《全球风险报告(2019)》(The Global Risks Report)显示,网络攻击和数据泄露等技术性风险已成为全球五大风险之一。随着大数据在当今社会活动中的不断渗透,其越来越多地被用作公共决策和治理的基础和依据,这一过程中由于警务大数据自身错误和扭曲等原因导致的后果可能非常严重,数据质量、隐私安全、价值争议等问题已经成为大数据时代警务新的风险议题。

2.1    数据质量问题:警务脏数据

大数据之所以具有巨大的价值是建立在其客观中立的假设基础之上。这些数据不受政治意识形态和社会制度的影响,数据质量反映了有关社会和经济关系的固有真相,从而为政策和实践提供了有力的实证证据[18]。然而,在许多司法管辖区,很多数据管理系统都是建立在有缺陷的、有种族偏见的,甚至是在一些非法行为和特殊政策期间产生的数据之上。这些警务实践和特殊政策塑造了创建数据的环境和方法,从而增加了产生不准确或系统性偏差数据(“脏数据”)的风险[19]。如因偏见、腐败等因素而产生的同意法令、备忘录等数据带有偏见性。生活在低收入、少数民族地区的个人,其“风险”被量化的概率比那些在更有利的社区(警察不通过点系统的监视)更高[7]。而且,大数据工具使用的信息也可能是被隐藏的警察自由裁量权的产物。如警务信息官员通过现场采集卡收集他们在街上遇到的人的信息,但是采集卡不太可能均匀或随机的分布。一旦转换成数据,这些信息即被认为是中立和客观的,即使它们是警员个人自由裁量决定的产物[13]。

2.2    数据风险问题:隐私与安全

在大数据环境中,社会组织和个体在日常生活中为越来越多的警务数据贡献着力量。当前,美国预测警务将保护公民隐私作为其执法的前提,要求警方在收集和使用个人隐私数据时,必须遵守美国第四修正案(Fourth Amendment Law)及相关公民隐私权法案的规定[14]。但事实上大数据聚合和分析涉及的一个关键安全问题是,收集和处理大量有关组织和个人的敏感信息,以及知识产权、商业秘密和财务信息[20]。一方面,对于警务系统而言,电子数据库构成了当代刑事司法运作的神经系统,但从这些數据库中产生错误的风险并不小,广泛的、相互联系的电子信息集合的不准确性引起了社会对个人隐私的特别关注[21];另一方面,警察使用大数据挖掘作为调查方法可能会干涉普通公众的隐私权,实时犯罪中心的权力和绝对集中的监视引起社会公众对自身安全的普遍担忧[22]。因此,当美国警方使用大数据挖掘的调查方法实际上干预了公众的隐私权时,仅仅实施监视就可能抑制公众自由表达、行动和非常规行为的能力,即使没有实施拘留或逮捕等执法行为,监视也可能具有侵入性。

2.3    数据价值问题:有效性的争议

虽然已有实践彰显了警务大数据在提高执法效率和配置警务资源方面的巨大价值,但数据驱动将在多大程度上提高警务系统的效率并减少偏见,这仍是一个开放的经验问题[7]。尽管技术不断进步,但自1967年总统执法与司法委员会报告发布以来,暴力犯罪和财产犯罪的犯罪清除率仍然顽固地固定在45%左右[23]。目前,一些大数据分析系统不但没有填补执法部门的技术空白,而且创造了新的制度需求[7]。对于数据的依赖也可能阻碍了警察根据常识进行预测判断的能力。如根据历史数据绘制的犯罪地图可能会导致更多的人因居住在有色人种为主的社区而被捕。这些影响是技术本身的产物,即使使用它的警察部门有责任感也可能发生。预测性警务系统在多大程度上产生了这些歧视性结果,公众和警察本身都不清楚[24]。也就是说,预测分析的使用有可能在技术上重新定义偏见并加深现有的不平等程度。而且,预测算法可能将使一些潜在偏见持续下去。如尽管白人和非裔美国人以同样的程度使用大麻,但非裔美国人因持有大麻而被捕的可能性是白人的3.73倍,因为许多预测算法实际上依赖于先前的逮捕或定罪记录[25]。而且,如果技术能够消除警察判断力的一些不良使用(如种族偏见),对其过度依赖也有可能削弱警察的正常判断力,这包括警察掌握的社区事件状况,而这些经验性判断并不依赖于数据采集。

2.4    数据法律问题:公平与自由裁量权的标准

警务大数据对现有的警察活动的法律框架构成挑战。执法部门使用大数据的法律含义跨越了刑事、宪法、行政和隐私法[9]。在法律层面,允许警方究竟在多大程度上挖掘大数据,应该由谁做出相关决定,以及应该如何监督大数据调查方法同样是经验性问题。随着更多数据传感器和分析平台被纳入执法行动中,警方越来越多地利用与案件没有任何直接联系的个人数据。这些创新所涉及的法律风险在很大程度上仍然没有受到法律界的审查[21]。新技术通过降低成本和提高警察识别可疑人员的能力,改变了传统监督的自由裁量权。自由裁量权的扩大引发了有关警察监督和处置公平的重要法律和政策问题,尤其是涉及到警察自由裁量权和问责制这些关键性问题。大数据工具似乎提供了对信息的客观分析,但基于自由裁量权的人类决策可以在大数据中以隐藏的方式发挥重要作用。个体或组织使用大数据工具进行决策都会涉及到自由裁量权,如采用哪种数学模型,使用哪些数据,以及如何显示这些数据等,他们还将决定如何和在何处应用大数据工具。

3   美国警务大数据风险议题的政策启示

尽管精算量化的方法已存在于刑事司法系统中近一个世纪,但数据驱动的决策在最近几十年才被系统地纳入执法实践[7]。随着情报机构对大规模监视和大数据挖掘全球性讨论的深入展开,如今规范警务大数据的应用势在必行[26]。美国警务大数据风险议题的提出意味着,要更好地发挥警务大数据的价值,在追求数据分析技术进步的同时,不能忽视政策法律甚至伦理道德对警务大数据实践的规制和指导。美国警务大数据风险议题尽管是源自美国实践的特殊问题,但其在世界范围内都不同程度地存在着,因此也可以看作是警务大数据应用的共性问题,这使得数据管理本身成为新的政策需求,对我国正在展开的相关实践来说,同样具有政策启示意义。

3.1    加強数据采集的源头治理,防范人为因素导致的风险问题

(1)制定明确的数据采集规范,从源头上保障数据采集质量。目前我国《网络安全法》对数据采集有相关规定,但该法对警务数据信息采集权的规定并不明确[27]。在采集标准上,急需制定专门的数据采集规范,建立统一的数据采集、录入和审核标准。在采集主体上,需要规定数据采集的主体范围,并确立数据质量主体责任。除了政务部门的信息采集官员外,还要重新审视第三方参与数据采集与供给的相关规定[7],加强行业自律审查,建立数据授权和保护机制。在采集内容上,明确数据采集需求和采集范围之间的关联。其中如何规定数据采集行为所涉及的公民隐私保护问题仍然是相关政策亟待回应的重点。

(2)规范数据采集与使用行为,防范数据采集使用过程中人为因素导致的风险问题。在数据采集与使用中,个体偏见、歧视、操作失范等人为因素会引发数据失真、数据使用不当等问题,影响执法的公正性与效率,但目前我国警务数据实践尚缺乏对这一问题的足够关注。除建立数据采集规范和相关标准之外,应在制度上加强警员的数据质量意识和数据素养培训,对数据造假、数据欺诈等行为建立惩罚机制。同时,应建立数据使用方面的伦理规范,对警员的数据使用行为进行伦理审查。

3.2    构建数据安全管理保障体系,加强数据管理系统的风险评估

(1)出台专门的警务数据安全管理政策,弥补当前相关政策法规的不足。从现有实践看,我国数据安全管理政策主要集中在科学数据公开共享、政务数据开放等方面,应结合警务数据安全管理的特殊性和具体需求,整合现有相关政策规定,构建一整套警务数据安全管理的政策和标准,并进行政策试点和实施效果评估。数据安全立法要加强不同生命周期阶段的数据保护,明确数据的采集、传输、访问权限和使用流程,实施对使用主体行为的绩效考核。同时,制定数据安全风险的应急预案,开展数据安全应急演练。

(2)构建数据安全管理的技术支撑体系,利用大数据技术来增强数据管理的能力和水平。需要建立健全数据安全防护体系,加强警务大数据防攻击、防泄漏、防窃取等安全防护技术手段建设,强化数据安全监测、预警、控制和应急处置能力。

(3)定期开展数据管理系统的风险评估。警务数据管理系统的安全性与其承载数据的安全息息相关。美国2012年发布的《网络安全法案》和2013年发布的《联邦信息安全管理修订法案》都提出了通过持续监测政府信息系统的脆弱性,定期开展威胁评估和安全措施有效性评估,以确保政府网络信息安全的思路[28]。其中,数据安全管理系统的评估主要是定期、持续地通过访谈、检查等方法对数据的完整性、保密性以及灾备能力等方面的保障措施进行风险评估,防范系统在软件、硬件、协议等多方面存在的未知的漏洞隐患,并对发现隐患进行及时整改。

3.3    强化数据分析技术的可靠性,促进警务决策在经验与数据之间的平衡

(1)通过多主体合作来提升技术开发力度,增强数据分析结果的可靠性。技术创新有助于开发更为精准的犯罪预测模型,优化警务大数据挖掘的关联分析,降低技术因素导致的风险问题,从而实现从低价值密度的海量数据中提取出满足警务需求的情报信息。如大数据已经能够测量出存在的种族偏见,而适当的预测算法设计可以避免偏见因素,或者调整数据来抵消其歧视效应[25]。我国警务部门应从政策上推动警务部门与科技型企业、学术机构以及社会组织的互动关系,共同开发更加精准的犯罪预测算法和理论模型,加强数据脱敏、数据审计、数据备份等,从而推进大数据预测的实施效果。另外,大数据分析算法在使用方法上应该是透明的,以增加算法的可信度和中立性[24]。

(2)探索组织决策在经验和技术工具之间的平衡。现代警务活动不仅是大数据技术驱动的结果,而且还是多领域知识推动的复杂过程。警务人员不仅需要关注大数据分析的结果,而且还需要根据適当的经验知识将分散在不同系统中的大数据与过程分析联系起来,以便于提供支持证据和做出决策[29]。因此,在警务实践中不能“唯数据导向”,数据并不完全是中立和客观的,尤其是涉及道德和伦理问题时,需要从政策上处理好个体自由裁量权和技术工具使用之间的平衡问题。

4   结语

作为公共安全数据管理的一个应用领域,美国警务大数据在取得实践进展的同时,其风险议题的提出显示了制度建设对技术进步反应的滞后性,使数据管理政策成为警务大数据实践的现实需求。这需要政策制定者在数据采集规范、数据安全管理以及技术研发支撑上予以相关政策内容的响应。毫无疑问,实现大数据价值与大数据本源风险之间的平衡是具有挑战性的,需要合理考量技术理性与价值理性,综合运用法律、政策、伦理、技术、标准、管理等手段进行治理。本文仅基于美国警务大数据实践,侧重从政策角度对这一具有共性的风险议题作了一般性回应与思考,还需要立足我国本土化实践进展与风险议题的特殊性,通过顶层设计、部门协同和社会参与,进一步探讨警务数据管理的制度安排问题,促进我国数据驱动的警务实践的发展。

参考文献:

[1]  Leng J,Li G.Big Data-driven Predictive Policing Innovation[C].2018 7th International Conference on Energy,Environment and Sustainable Development(ICEESD 2018).Atlantis Press,2018.

[2]  Ridgeway G.Policing in the era of big data[J].Annual Review of Criminology,2018(1):401-419.

[3]  Sherman L W.The rise of evidence-based policing:Targeting,testing,and tracking[J].Crime and justice,2013,42(1):377-451.

[4]  Braga A A,Weisburd D.Policing problem places:Crime hot spots and effective prevention[M].Oxford University Press on Demand,2010.

[5]  Weisburd D,Mastrofski S D,McNally A M,et al.Reforming to preserve:Compstat and strategic problem solving in American policing[J].Criminology & Public Policy,2003,2(3):421-456.

[6]  Ratcliffe J H.Intelligence-led policing[M].Routledge,2016.

[7]  Sarah Brayne.Big Data Surveillance:The Case of Policing[J].American Sociological Review,2017,82(5):977-1008.

[8]  Ratcliffe J.Intelligence-led policing and the problems of turning rhetoric into practice[J].Policing & Society,2002,12(1):53-66.

[9]  Brayne S.The Criminal Law and Law Enforcement Implications of Big Data[J].Annual Review of Law and Social Science,2018,14:293-308.

[10]  Heverin T,Zach L.Twitter for city police department information sharing[J].Proceedings of the American Society for Information Science and Technology,2010,47(1):1-7.

[11]  Doumi T,Dolan M F,Tatesh S,et al.LTE for public safety networks[J].IEEE Communications Magazine,2013,51(2):106-112.