公益诉讼大数据运用路径探析

2020-04-03 13:33何莹
中国检察官·司法务实 2020年2期
关键词:公益诉讼大数据

何莹

摘 要:党的十九大提出要全面深化改革,公益诉讼作为新一轮检察改革的重点之一,面临着巨大的机遇和挑战。大数据时代背景要求提升检察工作与现代科技深度融合,检察公益诉讼要实现跨越式的发展离不开大数据的支撑。围绕当前公益诉讼工作存在的线索发现难、取证难等问题,聚焦公益诉讼大数据运用之路中的理念之争、范围之争和方式之争,提出按照数据优先的理念,重在数据采集;构建以执法监督数据为核心,社情民意数据为支撑的数据中心;利用AI人工智能研发公益诉讼智能研判平台。

关键词:公益诉讼 大数据 智能研判平台

党的十九届四中全会作出《中共中央关于坚持和完善中国特色社会主义制度、推进国家治理体系和治理能力现代化若干重大问题的决定》,明确提出要拓展公益诉讼案件范围,这使得公益诉讼工作拓展到了社会治理的更多方面,步入跨越式发展阶段。自2017年7月检察机关提起公益诉讼制度全面实施以来,截至2019年9月底,全国检察机关向行政机关发出诉前建议187565件,回复整改率均在90%以上,绝大部分公益受损问题在诉前得到解决,提起民事公益诉讼和行政公益诉讼6353件,切实履行公益保护职责。[1]在取得成绩同时,检察公益诉讼依然面临线索发现难、调查取证难等问题,更多需要检察监督的公益领域还有待开展,检察机关迫切需要寻找解决路径。在信息化迅猛发展的时代背景下,检察机关将目光投向了大数据运用,尝试发挥大数据的优势助力检察公益诉讼的发展,破解发展难题。为此,本文拟通过深入分析公益诉讼与大数据运用的必要性,以问题为导向,提出公益诉讼大数据运用的路径,为检察公益诉讼在大数据背景下的发展方向提出完善建议。

一、公益诉讼与大数据

《中共中央关于坚持和完善中国特色社会主义制度 推进国家治理体系和治理能力现代化若干重大问题的决定》中,明确了“坚持和完善中国特色社会主义法治体系,把全面依法治国落实到国家治理各领域各方面各环节”。检察公益诉讼经历了“顶层设计、法律授权、试点先行、立法保障、全面推进”,作为完善中国特色社会主义法治体系,落实生态文明建设、提高依法行政的重要抓手,受到了广泛关注。法律监督职能是宪法对检察机关性质的定位,也是我国检察制度的主要标志。[2]开展公益诉讼工作,实质上是用司法的手段来维护和保障国家利益和社会公共利益,是用司法的力量来推动依法行政,是全面推动依法治国、健全社会公平正义法治保障、加强对法律实施监督的一个重要方面,是以实际行动来回应人民日益增长的美好生活需要,是新时代中国特色社会主义的应有之义。

随着科学技术的迅猛发展,以微电子技术、计算机技术和通讯技术为代表的信息技术取得了重大突破,在当前政治、经济、思想以及文化等诸多社会层面得到了广泛的应用,也对我们通过“智治支撑”推动国家治理体系和治理能力现代化提出了更高要求。大数据具有4V特征,即海量的数据规模(Volume)、快速的数据流转和动态的数据体系(Velocity)、多样的数据类型(Variety)、巨大的数据价值(Value)。[3]“智慧检务”是通过大数据、云计算、人工智能等新技术,打造集“信息感知、网络传输、知识服务、检务应用、运行管理”五维一体的检察信息化应用体系,[4]促进检察工作与信息化深度融合,推进检察决策科学化、参与社会治理精准化、服务人民高效化。在检察系统内部,高检院已明确把检察监督信息化建设作为科技强检的重点工作,智慧检务建设正在稳妥推进。在公益诉讼工作发展的总体框架下,检察机关更需要借力“大数据”,结合智慧检务发力,以转变传统办案模式,克服公益诉讼面临的实际问题,推动检察公益诉工作更快更好发展。

二、公益诉讼与大数据深度融合之必要性和可行性分析

(一)检察信息化建设发展迅猛

检察信息化经过20多年的建设,经历了从检察办公自动化、检察机关网络化、检察业务信息化、检察工作智慧化几个阶段。近几年来,全国各级检察机关在最高检的领导下,信息化建设均取得重大进展,大数据技术的应用已成为各级检察机关提高检察监督能力的“助推器”,各地检察院不断在推进大数据与检察监督的深度融合上下功夫、求实效。而检察公益诉讼作为检察机关的一项新业务,从专业要求而言,挑战大于机遇,而要想从容应对挑战,就应当借助检察信息化建设的东风,按照张军检察长要求,“把司法改革和现代科技应用结合起来,统筹研发运用智能辅助办案系统,积极参与和推进大数据办案平台建设,推动新时代检察(公益诉讼)工作质量效率有新的提高。”真正讓检察信息化建设在公益诉讼工作中发挥实战效用。

(二)公益诉讼工作本身的特点与大数据运用存在契合点

公益诉讼制度属于顶层设计制度,自十八届四中全会提出探索检察公益诉讼以来,对检察机关作为公共利益的代表,履行公益保护职责,避免“公地悲剧”的重要作用,从党中央到老百姓,都给予充分期待。同时,检察机关是创新社会治理的重要主体。[5]公益诉讼涉及社会治理的方方面面,各个领域专业性强,具有期待高、责任重、范围广、专业性强的特点。而目前公益诉讼办案人员有限,专业能力还有待提升等客观情况,又是检察机关开展公益诉讼面临的实际困难亟待解决。通过大数据的运用,借助人工智能实现线索的自动推送和分析研判,实现“人工”到“人工+智能”的公益诉讼工作智能化再造,是有效解决问题的路径。

(三)公益诉讼工作面临的两大困境急需大数据助力

除了案多人少矛盾外,在具体办案环节中,困扰公益诉讼工作发展的瓶颈就是线索发现难和调查取证难的问题。

1.公益诉讼案件线索匮乏。检察机关获取公益诉讼案件线索渠道较少,通过内部移送线索在公益诉讼领域发挥的作用并不明显。而通过社会公众举报获取公益诉讼案件线索,一方面,由于公益诉讼不涉及个人利益、社会公众对公益诉讼工作了解甚少等原因,群众举报提供的线索较少;另一方面,群众举报提供的线索往往不够具体明确,直接导致相关线索成案率较低。而对于已建立的“两法衔接”移送公益诉讼线索机制,由于行政执法机关主动共享行政执法信息及相关案件数据积极性不高、多个行政执法平台并存运行不畅等,导致行政执法信息平台存在使用率低、案件不录、少录、迟录等问题,案件线索主要是通过主动出击、受害人、知情人举报等手段获得,检察监督缺乏刚性,监督信息渠道不畅,阻碍立案监督线索发现。[6]

2.公益诉讼案件调查取证难。在公益诉讼案件的办理过程中,往往要面临调查取证难的困境。而造成这一现象有多方面的原因:一是检察机关调查取证权缺乏保障。最高人民法院、最高人民检察院《关于检察公益诉讼案件适用法律若干问题的解释》规定,人民检察院办理公益诉讼案件,可以向有关行政机关以及其他组织、公民调查收集证据材料;有关行政机关以及其他组织、公民应当配合。但是对于行政机关及其他单位和个人不予配合的情形,并未提供救济性保障措施,上述规定缺乏刚性。实践中也证明,在利益博弈较为尖锐的公益诉讼中,检察机关难以通过检察建议的方式有效破解行政机关不予配合的难题。二是在行政公益诉讼中,大部分的证据都掌握在行政机关中。如行政机关调查到的证据情况,履行告知、听证、催告等法定程序情况。尤其在证明行政机关怠于监管行政相对人的违法行为时,检察机关调查的结果本身就是对行政相对人不利的,行政相对人经常会不配合,存在门难进、甚至不愿意配合检察机关调查取证的情况,影响了正常公益诉讼工作的开展。三是证据证明标准高且收集困难。公益诉讼案件办理时需要认定侵害公益的事实、造成的后果以及侵害行为与造成后果的因果关系,而能够辅以证明上述要件的证据证明标准高,且证据收集起来较困难。

线索发现难、调查取证难的旧题和案件范围拓宽、监督领域更广的新题要一起破,其不二法门就是借助检察信息化建设的东风,借助大数据的运用,实现线索的自动推送和分析研判,运用人工智能、无人机等技术开展调查取证,辅助一线办案干警高质效办理公益诉讼案件。大数据的运用是公益诉讼工作发展的突破口,谁抓住了这个机遇,谁就能实现公益诉讼工作的高质量长远发展。探索大数据运用之路径是公益诉讼实践提出的迫切需求。

三、大数据助力公益诉讼工作的路径选择及难点分析

新时代要求检察工作与现代科技深度融合,公益诉讼线索的发现离不开大数据支撑。识大势,善借势,大数据运用之路就是让公益诉讼工作腾飞的翅膀,就是让公益诉讼工作实现跨越式发展的关键点。探索公益诉讼大数据运用之路的两个着力点就是数据采集和平台研发。但是,在运用大数据助力公益诉讼工作时,会遇到三个难点问题:

(一)理念之争:重数据采集还是重平台研发

大数据助力公益诉讼工作主要是通过平台研判数据,实现线索的自动推送,解决公益诉讼线索发现难的问题。但在具体操作过程中,应当注重平台的研发还是采集数据,在当前司法实践中仍存在争议。由于信息化的时代趋势,目前全国各地都在探索公益诉讼平台的研发,都把关注点放在平台的线索研判和自动筛选,忽视了采集数据的重要性,导致实际上筛选出来的线索成案率并不高。各地研发的平台还存在能否异地兼容使用的问题,一旦不能兼容,容易造成研发投入的重复性和局限性。为此,在开展借力大数据开展公益诉讼工作中,第一步需要厘清理念问题,即重在解决数据采集还是重在平台研发,如何在平台研发时考虑经验的可复制性,避免重复劳动。

(二)范围之争:重在采集舆情数据还是执法监管数据

数据是发现公益诉讼监督线索的前提,没有数据,就是无源之水、无本之木。讲到数据,大部分检察机关都认为是民意舆情数据,为此,在确定数据采集范围时,主要针对的是微信、微博、论坛以及其他网络平台的数据捕捉,而没有过多考虑过行政机关本身的执法监管数据。对于采集行政机关的数据,依然存在畏难情绪,经常受制于行政机关本身信息化水平以及行政机关的各种不配合和推脱。检察机关经常认为向行政机关采集数据举步维艰,难以完成,在具体操作时缺乏方式方法。同时还担心采集的数据缺乏重点、关键信息,或数据信息采集滞后。在实践中,已采集到的数据信息大部分是普通数据信息,重要信息、敏感信息缺失,且大多属于已办结案件信息,无对相关信息的实时采集,数据信息采集相对比较滞后。行政执法监管数据采集难,是检察干警最迫切需要解决的问题。

(三)方式之争:利用爬虫技术搜索比对还是利用AI人工智能

数据的使用方式决定了使用的效率和效果。目前实践中对于如何利用数据还在不断摸索中。但普遍存在的问题是,数据利用效率不高。各类信息数据存在信息孤岛现象,如很多数据只是简单累加、对比及单一计算,对数据之间的内在联系挖掘不足,数据的利用率低、交互性低,各个信息系统无法自动比对、筛选,无法形成数据模式,无法实现数据“乘法融合”。[7]这给数据使用提出考验,是采用传统的爬虫技术搜索比对还是利用AI人工智能的方式进行数据的分析研判。

四、公益诉讼大数据运用的具体路径

(一)按照数据优先的理念,重在数据采集

1.明确数据采集的基础性作用。数据采集是公益诉讼信息化工作的源头活水,是研发平台的前提和基础,也是解决线索发现难等工作瓶颈的关键。因此,相对于平台研发,数据采集是基础性工作,也是关键性工作。平台研发更多的是资金的投入、模型的构想,而数据采集的开展情况,则最大限度决定了公益诉讼大数据运用的深度和广度。因此,重点应在攻破数据采集关,而非一开始就着手平台研发。

2.采用“库用分离”,提升可复制性。大数据运用在最初期的构建中,就应该着重考虑研发效益,以最小的投入输出最大的产出。公益诉讼智能研判平台与大数据中心采用“库用分离”的原则,把采集回来的数据与平台进行分离设计,使得数据中心与研判平台两者独立研发、融合使用。实现平台研发后,其他使用者只要有自己的数据库,就可以与该公益诉讼智能研判平台对接,平台的数据模型就能正常运转推送线索,无需再耗时耗力研发平台。“庫用分离”是实现平台可复制推广的技术支撑。

3.库用之间利用机器人实现数据的智能化清洗。采集到的数据经过统一数据格式、贴上属性标签等格式化清洗、结构化处理后,统一导入大数据中心,成为大数据中心的基础数据。平台从大数据中心数据库中自动抓取数据。如图所示:

由于行政机关的信息化程度各有不同,采集到的数据制式不统一,既有视频资料、Word文档,又有PDF、EXCEL,很难在系统平台里调度起来进行数据碰撞。如果简单采用人工进行数据的格式化清洗、结构化处理,又会面临人力资源的耗费,与智能化辅助办案的目标相悖。因此,在数据清洗环节,需研发专门的机器人,实行自动化地捕捉关键信息,由机器人承担数据格式的统一和属性标签的制作,顺利将数据统一导入大数据中心进行使用。

(二)构建以执法监督数据为核心,社情民意数据为支撑的数据中心

1. 明确数据采集的重点为执法监管数据。由于舆情民意具有分散性的特点,虽然受到百姓关注,但多数只是感观认识甚至是主观推断,线索质量不高,成案较难。在实践中,舆情数据量大,核实工作繁重,最终成案率不高。在利用诉前建议推动依法行政过程中,舆情数据本身就属于外围数据,并非行政机关依法行政的核心数据,大量违法行政行为并不在舆情数据中集中体现。事实上,行政执法监管数据才是推动依法行政的核心和关键,具有普遍性的违法行政行为和不作为将集中呈现在具体的执法办案中。因此数据采集的核心和关键是执法监管数据,能否采集到执法监管数据,以及相应采集的全面性、准确性,将直接决定公益诉讼监督的深度。以锡山区检察院为例,制定了《公益诉讼数据采集清单》,确定了采集范围,现已采集包含41家单位各类行政执法、司法业务数据和监管数据,以及舆情社情民意数据、12345公共服务热线数据、网格化管理平台数据等等,为公益诉讼平台研发提供良好的基础。采集到的数据同时起到了辅助调查取证的效果,如在锁定某一企业存在污染的线索后,可在数据中心进行该企业的相关查询,掌握企业主体情况、行政处罚情况等等,在不惊动被调查对象的情况下完成前期外围调查。

2.建立多样化的数据采集方式。全面的数据采集依赖完备的数据采集方式。基于行政机关的信息化水平差异以及数据开放存在层级差异,可综合采用数据库对接、专线连接、账号登录、拷贝方式进行数据采集。

第一,数据库对接是最优方式,采集的数据最为准确、全面。由于能进入数据库意味着能更改数据,出于对数据安全性的考虑,行政机关能接受数据库对接的方式并不多,但可以有针对性地对一些敏感性相对低的数据进行这种方式的采集。以锡山区检察院为例,已通过前期充分沟通,直接对接锡山区263(“两减六治三提升”)监督监管联动平台、无锡市自然资源和规划局信息共享系统(共享行政许可、行政处罚、规范性文件、永久基本农田划定、年度卫片执法等所有数据)、江苏电信“舆我有关”舆情监控平台等3个底层数据库。

第二,专线连接、账号登录是常态化方式。该方式只需行政机关向检察机关提供账户密码,检察人员就能像行政执法人员一样登陆进系统进行查看,能够达到实时、动态、精准获取数据。以锡山区检察院为例,实时连线区生态环境保护局内外网全系列平台(包含排污、环评、空气质量、危险废物动态管理、“一企一档”管理等共计30个工作平台)、网络化管理综治平台、乡镇民情APP等平台数据,以互联网、政务网账号登录方式采集发改、城管、卫健委等27家单位共401类数据,为平台研发提供了坚实的数据支撑。

第三,数据拷贝实现拾遗补缺。鉴于部分行政机关信息化水平较低,采用数据拷贝进行补充,能有效保障数据采集范围的全覆盖。以锡山区检察院为例,对来自25个单位103类无法通过线上采集的数据,如阳光扶贫资金信息、12345举报信息等进行拷贝,有效弥补了上述数据难以采集到位的客观缺陷。

3.构建“刚柔并济”的数据采集保障。在推进数据采集工作中,要从理念转变及制度构建两方面进行保障,做到刚柔并济。“柔”体现在理念转变,落实好张军检察长提出的“双赢多赢共赢”监督理念。要正确认识“监督与被监督”的关系,把平衡点放在问题的解决上。行政公益诉讼的任务是提醒相关单位认真审视工作中的突出问题,及时弥补工作缺陷和机制漏洞,帮助行政机关改进工作,促进政府依法行政,而不是对行政执法机关“挑刺找茬”。锡山区检察院正是注重了与行政机关共同推动问题的解决,努力让行政机关感受到公益诉讼工作的目的是通过检察监督“事”促进依法行政,能有效降低“人”的违法违纪风险,才使得数据采集工作得到了党委政府和各行政执法机关的大力支持。

“刚”体现在制度建设,以刚性制度完善数据采集的保障。锡山区检察院通过推动区委办、区政府办联合发文《锡山区行政执法与刑事司法衔接工作实施细则》,与区纪委监察委会签《线索双向移送协作配合实施意见》,与区法制办、政务办会签《行政机关执行“两法衔接”工作实施细则的督察规定》,明确将行政执法信息采集作为年度行政执法机关绩效考核指标之一,并对不配合数据采集的机关定期通报,以刚性制度保障数据采集的实时性、真实性、全面性。

(三)利用AI人工智能研发公益诉讼智能研判平台

1.AI人工智能在分析研判行政执法监管数据的优势。利用爬虫技术搜索比对,对于舆情数据的分析较为适用,但是智能化不足,推送出来的线索仍比较粗放,精准度不高,仍需大量的人力物力投入来核实线索的真实性。而运用AI人工智能对行政机关执法监管数据进行分析,能及时发现行政执法的普遍性问题,且对线索进行“建议监督、疑似线索、不构成线索”三类分级推送,智能筛查出有价值的线索自动推送给检察官,使线索发现从“人工摸排”变为“智能筛选”、从“粗犷排摸”变为“精准筛选”,有效解决公益诉讼案件面广、专业性强与办案人员少、专业知识储备有限的矛盾。

2. 利用AI人工智能研发公益诉讼智能研判平台的构想。平台以法律法规、行政机关职权清单、典型案例为基础构建数据字典,以线索推送、线索评估、处理结果、数据字典为基本框架,以地图可视化方式呈现,采用模型匹配、智能读取、自主学习、深度学习等人工智能研判方式,根据不同案件类型建立不同模型,自动推送公益诉讼线索。

平台研发最关键的一环是建立数据模型,通过模拟现实世界中办案人员的办案思维模式,以样本训练、深度学习方法,将同类案件的办案思维抽象为信息世界的数学算法,以此为基础建立数据模型。模型对推送出的结果进行二次学习,经过不断的学习提高对数据的识别度,实现精准推送公益诉讼线索。平台应涵盖多个专业化模块,如环保危废模块可推送环保危废类的公益诉讼线索、违建模块可推送违章建筑类的公益诉讼线索等。

以锡山区检察院为例,目前已建立环保固废、263监督监管平台、舆情三个数据模型。2018年锡山区检察院通过平台自主推送线索72条,立案审查发出诉前建议67份;2019年通过平台已立案26件。该院2018年,利用数据采集发现的案件线索占公益诉讼线索总量从76.7%,成案总数占办案工总数的53.4%,至2019年上半年,两项数据已分别上升至83%和80.5%。涉及环保、住建、人防、卫健委、文体、民政、市场监督、工信、农业农村局等多个行政机关。同时,该院积极尝试运用无人机巡航取证图像智能分析技术,将巡航数据与行政执法数据进行碰撞比对来发现线索和实现调查取证,已实现辅助办案30余件。

例“环保固废”模型:平台自动抓取大数据中心的环保固废类数据信息,模型通过神经网络方式将违法事实、处罚决定、法律法规、职权清单进行交叉比对,从而推送处罚不当、不正确的案件信息,并根据比对符合程度得出阙值,进行“建议监督、疑似线索、不构成线索”的三级分层推送。

3. AI人工智能模式下公益诉讼智能研判平台的发展方向。平台建设是提高办案质效的必然要求。平台按照办案流程,完善线索来源、线索初核、分级评估、调查预案、调查取证、检察建议、整改回复、跟踪监督等八环节。在此基础上确立平台研发的步骤和进度,平台研发的前期目标是将大数据中心的数据调动起来,实现线索的自动推送和分析研判,走好办案环节的第一步,让线索来源实现规模化筛选、智能化推送。从平台的长远发展而言,在AI 人工智能不断深度学习中,最终实现一键生成调查预案和检察建议,真正实现辅助決策办案的效果。

注释:

[1]参见《最高人民检察院关于开展公益诉讼检察工作情况的报告(摘要)》,《检察日报》2019年10月25日。

[2]参见王国庆:《完善检察机关法律监督程序若干思考》,《人民检察》2016年第16期。

[3]参见上海市金山区人民检察院课题组:《大数据运用与检察工作创新》,谢鹏程主编:《中国检察》(第28卷),中国检察出版社2019年版,第134页。

[4]参见高详阳、宋红伟:《大数据运用促进检察工作转型研究》,中检网院服务平台,最后访问日期:2019年12月12日。

[5]参见尹晔斌:《检察机关创新社会治理体系的路径探析》,《湖北师范学院学报(哲学社会科学版)》2015年第3期。

[6] 参见张薰尹、许士友:《大数据司法办案下的公益诉讼》,《中国检察官》2018年第10期(上)。

[7]曹建明:《做好互联网时代的检察工作“+”法》,载《中国法律评论》2015年第3期

猜你喜欢
公益诉讼大数据
我国现行民事公益诉讼制度的缺陷及完善
版权公有领域侵权责任主体范围研究
建立我国环境公益诉讼制度的几点思考
浅论检察机关公益诉讼制度
大数据环境下基于移动客户端的传统媒体转型思路
基于大数据背景下的智慧城市建设研究
数据+舆情:南方报业创新转型提高服务能力的探索