智慧法院中电子卷宗随案同步生成与深度应用的研究

2022-10-12 05:22许方舳连晓燕
中国电子科学研究院学报 2022年8期
关键词:卷宗深度法院

徐 斌, 许方舳, 连晓燕

(中国司法大数据研究院有限公司, 北京 100043)

0 引 言

2017年,最高人民法院下发了《关于全面推进人民法院电子卷宗随案同步生成和深度应用的指导意见》,2018年下发《关于进一步加快推进电子卷宗随案同步生成和深度应用工作的通知》,并制定《电子卷宗随案同步生成和深度应用技术要求》,从系统建设和应用角度对全国法院进行指导,从组织实施角度进行规范。2020年12月,最高人民法院在全国法院第七次网络安全和信息化工作会议上强调,突出电子卷宗深度应用在智慧审判中的重要地位,要继续推进电子卷宗随案同步生成。“十四五”期间,智慧法院建设进入全新阶段,最高人民法院提出了“全面深化智慧法院建设,加快推进审判体系和审判能力现代化”的要求,需要全面推广电子诉讼,提供更加优质高效的司法服务,让智慧法院建设成果更多更好惠及人民。面对新时期智慧法院的新发展需求,电子卷宗随案同步生成与深度应用工作也迎来了全新的挑战。

在法院内部业务办理日臻先进、诉讼服务环境逐步完善的前提下,结合全国法院电子卷宗目前的建设现状和实际问题,如何进一步响应并落实最高法院电子卷宗随案同步生成和深度应用的指导意见,更好地利用信息化手段服务人民群众,提升人民群众的满意度,服务法官干警,提高法官办案效率,减少法官工作量,服务司法管理,促进全业务网上办理以及全流程司法公开,是电子卷宗随案同步生成和深度应用建设发展的重点方向。

本文将对电子卷宗做一个更加体系化的思考,不仅从技术角度出发,还更关注电子卷宗在法院领域的实际应用场景。从法院业务本身出发,以一种更加务实的理念探索科学技术在法院领域的应用,运用科技力量更好地服务智慧法院建设,充分发挥电子卷宗随案同步生成和深度应用在法院全业务流程中的智慧价值,为实现法律大数据“科学实验”到“产业革命”的真正转型[1]提供智慧法院助力。

图1 电子卷宗与各业务对应关系

1 电子卷宗概述

1.1 智慧法院电子卷宗的基本内涵

法院卷宗材料[2]是法院在其工作活动中形成的有保存价值的原始记录,在司法工作中发挥着不可替代的重要作用。一个案件在不同程序环节都会产生大量的文件材料,同时需要不同的相关人员对卷宗进行审阅,案件的证据材料、诉讼文书、当事人情况、犯罪事实与情节等实体事实和程序事实都要通过卷宗来呈现[3]。然而在社会不断纵深发展的大环境下,卷宗数量规模飞速增长,诉讼档案类别多元化趋势持续增强,这对卷宗的收集、整理、归档、利用及保管等环节提出了更高的要求[4]。面对案件卷宗种类繁多、数量庞大、专业性强、保密要求高等特点,传统的卷宗管理理念和方法在很多方面已经不能适应现代案件卷宗工作的要求,必须引入创新的思路,通过智能化、科学化、一体化的技术和手段提高案件卷宗管理与利用的深度与广度[5]。在法院卷宗管理中注入新的生命力,才能更好地服务法院工作及民生,也更适应法院新时期信息化发展的要求。

电子卷宗应运而生,电子卷宗是指法院在案件受理时接收或办理过程中形成的电子文档、图像、音频、视频等电子文件,以及将纸质案卷材料依托数字影像、光学字符识别[6](Optical Character Recognition,OCR)、自然语言处理[7](Natural Language Processing,NLP)等技术制作而成的电子文档、数据等电子文件。

电子卷宗贯穿整个业务活动,法院电子卷宗与各业务系统之间的对应关系如图1所示。在每个业务活动中都会产生和应用电子卷宗,从立案登记阶段的纸质文件扫描入库和电子材料上传开始,电子卷宗的生成分布在审判立案、庭审、合议、裁判、结案、送达等所有环节。电子卷宗目前在法院领域的应用主要包括电子卷宗随案生成和深度应用两大部分,同时由电子卷宗监督管理和电子卷宗数据库作为支撑保障。

新时期智慧法院建设面临前所未有的迫切需求,需要满足智能化时代人民群众多元化司法需求,需要提升审判执行质效,全面实现网上办理[8]。深入推进智慧法院建设的前提是法院要完成数字化转型,把审执工作中的海量数据固定下来,而电子卷宗恰恰是这些数据的载体,如果脱离了电子卷宗,缺乏数据要素流转,智慧法院建设也就无从谈起。

1.2 智慧法院电子卷宗发展与应用现状

截至2020年底,全国已有3 256家法院建设了电子卷宗相关系统,从技术上实现编制电子卷宗目录、网上阅卷、法律文书辅助生成、电子卷宗归档等核心功能建设,占全国法院总数的93%以上[9]。纵观全国法院,电子卷宗随案同步生成与深度应用工作做的比较好的地区有河北、江西、上海、青海、浙江等省份。

目前电子卷宗的生成模式主要有两种,一种是分散式生成模式,另一种是集中式生成模式。分散式生成模式是指案件办理各个环节的司法辅助人员在各自工作岗位进行随案同步扫描,上传的卷宗图像材料统一进行智能化集中处理,系统将自动完成各种案件的各个阶段上传电子卷宗的分类、排序、纠偏、剔除空白、图像整洁等处理。集中式生成模式是指在人民法院诉讼服务大厅设立“收转发中心”或“数字加工厂”,实现诉讼材料“收、转、发”事务的全流程集约化、智能化管理,规范法院诉讼材料递交统一入口,对当事人递交材料统一登记管理、前置集中扫描、智能识别回填,快速完成相关立案流程和材料接收工作,对当事人递交的纸质材料通过智能材料收转柜,实现纸质材料递送、跟踪、签收等全程留痕、智能化流转,完成各部门之间的材料流转,案件送达文书网上推送至“收转发中心”进行集中送达。

电子卷宗深度应用作为电子卷宗建设的另一主要组成,依托于电子卷宗随案同步生成所产生的电子卷宗数据,实现卷宗的深度智能化应用。主要包括信息回填、网上阅卷、信息公开、文书生成、类案推送、审判管理、卷宗归档、卷宗调阅、业务协同、司法指数生成、专题研究辅助、案件关联等功能。大部分法院仅实现了单个业务节点的应用建设,各节点之间并未打通线上渠道,未形成有效闭环,在纸质卷宗扫描、加工、保管、归目、挂接、整理等各环节未能形成全流程串联以及线上管控、线下联动,实现流转过程全程线上留痕管理的法院较少。同时“十四五”新时期人民法院信息化发展规划也对电子卷宗深度应用提出了新的要求。

1.3 电子卷宗建设过程中主要的问题

整体来讲,全国法院电子卷宗的应用和工作开展及仍存在较大差异,主要有以下三点问题:智能化程度不足、重复性存储和缺乏统一监管。

一是部分法院深度应用功能智能化程度不够[10]。没有积极部署相关深度应用功能,如电子卷宗网上阅卷功能不具备内容全文检索、卷宗灵活标记等功能,编目系统智能化程度不够、证据未实现编目、系统响应时间过长等。目前电子卷宗深度应用所提供的智能辅助功能还不够智能化、人性化,如目前使用类案推送功能的法院,其系统几乎100%都是基于案由推送,没有基于案件事实推送,推送量太多,不够精准;案件信息自动回填还不够完善,不能做到可填信息的全量回填,需要进一步优化,这些问题严重影响了法官的体验感。

二是各类应用对电子卷宗重复性存储。根据全国法院实际调研,目前电子卷宗系统与审判业务系统独立运行,审判业务系统及其他业务应用在调阅电子卷宗时,为便利快速打开,多数情况下对电子卷宗进行存储,导致电子卷宗分别存储在不同应用中,尚未实现电子卷宗统一存储。

三是电子卷宗监督管理有待完善。目前缺乏电子卷宗的监督管理机制,全国法院建设电子卷宗系统多数集中在应用层面,对于电子卷宗的监督管理以及从哪些方面监管等还有待加强,各地法院应依据电子卷宗的管理要求实现电子卷宗的多维度管理功能。

2 智慧法院电子卷宗关键技术与应用场景

2.1 智慧法院电子卷宗系统总体架构

电子卷宗系统支持在办案过程中通过诉讼服务平台上传、扫描设备输入、业务系统流转等方式随案件流程同步收集文本、图表、音视频资料,或将纸质诉讼材料作电子化处理,形成电子文档,并且能够贯穿于办案的全业务流程,并在各个环节提供智能化服务,是智慧法院建设应用的重要基础[11]。本文根据现有基础和实际需求,以审判为中心,提出电子卷宗系统的总体架构,如图2所示。

图2 电子卷宗系统总体架构图

对于电子卷宗系统的总体架构,主要包括六部分。

1)电子卷宗系统提供基础支撑的基础设施层,主要包括支撑电子卷宗系统计算存储的云网等,以及扫描设备。

2)电子卷宗的数据层,包括电子卷宗的原始数据和解析后的结构化数据,为卷宗的应用提供数据基础。

3)电子卷宗业务应用层,包括电子卷宗随案生成模块、电子卷宗深度应用模块和电子卷宗监督管理模块,涵盖电子卷宗生成、应用及管理全生命周期。

4)用户层,电子卷宗的深度应用不光能够给审判领域提供服务,目前已经扩展到诉讼服务、执行和管理领域;左侧为电子卷宗的标准规范体系,指导和监控电子卷宗的生成和应用以及管理;右侧为保障体系,为电子卷宗的安全和稳定运转提供安全和运维服务。

2.2 电子卷宗关键技术

在电子卷宗的生成和应用中,核心技术在于两点,第一是将纸质文档转换为电子文档,第二是将原始的非结构化数据转化为结构化数据。在这两个过程中主要用到OCR技术[12],OCR 是指利用扫描仪或数码相机等电子设备扫描打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。典型的OCR技术路线如图3所示,主要包括图像处理、文字检测和文字识别。

图3 OCR技术路线图

在识别纸质卷宗的文字前,要对扫描后的原始图片进行预处理,以便后续的特征提取和学习。这个过程通常包含:灰度化、二值化、降噪、倾斜矫正等子步骤。灰度化,就是将一张彩色图片变为黑白图片。二值化是用来从多值的数字图像中直接提取出目标物体,最常用的方法就是设定一个阈值T,通过这个阈值将图像分为大于T的像素群和小于T的像素群两部分。图像降噪是用来减少数字图像中噪声的过程,二值化后的图像中会看到很多零星的小黑点,这就是图像中的噪声,会极大地干扰程序对图片的切割和识别,因此需要对图像进行降噪处理。倾斜矫正是指通过程序将倾斜的图像旋转到一个认为最可能水平的位置,这样切出来的图,才有可能是最好的一个效果。

图像经过一定的处理后,就可以进行文字的检测工作。CTPN[13](Detecting Text in Natural Image with Connectionist Text Proposal Network)方法就是在场景中提取文字的一个效果较好的算法,能将自然环境中的文本信息位置加以检测。CTPN本质上是一个全卷积网络,允许任意大小的输入图像。它通过在卷积特征图上密集地滑动小窗口来检测文本行,并且输出一系列细粒度的(例如,宽度为固定的16个像素)文本区域。基本流程如图4所示,VGG16的conv5的特征图作为输入,滑动窗口为3×3,conv5特征图的大小由输入图像的大小决定,用简单的文本线构造算法,把分类得到的文字的细长的矩形合并成文本线。

图4 CTPN基本流程图

只通过文本检测识别每个单字符以实现全文的识别,这一过程会导致上下文信息的丢失,即使对于单个字符有较高的识别正确率,其条目识别正确率也难以保证。因此引入上下文的信息,成了提升条目准确率的关键。从深度学习的角度出发,需要分类器对其进行分类。人工神经网络经过一段时间的发展在OCR中主要充当了分类器的作用,网络的输入为文字特征向量,输出是类编码,在识别类型较少且结构区分较为明显的文字识别中,特征向量通常为字符图像像素点的矩阵,这样特征提取相当于是一个黑盒的操作。分类器的设计方法一般有:模板匹配法、判别函数法、神经网络分类法、基于规则推理法等。成熟的分类器也有很多,其中卷积神经网络(Convolutional Neural Network,CNN)尤为抢眼,除了省去人工特征提取的流程外,共享权值的方式也减少了权值数量,大幅减少了计算开销。基于神经网络的电子卷宗自动分类方法[14]结合CNN和循环神经网络(Recurrent Neural Network,RNN)算法,构建了电子卷宗自动分类模型,细粒度考虑了电子卷宗图像的特性,有效解决了电子卷宗文档图像的自动化识别分类对上下文的逻辑结构考虑不充分的问题,且通过实验证明该方法与传统分类算法相比,可以有效提高电子卷宗的分类准确率。该方法的基本流程如图5所示,首先,利用CNN识别电子卷宗图像的静态特征;然后,根据电子卷宗的关键要素及上下文关系,将这些静态特征按特定的版面结构转换为时序信号;最后,利用RNN对时序信号进行处理,识别电子卷宗的动态特征。

图5 基于神经网络的电子卷宗自动分类模型

2.3 智慧法院电子卷宗应用场景

在法院信息化领域,电子卷宗可应用于多个应用场景,贯穿于法院业务的全流程,实现无纸化办案,如图6所示。本文列举了其中三个常见的应用场景。

图6 电子卷宗应用场景图

(1)电子卷宗自动编目

电子卷宗人工扫描编目需要编目人员对电子资料进行识别拆分、提取文件标题并手工输入文件名,费时费力。通过对电子卷宗的深度应用,可自动编目,替代手工编目,大大节约人力物力。通过上文提到的OCR、自然语言处理等技术,可以将所有电子文件自动区分为一份一份的独立文件,并根据文本、图像判断文本的类型及标题,将每一份文件命名,如起诉状、授权委托书、身份证-姓名、营业执照-公司名称、合同、发票、送货单、照片、送达回证、判决书等文件名。

(2)案件信息自动回填

对电子卷宗内容信息抽取后,通过对指定卷宗内容进行语义分析、文字抽取等处理,实现从非结构化数据到结构化数据的转换,实现各类卷宗关键信息的回填,免去法官逐字录入的繁琐工作,减少人工输入和校对工作量。该项应用需要深度挖掘电子卷宗与结构化数据项的内在关联,自动抽取电子卷宗中的相关信息,主要回填入办案系统的对应信息项,同时还能提供不同信息来源的信息校验。不仅能提取案件基本信息、当事人信息,还能提取案件事实要素。

(3)智能阅卷

智能阅卷主要包括两个方面,一方面是电子卷宗的在线流转共享,另一方面是线上阅卷。电子卷宗的在线流转共享可以支持在审理阶段中,合议庭成员网上阅卷和在线合议、审委会讨论等场景,同时还支持立案庭、审理庭、办公室和档案室中共享使用,避免大量使用纸质材料,造成浪费。另一方面,用户线上阅卷可进行内容的批注和圈注、大小按需缩放、目录点击到相对应内容、内容可全文检索、电子卷宗文字可随意复制等,这些智能化功能为法官办公增添了很大的便利。

3 智慧法院电子卷宗发展策略

(1)加强顶层设计

由于电子卷宗的应用贯穿于司法领域的各个场景,功能较为复杂,因此,部分法院存在电子卷宗系统建设功能重复且不兼容,系统之间没有对接,数据无法进行交互等情况,既浪费了建设资源,又无法很好地提供服务。通过顶层设计的方法,可以形成整体解决方案,统筹规划电子卷宗相关系统的建设。应统一研发、采购、维护、更新功能强大但便利、友好的电子卷宗系统及相关软件。当然,统筹也不能 “一刀切”,也要结合地方特色和法院办案人员习惯和需求进行开发采购,留出必要的空间。

(2)形成监管机制

电子卷宗的生成质效是否正确、合规、完整、有效是卷宗深度应用的基础性前提,能够直接影响电子卷宗深度应用的成效。但目前针对这一方面还缺乏有力的监管,应形成一套完善的监管机制,贯穿电子卷宗的生成、应用和存储,并通过技术手段实现智能化监管。在卷宗生成过程中对卷宗完整性、生成及时性、质量优良性、卷宗规范性等进行监督,对电子卷宗应用过程中从不同维度对电子卷宗进行监管,并对结果进行统计分析、可视化展示等,更好地服务电子卷宗随案生成质量提升和促进电子卷宗深度应用。

(3)加大培训力度

电子卷宗的目的就是为了法官能够不再使用纸质卷宗,而采用电子版本在线上使用,达到方便办案、快捷办案、规范办案的目的。但是对于长期使用纸质卷宗办案的法官来说,电子卷宗的使用存在一些困难,也会产生很大的抵触心理。针对目前一些法院电子卷宗使用率较低、使用范围不广、使用程度不深的现状,应通过培训的方式,使办案人员树立信息化办案理念。通过阶段性培训,使法官用的熟练,从心理上不再抵触电子卷宗,并逐渐养成线上办案习惯。

4 结 语

电子卷宗依托图像处理、文字识别、深度学习等技术,提供了丰富的应用,不仅节省了不必要的人力成本,还能使法官的办公、办案更加便利快捷。所以一定要重视电子卷宗的发展和规划,让电子卷宗更大幅度地推动智慧法院的进步和发展。电子卷宗发展是智慧法院的趋势,受到全国法院的广泛重视,未来的智慧法院要取得更好的发展就必须加大人力、物力的投资,完善相关的发展规划和发展制度,及时跟进电子卷宗的发展现状,以期通过电子卷宗获得进一步的发展机会,做新时代的司法领域的领军者。

猜你喜欢
卷宗深度法院
全国法院2021年审结商业贿赂、逃税骗税等
四增四减 深度推进
深度思考之不等式
陕西丹凤:实现电子卷宗全覆盖
简约教学 深度学习
保险拒赔案例“卷宗”:你和保险公司到底谁更老谋深算些?
电子卷宗系统顺利完成首次应用
论卷宗阅览权的行使与保障
深度挖掘
国外法界奇闻