一种公共法律服务智能语音数据管理系统的设计

2021-04-20 02:36占善华张永平

电子技术与软件工程 2021年1期

占善华张永平

（广东司法警官职业学院信息管理系广东省广州市 510520）

1 引言

公共法律服务是政府公共服务体系的重要组成部分，是司法行政机关的基本职责任务。近年来随着公共法律服务平台建设，语音数据快速增长，但这些数据并未进行深入的数据分析和挖掘，因此，为了更精确地分析人民群众的法律服务需求，提高法律服务的质量以及舆情数据的分析，拟引入智能语音技术对语音数据进行转写以及对转写后的内容进行分析、挖掘，提供可融入日常工作的公共法律服务智能语言数据管理系统，实现对语音数据价值最大化。

2 相关工作介绍

在智能语音领域，对于如何将利用好司法行政系统内的法律服务平台的海量语音数据，如何做到识别和转换后的语义分析，国内外研究和实现很少，语音识别的声学建模主要用于建模语音信号与音素之间的关系，业界相继提出了前馈型序列记忆网络(FSMN,Feed-forwardSequential Memory Network)[1]作为声学建模框架以及深度全序列卷积神经网络（DFCNN，Deep Fully Convolutional Neural Network）[2][3]。针对目前最好的语音识别系统采用双向长短时记忆网络（LSTM，Long Short Term Memory）[4-7]训练复杂度高、解码延时高等缺陷，一般来说可以使用深度全序列卷积神经网络来克服双向 LSTM 的缺陷，从而提高识别正确率。

3 本文系统设计

3.1 构建法律服务语音数据统一管理系统

公共法律服务平台包括电话，网络平台，实体大厅，数据分散，需要建立一个统一的语音数据管理系统，对语音数据和文本数据以及业务关联数据进行统一存储、管理、应用，并建设可视化数据管理平台，开放接口。

3.2 构建智能法律服务语音能力平台

语音听写能够把用户说的任意语音转换成对应的文字信息，配合语义理解后，语音听写就能够听懂人说话，和语音合成构成“能听会说” 的语音交互模式。图1为系统的整体技术架构图，其主要包括以下一些功能点。

3.2.1 端点检测

图1：公共法律服务智能语音数据管理系统技术架构图

端点检测，业界也称之为语音活动检测，即Voice Activity Detection，简称VAD[8-10]，VAD 的目的就是为了对一段数据进行语音和非语音的分离判别。简单来说，就是如果给定有一段语音，该语音具有一定的噪声污染，那么如何对该语音数据进行语音起点、语音结束点进行准确定位和识别，并同时可以去除噪声的部分，从而完整找到该语音数据真正对我们有效的内容。学术界对端点检测有准确的定义，即是对输入的音频流进行分析，确定用户说话的起始和终止的处理过程。

常见的技术方法有三种：基于阈值的 VAD、作为分类器的VAD、模型 VAD。在本系统中，可以综合使用。

3.2.2 噪音抑制

背景噪声对于语音识别应用是一个现实的挑战，对于研究者来说，如何对噪声进行抑制可以追溯到上世纪70年代。其实从字面意义去理解，大家会认为这非常简单，无非就是对于一段语音数据首先进行嘈杂信号的采取，然后尽可能的去除噪声，并尽最大程度保留原语音的语义。但最大程度保留语义确是一个大挑战，需要我们在设计算法的时候非常仔细的调整参数，同时需要进行大量的测试。利用speexdsp 库[11,12]可以实现一定程度的噪音处理工作，但对整个噪音抑制器效果并不是非常好。本文拟利用深度学习的思想处理，对语音数据设计深度学习模型，该模型可以使用具有数千个神经元和数千万个权重的层来执行噪声抑制。该方法可以提高精准度，缺点是对于计算成本要求较高，毕竟这需要存储数千行代码以及几十兆字节的神经元权重，但这对于一个服务于全省的平台来说，这点投入是值得的。确保系统应具备高效的噪音抑制能力，以提高用户在千差万别的环境中识别效果才是首要的。

3.2.3 支持中文常见语句听写

语音识别对于日常使用的常用对话有较高的识别率。这利用各大公司开放的SDK 或者开源系统进行中文常见语句的听写，需要有意识的加入法律服务领域的专业语句库，提高准确率。

3.2.4 支持中文标点智能预测

使用超大规模的语言模型，对识别结果语句智能预测其对话语境，提供断句和标点符号的预测。

3.2.5 热词识别

语音识别服务系统支持应用和用户自定义热词集。

3.2.6 个性化识别

应用级个性化是面向应用的个性化定制，既包括应用开发者通过构热词集提升识别效果，又包括应用开发者根据自己应用的定位；用户级个性化是面向终端用户的个性化定制，既包括用户上传自己的热词集来优化识别效果，又包括语音识别引擎针对用户提取声学模型；语音合成服务，采用中文文本、韵律分析和大语料库的方法合成语音。

3.3 构建服务管理平台

3.3.1 服务管理

为 SDK 分配唯一的身份标识 APPID，并通过此标识，控制为第三方开放的服务。

3.3.2 终端管理

从应用终端层面进一步细化管理，为每个终端分配其可访问的应用。

3.3.3 应用管理

管理各个应用所需的基础信息资源，如词库、快捷短语、翻译句对、语义资源等，同时，提供应用的升级管理。

3.3.4 运营管理收集用户的建议反馈；并多维度对客户、应用、服务的使用情况进行细致的统计分析，指导产品优化

4 可解决的问题

通过上述法律服务数据管理系统的设计，并基于该设计对语音数据进行深入的数据挖掘和分析，可以解决以下问题：

（1）各大法律服务平台收集的音频转写成文本，通过对文本进行数据分析和挖掘，发现法律服务的热点问题；

（2）问法律服务的人员配比及制定服务策略提供数据支撑；

（3）为舆情的发现和管控等提供数据支撑；

（4）通过分析文本内容，对法律服务的质量进行检查，分析法律服务咨询的内容和目的，挖掘出隐藏的案件。

5 结论

本文设计了一种公共法律服务智能语音数据管理系统，该系统开源实现音频语音识别转写，将各大法律服务平台收集的音频数据利用智能语音技术转写成文本，同时开发数据分析功能，对转写后的文本进行挖掘，包括服务质量和隐藏案件的挖掘，最后通过对转写后的文本内容进行整体挖掘和统计分析，从法律服务分析舆情数据。最终实现对法律服务的热点问题追踪，为制定服务策略提供数据支撑，同时也可以为舆情的发现和管控提供数据支撑，实现对语音数据的价值最大化。