基于NLP的合同风险诊断系统研究与实现

2021-09-27 12:18陶春华张鹏程
今日财富 2021年31期
关键词:重复性法规供应商

陶春华?张鹏程

合同作为所有经济活动的起点,是企业遵循市场经济规律的重要体现。合同签订流程涉及到大量的审核工作,需要丰富的法律经验。为了实现对合同全生命周期的管控,利用自然语言处理技术(NLP)进行合同文本分析,通过建立判示模型,对合同文件中的问题进行自动判别,能更加精准地把握合同签订全流程中存在的风险,有助于建立健全风险信息预警机制,提高企业合同风险管理工作水平和效率。

一、引言

国企经济活动具有项目繁多、资金量大、周期长和关系技术革新、生产发展等特点,在采购交易市场中占有重要位置。以国家能源集团大渡河流域水电开发有限公司(简称:大渡河公司)为例,当前大渡河公司合同风险审查工作主要依靠人工完成,审核过程可能存在缺乏客观性,难以避免好人思想、偏好思维,同时,审核工作具有大量重复性、体力性的日常工作。此外,合同流程涉及业务部分的交叉较多,但是前期却难以直接深入了解,导致前期风险排查不及时,后期容易产生纠纷或不利后果。因此,企业十分有必要加强对合同的合规风险管理,以不断提高企业经营管理水平和风险把控能力,提升企业的协同作战水平。

二、研究目标

合同风险诊断系统以智慧企业建设为依托,借助内外部的大数据汇集,利用智能化规则引擎,实现固化业务的智慧化解决方案,提升业务前期的参与度,有利于架构新型的企业合同風险智慧管控模式。

(一)将审核人员从重复性工作中解放,投入风险判示数据库建设

目前大渡河公司合同风险管控工作基本都依靠人、依赖人,大量重复性、体力性的日常工作也都由人完成,通过实现固化业务的智能化诊断,将审核人员从重复性工作中解放出来投入到风险判示数据库的建设。

(二)将审核人员个人经验转变为企业合同风险管控知识沉淀

将审核人员个人的合同风险判断经验,通过合同风险判示模型库的建立,形成企业在合同风险管控方面的知识沉淀。

(三)杜绝重复性出现的顽疾,降低合同风险造成纠纷的概率和损失

通过总结合同风险审核过程中重复性出现的顽疾,将其形成风险判示模型,通过智能化的风险管控机制,降低合同风险造成纠纷的概率和风险。

(四)杜绝合同审核中人为因素造成风险遗漏

合同审核过程中完全依赖人工审核,存在缺乏客观性,难以避免好人思想、偏好思维的问题,通过自动的风险判示模型提高合同审核的客观性,降低人为因素造成的风险遗漏。

三、核心业务模型

合同风险诊断系统的业务模型由数据的汇聚、处理、判示、预警四部分组成,各部分具体内容为:

(一)数据汇聚

平台的数据汇聚主要由供应商信息、法规制度、项目基础信息、合同文本文档组成。供应商信息通过内部的国家能源招标网和国能E购以数据导入的形式获取,通过外部的企查查等以数据接口形式获取,将两者获取的数据进行数据清洗后生成完整的供应商数据库;法规制度通过人工上传电子文档并利用智能文本解析算法自动分解章节条目,生成法规制度数据库;项目基础信息是通过对接集团ERP等系统获取,在ERP等系统创建新项目时,平台自动获取相关项目基础信息,如果存在部分信息获取不全的情况,支持人工补录,录入的方式以下拉菜单选择为主,以保证数据的规范性;合同文本文档是在项目进入合同审核流程时人工上传,支持Word文件格式,上传后系统自动对合同文本进行结构化解析。

(二)模型配置

平台的数据处理是通过风险判示模型进行的,由于项目各流程判示需求不同,平台提供建模工具进行判示模型的配置,模型分为事实倾向型(文本比对型)和数值比较型,根据不同判示类型,建模工具提供不同配置界面;对于事实倾向型(文本比对型),需要选择参照对象和目标对象,比如:配置资质不匹配的判示模型时,参照对象需要选择项目基础信息中的资质要求,目标对象需要选择供应商信息中的资质信息,在进行风险判示时,平台按照配置的对象获取相关信息进行文本比对。对于数值比较型,除了要选择判示的参照对象和目标对象外,还需要选择需要进行的数值比较方式,即大于、小于,或等于,比如:配置合同金额超过预算风险的判示模型时,参照对象就是项目进出信息中的项目预算,目标对象就是合同文本文档中的合同金额,同时设置数值比较方式为大于,在进行风险判示时,平台按照配置的对象获取相关信息进行数值比较。

(三)模型引擎

判示模型创建界面提供可视化的组态工具,通过拖拉拽形式的工作流编辑方式,可快速生成风险判示模型。通过构建风险判示模型,实现风险判示模型定义及可视化管理。

判示对象清单:展示系统预设的所有可能作为判示对象的各类信息,包括项目基础信息、供应商数据、合同文本信息、采购文件文本信息、投标文件文本信息等;

判示依据清单;展示可作为判示依据的所有法规制度信息,支持基于分词的模糊搜索,可快速查找需要的法规制度依据;

判示方式清单:展示所有系统预设的判示方式,选择该判示方式后,模型会按照该判示方式的预设操作进行相应的判示;

判示流程绘制区域:可将判示对象清单、判示依据清单、判示方式清单中的任意信息组件拖动到判示流程绘制区域,根据该信息组件的类型决定其显示方式;拖动连接线到判示流程绘制区域,连接不同信息组件,即可实现组件间的流程关系。

图 2 模型引擎

(四)供应商数据库

供应商基础信息模块展示通过企查查获取并进行数据清洗后的所有供应商基础信息记录。以列表形式展示所有采集到的供应商基础信息,提供按供应商名称快速搜索。

(五)法规制度知识库

以目录形式展示所有上传的业务相关法规制度,支持法规制度名称-章节-条目三级目录选择以查看具体法规制度条例,利用正则表达式实现法规制度的模糊搜索。提供法规制度上传工具,支持上传Word格式电子文档,上传后系统会自动利用智能文档解析框架实现法规制度文本文档的结构化解析工作,生成对应法规制度结构化数据。

(六)风险判示

在风险判示过程中,引入NLP智能辅助提高判示的准确性和高效性,比如:在合同关键要素不齐全的判示时,利用词法分析技术对合同文本如客户名称、金额、签约时间、产权主体等信息结构化抽取,同时,在未找到某项关键要素时,利用词义相似度技术查找类似的信息并给出相似度评价,提高后续人工审查的效率。对于简单的关键要素,使用文本检索工具对关键词或正则表达式进行全文查找;对于复杂的关系抽取/时间提取,需要使用最新的自然语言理解算法进行智能检索识别;对于复杂的关键要素,在检索前需要将关键要素与解析出来的合同文本目录进行绑定,缩小关键元素的检索范围,提高检索效率,降低服务器性能开销;对于找到的复杂的关键要素,支持人工复核,保障平台稳定运行。

(七)风险预警

平台利用风险判示模型将供应商信息和项目基础信息及合同文本进行风险判示后,输出风险判示报告。建立风险自动识别、风险提示预警的风险处理流程,通过消息推送、统一待办等手段实现相应功能。

四、系统实现

根据上述系统流程设计,我们对合同条款构建判示模型,通过对比采购文件合同模板与合同文件,实现差异章节的高亮显示,如下图所示,左侧为采购文件中合同模板文件章节,右侧部分为实际合同内容章节,可以看出,利用NLP技术的实现合同文件比对判式,能够有效提示合同审核人员合同问题及风险点。

五、结语

本文依托大渡河公司智慧企业建设,设计开发了基于NLP技术的合同风险诊断系统,通过实现内外部数据集成,利用大数据技术、NLP自然语言理解、智能规则引擎技术,实现合同签约风险诊断风险预警,随着系统判示模型的不断丰富和完善,系统实现切实、可行、经济合理、可实施性强的交易型合同合规风险智慧管控流程,将合同风险管理从业务员单一经验判断转变到与知识库融合解决的形式,把业务人员从重复性的业务工作中解放出来,投入到风险数据库建设中,杜绝已出现的合同风险重复性出现的顽疾,真正实现合同风险从事后处理向事前防范和事中控制转变。本项目的实施有效支持大渡河公司合同风险管控工作的开展,提高合同风险管控工作效率,降低相关风险造成纠纷的概率及损失,合同风险诊断系统也必将为大渡河公司带来更大的价值。

(作者单位:四川大汇大数据服务有限公司)

猜你喜欢
重复性法规供应商
呼叫中心外包供应商选择问题研究
2020年《理财》《财经审计法规选编》征订单
2020年《理财》《财经审计法规选编》征订单
基于供应链环境下乐山某超市供应商的选择
基于供应链环境下乐山某超市供应商的选择
高职教育中针对“对口单招学生”教学改革的探索
沃尔玛再曝供应商货款纠纷
推荐供应商
奇怪的法规
阅读练习