离岸贸易交易的真实性和资金结算的安全性

2023-05-30 06:02朱云涛陈宁麻婧漪尹雪煜龚剑涛李前胜陈仁炜
海南金融 2023年4期
关键词:风险大数据人工智能

朱云涛 陈宁 麻婧漪 尹雪煜 龚剑涛 李前胜 陈仁炜

摘   要:大数据分析是目前金融风险防控的一个重要方向,数据整合和各类算法的场景性应用是目前的主流应用模式。本文尝试性地总结了海南自贸港离岸贸易风险建模特点,有效地利用已知的各类信息碎片,结合图神经网络进行整合,为自贸港离岸贸易真实性和资金结算安全性提供有效保障。同时,创新性地提出一种基于复杂人工智能体的风险建模思路,并阐述了具体建模方法,搭建风控智脑,包括模型架构、算法、联动逻辑、初步验证以及模型的简单应用。

关键词:人工智能;图神经网络;银行;大数据;风险

DOI:10.3969/j.issn.1003-9031.2023.04.002

中图分类号:F752             文献标识码:A     文章编号:1003-9031(2023)04-0013-20

一、引言

新型离岸国际贸易是海南自贸港建设发展的一个重要方向,除业务本身能带来的GDP增长外,同时能为区域发展带来协同效应,目前已初步形成新型离岸贸易企业集群。在良好发展态势下,我们深刻认识到,海南地区现有市场体量仍然较小、新老机制尚需衔接配套、新型业务风险有待进一步识别防控,叠加离岸贸易三流分离、信息碎片化等固有问题,对自贸港离岸贸易真实性和资金结算安全性提出了全新的挑战。

有效利用已知的各类信息碎片是解决上述问题的关键,要充分利用政府资源整合各方数据,建设配套风险模型更有效地对数据进行处理。从各地实践来看,政府主导的大数据平台已经能逐步整合海关、银行、仓储、物流、征信机构等各方散落的信息,并通过整合性离岸贸易服务平台方便相关机构使用。

大数据分析是目前金融风险防控的一个重要方向,数据挖掘和各类算法的场景性应用是目前的主流应用模式,但单一算法已越来越无法满足复杂金融场景的使用需求,而场景化细分模型在拓展性和适应性方面又会受到较大的限制。通过精密的整体设计和创新性的智能算法模拟人类思维,在部分领域已能够超越人类极限水平,对于复杂情境也能较好适应。因此,在我国风险防控实务中,尝试引入较为复杂的高级人工智能已具备一定条件,并具有较为广泛的市场需求。

本文尝试性地总结了海南自贸港离岸贸易风险建模特点,创新性地提出了一种基于复杂人工智能体的风险建模思路,并阐述了具体建模方法,包括模型架构、所涉及的算法、联动逻辑、初步验证以及模型的简单应用,最后结合模型的整体构建框架,针对海南自贸港新型离岸贸易所面临的主要问题,给出了针对性的模型应用方案及实践效果。

二、文献综述

(一)各国风险监控实务

1.各国监管系统

单继进(2014)对国内外大数据监管方式进行了梳理,指出从各国银行业监管机构的监管实践来看,美国联邦金融机构监管委员会、美联储、货币监理署、联邦存款保险公司共同建立了监管采集数据标准规范,按季度从银行收集数据报告和统一运行报告,形成中央数据仓库(Central Data Repository,CDR)共享使用,其中联邦存款保险公司在中央数据仓库基础上建立“VISION系统”(Virtual Information Supervisory On the Net),利用收集到的数据进行监管分析;加拿大金融机构监管署和加拿大央行、加拿大存款保险公司建立了“监管报告系统”(Regulatory Reporting System,RRS),按季度、年度收集常规监管数据和专门数據,开展监管检查分析;中国银监会2012年开始建立EAST系统,旨在建设一个相对开放的数据分析平台,实现对银行业务数据的灵活组织、筛选、抽取、建模、挖掘和分析。

2.国外同业内部监控措施

李卓谕(2021)对国外同业的资金监管情况进行了梳理,摩根大通银行在创新利用人工智能、区块链技术方面拥有独特的资金安全风险管理经验。开发 Mantas 系统,将人工智能搜集的数据进行分析,监控公司全球所有支付交易,可以基于历史数据或通过外部监管数据实现自我更新。组建基于区块链的银行间信息网络(IIN),旨在解决世界主要市场的跨境支付问题,加入的的银行数量已超过400 家。花旗银行跨境汇款业务审核将系统监测和人工识别有机结合。一方面,通过自主研发的交易监测系统,抓取异常业务、过快或过频的异常资金流动、异常的客户关系和行为进行有效监控。另一方面,设立独立的人工识别团队,对无明确证明的可疑交易进行人工复查。

(二)金融场景的数字化

1.关联关系图谱查询

国内以企查查、天眼查为代表的关联关系整合取得了极大的成功,能将散乱的企业间信息通过后台模型的方式进行分群关联。李雨果(2021)指出,异构信息网络可以对多种类型的对象以及它们之间的丰富关系进行建模。

2.图神经网络的应用研究

李甜甜等(2022)研究指出,深度学习已成功应用于图像处理、自然语言理解等领域,在图像、语音、文本等形式的数据上获得较好效果。但深度学习一直无法很好地对于图形式的非结构化数据进行有效的适配。而作为一类主要用于描述关系的通用数据表示方法,图数据在产业界有着更加广阔的应用场景,如社交网络、电子购物、物联网、生物制药等场景。受到深度学习技术的启发,Marco Gori 等(2005)首次将深度学习技术与图数据结合,提出了图神经网络(Graph Neural Networks,GNN)的概念,使深度学习能够在图数据的相关场景中得到有效利用。GNN 的应用领域十分广泛,包括计算机视觉、化学生物、推荐系统以及自然语言处理等领域。常见的GNN 模型有:图卷积神经网络、图注意力网络、GraphSAGE 以及门控图神经网络。董彬(2021)认为,将图神经网络与数学自动推理系统相结合,可以极大提升系统的学习和推理能力。针对其可解释性进行研究,能够使推理的过程更加透明,令系统更加“类人”。

3.知识图谱的应用研究

世界是由事物和事件组成的,人类是以事件为单元记忆和理解世界的。现实世界是一系列动态的事件组成的,尹凯(2019)在知识图谱的基础上提出了事件知识图谱,以事件作为构建单元表示知识,利用事件和事件间关联构建知识图谱,动态的描述现实世界中事物之间的变化。

本文构建了多层资金链图谱网络,并将其与关联关系网络交织补完,通过异构图的方式进一步展现完整金融场景。相较于关联关系图谱还整合了更多交易关联关系和静态内容,综合性和全面性上更优,异构图展示的方式能更清晰地描画集团间复杂交易网络,同时兼顾了单一银行小数据量的特性进行了缺失数据补完。进一步利用图神经网络推理的“类人”特性,通过图神经网络复现了大脑的底层结构运作模式。通过累加式的图形构建方式,解决了图神经网路层次结构较少的问题;通过局部调用、全局延伸的调用处理模式,解决了大规模图形处理的问题,进一步拓展了事件与事件的变化关系构造的知识图谱,形成了事件集和事件集的知识图谱,搭建了基于高纬度标签记录的完整场景规则的识别和调用,使得超大规模数据记录、超大规模并行调用处理和迭代衍生推理等运行成为可能。

(三)AI智脑的构建研究

1.存算一体的限制

由于芯片运行所依托的冯·诺依曼架构,是基于存算分离的设计,即使芯片制程能够不断突破,把处理器的算力做到非常大,但由于存储器的访问速度追不上处理器的处理速度,处理器性能仍会受到严重制约。人类大脑中的神经网络既负责存储,也负责计算。底层架构的不同使得计算机模拟人脑存在瓶颈。

2.并行算力和功耗的限制

人类大脑中有1000亿级的神经元和百万亿级的突触共同构建了复杂的神经网络,而且这些神经网络大部分都处于激活状态,日常运行的功耗在20W左右。通过计算机模拟很难在同级功耗的情况下进行模拟。对超大规模参数的处理也是目前的一个很大的瓶颈。

3.大脑运行机制的模拟研究

赵菲菲(2019)通过类脑自主学习与决策神经网络模型研究指出,大量实验验证了从微观尺度借鉴脑发育过程的动态变化机制可以提升网络的适应性,帮助网络更加高效准确地工作。莫宏伟、丛垚(2021)对类脑计算各国研究进行了梳理,认为类脑计算技术的研究路线可分为两大类:一是自上而下,即先通过科学手段观察大脑内结构和功能运行机制,然后根据观察结果模仿大脑功能,如欧盟的人類脑计划和美国的脑科学计划。我国已有包括北京脑科学与类脑研究中心、上海脑科学与类脑研究中心在内的超过20个研究机构及实验室。二是自下而上的方法,即先构造大脑功能结构相关的假说和模型,然后验证假说和模型是否与真实神经结构、动力学规律相符,例如Friston的预测编码和自由能假说等。

目前的研究都是对于大脑局部功能的研究,如何对目前的研究进行从局部到整体的整合是未来的研究主题之一。本文将自主研发的新型类脑模型初步应用于实践,较好地部分替代人工进行智能化的处理,并且随着类脑模型的完整开发,功能将不断升级。新型类脑模型与混沌理论有很高的契合度。通过计算机模型完整模拟大脑存算一体的构建逻辑,相较于通过数理公式部分模仿大脑功能的复杂人工神经网络算法,有显著升级。

三、数字化解决方案

(一)自贸港建设过程中离岸贸易以及资金结算安全的风险特征

从银行业务实践来看,海南自贸港离岸贸易真实性以及资金结算安全性呈现出小样本、全球化、系统性、新颖性、碎片化等风险特征。

1.小样本

相对于中国香港、新加坡、上海、广州等地,海南离岸贸易起步相对较晚,总量仍然偏小,银行离岸贸易融资和交易结算也还在起步阶段,其中可用于提取风险特征的样本更少,不利于业务人员风控经验的积累,对区域性风险模型的建立也提出了更高要求。

2.全球化

海南自贸港面向全球,旨在打造新型离岸业务平台,贸易领域和金融领域的开放所带来的风险,既涵盖创新带来的新型业务风险,也将原先受国内制度保护的传统业务暴露在全面竞争的国际环境中,需要防范全球化风险。

3.系统性

在全球化过程中,海南拟对标新加坡、中国香港等有成熟完备的全套金融稳定体系,以应对潜在的国际结算以及离岸贸易风险,由于政治金融生态差异较大,经济体量迥异,短时间内海南无法完全借鉴,所产生的系统性漏洞有可能被利用,系统性风险防控体系仍待完善。

4.新颖性

国际货币体系、贸易结构正面临结构性调整,受国际政治因素驱动,具有不稳定、不平等和不均衡的特征。海南作为人民币国际化和新型离岸贸易的突破口之一,新兴政策在拓展摸索过程中可能产生的政策伴生风险和金融科技风险,较难通过现有体制机制很好地识别及防控。

5.碎片化

国际市场征信信息缺失,资金交易网络碎片化,贸易网络不透明,企业、政府、第三方机构的信息共享以及联合建模尚待完善,是交易真实性和安全性防范的难点。

(二)运用科技手段提升离岸贸易的监管能力

解决上述问题,除了进一步完善自贸港体制机制建设外,可以从以下五个方面着手建立风险模型,运用科技手段提升离岸贸易的监管能力。

1.小样本内新增风险事件的迅速准确识别

现有的风控模型,大多是对历史数据进行总结后形成的通用型标准,从大数定理上对风险防控能起到较好效果,但具体到细分市场或小样本空间时,可能存在模型过拟合或拟合度不匹配等问题。离岸贸易由于区别于一般贸易的特殊性,需要更精准地建立起事件与事件间的关系,包括新老客户之间的关系、自贸港离岸业务与其它离岸业务的关系、自贸港离岸业务之间的关系等,以更有效地识别处理自贸港离岸业务真实性。

2.国内市场经验的传递与总结

把握开展离岸贸易的真实动机,进行穿透式管理,能够更好地防范离岸贸易风险。因此,需要对历史各类风险事件进行沉淀以及全貌还原,通过模糊相似算法,来达到窥一斑而知全豹的效果。

3.对缺失数据进行补完、类比

通过多模型组合,挖掘隐藏信息,对现有信息进行合理性补充。通过将贸易信息与同类型企业进行类比,或与历史同期情况比较,来揭示其隐藏信息。解决离岸贸易中信息孤岛化、碎片化的问题。

4.对结构性变化进行识别

离岸贸易受国际政治经济局势、产业结构化调整、大宗商品市场波动影响较大,同时受制于所属集团或产业链的整体安排,部分波动可能存在一定的市场风险,或纯粹为套利、套保、融资、美化报表等原因存在。而银行传统的风险防范中,缺乏对具体业务结构的深入分析和自动比对。因此,需要建立风险模型,在深入总结提炼单笔业务信息的基础上,自动汇总生成多维度的全局性分析,掌握各类批量性、结构性的变化情况,来判断离岸贸易的真实性以及合理性。

5.全方位整合各类基础数据的综合性风控模型

海南大数据中心、海南自贸港离岸新型国际贸易综合服务平台已初步整合了海关、税务、企业、银行、物流、港口、第三方机构的部分有价值信息,对判断离岸业务真实性和资金交易安全起到了很好的支撑作用。建立开放性地处理各类数据、揭示其隐藏信息、印证其勾稽关系的综合性风险模型,能提高对各类数据的利用效率、拓宽应用场景,并節省用于数据标准化处理、专家经验积累、多方建模信息沟通、模型升级联动等方面的工作量。

(三)建模路径

1.搭建动态图谱

利用图模型分析技术动态识别数字化金融场景,融合以及补充各维度数据,构建各场景数字立体动态全景视图,形成有效的模型输入端。

2.搭建观察学习型AI智脑

通过自动比对分析、经验总结、泛化衍生等方式形成AI自迭代规则库,通过回忆或联想的方式进行拟人化思维,对碎片化、无显性特征的数据集进行分类处理,自动识别隐藏规则以及参数权重,具备一定的预测能力,在防范批量风险、新型风险方面具有较好的效果,具有零人工干预、全场景适应、自我迭代等优势。

3.积极探索模型输出端

结合业务实际完善离岸贸易风险真实性和资金交易安全性方面的应用,并通过系统开发、风险防控实践将部分成果落地。

四、动态金融场景的构建及应用

(一)通过图模型动态整合各类基础信息

1.搭建资金链图模型

通过资金链图谱构建及自动化分析技术,加强用途穿透识别、潜在风险揭示、隐藏信息提取、可视化展示等资金用途管理能力。

资金链图谱在后台整合我行全量交易数据,形成庞大复杂的交易网络全貌,并以此为基础图形进行后续分析(见图1)。一是开展多层交易网络分析挖掘;二是批量完成基础网络的构建,后续分析的运算量大幅减少;三是利用图形分析等新型技术进行特征分析、复杂节点处理、断点连接等处理,效率及效果均较基础编程模式有所上升;四是易于对接系统,形成全套可视化展示方案,加强与业务人员的直接互动;五是便于与其他基于图模型平台构建的模型进行联动;六是进行向量分析,加入时间维度,并可以应用立体矩阵分析等高级数学分析方法;七是可动态提炼经常性交易轨迹,应用于后续多项衍生研究。

2.搭建集团隐藏关联关系图模型

该模型通过分析集团内以及集团间企业的关联关系挖掘其隐藏联系。一是基于如高管、亲属、股权等基础数据构建基础关系对;二是结合知识图谱算法挖掘直接持股、间接持股等衍生关系对;三是分析集团之间关联度;四是分析集团间隐藏关联关系以及单户应纳未纳关系,助力贷前新客户授信过程(见图2)。

3.完成图模型拼接融合,通过点边属性整合静态基础数据

构建五层资金链图谱,整合放贷信息以及亲属、股东、供应链等8种关系类型,形成丰富的展示蓝图。通过以多层资金链为核心的个体行为研究,加上以关联关系为核心的关联影响研究,进行模型整合,构建静态金融场景(见图3)。

4.利用图平台形成动态全景视图

基于对客群交易行为的深入挖掘,通过不同的切片方式以及识别逻辑,并辅以隐形关联关系、变迁模型等辅助手段,构建并补完客户实际金融生态圈及交易轨迹。初期通过可视化展示方案,帮助客户经理识别管辖客户所属生态圈,不局限于单一客户范畴,后期将通过整合分析各类生态圈碎片,从实务角度出发对生态圈进行推广应用。

在静态研究中分别加入时间维度,动态形成金融场景的演变进程,进一步分析产业链中上下游客户的流失或新增(见图4、图5)。

对比金融场景1和2,可以看出CE客户的直接交易减少及上下游客户D的新增。

5.补充周期修订模型,拉平不同历史时期所产生的特殊影响

(二)通过图模型初步补充完善金融场景

1.断点连接

根据合理性判断,补充可能存在潜在联系。如基于全局资金链图谱,捕捉隐藏资金链路,挖掘多层可疑信贷资金违规使用行为(见图6)。

2.经常性交易轨迹提取

通过不同时间点切片,提炼经常性交易轨迹。时间切片可采取等量时间法、数据峰值法等多维度,以确保隐藏信息全量提炼(见图7)。

3.可视化洞察客户变迁

在原来交易轨迹模型的基础上,结合关联关系数据构建异构图,并基于时间序列可视化洞察客户变迁。用于多维度展示交易轨迹及企业关系簇的变化情况,分析识别客户的上下游客户的流失或新增,动态洞察客户风险(见图8)。

(三)图模型的简单应用

1.为人工智能形成有效的数据输入体系

将图模型结果通过矩阵特征、图形结构特征提炼等方式,为后续风险模型提供更多的分类方式及组合。通过图模型固化识别专家经验法提炼的场景信息,具有可解释性强,直观易识别等优势。

2.对部分风险场景进行直接监控

通过模型识别的回流、挪用、归集使用、集团关联度识别、归行率等可对贷后资金流异常监测、贷前集团统一授信等风险场景提供直接监控。

3.可视化展示,人机互动

图模型的所有过程数据均有其特定的意义,可直接作为前台展示,用于人工进一步识别分析;如集团隐藏关联关系目前对接企业信贷系统,作为贷前授信审查必看项辅助一线风险经理贷前审查。通过专家经验法识别的特定图形,可以作为风险识别结果直接应用于风险防控,且支持以图形方式进行推送,直观易懂。通过静态图形的延伸,以及动态图形的变化趋势,能十分清晰地看出明显的趋势性特征。

五、人工智能的建立及应用

(一)小浦风控智脑

搭建观察学习型AI模型,通过自动比对分析、经验总结、泛化衍生等方式,探索构建AI自迭代规则库,加强对特定客群的异常事件的风险信号识别以及大概率事件的贷后预测的能力。本文整体构建思路主要由四部分组成,包括多种算法挖掘隐藏初始规则、进化算法构建衍生规则、最优化方法提升规则有效性、相似度函数助力规则提纯(见图9)。

1.多种算法挖掘隐藏初始规则

初始规则挖掘主要由事件构成以及基础规则挖掘2个步骤组成。

(1)事件构建

结合具体业务场景及专家经验,构建基础标签。标签大类包括客户基本情况、授信情况、财务情況、结算情况、押品情况、风险情况、金融场景相关情况。

属性标签:表示长时间的状态,通常由类别型数据标签衍生特征来定义;

动作标签:表示短时间内的状态变更,通常由数据标签对时间窗聚合衍生特征;

事件定义:基于单个/多个数据属性标签或动作标签整合归类来定义的事件,数据标签及其数据变化都属于事件参数范围。

(2)基础规则挖掘

基础规则挖掘主要以下4种方式:

枚举法:根据具体研究场景枚举现有专家经验规则作为基础规则,根据对应场景内样本特征进行枚举组合构建,此方法优点可以对数据量小的场景进行全面分析,覆盖度较高,但数据量大的场景中效率较低;

特征提取分类算法:现有监督风险预测决策树、逻辑回归的变量结果作为基础规则,该算法目前多应用于风控领域,此算法无法对时序特征进行有效分析,结果较难从业务角度解释,但结果重要变量可作为后续挖掘标签;

无监督算法:将事件标签组合进行聚类,事件集结果作为基础事件,该算法目前多应用于银行风控反欺诈、反洗钱等领域;

关联分析算法-频繁序列模式挖掘:该算法可以用于关联事件序列挖掘。相较于频繁项集挖掘的关联算法Apriori和FP Tree,项之间没有时间上的先后关系,而我们需要分析的,是由若干数据项集组成的序列。该算法目前多应用于营销领域,在银行风控领域暂无相关应用。

2.进化算法构建衍生规则

进化算法是以达尔文的进化论思想为基础,通过模拟生物进化过程与机制的求解问题的自组织、自适应的人工智能技术。生物进化是通过繁殖、变异、竞争和选择实现的;而进化算法则主要通过选择、交叉和变异这三种操作实现优化问题的求解。我们利用进化算法对原有规则进行交叉、变异操作,替换部分片段从而得到新的规则,根据提炼评价函数打分,比较原有规则效果,完成迭代优化。进化算法也时有用于银行风控领域(见图10)。

3.评价函数提升规则有效性

对当前规则池中的各个规则分别打分,迭代挑选出优质的风控规则集合。一是构建规则前给每个样本赋权,迭代生成规则时未被其他规则捕捉的样本有更高的权重,从而提升样本多样化。二是对所有新生成的规则构建距离函数计算规则之间的距离,依据评价函数进一步去除类似的规则,提炼多类别规则。

Idea1(规则间距评价):将规则间的距离纳入评价函数,尽量寻找互不相似的规则。

(1)

其中,J备选规则的集合,J为备选规则的个数,xi为第i个备选规则,?兹为常规的评价函数(如精准率,召回率),d(xi,xj)为任意两个规则间的距离。

注意,该方法需要计算所有规则间的两两距离。计算复杂度较高,可以考虑kd树寻找最相似规则,或者使用迭代方法:

(2)

Idea 2(样本赋权评价):给样本赋权,未被其他规则捕捉的样本有更高的权重。

原理:若一条规则可以捕捉其他规则无法捕捉的违约客户,则该规则的评价应该增加。

设立一个大于1的超参数?啄,若一个正样本未被备选规则捕捉过,则权重为?啄,否则权重为 。k为该样本被捕捉过的次数。规则的评价为其捕捉的正样本的权重和/所有正样本的权重和。

4.相似度函数助力规则提纯

使用验证数据集对备选规则池中的规则进行评分,并依据评分结果对规则进行参数与结构的调整,最终达到规则提纯的目的(见图11)。

评价指标:

(二)模型功能的简单应用

一是对数字化金融场景信息进行机器学习,进一步识别具体场景中参数的有效性及权重,使得堆砌的各类数据得到有效塑型。二是通过对碎片化信息进行类比推理,进一步补完金融场景,显示出其可能存在的全貌。三是通过多维度拟合,全面及时揭示其潜在共通之处,有助于潜在风险识别以及批量结构性变化识别。

六、模型应用场景

(一)动态图谱的应用

1.多层资金链图谱自主查询

国内目前对资金的第一手划转进行了较为严密的控制,主要通过柜面和营运部门的刚性控制来实现。但资金流向的分析十分注重穿透性,很多风险实际隐藏在错综复杂的资金网络背后。如仅凭单笔交易,除了发现利率可能偏高外,很难识别出类似于庞氏骗局的金融诈骗,只有通过更高视野的全貌资金流向分析,才能发现其整体逻辑。海南片段化的单笔资金流特征可能较为明显。

基于资金链图谱,可以将散乱的单笔交易以可视化的方式关联起来,从而对于其中可能隐藏的线索信息一目了然。对防范批量性金融风险具有积极的意义。

目前已实现资金链图谱线上自主查询,可通过某一时点的单一对公客户为起点,以交易方向为有向连接,实现上下五层的实际关联交易查询(层数主要取决于算力限制,模型本身并无限制),通过点属性反映交易对手的基本信息,通过边属性反映交易的具体信息(见图13)。

图形采用动态可调整的展现方式,支持用户自主拖动具体点的位置,以更好地揭露隐藏信息。并且设置了一些便利化的图形成像选择,包括层数、期限范围、特征图形显示等选项。

图形支持辖内客户的任意自主查询,因此,如果单一图谱无法满足穿透管理需要,可以以中断节点为起点,再次进行扩展查询。通过多次图谱的拼接分析,形成资金流向全貌。图数据库的力量在于它们能够以超快的方式跟踪关系,从一个节点转到另一个节点。我们通过模式匹配从 Neo4j 中读取数据,从而充分利用图结构。模式匹配包括沿图移动模板并查看哪些节点和关系对与其一致。首先构建带有标签A或B的节点组成的有向图。当我们寻找序列A -> B时,在迭代中,节点标签和关系方向都与搜索模式匹配。图谱查询根据客户管辖权进行信息保密处理,且仅供内部风险管理使用。

2.动态金融场景可视化分析

自由一定意义上也会带来无序,原先通过制度性框架阻挡住的各类金融与贸易乱象可能会乘机渗透,单凭资金流向和单笔交易单证相符的核验已经较难实现实质重于形式的总体管理要求,也较难识别复杂多变的实际环境。因此通过图模型整合、补充离岸贸易相关的动态,金融图谱能获得更为广泛的全景视图。

在资金链图谱分析的基础上,拓展了动态金融场景的可视化分析,将关联关系、客户属性、各类隐藏信息反映在图谱中,以异构图的方式展现集群之间的交易联系,有效识别通过关联企业兜转、更为复杂的交易轨迹网络、资金掮客、异常交易轨迹等信息,使骗局原形毕露。

以可视化图谱的方式有条理地展示动态金融场景全貌,还能较好地辅助识别集团、集群之间的复杂关联交易风险。尤其是有较多集团设立的贸易子公司,单一企业层面的经营情况已不足以显示其真实的贸易背景。

由于系统限制,目前暂时不支持动态演变的直接展示,只能在不同时点切片进行查询后比对分析,了解整体交易的变化情况。

3.图谱统计分析信息定期推送

除了可视化分析外,形成的整体交易图谱网络也能提炼出额外的统计信息。如在重大关联交易、结算性交易、融资性交易、资金闭环管理等方面的统计上,不仅限于一层资金流,而是基于全量图谱信息进行统计。相关统计信息推送至贷后管理模块,以供贷后分析决策使用。

4.资金流向逐笔自动效验

整合了全量动态金融场景后,在资金用途检查的后台自动分析上,也能达到较好效果。通过多层图谱的探查分析,能自动识别资金回流、流向房市股市、归集使用、一对多还款、资金掮客、员工行为等信息,银行开展资金用途检查时,通过后台模型逐笔效验,如发现相关问题,则作为刚性控制要求排查反馈,并经有权人审定。

5.图型特征自动化提炼

在识别有问题的资金流向时,通常提炼问题的相关特征,并进行数据层面的自动化分析。有了图谱模型后,问题特征的识别多了一层手段,可以通过图形特征予以辅助识别,而且对于一些异常的图形特征也能予以自动标识,以便于后续进一步判断。如资金回流在图谱上呈现出一个首尾相连的环形,归集使用则呈现出一个散射图,一条链路上如果有某一点经过了行内员工,则可以作为员工行为信息进行排查(见图14)。除了异常行为外,一些经常性的交易也可以进行提炼,以进一步识别经济依存度、上下游供应商等产业链信息。目前这些特征图谱已能在图谱平台上通过特殊颜色进行标记。后台数据也已用于产业链分析、集团关联关系补充等分析模型。

(二)智脑模型的应用

1.批量识别变迁规则

将环境数据拼接整合后,仍需要进一步处理。目前主要是通过专家经验法,将已经成熟的业务规律用数字化的形式固化下来,仍缺少让数据自己说话的机制,不利于离岸贸易中新型风险的防控,新型风险的提前暴露需要一些自动化的手段。通过智脑模型,能按天提炼总结批量变迁规则,全量识别当天发生的所有批量性事件,掌握其共性特征,并通过与历史情况的比对了解其可能产生的负面影响,达到了用数据说话的效果。通过批量提炼目前实际发生的变迁规则,通过条件函数明确此类变迁行为历史的结果导向(见图15)。

2.客户及客群的非线性演变预判

风险智脑能通过首尾相连的方式,达到多层演变推理的效果。如识别出了当前客户的一个阶段性变化,匹配历史规则库后,命中三条历史变迁规则,发现其中两条在历史上存在过负面影响,有一定概率导致负面事件的发生,就先挑选出这两条变迁规则,然后以其变迁结果为起始点,匹配历史规则库,再次进行推理预判,通过上述方法再次锁定两条(假设)可能出现负面影响的规则,及其发生概率。经过多次迭代后,可以找到多条指向负面影响事件的路径及其可能发生概率,从而对某一客户变迁情况的未来各种可能性有了数字化的量化判断,并视情况采取相关防范措施。

有了单一客户的演变预判之后,批量客群的演变也就十分容易了,只需根据需要预判的内容,调整条件函数的筛选,然后将单个客户的大概率(最大概率且大于某一值的概率)演变可能进行叠加,就能大致得到批量客群的可能演变情况。用于行业分析、集团客户分析等结构化分析,以及政策效果预判等方面,均有较好的应用前景。

3.新增事件的关联分析

新增事件如果單纯以事论事的话,可能会忽略了很多关联影响,在大数据分析中,我们尽量多地集合了环境数据,以期望得到一个更完整的分析,尤其是在离岸业务涉及到的信息较为陌生,就更难进行关联联想。通过智脑模型能初步解决这一问题,通过历史规则库的提炼,识别出海量大数据之间实际的联动规则,当发现有限的新增事件后,匹配这些事件可能触发的历史场景变迁,通过条件函数筛选出可能导致负面影响的历史场景变迁,反向探查该场景下其他条件是否成熟,挑选出涉及到这些事件可能导致的负面影响,且具备发生条件的历史场景变迁,从而了解新增事件的关联性影响。即使面对碎片化、完全陌生的事件信息,通过标准化处理后,也能很好地匹配历史视图,了解片段化的局部事件可能导致的影响。同样,也可以通过迭代方式,了解后续可能发生的一系列变化。在处理超大规模变量上,智脑采用的独特算法能确保效果和效率兼顾。主要是通过以行的处理代替列的处理,局部调用,累加式学习等方式实现。

4.国内外经验的有效传导

在历史规则库的建设方面,仅从海南自贸港数据可能存在样本过少的问题,但只要能对国内或者国外的事件进行变迁规则提炼,通过上述预判逻辑,相关规则就能很好地辅助自贸港新增事件或客群变迁的判断,标准化的特征数据使得通用性大幅增强。而对于国际性的商业银行来说这并不是难事,尤其在中国香港、新加坡等地的规则提炼,能帮助海南自贸港借鉴成熟的风险防控经验。

5.多维参数的综合处理

大数据平台已集成了海量数据,标签维度也达到了万以上级别,通过单一的传统模型很难进行综合化处理,可全量识别其中关联关系和隐藏属性。

本文所提出的人工智能模型模拟了脑部运作模式,在规则提炼方面,通过对事件与事件的分析来降低标签维度的影响;在存储方面,构建事件的高纬度标签,在此基础上搭建历史变迁全景,并对历史经验规则进行提纯提炼等优化,形成最优化存储结构,高效存储了包含所有标签维度在内的历史变迁规律;在调用方面,以高效局部调用为特征,大幅降低了并行计算处理量,并通过对存储规则的调用参与运算,初步实现了存算一体化,支持新增事件全自动的机器自主分析。

6.完成全套自动化数据分析流程

智脑模型支持超大规模参数的同时,上游对接大数据平台,对实时数据进行有效处理,形成全量变迁规则,并根据具体需要进行自动非线性预判分析,锁定相应客群,下游对接单一客户的全套查询分析功能,自动出具案例分析报告,从而完成从源数据到具体风险案例的全套自动化分析预警功能(见图17)。

七、离岸贸易交易的真实性和资金结算的安全性的针对性解决方案

本文尝试将场景数字化整合后,通过通用型AI模型进行自动化的风险特征识别、提炼及防控,为自贸港构建了一面无形的自动防护盾。

(一)识别小样本客群中新型风险和隐藏风险

一是通过风控智脑对小样本中聚类较为集中的客群自动迭代分析,提炼出其相似特征,以供业务人员决策。二是对于表象特征不明显的小批量风险客群,通过多维度提炼分析,全量揭示其潜在共通之处,揭露隐藏规则。并对新增客户是否存在此类情况实时进行预警。三是对于能通过我行自动审批模型的客户,实时分析客群离散程度,确保小样本中没有集中性风险。四是通过模型建立事件与事件的关联,并可通过锁定部分参数(如行业、时间、地区等)形成特定维度的分析结果,了解面上风险情况。

(二)完善系统性风险防控体系

一是通过图模型应用,全量化揭示伴随参数、动态参数、模型参数,并补完碎片化信息,通过模型补完获得风险全景视图,在数据层面上进行完善。二是通过小浦风控智脑沉淀积累全行范围内历史上曾发生过的风险事件及其客观特征,在规则层面上进行完善。三是通过小浦风控智脑自动验证比对的方式,对新增客户或客群可能涉及到的风险事件进行排查,结合经补完的数据和风险规则,在识别上通过自动化的方式确保没有遗漏和疏忽。四是通过揭示历史风险客群调查处置过程中额外发现的信息,提供对当前客群的谨慎性假设。这些信息可能并没有纳入海南大数据平台,无法自动化处理,自动识别后提示业务人员。

(三)通过现有体制机制实时识别防控

一是对于批量客群的趋势化特征全量、实时地予以识别,并且所识别的趋势特征能通过规则展现的方式简单明了地传达到决策层。通过模型自动提炼分析,及时地识别、传达结构性变化趋势和新政策造成的影响,并进行持续化监控,防范影响的时滞性。二是该模型通过自迭代训练可不断自动调整有效参数及其权重,自动形成新的风险防控规则,对新型未知风险能较好识别及防控。三是通过趋势性分析、同类客群比较、历史经验判断综合作用,具有一定的预测能力,对于结构调整所带来的批量风险,能给出相对量化的未来预判。

(四)有效整合国际市场征信信息缺失、资金交易网络碎片化、贸易网络不透明问题

一是模型容错能力较强,当参数过少或过多时,能进行尽可能的有效处理。通过有限信息与行内现有客户进行相似度分析,以揭示隐藏风险。二是通过图模型揭示全量化动态金融场景,初步整合补完各类已有信息,并输入至风控智脑智能化处理。通过大数据整合与风控智脑的联动,形成一加一大于二的效果。

(责任编辑:夏凡)

参考文献:

[1]朱云涛.元宇宙银行体系建设初探[M].北京:中国商业出版社,2022.

[2]许白贞.EAST系统:现场检查中的“最强大脑”[J].武汉金融,2014(6):43-44+48.

[3]单继进.EAST系统的建设与发展[J].中国金融电脑,2014(10):11-13.

[4]李卓谕.A银行广西分行跨境汇款业务内部监管研究[D].广西:广西大学,2021.

[5]刘春航.大数据、监管科技与银行监管[J].金融监管研究,2020(9):1-14.

[6]尹凯.事件知识图谱平台设计及实现[D].四川:电子科技大学,2019.

[7]李为.基于图神经网络的多标签图像识别[D].黑龙江:哈尔滨工业大学,2020.

[8]肖琳,陈博理,黄鑫,等.基于标签语义注意力的多标签文本分类[J].软件学报,2020,31(4):1079-1089.

[9]譚卓.基于自监督学习的有向图神经网络模型[D].四川:西南财经大学,2022.

[10]董彬.图神经网络可解释性的研究与应用[D].四川:电子科技大学,2021.

[11]李雨果.基于异构图神经网络的个性化推荐[D].河南:郑州大学,2021.

[12]赵菲菲.类脑自主学习与决策神经网络模型[D].北京:中国科学院大学,2019.

[13]莫宏伟,丛垚.类脑计算研究进展[J].导航定位与授时,2021,8(4):53-67.

[14]李甜甜,张荣梅,张佳惠.图神经网络技术研究综述[J].河北省科学院学报.2022,39(2):1-13.

[15]马俊.数字金融、银行风险承担与经济高质量发展[J].海南金融 2023(1):18-37.

猜你喜欢
风险大数据人工智能
人工智能与就业