商业银行大数据风控还存在哪些短板

2018-07-14 07:16闫炯智
银行家 2018年7期
关键词:客户信息

闫炯智

随着社交软件、智能手机和网络的普及,数据呈现爆炸式增长,人们正在步入“大数据”时代,这种颠覆性的技术变革对社会、商业和个人都将产生巨大而深远的影响。在此背景下,本文阐述了大数据的内涵及其发展,介绍了目前在商业银行的应用现状及难点,并提出了大数据在商业银行风险管理领域深入应用的策略建议。

大数据风控的发展历程

目前,业界对“大数据”并没有统一的定义。研究机构Gartner认为,“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。大数据有“4V”的特性,包括“Volume ”“Variety”“Value”“Velocity”。“Volume”是指海量的数据,并随着科技的飞速发展,数据量将急剧增长。根据国际数据公司IDC的研究预测,到2020年, 全球范围内将产生的数据容量为35ZB,是2011年数据容量的近20倍;到2025年,全世界将创建和复制163ZB的数据,是2016 年所创建数据量的十倍。“Variety”是指数据的类型丰富多样,相较于以往文本形式为主的结构化数据,大数据时代包含了视频、音频、图片、地理位置、网络日志等众多类型的非结构化和半结构化数据。“Value”是指数据的价值密度与数据总量负相关。“Velocity”是指快速的数据处理速度,海量的数据量需要高效率的数据处理速度,同时,短时间内完成的数据处理结果有助于应用策略的快速制订及调整。

在网贷领域, 英国贷款网络平台W o n g a首創大数据风控。该公司成立于2006年,从事发薪日贷款(Pa y d a y Loan),可以全天24小时办理业务,向用户提供金额从50英镑到750英镑不等的小额在线借款业务。其独特的大数据自动风控系统克服了传统征信系统的片面、不注重成长性和效率低下等难点,将征信数据节点提升到8000个,能够根据用户填写的信息自动进行风险评估,并在20分钟内给出贷款报价,堪称大数据风控的鼻祖。

在征信领域, 美国金融科技公司ZestFinance具有代表性。该公司成立于2009年,在其模型中,往往要用到3500多个数据项,从中提取70000多个变量,在传统信用分数不到1000个数据变量的基础上发生了质变。该公司引领大数据计算和征信技术的前沿,颠覆了延续半个世纪的传统征信模式。

在国内银行业,工商银行、兴业银行、宁波银行等在大数据风控中取得了长足进展。

工商银行通过打造大数据服务云,支持大数据发展数据多样化、服务能力实时化、算法引擎智能化、基础平台云化的趋势,在信用风险领域成立信用风险监控中心,以大数据分析技术为手段,集信用风险的分析、监测、预警、管控于一体,确立了分析建模、实时监测、风险预警、核查管控、跟踪督办、反馈优化及考核评价的信用风险监控工作流程,实时开展融资客户、融资产品、信贷机构及信贷人员风险的监测预警及跟踪管控。

兴业银行在风险管理方面大力推动数据应用和数据挖掘分析的力度,迭代开发风控搜、核贷宝、黄金眼等创新型大数据产品。“风控搜”产品整合了互联网风险类信息,供贷前调查、贷中审批、贷后监控等各环节的人员使用,旨在成为一款“采集风险—提示风险—扑灭风险”的风控产品。“核贷宝”通过Python技术自动抓取各重要网站信息,提供一站式查询服务,可一键查多网,并智能生成征信报告,促进贷款审核流程的革新;同时,该产品通过对外部数据实现电子化存储,信贷人员在贷款审查审批、放款复核及贷后管理环节只需一次性查询。“黄金眼”以随机森林算法为核心,利用大数据信息技术,结合网络爬虫和搜索引擎,模拟人工查询和评价数据的过程,构建100余条预警规则和评分模型,利用图关联技术可视化展现客户的股东、担保、交易等关联关系。

宁波银行通过整合行内各业务数据, 引入互联网数据以及专网数据,建立了内容覆盖面更广、风险信息来源更多、预警针对性更强的大数据风控平台。该平台通过风控模型探测潜在风险信号,在贷前、贷中和贷后三个环节,向前台业务人员及各级审查审批人员提示风险,通过建设企业级客户标签画像系统,全面了解客户渠道使用、产品购买等信息,为风险控制提供决策支撑。

大数据风控的应用难点

商业银行具备实施大数据的基础,虽然我国很多商业银行都建设了数据中心, 但离大数据的应用要求还有一定距离,应用难点主要表现在以下方面。

人才短缺难点。在商业银行应用和推广大数据技术,需要既掌握大数据技术和IT技术,又懂业务逻辑和业务操作流程, 同时也熟悉银行内控合规要求等的综合性人才。然而,现实的人才情况限制着商业银行大数据技术的发展。一方面,在大数据技术应用和推广领域中的人才储备普遍比较短缺;另一方面,随着互联网金融的火热,商业银行的部分金融科技人才逐渐流失,从而限制了银行大数据技术的创新应用。

数据整合难点。商业银行拥有丰富的、标准化程度较高的客户数据,但这些数据宝藏往往分布在内部各条线、各职能部门、各分支机构之间,而且各信息系统是在不同时期建设的,开发者也各不相同; 同时,各系统之间的管理要求不同,标准不统一,共享基础差,业务信息也不一致。由于难以互联互通,缺乏共享机制,形成一座座“信息孤岛”,导致在应用数据时难以有效整合,许多行内数据仍然在数据库中“沉默”,未发挥应有的作用。

合规或审慎难点。大量的数据涉及客户隐私,而且有时候难以确定界限。银行作为受严格监管的金融机构,为了符合合规要求,或者出于保护客户隐私如手机号、家庭住址、身份证号等敏感信息的需要,抑或对大数据技术应用审慎的态度等原因,对所拥有的海量数据开发程度有限,使得宝贵的数据难以发挥效用。

开发和应用协调难点。由于银行内部各条线、各部门间的合作机制不完善, 又缺乏复合型人才,导致风险部门与开发部门、风险部门与业务部门的沟通协调成本较高,协调数据产品的开发实施周期较长,产品创新及应用推广与业务的实际需求难以有效匹配,从而使得创新、开发、应用难以有效统一。

传统系统架构适应难点。随着互联网金融、穿戴传感设备、物联网的快速发展,这些新形态下产生的数据、客户交易行为记录,以及包括银行在内所记录的影像、图片、音频等半结构或非结构化数据,都是非常有价值的数据信息,都将和结构化数据一并纳入数据管理和分析范围。目前,银行传统的系统对这类数据的处理能力普遍较弱,由于银行的业务链条较长、各信息系统较为复杂等原因,传统系统架构距大数据技术的应用与推广还有较大差距。

数据挖掘分析难点。由于搜集的数据信息可能不完整,无法积累客户在平时生活中展现的生活习惯、消费倾向等行为数据,难以与行内业务数据结合以刻画客户的消费习惯、风险偏好等。在未进行有效整合的情况下,银行风控人员很难准确识别客户的整体风险。特别是对于跨行业、跨区域、跨市场的担保客户或集团客户, 客户或其实际控制人往往存在多处注册、多头融资的情况,具有交易复杂、业务经营和资金流动等特征,传统数据分析难以清晰了解客户的生产经营、关联关系的全部真实情况,无法发现虚假信息、交叉违约、关联风险等多层复杂风险。

解决之道

银行历经了半个多世纪的建模和数据分析探索,以信用评级或评分模型为代表,积累了丰富的理论和实践经验,银行拥有群体数量庞大的客户,拥有海量的客户数据和交易数据,是一座有待深挖的宝矿。大数据的应用为商业银行风控带来了海量的数据、更加丰富的风控工具和更加高效的处理能力,具有远见和雄心的商业银行应当早做布局,引领金融科技的发展。可以从以下方面深化大数据的应用。

加强复合型人才的培养。大数据思维对银行风险管理水平的提升无疑具有十分重要的意義,但应该认识到大数据不是万能的,不能代替风险管理专家的作用。因为数据信息和模型本身具有局限性,能否最大程度地发挥数据的效用取决于用数据的人,因此需要大量培养既懂业务又懂数据和模型的专家,打造一支既对风险有定性分析判断、潜在风险排查、动态风险监测能力,又掌握数据整合挖掘能力、定量风险分析技术、具有风险模型开发和监控能力的复合型风险管理人才队伍。

建立集中式的风险监测预警中心。基于大数据及其挖掘技术,对分散在银行内部各业务条线、各职能部门、各分支机构、各子系统中的数据进行集中,与外部大数据进行整合后,实现商业银行的事前预警、事中控制、事后监测,并通过海量数据的核查和判定,及时挖掘、监测、预警、管控可能出现的风险点,构建覆盖“全流程、全客户、全业务、全产品、全资产”的全面持续的集中式非现场监测预警体系。力求从数据中寻找业务发展和决策的依据,提高全流程预警能力和风险管理的信息化、自动化水平。当发现客户出现结算、存款或交易等大幅变动或下降等异常情况时,则通过系统向各条线发出风险提示或预警,贷前调查人员应核实相关信息,贷中审查审批人员应据此作出审查审批意见和决策,贷后管理人员应及时开展现场核查,就风险情况督促客户改进,或采取压缩授信额度、提前收回贷款、资产保全等防范措施。同时,进一步完善基于大数据信息的集中式风险辅助审查审批体制,补充或校正授信申报机构对客户风险信息的收集和判断。运用合理的参数和模型,结合大数据信息,做出更全面、专业的分析和判断,使风险识别、计量、决策、防范更加准确及时。

强化与业务的联动。一方面,开展“请进来”,请业务部门负责人、一线业务骨干到风控部门和大数据应用项目组, 亲身体验大数据智能风控服务,并根据业务需要提出相关需求和改进建议,以更契合业务发展的需要,更好地提升客户体验。另一方面,通过“走出去”,派出懂产品、善介绍的骨干人员,深入到业务条线和分支机构,开展大数据产品宣讲、培训,并搜集业务方面的反馈意见,完善产品功能及服务,推动大数据风控产品的应用,激发产品创新动力。

深化数据挖掘分析。银行内部数据具有标准化、价值高的特性,是一座有待持续深入挖掘的宝藏,随着银行拥抱大数据进程的加快,内外部数据的整合将产生更大的潜在价值。银行应充分利用大数据技术对海量数据深入挖掘和分析:一是结合企业的静态和动态的数据,既要看企业资产负债表的静态数据情况,还要考察企业交易结算数据等动态数据;二是结合宏观、中观和微观的数据,综合考虑宏观经济、中观行业、微观企业的情况;三是结合结构化和非结构化的数据,其中结构化数据包括贷款、存款、交易流水等,非结构化数据包括企业管理层情况、产品信息、抵质押品情况等;四是结合行内数据和行外数据,行内数据包括信贷数据、交易结算、抵质押数据等,行外数据包括工商税务、司法环保、征信海关等方面的数据。通过以上几种结合,动态地分析贷前调查、审查审批、贷后管理、资产保全等全流程的客户及关联关系风险,更好地了解客户及其行为特征,优化风控技术和流程,提高风险评估模型的精准度,进一步提升风险管理的精细化水平。

建立大数据信用评分。通过大数据信用评分可以缓解传统征信体系中无征信记录的企业、个人,或财务数据难以核实的小微企业的借贷难题。在利用大数据建立个人信用评分方面,外部数据应涵盖身份核验信息、学历信息、运营商信息、司法信息、工商信息、银联消费信息等,内部数据应通过与个贷系统、信用卡系统对接,实现内外部数据的整合。在利用大数据建立企业信用评分方面,一是应用企业及高管的外部大数据,涵盖银监、征信、工商、司法、环保、税务、股东或高管投融资信息、公积金、房产指数、商标专利、外部舆情、学历认证信息、电商交易数据等; 二是应用行内的企业及高管账户行为数据, 包括交易往来、存贷记录、代发工资等。通过个人和企业的大数据信用评分,对接各业务条线生产系统,辅助贷前调查、授信审批、放款核验、贷后监控、预警等工作, 提升授信业务质效,尤其是对于由第三方平台如电商或支付公司推荐的客户,基于保护客户数据的考虑,平台往往不提供详细的信息,从而难以评价这些客户的风险。

需要指出的是,大数据有其明显的长处,但也有其不足。一是大数据容量越大,其噪音也相应地增加,甚至噪声增长速度可能快于数据量的增速,在大数据管理、分析方法尚未完全成熟时,挖掘成本较高。而银行传统数据含金量高,可以基于比较成熟的数理统计理论和方法,建立经典的数理模型。二是外部大数据往往反映相关关系,而银行传统数据更容易得到因果关系,只有把两者互相融合,把传统数据分析方法的完备性、准确性和大数据的多维性、及时性融合起来,才能真正提升大数据在银行风控中的实效。

(作者系华夏银行总行授信运行部总经理)

猜你喜欢
客户信息
五招教会你做好客户转介绍
机会
机会
订阅信息
展会信息
请问您怎么称呼
23
如何应对客户投诉
信息
健康信息