大数据背景下我国民营征信机构发展现状及改进研究

2018-10-09 11:29樊子琦杨青青
时代金融 2018年23期
关键词:大数据

樊子琦 杨青青

【摘要】互联网时代背景下,P2P网贷、消费金融、共享经济等业务在我国蓬勃发展,个人征信业务需求快速增长,对以中国人民银行为代表的公共征信机构提出了挑战,依托大数据技术的民营征信机构应运而生。但目前我国的民营征信机构信用评估模式在数据采集、建模分析和产品应用上还存在问题,文章通过借鉴美国信用评估公司ZestFinance的成功经验,对我国征信机构如何有效利用大数据技术改进个人征信信用评估模式提出建议。

【关键词】大数据 个人征信 民营征信机构

根据中国人民银行征信中心2015年发布的《征信系统建设运行报告》中显示,截至2014年央行征信体系还是以商业银行的金融信贷信息为主,占比达到70%以上,对于网络数据挖掘不足,新兴互联网金融机构如P2P网络平台以及大部分消费金融机构则尚未接入央行征信系统。随着互联网金融平台的活跃,更多的非传统信用数据需要纳入征信体系,为了促进互联网金融稳定发展,对个人征信业务提出了更高的要求。

2015年,人民銀行批准了芝麻信用、腾讯征信、深圳前海征信、鹏元征信、中诚信征信、中智诚征信、考拉征信、北京华道征信8家民营征信机构进入个人征信行业。这些新兴征信机构通过收集分析客户的线上线下信贷数据和网络行为轨迹数据,引入数据挖掘技术和数学模型实行多维度信用等级评估,节约传统征信的人力成本、时间成本,兼顾长尾市场,为个人征信市场注入了新活力。但同时民营征信机构的发展面临着来自各种挑战。

一、我国民营征信机构现状

(一)征信数据来源割裂,信用评级片面化

目前我国征信数据主要来自线下的金融征信体系、行政管理征信体系和商业征信体系以及线上的互联网金融、社交体系。其中线下数据主要是以央行征信系统的信贷数据、工商、司法以及行业协会数据为主,线上则是基于电子支付、P2P网贷、社交网络等互联网平台的大量非结构化数据,两者之间存在较强的割裂,传统金融机构的信贷数据难以与民营征信机构共享。

以芝麻信用和腾讯信用为例,从下表中可以看出芝麻信用数据来源主要来自阿里巴巴旗下电商的网络金融数据,其中来自淘宝和支付宝的数据占比高达40%;而腾讯信用则借助自身强大的社交网络优势,数据主要来自旗下微信、QQ等社交平台。首先双方的数据少有重合,多是依托自身平台,忽略其他互联网公司的用户数据,使评级结果缺乏普适性;其次,双方对于履约能力即用户信用状况的数据仅依赖于与自身建立合作关系的公共机构,这就意味着这些民营征信机构在进行信用评估时究竟能够获得多少线下信贷数据,还是个未知数。以上两点决定了目前我国民营征信机构在信用评级上仍然存在片面性。

(二)征信模型不成熟,信用评估缺乏可靠性

征信模型算法是大数据征信中的核心环节,我国民营征信机构发展尚未成熟,较美国等成熟征信体系相比还存在一定的差距。芝麻信用所采用的评估模型与美国个人消费信用评估公司开发的FICO信用评级法大致相同,但通过对比我们可以看出相比于FICO主要还是依赖于传统信贷数据,而芝麻信用引入了大量与用户信用状况关系较弱的社交、行为偏好数据。引入多维度评估固然可以更精确地刻画用户信用状况,但如何通过这些弱相关性的海量互联网数据挖掘出有价值的消费者信用信息,对征信模型的设计提出了挑战。

同时我们注意到,我国民营征信机构大多将个人的资产信息(如腾讯信用考察资产构成)和好友信用状况(如芝麻信用考察支付宝好友信息)纳入评估范畴,而FICO评分则主要关注用户信贷状况,不包含资产情况等个人敏感信息。国内做法难免加剧贫富人群信用差异,违背了互联网征信服务长尾用户的初衷,使结果产生偏差。综上看来,征信模型的不成熟会使评分结果缺乏可靠性。

(三)依托互联网金融集团,征信产品缺乏独立性

目前我国批准进入个人征信行业试点的八家征信机构大都属于阿里巴巴、腾讯等大型金融集团,而这些集团同时控股小额贷款公司、民营银行等金融机构,与征信机构存在高度关联性,征信产品能否对市场上所有金融产品采用相同标准成为评价民营征信机构独立性的重要因素。大多数征信产品主要依托集团所属平台数据进行评估,评估出的结果又服务于集团内各子公司的业务,这就使得民营征信机构的信用评级缺乏第三方独立性,要想真正应用到全市场金融业务上,还需要对公司主体独立性、关联交易管控、数据独立性等方面进行管控。

二、借鉴Zestfinance的成功模式

ZestFinance是美国一家新兴的互联网金融公司,提出了“Machine learning is the future of finance”的理念,ZestFinance的核心竞争力在于数据挖掘能力和模型开发能力。其大数据征信理念已被世界多家互联网金融公司认可,也与百度、京东等国内互联网金融公司建立合作,共同开拓国内征信市场。

(一)数据来源丰富,以信贷信息为主要数据源

ZestFinance的数据来源主要为第三方数据、用户提交的数据以及互联网数据。其中用户信贷信息、信用卡信息等结构化数据主要来自所购买或交换的第三方如银行、工商部门等公共机构,同时ZestFinance鼓励用户上传电话账单等来证明自己信用水平,有效弥补公共信息不足。互联网则提供了社交数据、网络行为、IP地址等非结构化数据。

值得注意的是ZestFinance在引入大量非结构化数据深度挖掘用户信用的同时,其进行信用评估依然以传统信贷信息为主要数据源,占比达到30%。因为首先互联网数据中尤其是社交数据多为文本和图像类数据,类型复杂,处理起来难度较大;其次,例如IP地址、社交网络行为等数据与用户信用相关性较弱,对模型的拟合程度要求也更大,过多依赖互联网数据可能会使信用评级的可靠性降低。

(二)强大的机器学习模型,不断优化调整模型

传统征信主要采用逻辑回归和决策树方法,但这两种方法各自存在不足。逻辑回归法变量数量有限,只能处理10-15个变量,要求所有变量必须存在且正确,而决策树方法则需要将所有申请人清晰划分为不同类别,操作难度较大。而新兴的机器学习技术能够克服传统回归方法的弊端,结合预测算法,不断优化调整模型,构建信用评估体系,这也是ZestFinance的核心竞争力所在。

ZestFinance开发了专门用于信用评估的ZAML平台,ZAML平台提供了可解释的机器学习模型,处理变量可以多达几千个。能够在10秒之内处理海量数据并提供信用评级,该平台主要由数据同化(data assimilation)、模型工具(modeling tools)和模型可解释性(model explainability)三部分组成。借助机器学习,把人类思考归纳经验的过程转化为计算机对数据的处理计算得出模型,ZestFinance的评分模型得以快速更新,由最初的信贷审批评分模型已经发展出八类不同的信用评估模型,覆盖教育、法律、消费等各个方面。

(三)征信产品应用渠道广泛,评级结果有效独立

ZestFinance通过大数据分析,突破传统征信限制,自2009年起,已为超过300,000,000人提供了信用评级服务,其中多为传统信用评级所没有覆盖的人群,填补了传统征信的空白。ZestFinance 提供的信用评级不仅可以应用于自身旗下的ZestCash贷款平台,为用户发放贷款,也逐渐被一些传统金融机构认可,使这些机构可以参考ZestFinance评分系统为用户提供金融服务。ZestFinance非但没有因为服务“高风险”客户而遭受风险损失,反而通过大数据技术的精准评估在实践中实现了33%的信贷损失的下降。

三、我国民营征信机构信用评估体系改进措施

针对我国现试点的八家民营征信机构所存在的问题,通过借鉴美国大数据征信机构ZestFinance成功的經验,现提出以下三点改进的建议

(一)促进各大平台信息共享,整合数据源

首先,对于结构化数据,各大民营征信机构要加强金融信用信息基础数据库建设,在保证信息安全的前提下,与传统征信机构如人民银行征信系统实现信息共享,尽可能获取用户信用高度相关的信贷数据;其次,对于社交信息、网络行为非结构化数据,各大民营征信机构不仅要依托自身互联网平台资源,也要与其他平台开展合作进行信息采集,获取更全面更客观的数据。通过整合线上线下的数据源,兼顾头部和长尾数据,提升信用产品的质量。

2018年2月,中国人民银行批准百行征信有限公司成为首家获得个人征信业务牌照的机构,由8家民营征信公司分别持股。百行征信集合国内互联网企业巨头如阿里、腾讯的网络平台的数据,同时立足于央行征信系统的用户信贷数据,实现了数据源的整合,具有巨大的发展潜力。

(二)加强国际合作,改进信用评估模型

中国应用大数据征信尚处于起步阶段,国内目前缺乏相关专业人才,其数据挖掘能力、机器学习技术以及在模型的设计方面与欧美发达国家相比具有一定的差距。而同时互联网金融在中国的飞速发展,又带来了丰富的网络数据资源,因此中国的民营征信机构可以利用自身丰富的数据优势,与国外大数据征信企业开展合作,依托其先进的机器学习征信技术,不断改进信用评估模型,提高评分可靠性。

目前,京东、百度均已与美国互联网金融公司ZestFinance建立合作关系。百度作为中国最大的搜索引擎,而京东拥有以京东金融为代表的消费金融体系,二者均掌握丰富的中国客户互联网数据,与ZestFinance强强联手,对其以后开展个人征信业务,降低信用风险具有重要意义。

(三)企业内部加强监管,保证第三方征信独立性

目前我国民营征信机构缺乏独立性主要表现在与母公司旗下其他信贷类业务存在利益冲突,同时担任裁判和运动员的角色难以保证评级结果的公正性。因此要求开展个人征信服务的互联网企业加强内部监管,从公司治理角度规范公司运营,使征信机构与其他业务机构独立开来,避免征信产品与其他如小额借贷、消费金融等业务挂钩。可以引入独立董事监督公司运营,多方面保证第三方征信的独立性。

参考文献

[1]王希军,李士涛.互联网金融推动征信业发展[A].互联网金融发展与监管,2013.

[2]刘新海,丁伟.大数据征信应用与启示—以美国互联网金融公司ZestFinance为例[J].清华金融评论,2014.

[3]李辰.我国大数据征信发展的现状、困境和经验借鉴[J].征信,2016.

[4]刘新海,丁伟.美国ZestFinance公司大数据征信实践[J].征信,2015.

[5]吴晶妹.未来中国征信:三大数据体系[J]征信2013.

[6]Jay Budzik.Explainable machine learning in credit.

[7]ZestFinance Seeks Growth in ‘Huge Chinese Market auto fianance news.

猜你喜欢
大数据
浅谈大数据在出版业的应用
“互联网+”对传统图书出版的影响和推动作用
大数据环境下基于移动客户端的传统媒体转型思路