基于Probit的网络借贷成功影响因素分析

2016-03-10 09:10李明初
会计之友 2016年4期
关键词:P2P网贷

李明初

【摘 要】 面对国内网络借贷行业快速发展、行业风险逐步暴露、法律监管体系尚不完善的发展现状,文章在明确清晰地界定了网络借贷,特别是P2P网贷范围后,以拍拍贷为例,通过抓取拍拍贷平台上最近的75 450条交易数据并利用Probit二元选择模型,分别从影响投资人借款认可度因素以及影响平台借款认可度因素两个层次,对影响借款人借款成功的因素进行了实证分析。根据实证分析结果,针对借款人如何提高投资人和网贷平台借款认可度提出可行性建议。

【关键词】 P2P网贷; Probit模型; 借款成功因素

中图分类号:F724.6;F832.4 文献标识码:A 文章编号:1004-5937(2016)04-0100-07

一、引言

(一)选题背景

P2P网络借贷是peer to peer lending的缩写,亦被称为“人人贷”。即由具有资质的P2P网络借贷平台(第三方公司)作为中介平台,借款人在平台上发放借款标,拥有资金并有投资理财意愿的投资人,通过该平台获取信息、参与竞标、进行交易操作,从而将资金贷给资金需求方的行为。P2P网络借贷平台,是在互联网上为借贷双方提供信息发布、交流沟通以及促成交易的第三方金融服务网站,其仅作为交易的技术支持方,而本身并不作为借贷资金的债权债务方。一般来说,P2P网络借贷平台的具体服务形式包括:借贷信息公布、资格审核以及信用评级、投资咨询、风险控制、逾期贷款追偿以及其他增值服务等。

自2007年起至今,P2P网络借贷公司发展经历了由零起点到爆发式增长的过程。据国内第三方网贷资讯平台网贷之家的统计与估算数据,2013年P2P行业整体贷款存量约268亿元,出借人数更是远超20万人。本文正是基于国内P2P网贷行业快速发展、行业风险逐步暴露、法律监管体系尚不完善的发展现状,试图通过以拍拍贷为例探究P2P平台下影响借款成功的可能因素,建立判断借款成功的预测模型,并以此来指导借款人通过有针对性地提高某些影响因素以提升P2P平台借款成功率,从而确保P2P网贷平台的良性平稳健康发展。

(二)文献综述

1.国外文献综述

国外学者对于借款人借款成功率以及借款利率的影响因素研究表明,借贷行为的影响因素主要为财务信息、人口特征、信用评级以及社交网络等软信息。

Freedman & Jin(2008)在研究中发现,在借贷平台要求借款人提供了自己更多的财务信息后,借款人的借款成功率将会上升。Herzenstein(2008),Ravina(2008),Pope & Sydnor(2008)等的研究表明,借款人的年龄、性别、外表以及种族等人口特征对借款成功率和借贷利率具有显著的影响。Klafft(2008)通过对Prosper平台的交易数据进行分析,证明借款人的信用评级是对借款利率影响最大的因素。然而不同的是,当研究的被解释变量变成借款是否成功时,借款人银行账户的存在与否却成为决定借款能否成功的最重要因素。

Lin et al.(2009)在针对社交网络中的关系嵌入维度进行研究后,最终的结论是:关系型社会资本可以有效降低由信息不对称带来的逆向选择风险。Greiner et al.(2010),Sergio Herrero-Lopez(2009),Steh Freedman(2010)等的研究进一步肯定了Lin等的研究结论,认为当借款人拥有的社会资本越多时,其借款成功几率越高,借款利率越低,并且违约概率更低。

Laura Larrimore et al.(2011)通过分析借款人列表上的语言描述来检验P2P借贷环境下语言使用和说服成功之间的关系,从而为借款人增强对投标人的借款说服力提供了指导建议。类似的,Sonenshein,Herzenstein,Dholakia(2011)的研究同样表明了信用等级较低的借款人仍可以通过合理的解释赢得投资人的信任,从而影响投标人的借出决定。

Eunkyoung Lee & Byungtae Lee研究证实了P2P网络借贷中的羊群效应,表明投标的参与度越高,借款人与投标人之间的互动与交流越多,越容易吸引更多的出借人参与投标。同样的,Puro et al.(2010)对P2P平台上的从众行为进行了实证分析,发现竞标过程中贷款人的从众心理是显著的。

2.国内文献综述

与国外的研究重点不同,我国国内学者对P2P网贷平台的研究主要集中在P2P网络借贷的发展历程及发展模式、平台介绍、作用与意义、风险与监管以及少量的实证分析等方面。温小霓、武小娟等(2014)利用拍拍贷平台上的交易数据进行实证分析,结果发现借款金额、借款人历史成功次数、信用积分、审核项目数对借款结果有正的影响。这一结果与郭奕(2011)、李文佳(2011)等的实证基本一致。陈霄(2014)通过对平台内存在的“羊群行为”进行分析后发现标的特征、信用和地区因素对借款人成本具有显著影响。张娜(2010)从社会资本的角度出发,认为出借人对借贷平台以及借款人的信任、借款人的信用和借款人的社会关系资本会显著影响出借人对借款人的信任。

3.文献述评及本文创新

由国内外有关P2P网贷的研究重点差异可见,我国有关P2P网贷平台主要还是集中在P2P网贷模式的比较分析,以及P2P网贷面临的主要风险方面,对P2P网贷的实证研究比较缺乏,虽然已有部分学者已经对相关实证研究进行了初步探索,但无论是在数据的选取与设定上,还是在模型的选择上,都还有一定的提升空间。

基于目前我国P2P网贷研究的现状,本文拟以拍拍贷平台为例,希望通过对借款人分别赢得投标人以及网贷平台信任的影响因素的分析,深入探究影响借款人借款成功的因素,并寻找能够较为准确地预测借款人的借款成功可能性的回归模型,在弥补目前P2P网贷实证分析不足的同时,也能够为借款人的行为提供有效的指导。

本文最大的亮点就在于分赢得投资人信任和在赢得投资人信任之后赢得网贷平台信任两个阶段来探究P2P网贷中借款成功的影响因素。从两个阶段的分析方式可以很明显地看出,对于投资人和平台来说,双方的关注重点差异。投资人希望以最小的风险争取最大的收益,而平台则更在意借款人的真实还款能力和提供信息的可靠性,其目的在于保护投资者权益。此外,在数据的抓取与处理上,与以往仅抓取网页部分指标不同,本文利用了网站现有公开的全部信息,同时对原始数据根据网页存储数据特点进行了一定调整,力求最大限度地还原投资人投资历史时期下所见借款信息。同时,本文抓取的是最近交易的7万余条数据,时效性最强、数据量最大。

二、研究样本和变量

(一)数据来源

在变量的设置以及选取上,本文基于Microsoft Excel VBA编程环境,采取了可扩展超文本传输请求(XMLHttpRequest)方法,在拍拍贷平台上抓取了75 450样本数据,并以拍拍贷平台上显示的全部公开信息为依据,将变量分成了三个大类:借款信息(X)、借款人信息(Y)以及历史借款信息(Z)。借款信息表明本次借款标的对贷款人的吸引程度,由定量的借款基本信息(X1)和定性的借款其他信息(X2)两个子分类构成;借款人信息说明了贷款人对借款人本人的认可程度;历史借款信息则表示了贷款人对平台的认可程度。

最终,汇总本文所涉及的全部变量如表1所示。

(二)变量描述性统计

由表2描述性统计结果可以看出,是否满标的平均值为0.335,表明样本满标率仅为33.5%,仅有33.5%的借款人能够争取到投资人信任;而借款状态的平均值仅为0.228,说明最终借款成功率仅为22.8%,占满标的67.9%,说明在争取到投资人信任后,仅有一半多的借款人能够获得平台认可。可见,目前拍拍贷平台上借款人面对的两大问题就在于如何争取到更多的投资人信任以及如何获得平台的认可。

三、实证检验结果与分析

(一)相关性分析

从表3变量间的相关系数可以看出,除变量C4与C5之间相关系数超过0.5外,其他各变量间的相关系数均未超过0.5,说明变量之间相关性不强,因此,可以认为模型基本上不存在多重共线性。对于是否审错就赔付(C4)以及是否已通过预审(C5)之间存在相关性的问题,在之后的模型中采取了保留是否已通过预审这一变量的策略。

(二)模型建立

在探究影响借款人借款成功的因素时,投标是否满标(RES)是一个二元因变量,而在解释变量中如性别、借款目的等变量都是离散变量,因此本文采用了二元选择模型中的Probit模型进行回归分析。

二元离散模型定义为:

{yi}是一组取值为1或0的独立离散随机变量,xi是已知常数的K维向量,β0是未知参数的K维向量,F是已知函数。

一般而言,F函数形式应用频率较高的是线性概率模型、Probit和Logit模型。由于线性概率模型具有明显的缺点:F的取值并没有限制在0和1之间,因此线性函数并不是一个合适的分布函数。而由中心极限定理可以证明Probit模型的合理性,Logit模型与Probit模型类似。Probit模型可以有效地解决二元因变量的回归问题,同时在处理离散解释变量时也能够很好地将其转化为哑变量并进行回归。其函数形式如下:

本文将借款人由提交借款申请到最终获得借款成功细分为两个过程:首先借款人发布借款信息后在结束时间前达到满标状态是获得借款成功的第一步,即由足够多的投标人愿意借钱给借款人并表现为投标完成,也可以说借款人赢得了投标人的认可;其次投标完成的借款项目将会递交至拍拍贷平台进行借款审核,只有通过借款审核的借款标的才会最终获得资金,这一步体现了借款人是否赢得了平台的认可。因此在具体的建模过程中,本文同样分为两个部分:一是探究借款人赢得投标人认可的影响因子,以借款标的是否满标,也就是投标是否完成为被解释变量;二是在借款人已赢得投标人认可的基础上,探究借款人赢得平台认可的影响因子,以借款是否成功为被解释变量。

四、影响借款人借款成功因素的实证分析

(一)影响投资人借款认可度因素的实证分析

由前文所述,借款人需要获得足够多投资人的认可才能使借款标的被投满,这是借款人获得借款的第一步。因此首先以是否满标(RES)为二元因变量,以借款信息、借款人信息以及历史借款信息为解释变量,探究影响投资人对借款判断的因素。要特别注意的是,由于借入信用(C_1)是Di(i=1,2,…,9)之和,因此本文仅以C_1作为借款人的综合借入信用而不进一步对其进行拆分。如无特别说明,此规定适合于本文的全部模型。在剔除了不显著变量后,本文得到的回归结果如表4。

表4下方是模型的拟合优度检验,从表中所示Andrews和Hosmer-Lemeshow检验的结果表明,模型拟合效果十分显著。

进一步的,表5为根据概率Pr(yi=1|xi)的预测值是否高于分界概率0.5的情况下模型的期望-预测表(E-P)表。

由表5中数据不难发现,模型依照概率划分而得出的正确百分比(96.65%)预测的准确率非常高,这说明在现有模型下,对借款人借款是否成功的预测误差率几乎可以控制在5%之内。

对于二元选择模型,其系数的经济解释比较麻烦,不能直接理解为对被解释变量的边际效应,因此本文主要从解释变量系数的正负符号来定性地对回归结果加以说明。表6列出了通过模型回归得出的各解释变量对被解释变量的影响方向。

(二)影响平台借款认可度因素的实证分析

在借款人获得了投资人认可之后,即投标完成,也就是满标之后,借款人接下来面临的就是平台的审核环节,换句话说,就是借款人需要进一步得到平台的认可后,才能成功筹得资金。类似的,本文仍采用Probit模型,以借款成功(FIN)为二元因变量,以借款信息、借款人信息以及历史借款信息为解释变量进行建模,希望以此来为借款人提高借款成功率作出指导。

在数据的调整上,本文在原有调整得到的60 837条数据中,将投标未完成的借款全部剔除,仅留下已经获得投资人认可,但借款尚需平台核准的样本数据。同时,模型同样剔除了对是否借款成功影响并不显著的解释变量T、C4、L2、L3、L5、G、A。经过筛选,最终留下了20 406条借款信息。

对以上样本进行建模,同样的,得到结果如表7,可以看到模型的拟合优度也十分显著。

表8显示的E-P表表明,依照概率划分而得出的正确百分比为91.78%,其预测的准确率相较上一模型有所下降,但仍保持了90%以上的预测准确性。由此说明,在投资人依照现有公布的信息已经做出“是”的判断的情况下,平台对借款的最终审核除了依靠对外公布的信息外,还加入了一些非公开信息的因素的考量,导致了模型预测准确性的降低。虽然预测的错误率相较之前的确有了一定程度的升高,但是整体的预测效果依然是可以接受的。最终,同样得到了各解释变量对被解释变量影响方向的汇总表,见表9。

(三)回归结果分析

通过表9和表6的对比发现,在选取的解释变量上,两者已经产生了很大程度的分歧,这说明投资者和平台借款审核者的关注点并不完全一致,这种不一致使借款安全性进一步增强。其差异具体表现在如下方面:

1.借款信息

在借款基本信息上,借款金额对借款成功的影响进一步削弱,说明平台更有理由相信借款金额与借款人信用评级有密切的相关性;借款期限对借款成功带来了负效应,说明投资人和拍拍贷平台在借款期限上的看法是一致的,期限越长,风险越高。特别要注意的是,投资人和拍拍贷平台在借款年利率的看法上出现了明显的分歧,借款年利率对借款成功的影响产生了负效应。因为对于拍拍贷平台而言,高收益并不是其审核的核心,而有效控制借款风险才是平台审核的重点。在同等条件下,借款人的借款利率越高,说明平台与借款人之间的信息不对称可能就越严重,那么投资人遭受的违约可能性就越大。因此,平台会考虑控制一部分具有过高借款利率的借款标的的发布。

在借款其他信息上,特别需要注意的是非提现标变量的负系数。这表明平台对于非提现标的态度是比较谨慎的,事实上,这样的态度具有一定的合理性。因为非提现标指的是借款人在获得借款后资金不会变现,而仅仅会在平台上进行投资流转,这表面看起来似乎保障了借款在平台控制下的安全,但实际上扩大了平台风险,一旦一笔资金通过多笔非提现标进行转手后,在每一次借款利率进行积累的同时,借款风险也不断加大,当链条末端的最后一个借款人无法投资到比借款利率更高的产品时,他就将选择违约,那么这个违约风险将会顺着债权债务关系层层扩大,最终可能引发平台借款的大规模违约事件,导致平台的倒闭。因此,平台对非提现标采取谨慎的态度有利于对平台风险的掌控。

2.借款人信息

在借款人信息上,性别和年龄已经不是平台审核借款的重点,与投资人更为不同的是,平台在借款审核中更看重借款人的身份。由回归结果可以看出,无论是工薪族、学生,还是私营业主、网店卖家,这些身份对借款的最终成功都具有显著且较强的正效应,但这四个变量的系数相差并不是很大,说明在平台看来,借款人身份的差异对借款成功影响造成的波动并不大。这说明平台在审核借款资质的过程中,更加注重借款人信息和资料的完整性,如果借款人对自身信息披露较为充分,那么毫无疑问他将更容易获得平台更大的认可度。

3.历史借款信息

在历史借款信息中,成功次数、流标次数以及借入信用给平台借款审核带来的影响与给投资人投资带来的影响基本一致,这反映了平台对于平台本身统计数据的认可程度。

五、总结与建议

本文通过建立Probit二元选择模型,探究了显著影响投资人以及网贷平台对于借款判断的可能因素,并通过拟合优度等检验进一步加强了模型结论的可靠性。经过对模型解释变量的逐步调整后,本文最终得到了对投资人行为预测具有95%以上准确率、对网贷平台借款审核结果预测具有90%以上准确率的回归模型。这是目前为止,在国内对P2P网贷平台上借款人借款成功影响因素的实证研究中,准确性最高、涉及变量最为全面的模型结果。

经过以上两个回归过程,可以对借款人如何提高投资人和网贷平台的认可度提出如下建议:

在借款信息上,合理设定借款年利率以及注意对特殊标的类型的申请。借款年利率应设定在自己能够承受且对投资人有足够吸引的范围内,同时要注意过高的年利率可能对平台认可度造成的负面影响;同时,要注意尽可能申请特殊标的类型,以便大大提高投资人对借款的认可度,特别是安全标等,会对借款的成功起到极大的推动作用。

在借款人信息上,虽然对于性别和年龄产生的或负或正的影响不是借款人所能左右的,但是意识到这些固有因素的潜在影响,有利于借款人通过其他方面的改善来得以弥补。特别是在个人职业等软信息上,借款人要特别注意资料的真实完整性,这对于争取投资人和平台的信任都具有显著效果。

在历史借款信息上,借款人要慎重申请借款,确保借款记录的良好对于以后借款所产生的持续放大作用具有极为重要的意义。特别要警惕借款流标的可能性,可以通过本文的回归模型加以预测,并有针对性提高借款成功的可能性,有效避免流标情况的发生。这一方面对积累个人信用具有重要作用,同时较低的流标次数也会对投资人和网贷平台释放积极的信号,有利于达到最终借款成功的目的。

到目前为止,由于P2P网贷平台尚处在新兴发展阶段,市场各方力量还在不断成长,尚不成熟,因此其借款利率还没有实现资源的最优配置,平台的风险控制机制还有待实践的检验,平台所面临的政策风险还有待进一步明确和评估。随着P2P网贷平台的进一步发展,行业自律组织以及相关法律法规的不断成熟,P2P网贷平台将会更大程度地发挥其普惠金融的优势,这不但能让更多的人享受到P2P网贷发展带来的福利,同时对提高我国利率市场化程度将产生巨大的影响。

【主要参考文献】

[1] SETH F,GINGER Z J. Do social networks solve information problems for peer-to-peer lending? evidence from prosper. com[D]. NET Institute Working Paper, 2008.

[2] GREINER M, WANG E H.The role of social capital in people-to-people lending marketplaces[D]. ICIS Proceeding Paper,2009.

[3] LEE E,LEE B. Herding behavior in online P2P lending: An empirical investigation[J]. Electronic Commerce Research and Applications, 2012, 11(5): 495-503.

[4] LIN M, PRABHALA N, VISWANATHAN S. Judging borrowers by the company they keep: friendship networks and information asymmetry in online peer-topeer lending[J]. Management Science, 2011, 59(1): 17-35.

[5] PETER R. Lending Club 简史[M]. 北京:中国经济出版社,2013.

[6] 第一财经新金融研究中心.中国P2P借贷服务行业白皮书(2013)[M].北京:中国经济出版社,2013.

[7] 芮晓武,刘烈宏.中国互联网金融发展报告(2013版)[M].北京:社会科学文献出版社,2014.

[8] 谢平,邹传伟.互联网金融手册[M].北京:中国人民大学出版社,2014:167-189

[9] 陈霄.民间借贷成本研究——基于P2P网络借贷的实证分析[J].金融经济学研究,2014(1):37-48.

[10] 温小霓,武小娟.P2P网络借贷成功率影响因素分析——以拍拍贷为例[J].金融论坛,2014(3):3-8.

[11] 牛瑞芳. 我国网络借贷行业的发展问题及对策研究[J].会计之友,2014(19):15-17.

[12] 廖理,李梦然,王正位.聪明的投资者:非完全市场化利率与风险识别——来自P2P网络借贷的证据[J].经济研究,2014(7):125-137.

[13] 李广明,诸唯君,周欢.P2P网络融资中贷款者欠款特征提取实证研究[J].商业时代,2011(1):41-42.

[14] 谢平,邹传伟.互联网金融模式研究[J].金融研究, 2012(12):11-22.

[15] 张娜.P2P在线借贷研究述评[J].经营管理者,2010(8):299.

猜你喜欢
P2P网贷
基于保险的互联网金融网贷平台风险控制
网络借贷中非法集资类犯罪的司法认定
我国P2P网贷行业的发展状况及对策分析
新规视角下P2P网贷的监管剖析与研究
P2P全方位风险管控模式初探
中国P2P网贷行业借贷风险防范研究
浅析我国P2P网络借贷的主要运营模式
浅析我国P2P网络借贷的主要风险