基于电信运营商大数据分析的个人征信评估模型

2017-11-30 06:26施元元
科技与创新 2017年20期
关键词:通话次数运营商

杨 晟,施元元

(中讯邮电咨询设计院有限公司,上海 200050)

基于电信运营商大数据分析的个人征信评估模型

杨 晟,施元元

(中讯邮电咨询设计院有限公司,上海 200050)

电信运营商在征信领域极具价值,主要研究了如何利用电信运营商大数据分析结果来构建个人征信评估模型。

电信运营商;互联网;身份信息;位置信息

1 电信运营商在征信领域的优势

电信运营商目前在征信行业被视为一块可口的蛋糕。电信运营商在征信行业具有天然优势:①数据覆盖极广。手机号码基本人手一个,三大运营商基本能覆盖所有人群。在这一点上,即使BAT等互联网巨头也是难以望其项背。②随着实名制的普及,身份证号码、手机号码、姓名等真实身份信息之间的关联越来越强,大大降低了征信行业的伪冒风险,冒名申请、代办养卡等行为的难度陡增。③运营商数据能方便地构建出个人关系网。④运营商能提供位置信息的变化,从而建立征信预警机制。

2 个人征信模型

电信运营商的数据优势表现在全面、及时、多形式等方面,如何提取有价值信息,构建合理的个人征信评估模型,是本文研究的方向。

我们将从用户基本信息、消费信息、活动信息、通话分析、数据流量分析、关系分析六大类型数据着手,聚合形成个人的信用评分。

2.1 用户基本信息

用户基本信息包括:①身份证件信息。运营商认可的实名制证件包括了身份证、警官证、军官证、户口本、港澳居民通行证、台胞证这几种。这部分信息主要用于验真使用,对于军官证、警官证可以进行加分处理。②性别信息。性别信息可从身份证件信息中提取。③年龄信息。年龄信息可从身份证件信息中提取,不同年龄段设置不同信息分值。④家庭住址。用户预留在运营商处的住址信息,如果用户有宽带业务,则可以设定为宽带地址。⑤入网时间。用户名下最早号码的入网时间,入网越早信用度越高。⑥VIP等级。用户在运营商处最高的VIP等级。⑦号码数量。由于双卡手机的普及,一个身份证号码可能有多个号码。⑧名下其他业务。比如企业业务、宽带业务、专线业务等。用户基本信息主要用来贷前验真使用,可以作为用户信用分的基本分。

2.2 消费信息

消费信息包括:①名下总消费。用户名下所有业务的月度总消费,可以是半年的平均消费。②名下最高套餐评级。根据用户不同套餐类型,设定不同评级分。③套餐外消费金额。用户超过套餐的消费金额。④消费变化趋势。月度消费的变化趋势。⑤终端型号。用户所使用终端的品牌、型号。⑥终端价格。按1 000元以下、1 000~2 000元、2 000~4 000元、4 000元以上四档分档计算信用分。⑦终端更换次数。提取一年内用户终端更换次数。⑧终端更换价格变化趋势。根据更换终端的价格变化情况计算信用分。⑨欠费次数。月均欠费次数。

2.3 活动信息

活动信息包括:①住宅区域。根据用户在夜晚(比如每日22:00—6:00)登录基站次数最多的位置列为用户的住宅区域。可以分为高档住宅、普通住宅、城中村、乡镇农村、厂区等不同档次区域,分别计算信用分。②工作区域。根据用户在工作日工作时间(非周末的9:30—11:00,14:00—16:00)的位置列为用户的工作区域。可以分为工业区、高档写字楼、普通写字楼、科技园区、政府机关、军队、学校、医院等各种类型,分别计算信用分。③晚餐区域。根据用户在晚餐时间(18:00—19:30)位置列为用户的晚餐区域。将晚餐区域分类,可以分为高档饭店、普通饭店、综合体、快餐等,根据用户在不同场所出现的次数分别计算信用分。④娱乐区域。根据用户在晚餐后时间(19:30—22:00)位置,列为用户娱乐区域。将娱乐区域分类,可以分为KTV、会所、电影院、超市等,根据用户在不同场所出现的次数分别计算信用分。⑤漫游天数。根据用户月均漫游到外地的天数,计算信用分。

用户活动位置的判断主要基于主服务小区更新信息、MR采样信息等判断,同时,前期需要对不同场所进行手动分类。比如对高档住宅、普通住宅等做好分类标签。

2.4 通话分析

通话分析的内容包括:①单月总语音时间;②单月总通话次数;③单月本地通话次数;④省内国内漫游通话次数;⑤通话时间次数变化趋势分析。

根据用户的通话次数、通话时间、不同漫游地通话次数、通话时间次数变化趋势对用户进行信用评分。

2.5 数据流量分析

数据流量分析的内容包括:①数据流量。用户月均数据流量使用量。②数据流量使用变化趋势分析。③即时通讯类流量占比。④各类流量的比例,比如视频流量、游戏流量等。⑤淘宝、京东等消费类网站访问次数。

根据用户的月均流量使用情况、变化趋势、不同流量占比、消费类网站访问次数对用户进行信用评分。

2.6 关系分析

关系分析的内容包括:①快递人员通话次数。结合号码库,计算月均和快递人员的通话次数。②司机人员通话次数。计算月均和滴滴快车等网约车、出租车司机通话次数。③外卖人员通话次数。计算月均和饿了吗等外卖骑手的通话次数。④亲密联系人。提取多位,比如10位频繁通话联系人。

2.7 多指标聚合

基于上述6类指标,采用多指标聚类系数化的方法对上述不同数据进行整合,形成个人的信用评分,计算公式:消费信息得分+活动信息得分+通话分析得分+数据流量得分+关系分析得分×用户基本信息得分=个人信用得分。电信运营商可以直接提供个人信用得分供征信企业使用,也可以给出各个子模块得分,由征信企业自行使用。

3 征信风险预警

目前,用于征信的数据多种多样,比如基本的社保、公积金信息,也有互联网企业的相关信息,比如芝麻信用等。这些信息的实时性都没有运营商的高,手机的普及使得运营商时刻掌握运用的位置估计、通信行为,可以据此建立征信风险预警体系。

3.1 提前预警判断

根据用户通信行为的变化,对用户进行提前征信预警,可以从下列几个方面评分:①名下手机号码增加。②通信行为变化。例如通话次数显著减少,通话时长缩短;③和特定高风险用户联系增多。比如高利贷提供者、境外赌场、彩票站等;④待机状态变化。关机次数增多、挂机次数增多、关机时间增加等;⑤亲密联系人有急剧变化。⑥出现在高风险位置。例如澳门、拉斯维加斯等赌场区域或者传销聚集区域,例如以前的广西北海。⑦异常网络行为。比如接入赌博类APP、用搜索引擎搜索“赌博”“高利贷”等关键词。

一旦用户出现上述非正常的通信行为,偏离其长期平均的模式,即可发出对该用户的征信预警,供征信企业使用。

3.2 高风险警示

如果用户已经成为高风险人员,例如出现逾期不还的情况,或者已被提前预警警示,则我们利用运营商大数据分析可对用户进行高风险警示判断,基本模型为:出现在高铁站、机场、本市高速国道出城口等区域;访问携程、去哪儿、各大航空公司官网等出行相关网站、APP,或与此类业务提供商通话;本人或亲密联系人长时间非正常时间关机,比如工作日连续关机超过5 h。一旦出现上述行为,则可以触发高风险警示,并提供给相关征信企业。

4 总结与展望

电信运营商在征信领域具有天然优势,传统的征信方法和电信运营商、互联网公司提供的大数据分析应该起到互补的作用。电信运营商大数据分析对传统征信无力涉及领域的覆盖,极大提升了征信服务的实时性、提高征信结果的准确性。同时,电信运营商也必须承担相应义务,比如如何确保用户数据的匿名状态,对数据的匿名安全性作出评估,如果数据交易的对象具备对数据复原身份属性的能力,则应当限制此类交易。在交易协议中,需要通过协议来明确交易各方对于数据安全的责任,尤其约束交易方不得再进行身份识别性的利用。

F626

A

10.15913/j.cnki.kjycx.2017.20.056

2095-6835(2017)20-0056-02

〔编辑:张思楠〕

猜你喜欢
通话次数运营商
微信上小额借款 请务必通话确认
2020年,我国汽车召回次数同比减少10.8%,召回数量同比增长3.9%
最后才吃梨
俄罗斯是全球阅兵次数最多的国家吗?
一张图看三运营商政企业务
《戊戌元日与友人通话》
微评
运营商们的4G时代—急需向消费者证明自己
3G视频通话技术获飞跃
哈,我不生气!