基于Logistic回归模型和因子分析法的车险续保率影响因素分析

2019-09-05 02:48昆明理工大学交通工程学院云南昆明650500
物流科技 2019年8期
关键词:续保车险投保

林 海 (昆明理工大学 交通工程学院,云南 昆明 650500)

0 引 言

近年来,我国保险行业稳步发展,财产保险行业也得以快速发展,而车险保费收入在我国整个财险保费收入中占了绝大部分,并且由于汽车行业交易量的增加以及相关政策的出台,车险的投保率逐步提高。但由于车险产品的功能很难做到差异化,车险市场同质性严重,费改后价格竞争和各种高成本的营销手段成为市场竞争的主要策略,使得财险公司在维持市场占有率的情况下很难盈利。在这种情况下,提高车险业务的续保率,维护客户忠诚度对于财险公司的长远经营具有重要意义,分析车险业务中影响续保率的因素,从而锁定目标续保客户群体,实现精准营销。

目前,已有研究从不同角度对续保率影响因素进行研究。Young Moon Chae分别运用决策树C5.0算法、Logistic回归和关联规则对韩国寿险政策是否对投保客户产生有利影响进行分析,并对3种算法运行出来的结果进行比较分析[1]。Shu-Hsien Liao等对台湾的人寿保险市场进行了基于Apriori算法和聚类算法的客户细分,通过对客户需求链的分析,给出了保险企业在新产品开发和客户营销方面的建议[2]。倪琪等利用某保险公司的车险续保数据,探究哪些变量能够较为显著地起到影响作用,并讨论目标客户与普通客户在影响因素上面的共性与差异[3]。王钧等先还原出原始因素表单,然后采用租糙集理论(Rs)产生规则,利用灰色关联度法进行分析,从而获得可信度与各个因素之间的关系,从而推广到续保率与因素的关系[4]。陈曼发现车辆种类的不同会导致续保率的不同,其中家庭自用车的续保率最低[5]。杨子江等认为承保车辆的车龄、车价、品牌等因素对车辆的续保与否有影响,但是并未作出实证分析来印证[6]。王梦晨从客户层面、车辆特征层面及公司政策层面分析了车险业务中影响续保率的因素并选择广义线性模型中的Logistic模型为工具,筛选有解释能力的变量,作为影响续保率显著的风险维度,根据模型结果提出提高续保率的建议[7]。上述研究缺乏对车辆续保率影响机理研究,针对此问题,本文以某保险公司65 535条数据为样本数据,通过对样本数据进行降维处理、异常数据删除及冗余数据合并后提取出19个影响因素,运用Logistic回归模型建立影响车险续保率因素排序分析模型,确定各车险续保率影响因素的重要程度。在此基础上,利用因子分析法表征和计算各因素的关联度,对影响因素进行权重计算,进而为保险公司提高车险续保率提供科学依据。

1 理论与方法

1.1 Logistic回归模型

1.1.1 模型简介

通过微课视频的录制,将临床医学知识碎片化,可以使得规培医师在学习过程中将知识零存整取,有利于将来从事某一专项医师时知识的积累。又可化整为零,将来从事某一专业时,有疑问还可以随时线上查阅。

因为n≥5,n-k≥3,根据性质1,|Ei,j|≥2,取边且边(x,y),(x′,y′)∈Ei,j,则在内存在x与x′间的哈密顿路HP,不妨令HP={x,P1,u,P2,x′}.同理,在内存在y与y′间的哈密顿路HP′,取HP′={y,Q1,v,Q2,y′}.下面构造u,v间内不交的路.

Logistic函数又名生长函数或Pearl-Read曲线。是由比利时数学家P.F.Verhulst在1838年首次提出的,是广义线性模型家族中的一种。此后人们对Logistic模型进行了系统的研究和应用,使得它在农业、经济学、医学等各个领域都占据着非常重要的作用。

1.1.2 模型的建立

通常选取特征值大于1的因子为公因子;将原有变量的统计数据导入SPSS,按照因子分析操作处理,得到因子解释原有变量特征值从大到小排列的结果,结果显示,相关系数矩阵特征值大于1的共有4个公因子。本例中,方差贡献率a1=17.89%,a2=15.88%,a3=11.11%,a4=10.51%,累积方差贡献率a1+a2+a3+a4=55.39%,能够较好地反映大部分数据信息,即认为前4个因子就能基本保留原有数据信息,所以提取4个因子是合适的。

其中:P(Y= 1)表示对于给定的x相应个体选择1的概率。F(z)是Logistic累计概率密度函数。Y通过Logistic函数被转换为概率。

其中:P为保单的续保概率,m为协变量个数(个);β1,β2,…,βn为各个自变量的Logistic回归相关系数;x1,x2,…,xn为影响车险续保率的各个自变量;z与若干个预测变量x呈线性关系。由式(2)得知回归方程的因变量是对数的某个具体选择的机会比。Logistic回归模型的优势是把 [0,1] 区间上的预测概率问题转化为在实数轴上预测一个时间发生的机会。

1.2 因子分析法

(2) KMO与Bartlett球形检验

“因子分析”的名称于1931年由Thurstone首次提出,因子分析的基本目的就是用少数几个因子去描述许多指标或因素之间的联系,即将相关比较密切的几个变量归在同一类中,每一类变量就成为一个因子,以较少的几个因子反映原资料的大部分信息。

1.2.2 模型建立

报告从四个方面展开,首先介绍国家的一些相关政策和新要求,其次对图书馆目前的发展现状和服务进行论述,再次从新技术的角度介绍国内外的一些实践以及西安电子科技大学图书馆的实践,最后对于提升图书馆传统服务提出总结和建议。

因子分析的基本模型如下:设有p个原有变量x1,x2,…,xp,且每个变量(经标准化处理后) 的均值为0,标准差为1。现将每个原有变量用k(k<p)个因子f1,f2,…,fk的线性组合来表示,则有:

根据Logistic回归模型得到的渠道、NCD、签单保费、投保类别、是否投保车上人员、三者险保额、是否投保盗抢、品牌、被保险人性别、车龄等10个影响因素,遵从完备性、科学性、系统性及可操作性等基本原则,分别从产品属性、承包属性、客户属性、标的属性等4个准则层构建评价体系,使评价体系从不同方面综合反映车险续保率影响因素(见表1),运用SPSS多元统计软件进行影响因素权重分析。

2 基于Logistic回归模型车险续保率影响因素分析

2.1 数据来源

(3) 因子个数的确定根据特征值与成分数分析,4个因子满足特征 值λ≥1的原则,因此,因子总数暂定为4个,公共因子可以依据累计方差贡献率来确定,前k个因子的累计方差贡献率定义为,其中ak为前k个因子的累计方差贡献率为第i个因子的方差贡献;λi为第i个特征值。

2.2 变量选取

多重共线性是指线性回归模型中的预测变量间存在高度相关的关系,会导致模型的估计值产生偏差。应用方差膨胀因子(Variance Inflation Factor,VIF)对模型的预测变量进行检验,排除有显著共线性的变量。一般认为,当VIF>10时,说明自变量之间具有显著的共线性,需要剔除相应的自变量。针对样本数据中的28个影响因素,根据多重共线性检验结果,剔除不显著变量后,得到渠道、品牌、投保类别、新车购置价、车龄、NCD、被保险人性别、被保险人年龄、是否投保车损、是否投保盗抢、是否投保车上人员、三者险保额、签单保费等13个影响因素,确定此13个影响因素作为自变量。

2.3 结果分析

运用SPSS Modeler数据挖掘软件建立Logistic回归模型,得到车险续保率影响因素的重要性排序,如图1所示。

检验是否适用因子分析的常用统计量,包括KMO检验以及Bartlett球形检验。经过计算,检验结果KMO值为0.543>0.50,说明适合使用因子分析;同时,Bartlett球形检验对应的P值为0.000,小于给定的显著性水平p=0.05,因此认为原有变量适合作因子分析。

3 基于因子分析法的车险续保率影响因素权重确定

3.1 计算步骤

(1)评价指标体系构建

用矩阵的形式表示为:

1.2.1 方法简介

从图1中可以看出渠道、NCD、签单保费、投保类别、是否投保车上人员等因素对是否续保的影响较大。

图1 车险续保率影响因素的重要性

表1 指标汇总表

本文运用某保险公司的部分续保数据来说明Logistic回归模型在续保模型中的应用。由于考虑到选取的解释变量的同质性问题,仅选取部分家庭自用车作为样本进行建模,剔除无效样本及对样本数据进行降维处理、异常数据删除及冗余数据合并后,样本容量大约有26 734条。

Logistic回归模型被用于描述二分类变量(因变量为0和1)和一个或多个自变量之间的关系。Logistic回归模型的一般表达式如下:

由于地理位置、开发条件和国家政策的原因,西沙群岛群岛邮轮旅游仅停靠全富岛、银屿岛和鸭公岛三座岛屿,线路单一。因全富岛、银屿岛和鸭公岛三座岛屿面积小,成熟开发的旅游产品少,游客体验好感度下降。加之西沙群岛的地理位置,极易受台风影响,邮轮旅游产业脆弱性高。

3.2 结果分析

通过SPSS软件得出车险续保率影响因素权重排序,第一主因子产品属性包括是否投保车上人员、是否投保盗抢和签单保费是影响车险续保率的首要关键因素,综合权重达0.32;第二主因子承保属性包括渠道、投保类别、车龄、NCD是影响车险续保率的次要关键因素,综合权重达0.29。

自贸港金融与当地发展水平和定位紧密关联,为此必须形成总分协同的战略执行体系。综合金融服务方案设计必须要求分行之间、业务条线之间的协同合作,整合已有自贸区业务、未来的自贸港业务、离岸业务和境外机构资源。因此,商业银行应加强总行层面的顶层设计,建立专司自贸港业务的领导协同小组,制定整体自贸港金融服务发展规划。同时,在组织架构上建议研究制定自贸区/港分支机构架构管理办法,以减少沟通汇报层级,提升管理效率。

4 结论

(1)本文以某保险公司26 734条保险样本数据为分析对象,通过Logistic回归模型中的多重共线性处理剔除不显著变量后,得到渠道、品牌、投保类别、新车购置价、车龄等13个影响因素。应用Logistic回归模型构建车险续保率影响因素重要程度排序图,结果表明,排名前十的车险续保率影响因素分别是:渠道、NCD、签单保费、投保类别、是否投保车上人员、三者险保额、是否投保盗抢、品牌、被保险人性别、车龄。

1.1 研究对象 以2017年贵州大学参加测试的全体学生为测试对象,共计28 302人,具体情况见表1、表2。从表1、表2中可以清晰看出贵州大学虽地处西部,但学生来源涵盖了29个省、直辖市和自治区,包含了31个少数民族及其他(以穿青人为主)。针对大学生体质健康研究,取贵州大学这个整群作为调查对象具有一定的代表性。

依托长流规,加强治江顶层设计。规划是治江各项工作的龙头。2013年,长江委切实加强治江顶层设计,长江流域水利规划和前期工作进展顺利。结合新修编的长流规对水利工作提出的新要求和治江工作实际,长江委广泛、深入地开展宣贯工作,提高了全委干部职工及社会各界对长流规的认识和了解。同时,组织开展了数十项水利规划编制工作,其中,修订完成《长江中下游干流河道治理规划》,编制完成岷江、雅砻江、赣江、沅江等流域综合规划,基本完成湘江、资水、抚河、信江等流域综合规划。加紧组织开展长江流域(片)水中长期供求规划、主要江河流域水量分配方案制定、全国治涝规划等规划编制工作。

(2)由因子分析法确定的各因素的综合权重排序可知,产品属性包括是否投保车上人员、是否投保盗抢和签单保费是影响车险续保率的首要关键因素,承保属性包括渠道、投保类别、车龄、NCD是影响车险续保率的次要关键因素。因此,保险公司在制定精准营销策略时需要有针对性和侧重点,从而有效提高客户车险续保率。

猜你喜欢
续保车险投保
基于改进DeepFM的车险索赔预测模型的研究
一种基于5G网络平台下的车险理赔
基于二元Logit模型对车险续保影响因素的研究
保险投保与理赔
短期医疗险,你了解多少?
车险客户续保率
互联网财险投保者
公路工程保险投保策略
基于 Tweedie 类分布的广义可加模型在车险费率厘定中的应用