新Lorenz曲线模型及应用

2016-12-20 12:31杜文超刘亚相
统计与决策 2016年23期
关键词:年份性质分组

杜文超,刘亚相

(西北农林科技大学 理学院,陕西 杨凌 712100)

新Lorenz曲线模型及应用

杜文超,刘亚相

(西北农林科技大学 理学院,陕西 杨凌 712100)

Lorenz曲线作为分析国家收入分配状况的重要工具,近年来得到广大学者的关注和广泛应用。文章提出了新的Lorenz曲线模型,通过Monte Carlo数值模拟及实际应用分析,并与十个经典的Lorenz曲线模型作对比,来说明新模型的优越性和合理性。

Lorenz曲线;新模型;数值模拟;实际应用

0 引言

在经济学研究领域,Lorenz曲线是分析国民收入和财富分配状况的重要工具,并受到广泛应用。Lorenz曲线首先由Max Otto Lorenz提出,随后受到许多学者的关注。目前,Lorenz曲线模型的建立主要有3种方法:几何算法、曲线拟合法和分布函数法。本文讨论的内容属于曲线拟合法,基于前人的研究,根据Lorenz曲线所具有的性质,构造了新的Lorenz曲线模型。

1 模型的建立

1.1 orenz曲线的定义

Lorenz曲线L(p)表示的是收入小于或等于x的人口所拥有的收入占总收入的比例,即:

其中,μ是平均收入,x表示收入,f(x)是收入分配的密度函数。记收入分布函数为F(x),p=F(x)表示收入小于或等于x的人口比例,F-1(p)表示F(x)的反函数,那么Lorenz曲线还可以表示为:

1.2 Lorenz曲线的性质

由定义可知Lorenz曲线L(p)具有如下性质,

性质1也是使函数L() p成为Lorenz曲线的充分必要条件。1999年Jose-Maria Sarabia等人研究了Lorenz曲线的衍生模型,提出如下性质:

性 质2:若 L(p )是 一 个Lorenz曲 线 ,考 虑Lα(p)=pαL(p),α≥0,

当α≥1时,Lα(p)是一个Lorenz曲线;

当0<α≤1,且L‴(p)≥0时,Lα(p)是一个Lorenz曲线。

2011年,王祖祥等人在Sarabia等人研究的基础上,进一步分析了Lorenz曲线,扩充了Lorenz曲线的性质,提出性质3。

性质3:假设 f(p)和g(p)都是Lorenz曲线。那么L(p)=f(p)αg(p)υ也是Lorenz曲线,只要下面任一条件成立:

①α≥1,υ≥1;

[ ]

0,1上递增;

1.3 新模型的构建

Kakwani和Podder(1923)提出了较早的Lorenz曲线模型:

随后,Rasche et al(1980)、Gupta(1984)、Chotikapanich(1993)、Jose-Maria Sarabia和Enrique Castillo(1997)相继提出如下Lorenz曲线的经典模型:

2009年,Wang等人根据Schader和Schmid于1994年提出的模型

在模型(7)的基础上用e-γp替换了ηpγ,提出了如下模型:

并指出该模型比基于Pareto分布而得到的Lorenz曲线基础模型:

具有更高的拟合精度。此外,国内外学者还提出了许多衍生的Lorenz曲线模型,例如:

本文利用Lorenz曲线的性质,基于前人提出的基础模型,构造了如下四个新模型:

令f(p)=1-e-ap(1 -p)b,g(p)=1-(1-p)c。则当0<b≤1,0≤a+b≤时,f(p)为Lorenz曲线模型(8)且f‴(p)≥0;当0<c≤1时,g(p)为Lorenz曲线基础模型(10);当0<c≤1,d≥1时,g(p)d为Lorenz曲线模型(5)。由 Lorenz曲线的性质 1可知,当 0<b≤1,0≤a+b≤, 0<c≤1 时 , 均 有f′(p)≥0,f″(p)≥0,g′(p)≥0,g″(p)≥0,进而当m∈[0 ,1]时有 L11′(p)≥0,L11′(p)≥0,p∈[0 ,1] 。且 L11(p)满足L11(0)=0,L11(1)=1。故L11(p)为Lorenz曲线模型。同理可知当0<b≤1,0≤a+b≤,0<c≤1,d≥1,m∈[0 ,1]时,L12(p)也为Lorenz曲线模型。再根据性质3可得,当0<b≤1,0≤a+b≤,0<c≤1,d≥1时,L13(p)为Lorenz曲线模型;当0<b≤1,0≤a+b≤,0<c≤1,d≥1时,L(p)也为Lorenz曲线模型。14

2 模型数值模拟比较

基于Monte Carlo数值模型,对本文提出的四个Lorenz曲线新模型与已有的十个经典Lorenz曲线模型的拟合结果进行对比,来表明其拟合效果。

成邦文(2005)指出,社会经济规模指标近似服从对数正态分布。由此,本文假定收入变量X~lnN(μ ,σ),F(x)为X的分布函数,则Lorenz曲线上任一点所对应的横坐标满足p=F(x),且Lorenz曲线满足L(p)=Φ(Φ-1(p)-σ),其中Φ与Φ-1分别表示标准正态分布函数及其逆函数。由Lorenz曲线与收入分布函数之间关系,利用Monte Carlo数值模拟方法,生成服从对数正态分布的随机数,再分别计算收入分布函数值及Lorenz曲线函数值,进而估计Lorenz曲线模型。

本文采用最常用的三个指标来比较拟合效果:均方根误差(RMSE)、平均绝对误差(MAE)以及最大绝对误差(MAS)。为使得模拟结果不失一般性,本文取μ=0,σ=1,模拟100次,结果如图1至图3所示。图1至图3分别给出了模型L1~L14拟合效果指标RMSE、MAE、MAS的箱线图。在图中,箱线图的高低代表了模型拟合误差的大小,箱体触须的长短则代表了模型拟合效果的稳定程度。在图1中,本文提出的模型L14拟合效果最好,其次为L12、L13和L7;在图2中,L14仍表现最佳,其次为L12和L13;在图3中,模型L14要较之其他模型有明显的优势,其次为L12和L13。综合图1至图3,可以看出本文提出的模型L14具有非常好的拟合效果,并且拟合结果稳定;其次,本文提出的模型L12、L13相较于已有模型也具有较好的拟合效果,L11略次之。

图1 均方根误差箱线图

图2 平均绝对误差箱线图

图3 最大绝对误差箱线图

3 模型的实际应用

本文选用2013年第十届华为杯全国研究生数学建模竞赛“中等收入定位与人口度量模型研究”中的数据来检验模型实用性。本文所使用的原始数据见表1至表3所示。其中,竞赛E题表1收入分配分组数据用来比较新模型与已有模型的拟合效果;表2和表3收入分配分组数据则用来检验新模型对Lorenz曲线的描述能力。

表1 收入分配分组数据

表2 收入分配分组数据(地区A,年份之一)

表3 收入分配分组数据(地区A,年份之二)

3.1 拟合效果比较

运用Lorenz曲线模型L1(p)~L14(p)分别对竞赛E题中的表1收入分配分组数据进行拟合,拟合效果如表4所示。从表中可以看出,拟合效果最好的为本文提出的四个模型L11(p)、L12(p)、L13(p)、L14(p),并且相较于已有模型,具有明显的优越性,其中L14(p)表现最佳,误差最小。

表4 Lorenz曲线模型拟合结果

3.2 新模型实际应用

为更好地说明新模型的优越性和合理性,本文选用L12(p)和L14(p)模型对竞赛E题中表2和表3收入分配分组数据进行拟合,从而检验新模型的实用性及对Lorenz曲线的描述能力。

L12(p)、L14(p)对地区A在年份一和年份二的收入分配分组数据拟合效果如图4和图5所示,其中黑色实线是真实Lorenz曲线,黑色虚线是模型拟合的Lorenz曲线。

图4 地区A在 L12(p)模型下拟合的Lorenz曲线

从图4和图5中可以看出L12(p)与L14(p)模型拟合出的Lorenz曲线几乎与真实Lorenz曲线完全重合。在图4中,新模型L12(p)对年份一和年份二数据的拟合都表现出当p=0.7至p=0.9时误差变大,该模型低估了高分位点的总收入比重,因此由该模型计算的Gini系数将比真实值偏大。在图5中,新模型L14(p)对数据的拟合也出现了低估高分位点总收入比重的情况;在年份一中,当p处于0.8附近时,该情况表现明显;在年份二中,该情况得到明显的改观,拟合曲线几乎完全逼近真实曲线。总体来说,新模型L12(p)和L14(p)均具有很好的拟合效果,都能够几乎准确的表现真实Lorenz曲线,其中L14(p)表现更好,误差更小。

图5 地区A在L14(p)模型下拟合的Lorenz曲线

4 结论

本文利用Lorenz曲线的性质,在前人研究的基础上,提出了四个新Lorenz曲线模型,通过数值模拟和实际应用,新模型较之已有模型,表现出明显的优越性和有效性,新模型能很好的逼近真实Lorenz曲线,更加精确地描述真实Lorenz曲线,反映收入分布状况。新模型对于计算Gini系数以及更深一步的研究,具有很好的利用价值和参考意义。

[1]Ogwang J,Rao U L G.Hybrid Models of the Lorenz Curve[J].Econom⁃ics Letters,2000,(69).

[2]Sarabia J M,Castillo E,Pascual M,et al.Mixture Lorenz Curves[J].Eco⁃nomics Letters,2005,(89).

[3]Wang Z X,Ng Y K,Smyth R.A General Method for Creating Lorenz Curves[J].Review of Income and Wealth,2011,57(3).

[4]Wang Z X,Smyth R.A Hybrid Method for Creating Lorenz Curves[J]. Economics Letters,2015,(129).

[5]许启发.一个新的Lorenz曲线模型[J].数量经济技术经济研究, 2014,(11).

[6]成邦文.基于对数正态分布的洛伦兹曲线与基尼系数[J].数量经济技术经济研究,2005,(2).

[7]杨宝莹.广义Lorenz曲线的非参数统计推断[J].中国科学:数学, 2012,(3).

(责任编辑/浩 天)

F222.3

A

1002-6487(2016)23-0077-03

杜文超(1991—),女,黑龙江伊春人,硕士研究生,研究方向:居民收入分配及消费。

(通讯作者)刘亚相(1962—),男,陕西宝鸡人,博士,教授,研究方向:博弈论、金融数学、经济数学。

猜你喜欢
年份性质分组
特殊的一年
随机变量的分布列性质的应用
完全平方数的性质及其应用
九点圆的性质和应用
分组搭配
怎么分组
厉害了,我的性质
分组
什么是闰年?
一样的年份