中国居民代际收入流动性的水平、来源与潜力测算——来自CGSS 和CHIP 的经验证据

2022-06-27 09:00刘李华
南开经济研究 2022年4期
关键词:子代代际潜力

刘李华 孙 早

一、引 言

与收入分配的结果相比,个体在发展机会上的公平性受到了越来越多的关注,而合理、适度的社会性流动既是提高机会公平程度和增强居民幸福感的必要条件,更是激发社会活力、促进经济健康可持续发展的重要保障。党的十九大报告指出,要“破除妨碍劳动力、人才社会性流动的体制机制弊端,使人人都有通过辛勤劳动实现自身发展的机会”;2019 年12 月中共中央办公厅和国务院办公厅印发了《关于促进劳动力和人才社会性流动体制机制改革的意见》,进一步明确了“构建合理、公正、畅通、有序的社会性流动格局”的目标。为了更快更好地实现该目标,必须准确把握现阶段中国社会性流动的水平、来源和潜力,为相关政策的制定提供科学依据和经验支撑。

收入是个体社会经济地位最直接和最终的表现形式,因而研究“收入的流动性”是剖析个体“社会性流动”最直接的方式,其度量指标一般有两类:一类指标刻画子代收入分配对于父代收入分配的延续情况,即两代人之间收入的传递性,传递性越低说明代际收入流动性越高;另一类指标描述个体在其生命周期内获得收入的变化情况,即代内收入流动性。由于“代际流动”可以比“代内流动”更好地揭示社会机会的开放性或封闭性(李路路和朱斌,2015),本文关注的重点集中于代际收入流动性。与收入相类似,个体在受教育程度、职业、城乡、区域和社会资本等其他维度上的社会性流动同样可以分为“代内”与“代际”两个方面,本文均聚焦于代际社会性流动,在某一维度上的代际传递性越小,表明该维度的社会性流动越高。代际收入流动由代际职业、教育、区域和城乡流动等共同决定,是个体社会性流动最核心的体现。

关于代际收入流动的文献十分丰富,现有研究主要沿着两条路径展开。一类文献致力于准确测算代际流动性,进而对社会中是否存在阶层固化的现象或趋势做出判断(Inoue 和Solon,2010;Justman 和Stiassnie,2021;陈琳,2016);另一类文献关注代际传递机制及其经济影响,人力资本、职业、社会资本等代际传递机制得到了大量经验研究的支持(Alesina 等,2018;Chetty 和Hendren,2018)。相比而言,对代际收入流动进行分解并深入探究居民代际收入流动的结构性特征的文献较少,按照解构思路可以分为两类。一类文献将代际流动分解为增长效应、排序效应和离散效应(李任玉等,2017;汪小芹,2018);另一类文献则是以代际收入传递机制为基础,分解各个传递机制对代际收入弹性的贡献率(陈琳和袁志刚,2012;杨沫和王岩,2020)。现有研究关于代际收入流动的分解为深刻认识社会性流动提供了坚实的基础,但仍存在一定的不足,尤其是未能回答两个重要问题:现阶段中国居民不同维度的社会性流动分别在多大程度上创造了代际收入流动?中国未来提高代际收入流动性的潜力如何?本文将在准确测算代际收入流动性的基础上尝试对这两个问题做出回答。为了更加清楚地说明本文对代际收入流动的分解与已有文献的不同,绘制图1 直观地展示本文代际收入流动性“来源”与“潜力”的含义。

图1(a)中,纵轴从低到高代表代际收入流动性增加,即代际收入弹性减小,横轴表示真实的代际收入弹性,维度a、维度b、维度c……表示人力资本、职业、户籍类型等代际传递机制,即子代内生的特征与父代特征之间的传递性。如图1(b)所示,内生的子代特征由多种因素共同决定,这些因素可归纳为两类:一类是子代外生特征(如性别)、外部宏观环境和随机变量等与父代无关的因素,另一类是父代的人力资本、职业、户籍类型等特征。子代收入和父代收入分别受到各自特征的影响,由真实的子代收入与真实的父代收入可以计算出真实的代际收入弹性。假定子代某一内生特征(以a 为例)仅受到第一类因素的影响,而完全不受父代特征的影响,则可以获得一个反事实收入并计算出相应的反事实代际收入弹性,表示为图1(a)中纵轴上的圆点,该反事实代际收入弹性与真实代际收入弹性相比减小的幅度(用虚线大括号标出),即维度a 创造代际收入流动的潜力。反之,假定子代特征a 完全与父代特征a 相同,而不受第一类因素的影响,同样可以测算出反事实收入和相应的反事实代际收入弹性,表示为图1(a)中纵轴上的三角形,该反事实代际收入弹性与真实代际收入弹性相比增加的幅度(用实线大括号标出),即代际收入流动中来源于维度a 的部分。

图1 代际收入流动性“来源”与“潜力”的含义

与将代际收入流动分解为增长、排序和离散效应不同,本文强调代际收入流动来源于多个维度的代际社会性流动。同时,本文又有别于研究各个传递机制对代际收入弹性贡献率的文献,这类文献相当于计算图1 中单个维度的“潜力”在所有维度中所占的份额。本文关注不同维度社会性流动的“创造力”,尝试从新的视角评价各个维度的社会性流动已经发挥的作用(来源)和未来一定时期内所能发挥的最大作用(潜力)。

本文的主要贡献包括:①从整体情况、性别差异、城乡差异、阶层差异和变化趋势等多个角度勾勒了中国代际收入流动性的全貌,为制定具有针对性的公共政策提供支撑。②利用反事实法测算了不同类型的社会性流动所创造的代际收入流动,拓展了有关代际收入流动来源的研究视角。③利用反事实法测算了中国居民代际收入流动性的潜力,明确今后一定时期内提高代际收入流动性的政策着力点。

二、方法设计

(一)代际收入流动性水平的测算

在测算代际收入弹性时,通常会因父代永久收入难以获得、父代与子代收入的关系非线性以及将“户”作为调查单位取得父代和子代的收入数据等原因,产生暂时性冲击偏误和生命周期偏误、模型设定偏误及样本选择偏误(Haider 和Solon,2006;郭建军等,2017)。为了尽可能减小上述估计偏误,并同时满足测算代际收入流动性来源和潜力的需要,本文将参考双样本二阶段最小二乘法(TS2SLS)的思想估计代际收入弹性(Angrist 和Krueger,1992;Inoue 和Solon,2010)。基本思路是,利用两个样本的数据来估计父代永久收入的预测值,用预测值代替难以获取的父代真实永久收入,从而测算出代际收入弹性。其具体方法如下。

第一步,选取来源于同一总体的两个数据库(或两个样本),分别作为主样本和辅样本,设定父代收入模型。已有文献通常将人力资本Edu、性别Gen、出生年代Time、户籍类型Urb 和职业Occ 作为与父代永久收入相关的特征变量。单年收入则既受到特征变量的影响,在生命周期内还表现出先增大后减小的趋势,一般通过引入年龄Age及年龄的平方项Agesq 来刻画。本文将民族Nat 和地区Area 虚拟变量也作为与永久收入相关的特征变量处理,以控制东、中、西部地区经济发展水平不同和民族差异导致的个体永久收入差异。于是,父代单年收入的决定模型表示为:

其中,ln y 表示单年收入的对数,下标i 代表个体,为随机误差项。为了更加准确地预测父代永久收入,在估计模型(1)时,将样本年龄限制在30 岁~60 岁。

第三步,建立模型如式(2)所示,估计代际收入弹性。

上述测算方法的优势包括:①仅需一个包含个体年龄、收入和与个体永久收入相关的特征变量的数据库以及一个包含子代收入、子代与父代年龄和特征变量的数据库即可,无需相互匹配的父代与子代收入数据,能够在一定程度上解决数据可得性的问题;②使用预测的父代永久收入作为解释变量估计代际收入弹性,能够较好地解决暂时性冲击偏误和生命周期偏误的问题,对样本年龄的限制也起到了类似的作用;③主样本中的父代与子代不一定在同一户中,避免了样本选择偏误(Cervini-Plá,2015;Lefranc 等,2014;郭建军等,2017)。

(二)代际收入流动性来源和潜力的测算

正如本文第一部分所指出的,随着发展机会越来越受到重视,收入分配的研究超越了狭窄的结果论的分析范围,越来越多地关注机会不平等。代际流动性一定程度上可以反映社会的机会不均等程度,当代际流动性较高时,子代较少受到原生家庭的影响,意味着机会不平等程度更低(李任玉等,2017)。但是,仅仅测度代际收入流动性及各类社会性流动并不能为厘清两者之间的关系提供足够的信息。本文对代际收入流动的分解能够较好地解决以上问题,其原理类似于将收入不平等分解为机会不平等和努力不平等。在分解收入不平等时,通常将影响收入的因素归纳为“环境”和“努力”两类(Roemer,1998;李莹和吕光明,2019),通过假定其中一类因素对收入不产生影响构造出反事实收入,进而计算相应的反事实收入不平等。本文则将影响子代内生特征的因素也归纳为两类,并由此构造反事实收入和相应的反事实代际流动性。本部分将具体介绍各个维度的代际社会性流动所创造的代际收入流动,即代际收入流动来源的测算方法,以及各个维度的代际社会性流动所能创造代际收入流动的最大程度,即代际收入流动潜力的预测方法。

1. 研究维度的确定与模型设定

目前被广泛认可的代际收入传递机制包括:基因遗传、婚姻匹配、人力资本、职业和社会资本。不同于基因遗传和婚姻匹配,人力资本、职业和社会资本的代际流动更易受到政策和社会经济发展的影响。尽管中国已经开始建立统一的户口登记制度,城乡二元户籍管理模式已成为历史,但考虑到城镇与农村在教育、收入等诸多方面的差距并不会在短时间内消除,仍有必要将户籍类型视为代际传递的重要机制之一。综合数据的可得性、中国经济特征和政策作用空间,本文将从人力资本、户籍类型、职业和社会资本四个维度测算并分析代际收入流动性的来源和潜力。参考现有文献关于代际收入传递机制的研究(Kearney 和Levine,2016;陈琳和袁志刚,2012;罗楚亮和刘晓霞,2018;周兴和张鹏,2015),构建相应的计量模型。

首先,子代人力资本受到父母人力资本和收入水平的影响;城镇教育资源一般优于农村,即人力资本与个体学龄时期的户籍类型有关,限于数据的可得性,可用父母的户籍类型替代;传统观念影响下教育投资的差异、天然的生理差异和外部环境等使男性和女性通常具有不同的人力资本水平;随着中国教育事业的发展,国民受教育水平不断提高,用出生年代变量捕捉这一变化;学龄时期其他人的受教育水平Hum 不仅影响父母对于子女教育的态度,也会影响个体的受教育质量(孙早和刘李华,2019)。由此建立子代人力资本决定的模型,如式(4)所示。

个体初始户籍类型一般与父母的户籍类型相同;在考察期内,鲜有个体从非农户口转为农业户口,而从农业户口转为非农户口的原因主要有升学、招工、城市扩建、征地等。换言之,个体受教育程度、所在地区的城镇化水平(City)和父母的户籍类型是影响个体户籍类型的重要因素。建立子代户籍类型决定的模型:

在个体职业选择时,可选范围常常受到限制,使子代更倾向于选择与父代相同的职业类型( 纪珽 和张国峰,2021);不同职业对从业人员受教育程度的要求存在差异;城镇个体具有更加多元的职业选择;产业结构(Stru)变化意味着不同类型职业岗位数量改变,从宏观上影响着个体从事某一职业的可能性(郑筱婷等,2020)。子代职业类型决定的模型如式(6)所示。

当个体受教育程度提高时,社会资本(Soc)的数量会有所增加,其质量会有所提高;白领和城镇居民的社会交往更加多样,一般比蓝领和农村居民具有更多的社会资本;婚姻(Mar)通常会扩大夫妻双方的社会关系网络,增加社会资本;政治面貌(Pol)反映了个体的政治资本,政治资本与社会资本密切相关,党员身份还被视为能力的象征,个体可能凭借党员身份积累更多的社会资本。子代社会资本决定的模型如式(7)所示。

最后,构建子代特征变量影响子代收入的计量模型:

式(4)~式(8)中a、b、c、d 和为待估参数;e、e、e、e和是随机误差项;其他符号的含义与上文相同。在得到式(4)~式(8)的参数估计值后,利用反事实法测算代际收入流动性的来源和潜力。由于测算代际收入流动性的来源和潜力时构造反事实收入的具体步骤不同,下文分别展开介绍。

2. 代际收入流动性的来源

按照相同的思路,可以测算户籍类型和职业代际流动创造的代际收入流动。由于主样本中父代社会资本不可得,在估计社会资本代际流动创造的代际收入流动时需额外增加一步,即根据式(7)的估计结果预测父代社会资本,考虑到社会资本完全在社会经济活动过程中决定,利用预测值替代缺失的真实值是可接受的。

3. 代际收入流动性的潜力

与测算代际收入流动性来源的假定恰好相反,对代际收入流动性潜力的测算意味着需要假定个体特征变量不受父代特征的影响,即子代的人力资本、户籍类型等只受到式(4)~式(8)中除父代变量以外的因素的影响。沿着Almås 等(2011)和雷欣等(2017)测算机会不平等的思路,设计代际收入流动性潜力的测算方法。

三、数据来源、变量度量与描述性分析

(一)数据来源与变量度量

本文使用的宏观层面的数据来源于《中国统计年鉴》《新中国60 年统计资料汇编》和各省统计年鉴;微观层面数据来源于中国综合社会调查(CGSS)和中国家庭收入调查(CHIP)。根据微观数据库中所包含的变量信息,将CGSS 作为主样本并使用了目前可获得的全部10 次调查数据;CHIP 作为辅样本,为了与CGSS 数据的时间跨度和样本类型相匹配,仅选用2002 年城镇居民调查数据、2007 年和2013 年的城镇和农村居民调查数据。

本文所使用的微观个体指标包括子代的真实收入、社会资本、政治面貌、婚姻状态以及子代与父代的年龄、地区、职业、人力资本、户籍类型、出生年代、民族和性别。其中,收入用受访者全年总收入度量并取自然对数;人力资本用受教育年限度量;用社会网络的声望达高性度量社会资本;根据出生年份生成出生年代虚拟变量,如出生于20 世纪80 年代虚拟变量记为Time80 ;根据个体所在省份划分为东、中、西部三个地区,并以东部地区为基准,生成中部地区Area2 和西部地区Area3 虚拟变量;职业类型、户籍类型、民族、性别、政治面貌和婚姻状态也为虚拟变量,白领、非农户口、汉族、男性、党员、已婚相应变量值取1,否则取0。

本文所使用的宏观层面数据包括个体所在地区的城镇化水平、个体获得当前工作时所在地区的产业结构以及在学龄期其他人的人力资本水平。由于个体年龄跨度较大,若直接使用学龄期及获取当前工作时的相应变量,将造成大量数据缺失,故用调查当年的数据进行替代,仅捕捉横向的地区差异,即用各省6 岁以上人口平均受教育年限度量其他人的人力资本水平,用城镇人口比重度量城镇化水平,用第二、第三产业从业人员占全部从业人员的比重度量产业结构。

(二)描述性分析

CHIP 数据中符合30 岁~60 岁年龄要求的样本观测点约六万四千余个。收入、人力资本、职业类型、民族和户籍类型等变量补缺后仍有不同程度的缺失,删除这些变量中有缺失值的样本观测点后,共得到38948 个观测点。其中,男性、职业类型为白领、汉族及城镇户籍的观测点分别约占样本容量的60.6%、34.5%、96.2%和57.7%。样本平均年龄为43 岁,收入对数的均值为10.0,平均受教育年限为10 年。值得注意的是,由于样本仅包含年收入不低于120 元的个体观测点,而是否能够有工作并获得高于120 元的收入与个体的受教育程度、年龄、性别等因素有关。因此,变量的均值并不能反映对应调查年份总人口的特征。

尽管在估计代际收入弹性时需要将样本中子代年龄限制在26 岁~55 岁,但在估计式(4)~式(8)并构造反事实的人力资本、户籍类型、职业、社会资本和收入时无需限制样本年龄,且涉及的变量不尽相同。因此,对CGSS 数据的描述性分析没有剔除部分变量有缺失的样本观测点,并保留所有年龄的观测点。CGSS 中个体收入对数的均值为9.44,男性样本占比为48.1%。对比个体及其父母的受教育年限、户籍类型和职业类型,可以发现平均受教育年限、城镇户口以及白领所占比重均有明显提高,一定程度上反映教育事业发展、城镇化和产业结构升级的宏观趋势。

利用CGSS 数据初步考察子代与父代特征的相关性:子代与父代人力资本相关系数约为0.52,女性和男性与父代人力资本的相关系数分别约为0.56 和0.48;城镇个体和农村个体与父代的人力资本相关系数分别在0.48 和0.42 左右。子代与父代社会资本和职业类型的相关性也呈现出类似的特征,即男性与父代特征的相关性弱于女性与父代特征的相关性,城镇个体与父代特征的相关性强于农村个体与父代特征的相关性。由此可以初步推断:代际收入流动的结构性特征为男性的流动性高于女性的流动性,农村的流动性高于城镇的流动性。当然,更为准确的结论仍需通过估计代际收入弹性进行判断。

四、代际收入流动性的估计结果与分析

本部分将报告并分析代际收入流动的水平、来源和潜力,深入研究考察期内代际收入流动性的性别、城乡和阶层差异及变化趋势,勾勒代际收入流动性的全貌。

(一)代际收入流动性的水平

依次利用父亲、母亲和父母平均收入衡量父代永久收入,估计代际收入弹性,结果报告在表1 中。由表1 可以看出,当父亲收入增长1%时,子代收入约增长0.4%;子代对母亲的收入弹性更大,约为0.514;由于父亲和母亲收入均有不同程度的缺失,若使用父母平均收入作为父代收入,样本观测点有所减少,相应的代际收入弹性估计值为0.462。Justman 和Stiassnie(2021)、Lefranc 等(2014)以及Cervini-Plá(2015)等大量文献采用了与本文相似的方法研究美国、日本和西班牙等国家的代际收入流动性,横向对比来看,中国的代际收入流动性处于世界中等水平。

表1 代际收入流动性的整体水平

按照子代性别划分样本,分别估计不同性别的子代对父亲、母亲、父母平均收入的弹性,并检验男性与女性的代际收入流动性是否存在显著差异。其结果显示,女儿对父母的代际收入流动性显著低于儿子对父母的代际流动性,子代对母亲的代际收入弹性也比对父亲的代际收入弹性更大,这与Kan 等(2015)、郭建军等(2017)和刘怡等(2017)的发现相似。综合Kan 等(2015)和Kalil 等(2016)的研究结论,一种可能的解释是,在子代认知形成的婴幼儿时期和童年时期,母亲与子代的接触时间更久,对子代产生了更强的影响,最终表现出更大的代际收入弹性。

为了研究代际收入弹性的城乡差异,按照父代户籍类型划分样本,估计代际收入弹性。其结果显示,农村代际收入弹性小于城镇代际收入弹性,但两者差异的显著性不高。考虑到父代的户籍类型是估算永久收入的变量之一,同样影响父代收入的父代受教育年限也与其户籍类型相关,当按照父代户籍类型划分样本时,父代永久收入的离散程度在城镇和农村之间的系统性差异可能被放大,进而影响代际收入流动性的测算。为了避免上述问题,将子样本中收入标准化并重新估计代际收入弹性,城镇和农村之间代际收入弹性的差异变为显著。然而,对收入进行标准化也可能损失了部分真实信息,如与非农业户口的父代收入相比,农业户口的父代收入标准差本应较小。综合上述分析可以判断,农村代际收入流动性至少不小于城镇代际收入流动性。

利用分位数回归依次估计全样本、城镇和农村样本在25%、50%和75%分位点上的代际收入弹性。其结果显示,全部样本和农村样本的代际收入弹性随收入百分位的提高而逐渐减小,而城镇样本代际收入弹性的变化则恰好相反。考虑到3 个分位点的信息较为有限,我们绘制了全样本、城镇和农村样本代际收入弹性随着分位数的变化趋势图。从该图中可以看出,全样本的代际收入弹性并非始终随分位数的提高而下降,而是在较低和较高的分位点上呈现上升趋势,大约在15%和75%分位点上分别达到了代际收入弹性的极大值和极小值。城镇样本在80%分位点之前以及农村样本在60%分位点之前,代际收入弹性的变化都较为平稳,在此之后才出现了明显的上升和下降趋势。考虑到农村收入一般低于城镇收入,全样本和分样本的回归结果事实上是内在一致的,均说明了高收入阶层和低收入阶层的代际收入流动性较低,对于农村更加需要打破贫困的代际传递,而城镇更应注重促进高收入阶层的代际流动。

最后,为了研究中国居民代际流动性的变化趋势,按照子代出生年代将样本划分为出生于40 年代、50 年代、60 年代、70 年代及80 年代5 个子样本。由于样本年龄被限定在26 岁~55 岁,出生于相同年代的个体年龄也较为接近,导致40 年代和50 年代的子样本估计结果未呈现明显的生命周期特征,40 年代子样本的性别系数估计也不再显著。与上文的分析类似,代际收入弹性的大小由相对位置的流动与父代和子代内部的离散程度共同决定,而父代永久收入由受教育程度、出生年代等变量拟合而来,出生于相同年代的父代收入拟合值会比实际值的离散程度更低,可能造成代际收入弹性的高估。为此,将父代收入与子代收入进行标准化后估计代际收入弹性,结果报告在表2 的列(1)中。可以看到,从40 年代到80 年代出生的个体代际收入弹性表现出先增加后减小的特征。经检验,各个年代估计值之间的差异是显著的,但20 世纪50 年代至70 年代之间的差异不显著。按照父代户籍类型划分样本,分别标准化收入后测算代际收入弹性,结果报告在表2 列(2)和列(3)中:城镇和农村50 年代至80 年代出生个体的代际流动性与列(1)的变化趋势相似,区别在于城镇内部和农村内部20 世纪50 年代~70 年代出生个体的代际收入弹性增长较为显著,一个可能的原因是这一段时期内出生的个体具有较高的代际城乡流动,因而能够在城镇和农村内部代际收入流动降低的同时,保证整体代际流动性没有明显恶化。列(2)和列(3)还显示,城镇20 世纪50 年代~70 年代出生个体的代际收入流动性低于农村同期出生个体的流动性,这与上文的分析类似;然而,城镇20 世纪80 年代出生个体的流动性已经超过了农村80 年代出生个体的流动性。这意味着,虽然考察期内农村居民的代际收入流动性水平和变化趋势较为乐观,但仍应保持一定的警惕。

表2 代际收入流动性的变化趋势

按照调查年份每两年为一组划分为5 个子样本估计代际收入弹性并报告在表2列(4)~列(8)的第一行中,可以看出代际流动性同样表现出先下降后提高的趋势。按照调查年份对样本进行划分的缺点在于,难以考察代际收入流动性的长期变化,也易受到每一轮调查中可能存在的系统性误差的影响,同时还在一定程度上混杂了不同出生队列代际流动的异质性;按照出生年代划分样本则混合了时间的变化趋势。因此,有必要同时根据年份和出生年代对样本进行更为细致的划分,结果报告在表2 列(4)~列(8)中。纵向比较每一列可以看出,除2012 年、2013 年在20 世纪60 年代出生的个体比50 年代出生个体的代际收入弹性略大(经检验,两者差异不显著)以外,每一列各出生队列的代际收入流动性均得到了显著改善。综合以上分析,可以对中国居民代际收入流动性的变化趋势做出判断,即从长期来看中国并没有阶层固化的趋势,这一发现与汪小芹(2018)和李任玉等(2018)的结论相似。新中国成立初期百废待兴,在计划经济体制下在20 世纪40 年代~60 年代出生的个体在人力资本投资、城乡间流动及职业选择上都不可避免地受到各种限制,因而代际流动性较低,甚至稍有降低的趋势;改革开放以来,经济飞速增长,产业结构不断优化,教育制度持续完善,城乡之间的要素流动壁垒被打破,使在20 世纪60 年代后期及70 年代之后出生的个体在受教育和职业选择中越来越少受到家庭背景的影响,代际流动性逐渐提高,义务教育法的颁布和实施保证了80 年代之后出生的低收入家庭的子代能够接受一定年限的学校教育,这是80 年代出生的个体代际收入流动性提高的重要原因之一(陈斌开等,2021;罗楚亮和刘晓霞,2018)。

(二)代际收入流动性的来源与潜力

按照第二部分介绍的方法测算代际收入流动性的来源和潜力时,反事实代际收入弹性估计值均在1%的水平上显著,不再报告估计结果。为方便比较,图2 绘制了子代相对父亲、母亲代际收入流动性的来源和潜力与真实代际收入弹性的比值。

图2 代际收入流动性的来源和潜力与真实代际收入弹性的比值

由图2 可以看出,在四个维度中,由人力资本代际流动所创造的代际收入流动最大,一方面是因为人力资本的代际流动很大程度上决定了其他相关的社会性流动水平,另一方面则是因为人力资本本身对收入具有显著且较大的正向影响。未来一定时期内人力资本流动创造代际收入流动的潜力也最大,如果子代人力资本水平与父代特征完全无关,在其他条件不变的情况下,代际收入弹性将降低22%左右,使代际收入流动性大幅提高。虽然目前由户籍类型代际流动产生的代际收入流动及相应潜力较大,但考虑到在现阶段父代为非农户口的个体几乎不可能转变为农业户口,户口类型与父代完全无关的假定事实上使户籍类型代际流动创造代际收入流动的潜力被高估。从职业代际流动的维度来看,其创造代际收入流动性的作用尚未被充分发挥,从这个意义上讲,未来提高中国居民代际收入流动性从而保障社会活力,政策重心仍应集中于改善人力资本投资和职业获得的公平性上。

需要特别说明的是,在测算代际收入流动性的潜力时,仅能对子代特征变量的取值做出反事实的假定,而难以预测未来子代特征变量的回报率。偏向型技术进步、市场化转型及人力资本的供给等均会对人力资本回报率产生影响(Acemoglu 和Restrepo,2018;郭凯明等,2020;杨飞,2017),如果人力资本回报率上升,由人力资本代际流动创造代际收入流动的潜力将更大。相反地,随着城乡要素流动加快、公共资源配置逐步合理化、城乡融合发展体制机制逐步建立和完善,有理由相信非农户口的回报率将趋于下降,也意味着户籍类型代际流动创造代际收入流动的潜力也将更小。

我们还进一步测算并绘制男性和女性、农村和城镇代际收入流动性的来源和潜力与真实代际收入弹性的比值。结合代际收入流动性的性别差异,可以发现,女性代际收入流动性较低最为主要的原因在于人力资本代际流动性较低,由人力资本代际流动创造的女性代际收入流动约为男性的50%;同时女性在各个维度代际流动的潜力小于男性该潜力,意味着即使男性和女性的代际流动潜力均被充分发掘,只要劳动力市场上仍存在性别歧视,两者之间代际收入流动性的差异就难以消除。农村与城镇之间的差异则表现出不同的特征:尽管考察期内农村代际收入流动性较高,但城镇代际流动的潜力较大,若能够被充分发掘,城镇的代际收入流动性有望超过农村的代际收入流动性。事实上,从表2 中20 世纪80 年代城镇样本的代际收入弹性较小已经在一定程度上得到了印证。

五、稳健性检验与进一步讨论

(一)稳健性检验

在研究代际收入流动性的变化趋势时,本文对收入进行了标准化,一定程度上排除了父代永久收入估计值系统性误差的影响,但也可能损失真实永久收入包含的信息。为了充分验证代际收入流动性的变化趋势,并排除各个年代的父代永久收入估计值离散程度不同对结果的影响,直接采用CHIP 数据匹配父代与子代并估计代际收入弹性,限于数据可得性,仅可得到子代出生于20 世纪60 年代至80 年代3 个子样本。参考李任玉等(2017)的做法,仍使用上文方式拟合得到的父代永久收入数据,但改用收入在各个子样本中的百分位数来估计代际收入弹性。其结果显示,当单独使用CHIP 数据时,从20 世纪60 年代到80 年代出生的个体代际收入弹性呈下降趋势;采用收入的百分位数估计时,从40 年代到80 年代出生的子代的代际流动性呈先降低后上升的趋势。类似地,按照父代户籍类型划分样本,采用收入的百分位数估计20 世纪50 年代至80 年代的代际收入流动性。其结果显示,城镇和农村子样本流动性先减小后增大,且与表2 呈类似的特征。综合来看,虽然使用不同方法和不同数据来源得到的代际收入流动性具体数值有所差异,但变化趋势较为一致,即长期来看中国的代际收入流动性没有恶化。

(二)进一步讨论

使用收入的百分位数测算代际流动性更多地反映了子代收入与父代收入在各自收入排序上的相关性。在子代与父代收入排序一定的情况下,代际收入弹性有可能增大也有可能减小;反之,代际收入弹性的大小也不能够准确反映子代相对于父代收入排序的变化。

使用反事实收入的百分位数重新测算4 个维度的代际收入流动性来源和潜力,结果报告在表3 中。从总体上讲,各个维度的社会性流动对收入排序代际相关性的影响与对代际收入弹性的影响较为类似,即来源于人力资本的代际收入流动及其潜力均是最大的,来源于社会资本的代际收入流动较大但潜力较小。从分样本和分位数回归的结果来看,除人力资本外,其他3 个维度的社会性流动创造代际收入流动的潜力均出现了负值。这意味着在部分子样本或收入阶层内,当户籍类型、职业或社会资本的社会性流动被充分挖掘时,在降低代际收入弹性的同时,也使得父代与子代收入排序的延续性增加,只有人力资本的代际流动能够在各个子样本和各个收入阶层同时实现代际收入弹性的缩小和收入排序变动的提高。由此引发的一个重要问题是,何种形式的流动更加符合“合理、公正、畅通、有序的社会性流动格局”的目标,是否有必要追求代际收入弹性和收入排序代际相关性的共同减小?Acemoglu 等(2018)认为频繁的阶层流动不仅很难实现,而且也未必有益于经济发展和社会稳定。从这个意义上讲,在代际收入弹性减小的同时,代际收入排序的变化减小或许反而更好。

表3 按照收入百分位测算的代际收入流动性来源和潜力

在此基础上,许多文献主张用代际间绝对流动性来衡量经济发展的包容性和机会的公平程度(Chetty 等,2017;汪小芹和邵宜航,2021)。绝对流动性通常用绝对流动率衡量,简单来讲即子代收入超过父代收入的个体数占整个群体的比例。在考察期内,真实的绝对流动率约为0.573,按照上文介绍的方法分别构建人力资本、户籍类型、职业和社会资本完全不流动和充分流动两种情形下的反事实收入,并按父代户籍类型划分样本,将相应的绝对流动率报告在表4 中。可以看到,在任一维度下实现充分的社会性流动或完全没有社会性流动,绝对流动率均低于真实水平,甚至在某些维度下完全不流动时比充分流动时的绝对流动率更高,这在一定程度上与直觉相违背。

为了厘清这种结果出现的原因,需要计算子代收入高于父代收入,且反事实的子代收入低于父代收入的个体真实收入(对数)的均值,结果同样汇报在表4 中。表4 显示,除户籍类型维度和城镇样本测算的职业维度外,完全不流动时的收入均值低于充分流动时的收入均值。这表明在完全不流动和充分流动两种情形下受到损害的个体是有不同的,即在这两种情形下,原本能够实现收入向上流动却因某一维度的社会性流动发生改变而不能实现收入向上流动的个体是有差异的。如果消除人力资本、社会资本或农村样本的职业代际流动,不仅会降低社会整体的向上流动比例,而且受到损害的个体平均收入较低;与此相反,在人力资本、社会资本或农村样本的职业代际流动十分充分时,尽管整体向上流动比例也会降低,但受到损害的个体平均收入较高。简而言之,前者使低收入群体更加难以超越父代收入,后者则使高收入群体更加难以超越父代收入。可见,从合理、公正的角度讲,绝对流动率也并不能完整刻画流动性水平,需要深入分析不同情形下不同个体受到的影响,并进行综合判断。

表4 不同情形下的代际收入流动性和收入不平等水平

下面,进一步计算真实的收入基尼系数,并依次测算4 个维度上完全不流动和充分流动两种情形下的反事实收入和反事实的基尼系数,结果报告在表4 中。其测算结果表明,消除某一维度的社会性流动并不必然导致收入不平等的加剧,但在任一维度上的社会性流动被充分发掘时,均有助于降低收入不平等程度。

综合以上分析可知,代际收入弹性、收入排序的代际相关性、绝对流动率及基尼系数均只能提供代际收入流动性的部分信息,需要同时将各个指标纳入分析范畴才能描绘出代际收入流动性来源与潜力的全貌。由于人力资本充分流动时,不仅能够大幅削弱代际收入弹性和收入排序的代际相关性,而且绝对流动率的下降最小,受到损害的个体平均收入最高,能够达到的收入不平等程度也最低,因而促进人力资本的代际流动、保障教育公平是未来一定时期内提高代际收入流动性的最核心内容。

六、结 论

本文利用CGSS 和CHIP 数据从整体情况、性别差异、城乡差异、阶层差异和变化趋势等角度详细测算了中国居民代际收入流动性水平;结合统计年鉴数据利用反事实法进一步从人力资本、户籍类型、职业和社会资本4 个维度测算了代际收入流动性的来源和潜力;最后综合代际收入弹性、收入排序的代际相关性、绝对流动率等多个指标探讨了提高代际收入流动性的最优路径。

本文的结论是:(1)在考察期内中国居民代际收入弹性约为0.462,与其他国家和地区相比处于中等水平;女性、城镇的代际收入弹性大于男性、农村的代际收入弹性,但城镇20 世纪80 年代出生个体的流动性已经超过了农村80 年代出生个体的流动性;子代对父代的收入弹性随分位数的变化呈先增大后减小再增大的趋势,75%分位点上的个体代际收入流动性最大;长期来看代际收入流动性未表现出恶化的趋势。(2)人力资本代际流动创造的代际收入流动最大,其创造代际收入流动的潜力也最大;当各个维度的社会性流动被充分发掘时,男性与女性的代际收入流动性差异仍然难以消除,而城镇的代际收入流动性有望进一步超过农村的代际收入流动性。(3)代际收入弹性、收入排序的代际相关性、绝对流动率等均只能刻画代际收入流动性的一个方面,若要全面考察居民代际收入流动性,需要利用多种指标综合判断;当人力资本充分流动时,各个指标的表现均较好,因而保障教育优质均衡发展,推动教育资源共享,促进人力资本的代际流动,是未来一定时期内提高代际收入流动最重要的路径;同时,保障社会资本和职业获得的公平性也是提高代际收入流动性、维持社会活力的重要内容。

猜你喜欢
子代代际潜力
新世纪以来的“代际之分”与“代际之争”
——论代际批评的“有效”“有限”及其意义
《我和我的父辈》: 代际秩序建构与精神传承隐喻
春节,代际弥合好时机
科比:写给17岁的自己
古巴代际权力交接受世界瞩目
材用樟树子代测定及优良家系选择
长期低剂量金雀异黄素导致雄性子代大鼠肥胖及其机制研究
不同种源文冠果优良子代测定
学习潜力揭秘
12星座