高等教育与收入分配：改变命运还是阶层锁定
——基于CGSS2008数据的实证研究①

2014-03-10 02:55张凯宁

统计学报 2014年2期

关键词：工资收入回报率差距

张凯宁

（中国人民大学经济学院，北京 100872）

高教理论与政策

高等教育与收入分配：改变命运还是阶层锁定
——基于CGSS2008数据的实证研究①

张凯宁

（中国人民大学经济学院，北京 100872）

利用中国社会综合调查2008年数据，对高等教育与收入分配之间的关系进行了系统考察。通过基础的OLS回归发现，接受高等教育可以有效提高个体收入，且提高幅度远大于整体教育以及义务教育等阶段；通过分位数回归发现，高等教育在不同收入分位点上的影响存在着显著的差异，对于中低收入群体体现出比高收入群体更高的回报率，起到了缩小收入差距的作用；倾向得分匹配的结果显示，普通OLS估计方法对于高等教育回报率估计产生微弱的向下偏误，结合OB分解可以得出结论，即高等教育与家庭背景等个人特征因素对于收入差距的贡献是相互抵消的，接受高等教育很大程度上弥补了家庭背景、社会关系造成的收入差异，成为打破阶层锁定、改变命运的有效途径。本文的分析结果，为高等教育的发展、高等教育作用的发挥以及缩小收入差距政策的制定提供了经验证据。

高等教育；收入分配；教育回报率；分位数回归；倾向得分匹配；OB分解

Abstract：higher education;income distribution;returns to education;quantile regression;propensity score matching; Oaxaca-Blinde decomposition

一、引言

具有培养专门人才、科学研究、服务社会等职能的高等教育，是我国教育体系的重要组成部分。随着教育事业的不断发展，高等教育已经基本形成了适应国民经济建设和社会发展需要的较为完善的体系，为国家的经济发展和社会建设培养了大批的专门人才，发挥了重要的作用。特别是大学教育，成为培养国家急需的建设型人才的摇篮，为国家经济与社会的发展提供了不竭的动力和新鲜的血液。然而，高等教育的影响不仅仅是对于全国的宏观经济，更加现实的，是针对每一个接受过、正在接受或是将要接受高等教育的微观个体的影响，其中最为重要的就是高等教育的回报率问题，以及高等教育能否真正成为改变命运、实现人的发展、促进收入公平的有效机制。

首先，就高等教育回报率估计问题而言，最为重要的论证核心就是消除模型估计的内生性问题，以较为准确的方法对教育回报率进行度量。就高等教育而言，是否接受高等教育这一因素并不是外生的，而是受到很多内生因素的影响，极有可能存在的情况是，原本家庭状况越好，父母社会资源越丰富，个人自身能力越强的人，越有可能考上大学，或者说有更高的接受高等教育的概率，具备这些因素的人往往通过其个人能力与家庭背景可以获得更好的工作岗位与更高的工资。由于选择性偏差的存在，我们无法观测到高等教育对于个人收入的净效应。现有的解决内生性问题的方法中，最为有效的估计教育回报率的方法是使用“工具变量”，但难免存在“弱工具”问题，而且工具变量的使用条件也受到较多外生因素的限制。对于选择性偏差，考虑到将可能影响接受高等教育概率的变量直接加入回归方程必然引发多重共线性问题，因此不能直接将这些“污染”变量加入到正规方程中。在此情况下，为了观察到高等教育对个体收入的净效应，消除选择性偏差的影响，本文应用匹配模型进行分析：一方面考量常规的估计方法会对高等教育的回报率产生怎样的估计偏误；另一方面也可以分析影响接受高等教育概率的个体因素。

其次，本文还考虑了高等教育对不同收入群体的异质性影响。在不同的收入阶层中，高等教育并不会对收入产生完全相同的效应，很有可能会由于收入阶层的不同而产生异质性。因此，除对样本总体做均值回归之外，还分别对特定收入阶层的子样本进行回归，以观测高等教育对不同人群影响的异质性差别。在对子样本进行可比回归的方法中，分位数回归较为有效，可以针对收入分类进行极端值的检验，以不同分位点为回归基准，考察关键解释变量在不同分位点上所产生的效应是否有显著差异。

第三，也是最具有现实意义的问题是，高等教育能不能是一条阶层上升的通道。寒门学子能否通过接受高等教育以提高未来收入，又或者，高等教育成为出身优厚的个体的特权，对于家庭背景良好的个体“如虎添翼”，却成为阻碍普通人改变命运的特权教育，成为恶化阶层锁定的工具。本文结合受限因变量回归与OB分解对此进行分析。

二、文献回顾与模型设定

（一）文献综述

1.传统研究。当前，学术界有关教育回报率以及教育对收入分配效应的文献十分丰富。最早开始考察教育与收入分配关系的文献是收入分配的人力资本理论（Schultz，1960；Becker、Chiswick，1966；Mincer，1974），该理论将教育作为人力资本积累的重要途径之一，认为人力资本可以影响未来的货币或物质收入，构建了人力资本的投资收益曲线与人力资本挣得函数，分析了平均受教育程度与收入分配之间的相关效应。此后，人力资本的概念得到迅速发展，并以此衍生出关于教育回报以及教育对收入差距影响的实证研究。

在已有研究中，关于教育与收入分配之间关系的研究得出的结论相对统一。研究美国收入分配与教育关系的文献发现，平均受教育程度每增加一年，则收入不平等会下降10%（Malrin& Psacharopoulos,1976），提高社会教育水平有助于缩小收入差距。Chiswick（1971）使用9个国家的面板数据得出了相似的结论，即收入差距与国民平均受教育年限之间有负相关关系，普及教育有助于缓解收入分配不平等状况。此外，Becker和Chiswick（1996）通过理论推导以及美国的经验数据回归，进一步发现对数工资收入差距与受教育程度差距有正相关关系。Easterly、Rebelo（1993）和Sylwester（1999）的研究表明，国家平均收入水平将随着公共教育占GDP比重的上升而提高。这方面研究虽存在由样本选择导致教育影响的显著性界定差异外，理论机制与计量技术上争议较少。

既有的关于教育回报的研究文献中，对教育回报率的测算则存在明显的偏误。传统的研究教育收益率的模型中，多以自然对数工资作为被解释变量，以受教育年限作为关键解释变量，同时控制工作经验及其平方项，并以关键解释变量在回归中的系数作为教育回报率的度量（Mincer 1974）。国内关于教育回报率问题的研究大多基于这一估计方法。邵利玲（1994）依据1990年关于“国有企业改革中的职工问题”的调查数据，应用Mincer的回报率估算方法对职工个人教育回报率进行测度，得到的回报率为0.75%。赖德胜（1998）根据中国社会科学院经济研究所1995年11个省城镇住户抽样调查数据，估算出的城镇职工收入与其教育程度间的收益率为5.73%。但是，这些研究均存在忽略个人能力等不可观测的因素对个体收入效应的影响，因而，直接以受教育年限的回归系数作为教育回报率包含了遗漏因素的效应，估计有偏误。这些源于个人能力因素，既可以对关键解释变量——受教育年限产生影响，又可以对被解释变量——对数工资水平产生影响。在此条件下，系数估计将依赖于关键解释变量与内生遗漏变量之间的相关程度，因而使得估计系数不够稳健。

2.内生性问题的解决——工具变量研究。着眼于教育回报率的传统文献中存在的内生性问题，国外学者提出两种解决方法：其一是代理变量法，即在回归方程中加入不可观测因素的代理变量，例如个人能力与父母受教育程度正相关，因此将父母受教育程度作为衡量个人能力的指标加入回归的规范方程（Lam、Schoeni，1993），以此解决内生性问题；其二工具变量法，即寻找一个外生于模型，而又与关键解释变量相关的变量作为工具变量进行回归，该因素与受教育年限有显著正相关关系（相关性），并只能通过影响关键解释变量从而对被解释变量产生影响（外生性），如最小离校年龄、学校的地理位置与家庭的距离都在一定程度上对受教育程度产生影响（Card，2001）。Harmon和Walker（1995）以英国20世纪40年代以来最小离校年龄规定的调整作为工具变量，估计其对于教育回报的影响。Meghir和Palme（2005）以瑞典20世纪40年代教育改革作工具变量，研究了其对受教育程度变化进而对教育回报的影响。这些工具变量虽然一定程度上解决了受教育年限的内生性问题，但自身又带来了新的内生性问题。Angrist和Krueger（1991）在估计美国劳动力市场教育收益率时，以“出生季度”作为受教育年限的工具变量，依靠由于《义务教育法》带来的第一季度出生者与后三季度出生者之间受教育年限的不同，利用政策外生冲击带来的变异解决遗漏变量产生的模型估计偏误，比之前文献中工具变量的选择更具有说服力。国内的相关文献，借鉴出生季度的工具变量模型，依据中国2005年1%的人口抽样调查数据，对我国的教育回报率进行估计，发现传统估计方法可能低估了中国劳动力市场上的教育回报率（吴要武，2010）。

以出生季度工具变量为基础的研究受到的一项质疑是“弱工具变量”问题，即出生季度与受教育年限变异之间的相关程度并不强。此外，由于出生季度作为工具变量的有效性是严格依赖于义务教育政策与劳动法政策对于入学、退学年龄以及工作年龄的限制的，因此，用出生季度的工具变量方法研究义务教育阶段之后的教育回报率是不可行的。

3.当前研究的不足。教育回报率是当前人力资本与收入分配研究的热点，在基础理论构建之后，很多文献都通过各种巧妙的方式（特别是工具变量的估计）来解决内生性问题。基础研究在分析教育对收入影响的问题时，主要基于均值下受教育程度与平均收入的关系，得出了高的教育程度对应着高收入的关系，即受教育程度有一个正的回报率，而对于教育收益的异质性，以及由此可能造成的收入差距的变化则鲜有考察。如果高的教育等级可以提升个人收入，并且对低收入者的收入提升越有利，那么随着较高等级的教育逐渐普及，贫富差距将会有缩小的趋势。苏梽芳与蔡经汉（2010）利用分位数回归的方法研究了不同层次学历的教育所带来的教育回报率的不同，邢春冰（2006）使用同样方法对我国不同所有制部门工资决定和教育回报进行了估计，但均未考察不同收入层次的个体的教育回报率之间的差异。

此外，对于教育回报的准确测度问题，工具变量的选择饱受“弱工具”的诟病，并且外生性的成立往往受到很多因素的限制，难以准确测度教育对收入的净效应。本文所要解决的问题，一是对比个体资质与教育程度对于收入水平的影响何者占优，二是对个体受教育程度对于收入变化的净效应进行估算，并加以分析。

（二）模型设定

1.基本回归模型及变量的设定。本文首先运用基础方法进行回归。在变量选择方面，目前已有不少关于教育与收入的回归方程的设定，本文的收入决定模型是基于Mincer（1974）的人力资本收入模型的方程设定，基本模型设置如下：

其中，LnY为被解释变量，是收入的对数值；edu为关键解释变量，表示是否选择接受高等教育；其余为控制变量：D1表示是否具有党员身份，D2表示户口类型是农村户口还是非农户口，D3表示性别，exp和exp_2分别表示工龄与其平方，x1和x2分别控制了本人及其父亲的工作单位类型，province控制了个体所属省份的情况。

在Mincer的模型中，个人工作经历是重要的衡量人力资本的指标，也是模型重要的解释变量，工作经历越长，收入可能就越高。因此，本文加入以工龄衡量的工作经历对此进行控制。

以党员身份衡量的政治资本对于收入也会产生一定影响。已有研究表明，党员身份更便于寻租，也更容易发生为私人牟利的行为（杨瑞龙、王宇锋、刘和旺，2010）。同时，拥有党员身份的人可以得到更多的社会资源和信息（Walder，1995），可以成为求职或晋升时的相对优势。作为重要的政治资本，党员身份对于个人收入有着正向的作用（Knight、Yueh，2002；Appleton、Knight、Song、Xia，2008）。因此，本文也对党员身份进行了控制。

在当今中国的城乡二元经济模式下，劳动力市场中存在严重的城乡分割与户籍歧视。姚先国、赖普清（2004）利用企业和农民工的调查数据分析了劳资关系的城乡户籍差异，发现户籍歧视可以解释城市、农村两类工人劳资关系差异的20%～30%。进一步来看，在城乡劳动力市场分割的背景下，户籍制度歧视会对农村劳动力工资带来大约28%的户籍折扣（李芝倩，2007）。因此，在研究收入问题时，户籍差异也是必须要考虑的因素。

性别差异同样是需要关注的因素。一般来说，收入分配领域普遍存在着性别歧视现象。李春玲和李实（2008）的研究认为，分配型性别歧视与估价型性别歧视是性别歧视的主要手段，已逐渐成为影响收入分配的重要因素，在研究中应该加以控制。

行业差距同样是造成收入差距的重要原因。所有制属性不同的单位可能会带来工资收入的差距，企事业单位、政府机关等在收入上的差异是现实存在的。通过对我国15个行业大类、工业行业30个非垄断及6个垄断行业的分析，发现垄断等因素造成了不同行业之间收入分配的显著差别（杜健、张大亮、顾华，2006）。因此，本文在方程中也将个体所属单位的性质进行了控制。

个人的工作收入与其家庭背景及社会关系也有很大的关联。精英代际转化和阶层再生产模型反映出在市场转型过程中，父辈的某些特质会对子代的职业选择、职业进入门槛以及子代的阶层特征产生显著的影响（郑辉、李路路，2009），自然也会影响到其就业机会与工资收入。因此，对于父辈的职业类型的控制是必要的。

我国各地区间存在明显的收入差距，不同地区经济发展战略（林毅夫、刘培林，2003）等要素的差异，导致各地经济发展的不均衡，进而带来地区间收入分配差异。因此，以省份衡量的地区变量也必须被控制。

2.分位数回归（quantile regression）。分位数回归模型是对以条件均值为基础的普通最小二乘法（OLS）的拓展，由Roger Koenker和Bassett两位学者于1978年提出。该模型利用被解释变量条件分位数建模，通过最小化加权残差绝对值之和对回归参数进行估计。相比于传统的普通最小二乘回归，分位数回归在随机误差项呈非正态分布条件下具有更高的估计效率；代表某一特定区域的数据信息，收益长但影响有限，参数估计更加稳健；能更加全面刻画变量分布特征，捕捉分布函数尾部特征（李红梅，2012）。特别的，分位数回归法对于考察解释变量对不同等级的被解释变量的异质性影响具有很好的效果。

在此，设模型中所有的控制变量为X，它是个包含D1、D2、D3、exp、exp_2以及x1、x2、province在内的向量，由此构建出的分位数回归模型如下：

其中，q是分位点，取值为0～1；ε是误差项；δq代表了q分位点下关键解释变量的回归系数，表示了当收入在某一分位点时，接受高等教育与不接受高等教育个体之间的收入差异。在给定X的条件下，可根据下面的最小化方程求解βq的无偏估计量（陈强，2010）：

当q=0.5时，称为“最小绝对离差估计”（LAD），其系数估计因不易受极端值影响而更加稳健。本文通过分位数回归方法，可以更清楚把握是否选择接受高等教育对于收入分配的影响。如果高等教育可以增加收入，且其对高收入者的收入增加效应小于低收入者，那么高等教育则有助于改善收入差距。

3.倾向值匹配法。倾向值（propensity score）概念最早是由Rosenbaum和Rubin于1983年提出，是指在控制被研究个体可观测的混淆变量的基础上受外生冲击影响的条件概率。由于存在模型外的混淆变量引起的选择性偏误（selection bias），“污染”了解释变量与被解释变量之间的关系，因此对于解释变量净效应的估计会产生偏误，通过控制倾向值的方法则可以消除选择性偏差的不利影响。倾向值匹配是将受到外生冲击的处理组与没有受到外生冲击的控制组进行配对，保证处理组与控制组有相等或相近的倾向值，以控制选择性偏差，研究外生冲击的影响效应。基于相同的问题，计量经济学家Heckman（1979）提出了解决选择性偏差的“两步估计法”（two-step estimator）：第一步，通过模型拟合个体参与到处理组中的概率；第二步，在控制参与可能性的前提下，考察关键解释变量，即外生冲击对于被解释变量影响的净效应。

在标准的实验环境中，是否接受高等教育的处理效应可以由以下公式推算得出：

其中，T表示高等教育的净处理效应；π指实验组——接受高等教育的对象在样本总体中所占比例；w是一个二元选择变量，1表示接受过高等教育，0表示未接受高等教育；Y1和Y0分别表示接受过高等教育的样本的收入水平与未接受过高等教育的样本的收入水平。等式中，E（Y1|w=1）与E（Y0| w=0）是可观测的，即接受过高等教育的样本的收入水平与未接受过高等教育的样本的收入水平，但E（Y0|w=1）与E（Y1|w=0）是无法观测到的，即无法知道接受过高等教育的人在没有接受高等教育情况下的收入水平，以及没有接受过高等教育的人在接受高等教育情况下的收入水平。这也正是现实方法无法准确估计处理效应的瓶颈所在。

如果能够找到影响一个个体进入处理组还是控制组的相关因素，并且将这些因素控制起来，就能近似保证w与Y之间关系的独立性。倾向值匹配得分正是通过寻找这样的影响因素Z，并将Z通过Logistic回归归结为一个特定的倾向值P，并将倾向值相近的样本进行配对，以此来近似的达到等式所描述的准实验分析框架：

此时，本文选择个体父亲的教育水平（D4）、父亲是否是党员（D5）、个体自身是否是独生子女（D6）以及父亲的工作单位类型（x2）作为判断进入处理组还是控制组的关键变量。依据这些变量回归得出的倾向值对样本进行匹配，匹配后可以近似地认为处理组与控制组除了处理效应之外，在总体上是同质的，对匹配后的样本进行检验便可以得出净处理效应。本文通过倾向得分匹配，一方面分析在控制影响个体接受高等教育的概率之后，普通回归对于教育回报率究竟是高估还是低估；另一方面，也通过回归的细节，分析同时影响个体接受高等教育与未来收入的因素及其影响机制。

4.OB分解。所谓OB分解，全称Oaxaca-Blinde分解，由Blinder（1973）和Oaxaca（1973）在分析工资的性别差异时提出。其分解方法的思想在于，将对数收入的均值差距分为两个部分：一部分是被个体特征所解释的，称为特征效应；另一部分是被处理因素所解释的，称为系数效应。本文在均值意义上对接受高等教育与未接受高等教育的群体的收入差距进行分解，分解方程如下：

其中，edu代表接受高等教育，uedu代表未接受高等教育，X代表个体特征，β是估计的系数。等式中，等号右边的第一项为收入差距中可被个体特征所解释的部分，即特征效应；第二项为是否接受高等教育而带来的收入差距，又称为系数效应。本文之所以要构建OB分解进行分析，目的在于探究高等教育的系数效应与个体身份背景、家庭条件等特征效应对于对数收入会产生怎样的影响，其中反映着怎样的机制。若系数效应为正，特征效应为负，则可以反映出个体的家庭背景、政治身份等可以抵消部分高等教育的效应；反过来说，就是高等教育真实的回报率可能由于社会背景、家庭背景等因素的影响而被低估。高等教育有抵消家庭背景、社会关系对于收入差距扩大的作用，为出身较差的群体提供了社会阶层的上升渠道。反之，如果二者效应均为正，且倾向得分匹配反映出家庭背景与出身对于接受高等教育的概率，进而对收入有显著的影响，即在控制了接受高等教育概率之后的教育回报率明显下降，则说明高等教育是社会阶层固化的工具与途径。由此可以分析高等教育在社会阶层流动中的功能与作用机制。

三、数据描述与初步分析

（一）数据来源

本文所使用的数据均来自中国人民大学与香港科技大学调查中心联合完成的中国综合社会调查项目（CGSS）。该项目收集到的数据系统详尽，是很多社会科学实证论文写作的数据来源，已应用于心理学、经济学以及社会学研究的各个领域。本文利用2008年的调查数据，研究是否接受高等教育对于收入差异的影响。该调查样本选择覆盖农村与城市的各种群体，共有6 000个样本，可以满足实证研究对数据量的要求。

（二）指标选取、定义与识别

本文在模型构建中所用到的被解释变量、解释变量及各控制变量的定义以及处理方法见表1。

表1 主要变量的定义与处理方法

本文选择的样本群体均是当前并非接受在校教育，而是已经进入工作岗位的群体。之所以分别选择年工资收入对数以及小时工资收入对数作为被解释变量是考虑到工作强度的问题，小时工资相对于总工资，消除了工作时间长短对于收入的影响。本文的解释变量为是否接受高等教育的二元选择变量，之所以选择义务教育阶段之后的群体作为研究样本，是考虑到个体若从未接受过教育或是没有完成义务教育，更可能是由于家庭极度贫困或是教育资源极度匮乏造成的，个体没有选择是否能接受高等教育的机会与主动性，而义务教育阶段结束后，一方面说明这部分群体有接受教育的能力与资源，另一方面这部分群体在综合考虑自身家庭背景、政治与社会资本的情况下，非强制性教育也为他们提供了选择是否接受高等教育的可能。

（三）描述性统计

表2 主要变量的描述性统计

注：圆括号中为样本的标准差。

首先，从整体上看，接受过高等教育样本占样本总体比例相对较低。其次，从描述性统计结果来看，可以发现，无论是年工资收入对数还是小时工资收入对数，接受过高等教育的样本都要高于未接受过高等教育的样本，且相对较小的标准差也可以看出接受过高等教育的群体收入之间的差异较小。此外，接受过高等教育的样本中，党员比例明显高于未接受过高等教育的样本；接受过高等教育的样本中，户口类型以非农业户口为主，占比高达98.6%，可见高等教育特别是正规大学本科教育存在明显的城乡差异；从性别方面看，整体上呈现出男性多于女性的态势，但接受高等教育与不接受高等教育的样本中男女性别比例则大体相当；从工龄的描述统计中可以看出，接受过高等教育的样本工龄相对较短，一定程度上反映出教育与工作经验之间的取舍关系；从对父亲受教育水平以及党员身份的描述中可以看出，接受高等教育的样本，其父辈往往也具有较高的受教育经历，但具有党员身份的则相对较少；在接受高等教育的样本中，独生子女所占比例远高于未接受高等教育样本中独生子女的比例。总体来看，父亲的受教育经历、政治身份以及个体是否是独生子女，在是否接受高等教育的群体之间存在明显的差距，很有可能是影响个体是否选择接受高等教育的关键因素。

图1 自然对数收入的核密度估计

核密度估计方法的优点在于直接依据样本本身来对数据的分布特征进行判断拟合，从图1的核密度估计中可以很明显看出：首先，接受过高等教育样本的对数收入均值要明显高于未接受过高等教育样本的对数收入水平；其次，接受过高等教育样本的收入相对集中，未接受过高等教育样本的收入则相对离散。由此可以得出结论，即接受高等教育的确有助于收入的提升，这符合传统的理论研究，也符合常识判断。

四、实证分析

（一）传统方法——普通最小二乘法（OLS回归）

首先，我们复制传统研究结果，根据相关数据与模型设定进行回归。

表3 接受高等教育对收入影响的普通最小二乘回归

从上述回归模型中可以看出，模型整体对于年工资收入对数与小时工资收入对数的解释程度分别达到了35.70%与37.91%，可见本文所构建的模型具有一定的解释力。在两个回归中，接受高等教育对于工资收入都有显著性影响，接受高等教育的年工资收益为57.7%，而小时工资收益为68.2%，与吴要武（2010）在工具变量方法下估计出我国的教育回报率为13.9%～15.9%相比，这一比例相当高。可见，高等教育相对于其他基础性教育而言，有着更高的收益率。高等教育对于小时工资率的提升程度高于对年工资的提升程度，反映出高等教育确实在很大程度上提升了劳动生产率，因而才能获得更高的小时工资。同时，本文为了防止多重共线性对计量结果造成偏误，对数据进行了共线性检验，发现关键解释变量——是否接受高等教育的模型膨胀系数（VIF）分别为1.63和1.64，工龄与工龄平方项之外的其他变量的膨胀系数也均在合理范围内，模型平均膨胀系数为2.53。可见，对于模型整体而言，并不受共线性问题的影响，整体的系数估计是稳健的。

对其他系数的分析。首先，党员身份对于收入有正向的影响，政治身份收益达到13.3%和13.5%，这与刘和旺、王宇锋（2010）估算出的5.85%～11.2%大体相近，但影响效果并不显著，这可能是受相关数据限制造成的。其次，非农户口比农业户口在年工资收益与小时工资收益上分别高出28.9%和27.1%，男性平均年工资收益与小时工资收益要比女性高出26.3%和27.5%，在劳动力市场上存在着严重的户籍歧视与性别歧视。由于工龄与工龄平方之间有显著的共线关系，其系数估计与显著性程度也可能存在一定偏误，因此不予讨论。

（二）高等教育影响异质性的研究——分位数回归

依据上述分析可以发现，高等教育对于收入分配的确有着显著性影响，下面将进一步通过分位数回归对高等教育的异质性影响进行分析。按照一般的对分位数回归系数的解释，以及自变量为虚拟变量的情形，本文对高等教育系数的解释是：在年工资收入对数的q分位数上，接受高等教育比不接受高等教育高（eδ-1）*100%（张义博，2012）。由于年工资对数与小时工资对数回归的输出结果大体相近，本文在此只报告年工资收入对数分位数回归的结果。

表4 年工资收入对数的分位数回归

从表4可以看出，高等教育在不同分位数上的回归结果仍然显著，并且产生了明显的变化。随着分位数的逐渐提高，高等教育回报率呈现出先上升后下降的趋势，经过换算，位于不同分位点数上的高等教育回报率分别是80.58%、89.46%、91.36%、83.86%、73.67%、57.46%、34.18%。由此可以得出结论：高等教育对于不同收入群体而言，的确存在异质性影响。相对于高收入人群而言，中低收入人群接受高等教育对其收入增加效果更明显。收入位于35%分位点的中低收入群体，其接受高等教育的回报率高达90%以上；收入位于95%分位点的极高收入群体，其接受高等教育的回报率仅有30%左右。对于中高收入者而言，高等教育的回报率呈现出一种快速下降的趋势。由此可以看出，高等教育对于缓解收入差距起到了很重要的作用，以更高的回报率促进中低收入群体的收入增长。其背后的机制可能在于，对于中低收入群体而言，其本身并不具备十分出众的政治资本与社会资源，高等教育无论是作为一种信号显示工具还是一种对自身生产效率的提升，都极大地增加了其社会竞争力，使其在中低收入人群中取得了较高的职业平台与职业优势。因而，相对于没有接受高等教育的中低收入者而言，接受高等教育的群体拥有更多的就业机会和更好的就业选择。对于较高收入群体而言，他们本身可能具有良好的家庭背景、丰富的政治资源与社会资源，高等教育的经历可以提升其竞争力，但在职业选择与就业竞争中可能并不起主要作用，高等教育经历并不能在很大程度上扩大其相对于同类型高收入人群的竞争优势。

考察其他因素的回归系数可以发现，很多回归系数对于某些分位点变得不显著，但关注其中与收入有显著关系的几个系数值，仍可以得出很多有用信息。首先，性别对于年工资收入的影响基本都是显著的，影响系数之间差异不大，并且没有明显的变化规律。这表明，性别歧视在各个收入阶层均存在，女性会由于性别歧视面临20%～30%的歧视性工资折扣。其次，党员身份对于中低收入人群的收入增加没有显著的影响，但对于中高收入群体的收入则有较高程度的正相关性，这反映出政治资本可能只在较高的收入层次上才能为个体带来牟利空间，此时党员身份更有利于其扩展社会网络或是寻租等。第三，在50%分位点上，工龄对于收入有较为显著的正向影响，这一定程度上表明，对于中产阶层而言，工作经验对于收入增长有较为重要的贡献。

将上述回归结果与OLS回归结果进行对比可知，分位数回归基本证实了普通回归的相关结论，只是在显著性上有所差异。同时，分位数回归也分析了高等教育对不同收入群体的异质性影响，得出了高等教育有助于缩小收入差距的结论，从侧面印证了高等教育可能具有的打破阶层固化、促进阶层流动、改变命运的功能。但是，这也引出一个疑问，如何度量高等教育对一个个体的净效应，即对于某一特定个体，排除了个体异质性对于接受高等教育选择的影响后，其是否接受高等教育会带来多大的收入差距。

（三）高等教育的净效应分析——倾向得分匹配

通过上述分析已可以看出高等教育的收入效应，但由于存在选择性偏差，系数估计可能有一定偏误，关键解释变量之前的回归系数可能无法准确衡量高等教育的真实回报率，因为是否能够上大学这一选择中包含着个人家庭教育、政治背景以及社会资源各方面的信息。因此，我们进一步应用倾向值匹配的方法对高等教育的净效应做出估计。

估计分两步，第一步是二元选择模型的拟合，估计结果见表5。

表5 选择接受高等教育的二元Logistic回归

由表5可以看出，父亲受教育水平、父亲党员身份、个体是否为独生子女都在很大程度上影响着样本是否能够进入处理组——接受高等教育的可能性。从回归系数可以看出，如果父亲有大学本科及其以上的受教育经历，比父亲没有高等教育受教育经历的样本更可能进入处理组，这可能与家庭对上大学的意愿、家庭教育对于知识的积累及能力的培养有关；如果父亲具有党员身份，则样本接受高等教育的可能性要比父亲没有党员身份低，原因可能在于，父辈的党员身份象征着一种政治资本以及社会资源，子女即便不接受高等教育同样能够有其他途径获得体面的工作和较高的收入，考虑到投入产出以及利益的取舍，很可能选择不接受高等教育。此外，在表5没有报告的是，当父亲的工作单位是党政机关时，回归系数为-0.797（显著性水平为0.001），其中的原因也与党员身份相似，即父亲拥有更好的社会背景以及社会资源，子女不一定非要通过接受高等教育才能进一步提升自己的人力资本，因此回归系数是显著为负的。回归结果显示，独生子女比非独生子女有更大的概率接受高等教育，简单的原因是，家庭的资源是有限的，独生子女往往拥有更为充足的家庭资源以及教育资源，受到更多的关注，在各方面的发展上也比非独生子女更好。

估计的第二步，根据以上的回归结果，我们对所有样本进行倾向值打分，并根据倾向值打分的结果进行匹配。本文针对年工资收入对数与小时工资收入对数均进行了匹配检验，主要采用最临近匹配法、核匹配法、半径匹配法与分成匹配法，结果如表6所示。

表6 倾向值匹配结果

表6是经过倾向得分匹配后的回归结果。根据父亲受教育水平、父亲党员身份、个体是否为独生子女以及父亲工作单位类型进行匹配后，将年工资收入对数、小时工资收入对数分别与是否接受高等教育进行处理效应比较。若直接将年工资收入对数、小时工资收入对数分别与是否接受高等教育的虚拟变量进行回归，得到的回归系数分别是0.633***与0.750***，对比直接回归与倾向得分匹配结果，倾向得分匹配的系数较小，略有差距但并不明显。这一数据对比反映出，在控制了个体的父亲受教育水平、父亲党员身份、个体是否为独生子女以及父亲工作单位类型，也就是控制了个体接受高等教育的概率之后，高等教育的回报率略有下降。这一方面反映出在个体更加具备接受高等教育的机会时，其同时也具备获得更高收入的某些特征，因此通过总体数据不加控制的回归对于教育回报率略有高估；另一方面也反映出，当个体的父亲在党政机关工作或者政治身份为党员时，个体接受高等教育的可能性反而减小，说明个体的家庭背景与社会关系等因素不是促使个体接受高等教育并获得高回报的主要因素，即不是造成教育回报率低估的主要因素。同时，也否定了个体由于家庭背景与出身较好，能够获得较高的接受高等教育的概率，进而获取高收入的阶层固化的分析逻辑。可以这样说，高等教育本身并不具备加剧阶层分化，锁定收入阶层身份的作用。

（四）改变命运还是阶层锁定——OB分解

上述分析逐渐理清了一条逻辑，即高等教育似乎并不是家庭背景深厚、出身良好的人群的特权，更具有一种缩小收入差距、弥补先天出身条件的促进阶层流动、促进收入公平的作用。这一机制可以通过一个简单的交互项回归来直观反映，首先构建回归方程：

其中，控制变量X1是一个包含D1、D2、D3、exp、exp_2以及x1、x2和province在内的向量；X2是一个包含D1、D2、D3、exp、exp_2以及x1和province在内的向量；x3所代表的是这样一个虚拟变量：当x2=1，即个体父亲的工作单位是党政机关时x3=1，其余情况下x3=0。

等式中，δ3以及γ3的经济学含义都是双重差分。δ3所代表的是父亲具有党员身份的个体是否接受高等教育的收入差距与父亲不具有党员身份的个体是否接受高等教育的收入差距之间的差距，γ3所代表的是父亲的工作单位是党政机关的个体是否接受高等教育的收入差距与父亲的工作单位不是党政机关的个体是否接受高等教育的收入差距之间的差距。这两个系数反映的都是高等教育对具有不同家庭背景的个体是否有明显的异质性影响，如果系数在经济上与统计上都是显著的，则说明高等教育对于家庭背景好的个体具有“如虎添翼”的作用，社会阶层将由此被进一步固化，收入差距将可能被扩大，反之则说明这一机制是不成立的。

表7所展示的，是根据上面的方程进行回归分析后的结果的简化。其中，被解释变量选择的是年工资收入对数，当被解释变量是小时工资收入对数时，可以得到相似的结论。

表7 双重差分结果

由表7可以看出，双重差分的系数是不显著的，即在父亲具备党员身份的个体中，是否接受高等教育会造成一个收入差距；父亲不具备党员身份的个体中，是否接受高等教育也会造成一个收入差距。这个差距在两者之间并没有明显的不同，由此反映出的是，高等教育对于特定的家庭背景并不存在所谓的“如虎添翼”的作用。

运用OB分解作进一步的也是更加精确的分析。在进行分析之前，对原有回归模型进行一定修改，在不引起多重共线性的前提下，将有关个体家庭背景的变量加入到OB分解模型中，分解结果如表8所示。

表8 OM分解结果

从表8可以看出，接受高等教育群体与未接受高等教育群体之间的收入差异，主要还是来自于教育本身。同时我们也发现，包括个体家庭背景与出身在内的个体特征也产生了很强的抵消作用，高等教育对于收入的影响有相当一部分被个体特征效应的影响所抵消。具体而言，单从高等教育的角度讲，原本对于收入可以产生0.523的影响，但个体的家庭背景、政治身份等非教育因素对此进行了0.222水平的弥补，最后表现出的总效应便成为0.301。从反面来讲，高等教育的存在是可以与个体特征的异质性相互抵消的。也就是说，接受高等教育可以减轻因出身和家庭背景不同而带来的不公平。据此，我们可以得出结论，高等教育并不依附于家庭出身，它具有打破阶层固化、促进阶层流动、改变人的命运的作用。

五、研究结论与政策建议

本文立足于已有研究，对高等教育的教育回报及其与收入分配之间的关系进行了系统分析，研究结论可以概括为四个方面。

第一，高等教育有一个显著为正的教育回报率，且相对于以往文献对于包括义务教育阶段在内的整体受教育过程的教育回报率要高。从整体上来看，对于年工资收入的回报率高达60%，对于小时工资回报率更是接近70%，可见高等教育一方面通过各种机制提升了总量工资水平，另一方面这种工资水平的提高源于效率的提升，而不是源于工作时间的延长，这一点从小时工资回报率更高的数据中可以看出。

第二，从分位数回归的结果可以看出，高等教育对于中低收入群体比对于高收入群体具有更高的回报率。这说明，高等教育更大限度的提升了中低收入群体在劳动力市场的竞争力，也反映了高等教育对于不同收入群体而言，具有缩小收入差距、缓解贫富两极分化的作用。

第三，从倾向得分匹配的结果中可以看出，在控制了个体接受高等教育的可能性之后，高等教育的教育回报率依然是显著的，但系数估计相比于一般的估计方法略有下降。这反映出，在关键解释变量为是否接受高等教育的虚拟变量时，对于教育回报率的估计具有向上偏误，但误差很小，基本上是准确的。

第四，结合倾向得分匹配与OB分解的结果可以发现，在受限因变量回归模型中，父亲政治身份以及工作单位性质等因素对于个体是否接受高等教育具有反向作用，而OB分解的结果也显示出在收入差异的贡献值中，系数效应与特征效应是相互抵消的。由此可以得出一个推论，往往家庭背景越好的个体，越不需要通过高等教育的途径提升个人的竞争力，而高等教育作为一种手段，在很大程度上弥补了先天的家庭条件与个人出身的差异，成为促进阶级流动、打破阶层固化的一种手段。

基于本文的研究结论，我们提出相应的对策建议。首先，要更加普及高等教育，为更多的社会中下层群体提供阶层进步的上升通道。其次，高等教育应在一定程度上向中低收入阶层倾斜，因为这样将带来更高的教育回报，更有效地发挥高等教育的效用。最后，高等教育应不断完善自身，更好发挥自身职能。

研究的不足与展望。本文在研究中最大的缺陷是，在倾向得分匹配过程中，计算模型倾向值使用了受限因变量模型，而此模型的最终拟合优度仅有0.1733，说明本文根据已有数据库所选择的解释变量不足以很好的衡量是否选择接受高等教育的倾向，使得匹配过程不够完美和精确。如何弥补这一缺陷，是下一步研究的努力方向。

注释：

（1）资料出处说明：本文所使用的数据全部来自国家社会科学基金资助之《中国综合社会调查（CGSS）》项目。该调查由中国人民大学社会学系与香港科技大学社会科学部执行，项目主持人为李路路教授、边燕杰教授。笔者感谢上述机构及其人员提供数据协助，本文内容由笔者自行负责。

［1］赖德胜.教育、劳动力市场与收入分配［J］.经济研究，1998（5）：43－50.

［2］杜健，张大亮，顾华.中国行业收入分配实证分析［J］.山西财经大学学报，2006（6）：73－78.

［3］田茂茜，虞克明.中国城镇居民人力资本收益率性别差异分析——基于贝叶斯分位数回归［J］.山西财经大学学报，2013（9）：1－10.

［4］吴要武.寻找阿基米德的“杠杆”——“出生季度”是个弱工具变量吗［J］.经济学（季刊），2010（2）：661－686.

［5］赵锦春，谢建国.收入分配不平等、有效需求与创新研发投入——基于中国省际面板数据的实证分析［J］.山西财经大学学报，2013（11）：1－12）

［6］林毅夫，刘培林.中国的经济发展战略与地区收入差距［J］.经济研究，2003，（3）:19－25.

［7］文雯.收入再分配效应的测度及其影响因素分析［J］.山西财经大学学报，2012（7）：9－15.

［8］姚先国，赖普清.中国劳资关系的城乡户籍差异［J］.经济研究，2004（7）:82-90.

［9］惠宁，郭淑娟.行业垄断与行业收入差距研究［J］.山西财经大学学报，2012（8）：21－30.

［10］杨瑞龙，王宇锋，刘和旺.父亲政治身份、政治关系和子女收入［J］.经济学季刊2010（4）:872-890

［11］Harmon C,Walker I.Estimates of the economic return to schooling for the United Kingdom［J］.The American Economic Review,1995,85（5）:1278-1286.

［12］Meghir C,Palme M.Educational reform,ability,and family background［J］.The American Economic Review,2005,95（1）:414-424.

［13］Angrist J,Krueger A.Does compulsory attendance schooling affect earnings［J］.Quarterly Journal of Economics,1991.

［14］Walder A G.Career mobility and the communist political order［J］.American Sociological Review,1995:309-328.

［15］Knight.J&L.Yueh.The Role of Social Capital in the Labor Market in China［C］.Oxford University，Department of Economics Discussion PaPer,2002.

［16］Simon Appleton，John Knight，Lina Song，Qingjie Xia.The economics of communist party membership:the curious case of rising numbers and wage premium during China's transition［J］.The Journal of Development Studies 2008,45（2）:256-275.

［17］Koenker R,Bassett Jr G.Regression quantiles［J］.Econometrica:journal of the Econometric Society,1978:33-50.

［18］Rosenbaum P R,Rubin D B.The central role of the propensity score in observational studies for causal effects［J］. Biometrika,1983,70（1）:41-55.

［19］Heckman J J.Sample selection bias as a specification error［J］.Econometrica:Journal of the econometric society,1979: 153-161.

［20］Blinder.A.Wage Discrimination:Reduced Form and Structural Estimates［J］.Journal of Human Resources 1973,8（4）: 436-455.

［责任编辑：冯霞］

Higher Education and Income Distribution:Change of Destiny or Locking of Hierarchy ----An Empirical Study based on Data CGSS2008

ZHANG Kai-ning

（School of Economics,Renmin University of China,Beijing 100872,China）

Based on OLS regression,we find that higher education can improve individual income,and the increase is far greater than the overall education and compulsory education.The outcome of quantile regression shows that the returns in higher education are significantly different at different quantiles of the income,and the ruturns to education is higher for low-income groups than highincome groups.Through propensity score matching,we can find that the OLS estimation produces weak downward bias when estimates return to higher education.Higher education is an effective way to break the locking of hierarchy and change fate.

G640

2095-106X（2014）02-0001-12

2014－05－10

张凯宁（1993－），男，山西太谷人，中国人民大学经济学院，研究方向是收入分配理论与微观计量经济学。

高等教育与收入分配：改变命运还是阶层锁定——基于CGSS2008数据的实证研究①

一、引言

二、文献回顾与模型设定

三、数据描述与初步分析

四、实证分析

五、研究结论与政策建议

高等教育与收入分配：改变命运还是阶层锁定
——基于CGSS2008数据的实证研究①