方言距离、同乡网络与跨市流动

2022-06-01 08:46王群勇张乃丹
南开经济研究 2022年3期
关键词:流动人口方言流动

王群勇 张乃丹

一、引 言

随着工业化、城镇化进程的快速推进,大规模的人口流动实现了低流动性向高流动性的转变,呈现出人口流动高度活跃的新常态。受我国流动人口政策调整及地区经济发展不均衡的影响,中国人口流动表现出明显的结构特征。首先,劳动力流动是人口流动群体中主要组成部分,我国经济发展存在明显的城乡、区域间不平衡,城市的就业机会和经济机遇是吸引劳动力空间转移的原动力。其次,大量农村剩余劳动力进入城市,成为我国改革开放、工业化和城镇化进程中涌现的一支新型劳动大军。根据2020 年第七次全国人口普查主要数据显示,2020 年人户分离人口达到4.93 亿,约占总人口的35%,其中流动人口是3.76 亿,相比2010 年增长了将近70%;从流向上来看,流动人口中有88.12%流向城镇,其中以乡村流向城镇占比最多;从流动范围来看,人口流动以省内流动为主,占全部流动人口的66.78%;另外,跨省流动人口流向东部地区的人口最多,高达73.54%,其次是流向西部地区,占15.06%。当前居住地与户籍所在地不一致的现象已经相当普遍,并且随着流动人口规模进一步扩大,人口的积聚效应进一步显现。

人口跨区域流动及空间分布的话题一直备受关注,已有文献主要关注经济因素、制度因素、地理因素等的影响。近年来,相关研究将视角逐渐转向文化、社会网络等非正式制度。由于长期受传统文化、家族和宗法势力等历史环境与非正式制度的影响,中国社会呈现“差序格局”的结构,而亲疏远近的人情关系体现的是有限范围内的“集体主义”,其具有一定程度的“排外”特质。对于流动人口而言,他们缺乏对本地市场的了解和相关从业经验,其自身能力有限,加之文化差异会强化身份认同观念和降低信任水平,使他们面临较大的“外来劣势”。对此,他们往往采取追随和模仿式流动,通过从社会网络中寻求支持和帮助,获取有效的信息和资源等,以此来降低流动风险和流动成本。可以看到,中国特殊的社会结构和文化特色为研究方言和社会关系影响人口流动提供了很好的现实背景。考虑到市内文化、社会结构大同小异和人口市内跨县流动行为的决策会受到更多不易度量的人为因素的影响,本文暂且不考虑市内跨县流动的个体,仅探讨省内跨市和跨省流动的决策行为。

本文的创新点包括:其一,本文在分析中国城际人口流动空间结构特征的基础上,基于移民社会网络理论和语言文化视角构建条件Logit 模型,系统性探究同乡社会网络和方言距离对于流动决策的共同影响。这有利于增进人们对个体流动决策形成机制的理解,是对现有相关研究的补充和拓展。其二,已有研究仅考虑了城市特征对人口流动的平均效应,而不同的人口特征会存在很强的异质性反应,因而加入人口异质性特征交互项来考察其差异化表现是本文的另一个贡献。

二、文献综述与研究假设

人口流动问题在发展经济学领域一直受到广泛关注,它关乎地区经济增长、社会民生等区域发展。大量研究从宏微观等多层次研究人口流动的机制,最早获得关注的是宏观经济因素对人口流动的影响,其典型代表包括刘易斯二元经济理论、费景汉-拉尼斯模型及乔根森模型,他们的基本观点可概括为经济发展的不均衡性导致人口跨区域、跨部门的流动。这对把握人口流动的宏观动因和机理给出经济学阐释和模型论证。由于上述宏观视角缺乏对现实情况的合理解释,因此后来研究逐渐拓展到微观分析,以托达罗模型、李的推拉理论、人力资本理论和新劳动迁移经济理论为代表的新古典主义研究方法,弥补了早期模型没有考察个体作为当事人的决策行为过程的不足之处。随着行为主义研究方法的运用,人们对流动人口主体性更为关注,强调个人因素必然会影响微观个体的行为决策(肖周燕,2010;刘风、葛启隆,2019)。在实证研究方面,不同城市在资源禀赋、地理位置、历史文化、政策选择等方面差异巨大,多方位地勾勒出流出地、流入地的系统性或区域性因素对人口流动的影响,包括城市公共服务水平(夏怡然、陆铭,2015)、城市生态文明建设(张海峰等,2019)、空气污染等城市环境要素(孙伟增等,2019)、房价(周颖刚等,2019)、方言文化(刘毓芸,2015;鲁永刚、张凯,2019)等。近年来,随着大型微观数据调查和计量技术方法的推进,相关研究将视角逐渐转向文化、非市场互动等非正式制度,认为非正式制度作为不同于国家干预和市场调节这两种最为基本的资源配置方式,同样也能在资源配置中发挥作用,体现为在节约成本的同时给予人们在正规渠道无法得到的资源。

(一)同乡网络与人口流动

20 世纪80 年代,国外开始利用社会网络理论、社会资本理论来解释人口的流动,考虑人类群体的特征和人类群体之间的相互联系,社会网络对流动去向选择会产生较多的影响。Massey(1990)认为社会网络是影响劳动力迁移与社会融合的重要因素。由于人类行为选择常偏好一定程度的本体性安全感和信任感,依靠亲缘、地缘关系搭建的社会网络值得信赖。相关研究进一步证实了移民的乘数效应,即每个成功迁移的个体会促进群体的后续迁移,已转移的个体能为潜在流动个体提供流入地相关信息、经验知识及就业机会,降低了职业搜寻成本,增加了被雇佣的概率,同时也会降低潜在流动个体的心理成本,提供面对风险的基本保障和社会支持。Stark 和Jakubek(2013)证实,基于迁移成本的考虑,阶段性迁移为资金缺乏的潜在移民提供资金并且加快迁移的过程。Bredtmann 等(2020)认为移民网络是正式制度和社会保障的有益补充,能促发个体流动。

Bryan A.Stuart(2019)研究流出地与流入地形成的移民网络对移民迁移决策选址的影响发现,对于黑人移民而言,网络关系能为其在流入城市带来就业机会,并降低迁移成本;平均每个从南边迁移到目的地的黑人会带动1.9 个黑人进行迁移。Frank Kalter(2016)通过构建特定迁移社会资本发现,当个体家庭成员(包括直系亲属和旁系亲属在内)曾有流动迁移情况的,会显著增加其他个体的流动概率,由此肯定了强社会关系对流动的正向影响;然而,将人口流动进一步分为两个阶段,弱关系仅对“是否考虑过流动迁移”的第一阶段有显著影响。盛广耀(2018)利用二次指派程序(QAP)网络回归分析发现,社会关系网随着人口流动网络形成,其积累效应促使人口流动网络产生自我强化特征。Foltz 等(2020)将社会网络关系聚焦在中国宗族网络方面,发现宗族网络通过降低迁移成本促使人口流动。随着流动人口在现住地社会网络嵌入程度加深,流动人口再次迁移的意愿低。Michaelides(2011)通过实证研究证明在控制了区域间工资和住房成本差异后,流动人口与现居住地联系越紧密,相关迁移的可能性越小。与此同时,不同类型的社会关系起着截然不同的效果。高虹和陆铭(2010)发现,社会信任作为本地化的整合型社会资本,本地的社会信任程度越高,劳动力流动的机会成本也会越高,不利于其形成跨越型社会资本,从而阻碍劳动力向外流动。综合文献研究来看,流动人口基于两地建立起的社会关系网络能为潜在流动者提供社会支持,降低个体潜在流动的成本和风险,增加预期回报,从而有助于其采取相同的流动决策和行为。

(二)方言距离与人口流动

近年来,学者们对于流动迁移机制的理解逐步从经济因素拓展到价值观念、偏好、规范、信任与认同感等非经济因素方面,肯定了后者在其流动机制中不可忽视的作用。首先,个体在面对复杂的外部环境时所表现的行为差异根源于个体的文化取向和偏好,内化的主观认知形成相对稳定的思维惯式和决策模式,即使个体进入新的环境,其观念和行为都难以迅速被改变(Bowles,1998;De Backer 等,2015)。其次,习俗、信念和行为规范通过代际相传在特定群体内部形成一种趋势或范式,进而影响群体成员交互行为,并在一定程度上形成有效的社会约束力,规范社会运行秩序。上述这些价值观、偏好、信任与规范等概念构成了文化的多面性,也自然而然成了理解经济社会现象、个人行为的深层次因素。

语言和文化是主客体相互交融、内在统一的有机整体(杜道明,2008)。语言被视为文化的综合表征。具体来说,语言作为人们日常沟通交流的工具,是信息的载体和文化传承与变异的重要传播途径。同时,语言也是文化的重要构成要素。一是语言习惯反映了人们对事物的看法,也反映了一个民族的历史与文化。二是语言决定了认知,由于人类生活在受特定语言支配的环境,所以人们的思维和行为方式会被语言潜移默化地支配。另外,考虑到文化的定义广泛而抽象,局限于文化维度的测量难度,常将语言作为文化因素的代理指标。可以说,语言差异归根到底是文化上的差异,文化的差异也塑造了丰富多元的语言差异,也就导致了不同群体在价值观、偏好以及信任、规范上的差异,进而影响人的行为。我国各地的语言差异主要源于方言,方言是语言的地理变体和社会变体,相应地将方言分为地域方言和社会方言。由于社会方言主要表现为同一种语言的人因阶层、职业、年龄、性别等不同而导致的口音、措辞、言谈等区别(游汝杰、周振鹤,1985)。因此,本文暂不涉及社会方言方面的问题,主要从地域方言的视角展开研究。按历史语言学的假说,方言分化是由移民开端的,但是后来的继续分化和演变过程又跟自然地理、交通地理、行政地理等因素密切相关,并且方言地理分布也逐渐趋于稳定,从古代旧府辖区方言分布和现代方言地理可以看出,其内部有很强的一致性。据文献资料记载,受自给自足的农业经济和古代地方行政管理制度影响,中国的汉语方言地理格局在宋代已经奠定,这种由自然分界线划分的区域往往又与民系、风俗和语言类似(游汝杰,2021)。方言差异所表征的地域文化差异是否会构成人口跨区域流入的障碍也一度成为国内研究的话题。相关文献普遍认为,方言距离代表着文化差异、身份隔离,方言距离的增加会加大迁移成本和异地工作、生活难度,不利于劳动力流动(李秦、孟岭生,2014);但随着普通话的普及及交通基础设施的完善,方言对人口跨区域流动的阻碍影响日渐式微(鲁永刚、张凯,2019;黄宗晔、杨静,2020)。刘毓芸(2015)认为,方言距离与劳动力跨区域流动呈倒“U”关系,方言距离越远越能促进劳动力流动,而一旦超过临界点,认同效应超过互补效应,则会抑制劳动力流动;社会身份认同效应是导致方言距离发挥负向作用的机制之一,而流动人口具有的劳动力多样性具有互补效应,促使人口流动(Liu 等,2020)。不可否认的是,早期方言影响着人们的沟通交流,随着普通话的普及,方言差异不再是跨区域交流的障碍,而更多地体现背后的文化差异、心理距离及群体认同感,语言形成的身份认同会进一步影响双方信任度。如果相互之间缺乏一定的信任度(黄玖立、刘畅,2017),会导致外来人口与当地人口在生活和工作方面难以有效融合,增加流动的隐形成本。

虽然关于网络和方言距离的文献对移民区位选择的影响研究较为充分,且普遍认为社会网络的“信息效应”和“同群效应”能提高迁移的可能性,促使劳动力聚集(潘静,2014),但是鲜有研究探讨二者的交互作用。Bredtmann(2020)的研究证实,网络关系对移民的重要性取决于语言异同的程度,二者交互项会产生积极的正向作用,母国与东道国间的语言距离越大,网络越重要;网络规模越大,因语言障碍造成的负面影响越小。这意味着个体习得东道国语言的成本越高,语言障碍越不利于移民获取知识和提升技能水平。为了“补偿”因流动到收入水平更高的地方所付出的高昂代价,依托移民网络能获得住房、就业机会等信息减少进入障碍和降低流动成本,所以移民网络对个体向东道国流动具有推动作用。在中国,人口流动集中在一定地域范围内,常表现为倾向于同一方言区域的流动;同时,地缘连带的跨区域人口流动现象也十分常见。例如,湖南新化县人遍布全国开设复印专业店,正是通过地缘、亲缘等乡土关系网络让其印刷技术得以扩散,同时也在更大范围内带动更多的同乡从事这项产业。冯军旗(2010)调查发现,新化县的方言是技术传播的一个重要阻隔方式。

本文基于全国流动人口动态监测数据,关注方言和网络关系的交互作用对人口流动的影响。本文度量的方言距离是潜在的流入地与流出地(户籍地)之间的方言距离。基于以上分析,本文提出如下假设(H1)。

H1:同乡网络能促进人口跨方言区流动,随着方言距离增加,同乡网络对人口流动概率的效应增强,即方言距离越远,同群效应越显著;随着同乡网络规模扩大,方言距离对劳动力流动的抑制作用减小。

关于流动人口的异质性研究有了比较一致的结论:流动人口中男性多于女性,年龄结构偏轻,受教育程度不高,并且多从事体力劳动等。以人力资本为例,Bryan A.Stuart(2019)认为,理论上而言,教育和社会网络效应之间的关系是模糊的,虽然教育程度的提升可以促进社会联系,但是也增加了个体选择非社会网络倾向的流入地的相对回报。李志刚、刘晔(2011)研究发现,受教育程度越高,其社会关系的分布受空间分隔的作用越不明显。除了受教育程度,流动人口的健康状况会影响流动距离和就业选择,进而影响人力资本回报等。因此,低人力资本水平的个体更加依赖社会关系网络提供职位推荐和就业机会,以便降低迁移成本和消除市场歧视及解决资金匮乏问题。另外,方言所代表的地方文化被视为地域归属感和认同感的重要组成部分,文化差异增大,认同感也会趋弱。有研究表明,在控制了普通话的普及程度后,地方文化越接近,移民越多;并且,对男性移民和教育水平较高的年轻人影响较大(李秦、孟岭生,2014)。据此,本文认为年龄、人力资本等不同人口特征的个体对方言距离和同乡网络会表现出异质性反应,并提出第二个假设(H2)。

H2:同乡网络和方言距离对异质性个体流动的影响存在差异化表现。

通过以上分析,本文基于方言距离和同乡网络的统一框架,探讨二者及其交互项对人口流动决策的影响(积极互补,还是消极替代,抑或是无显著作用)。此外,随着普通话在全国各地区得到不同程度推广后,以上两者对人口流动决策的影响是否存在差异化表现?

三、理论模型

依据已有文献研究,个体能够知晓自身拥有的禀赋、能力并选择能使自己效用最大化的城市,这一阶段除了受传统经济因素影响,文化距离和社会关系也会产生重要作用。在社会互动的视角下,行为人的行为决策不是独立进行的,其不仅受到所处环境特征和自身个体特征的影响,而且在较大程度上受到参照组中其他个体行为特征的直接影响。借鉴刘启超(2020)基于Michel 构建的异质劳动力的跨区域均衡模型,将社会网络加入理论模型中,本文对模型做了进一步扩展,加入社会网络()和语言文化(),阐释社会网络和语言文化在影响人口流动过程中的作用。

(一)基本假设

本节构建一个包含两个地区、两种群体的模型及其基本假设如下。

其一,我们构建一个包含两个地区r=A、B 的经济体,两地间生产的产品无差异,无运输成本,且产品的生产仅需要劳动力作为唯一需要投入的生产要素。初始状态下,两地区在生产技术和初始禀赋等方面均相同。

经济体人口资源均包括两种,分别是本地居民H和流动人口 L。在初始期两地区的流动人口与本地居民规模均等(以保证禀赋均等),但是以后各期个体是可以跨地区流动的,他们的区域分布格局的关系式为 L = L+ L,H = H+H。

其中,下标A 和B 分别表示两个地区;另外,本文不考虑人口增长的情况下,地区间人口流动后造成的人口地区分布格局。

由于各地区均包含两种劳动生产要素,相应的生产函数可表示为:

上述生产函数中,E ( L)是一个外部性函数,具有希克斯转移因子的特点,即随着流动人口的流入,区域内拥有较多数量的流动人口,具有不同知识技能储备的人口聚集会发挥互补性,通过知识溢出、人力资本外部性等机制能提高周围劳动力的生产率水平,但同时外部性的边际生产率也在降低。F ( L, H)满足稻田条件,即规模报酬不变,边际产出递减,且 F ( L,1) =f ( L), f ′( L) >0,f ′( L) <0。

其二,由于区域内的产品市场是完全竞争的,产品价格等于边际成本,即p=a,p=a。其中,p、p分别代表A 地、B 地产品价格,每单位产品需要投入a 单位劳动力,劳动力在生产中所获工资记作。由于在区域间自由交易且没有运输成本,故两地产品价格是相同的,即 p= p。同样,区域内的劳动力市场也是完全竞争的,因而每个地区劳动力的工资水平由边际生产率决定。由此,可得流动人口的工资为:

其三,经济体中每个人都是理性经济人,在消费预算约束下只追求当期效用最大化。朱江丽(2016)认为,对于社会、文化、网络、习俗和环境等社会人文因素不会直接影响生产,而是通过引致异质性偏好使得流动和选择产生差异化表现。这种异质性偏好会通过获得的收益影响个体的效用水平,进而作用于个体的流动决策。假定个体在城市内的效用包括两个部分,一部分是对于厂商生产的差异化计价产品的消费所获得的效用;另一部分是利用社会网络关系所带来的效用。最后,假设效用函数的私人成分和社会成分可以直接相加。给定区域r 内的个体i(i=H,L)的效用为:

式(4)第二项可以解释为地区r 的人口密度,实际上,从更加广泛的视角解释 S,即除了可代表地区的物理总面积以外,还可以指有限的资源储备,比如公共基础设施、公共福利等。

结合社会互动,进一步讨论区域空间承载力所造成的影响,v′ >0,v′ <0。另外,本文假定所产生的外部性不会溢出到另一地区。具体来看,第一部分效用得益于社会网络的集聚效应:区域内部人口越多,流动人口在本地社会嵌入程度越深,个体间交互的潜能越大,在交互过程中传递的信息、资源、机会越多,从而越有利于行为人进行决策;另外,也表现为情感意义上的地缘、亲缘关系,如同乡、亲人、朋友等都会带来情感上的效用。第二部分表示的是拥挤效应和认同效应,居住在有大量人口的区域虽然提供给大众诸多发展机会,但往往也面临着基础设施和公共服务供给的短缺。另外,流动人口在进入新环境时会面临语言沟通、本地融合等方面的障碍,同时在身份认同效应的影响下,会增加财物损失等各种意外风险(刘毓芸,2015),从而降低流动带来的效用水平,这些负向影响不利于人口流入。因此,个体选择进入某个区域的过程中,社会网络的集聚效应会对人口流动产生拉力,而公共服务、社会保障等带来的拥挤效应及文化差异造成的认同效应则会起到推力的作用。相应地,本文将消费的外部性设为公式(5)的形式。

在公式(5)中,a、、b 和为[0,1]的常数,a 表示聚集效应对效用的重要程度;b表示福利的拥挤效应对效用的影响程度;表示社会网络的规模强度,用于说明得益于聚集带来的正向外部性,聚集规模越大,群体内部的交流、互动越频繁,能有效弥补流动人口缺乏信息、资源、机会等“外来劣势”的不足;表示认同效应的重要性,这种效应包含以下两个含义:一是地区对身份、文化等开放包容度越低(本地社会群体在受到外来人口和外来文化冲击时所表现出来的排斥,即使这种排斥渐弱),外来人口要想迅速适应和融入当地社会的难度越大,导致流动人口在当地生活、工作获得的归属感越差;二是双方难以建立信任和认同感,增加信息成本,不利于知识溢出和吸收。

基于上述效用函数,个体在地区间的流动决策行为是由效用差异的驱动而产生的,以流动人口在A 地为例,得到以下效用函数的差距:

式(6)中,m 是常数,表示的是其他阻碍或促进个体流动的适应性因素,包括距离、区域经济、个体特征等。

(二)均衡

为了进一步阐释其中的机理,本文将假定生产的外部性、生产函数及因工资带来的间接效用的具体形式为公式(7)。

其生产函数的具体形式设定为规模报酬不变的C-D 生产函数(其中,0<<1 ,r=A,B):

由前文可知,个体在区域内所获得的效用分为两部分。其中,工资带来的间接效用设为工资水平的对数形式,如下:

将(9)式代入(6)式,可得

将式(7)、式(8)代入式(2),可得:

根据上式对 L进一步求微分,可得:

因此,在生产外部性既定的情况下,当聚集效应强于认同效应、拥挤效应时,存在3 种均衡。另外,在社会网络的作用下,均衡中的对称均衡是不稳定的,流动人口不会均匀地分布在两个地区,而非对称均衡是稳定的,表现为大部分流动人口会聚集在其中一个地区,这种流动具有累积效应和自我强化机制,拥有大量流动人口的区域会吸引越来越多的人口流入,进而产生稳定的非对称空间格局。

当聚集效应弱于认同效应、拥挤效应,且生产外部性足够弱或两条件同时满足时,存在唯一均衡,且全局稳定,流动人口会均匀地分布于两个地区。在认同效应和拥挤效应的作用下,流动人口流入当地能带来的效用水平会由于交流沟通成本增加、文化融合度低、当地社会群体排斥等而下降,不存在大量流动人口聚集于同一区域的现象,进而不会产生明显的非对称人口聚集空间格局。

基于上述理论模型的均衡结果,本文仅提取聚集效应和认同效应对人口空间分布格局的影响做进一步分析。结合现实,本文认为这种认同效应根植于文化多元和长期以来本地社会群体的代际传承,这使得不同地区文化存续和发展具有一定的独立性;在不存在生产和消费外部性(即地区间的生活福利设施是独立相同,不受人口规模影响)时,社会网络所产生的正向交流外部性和文化多元所产生的负向认同效应是影响流动人口聚集的一对作用力和反作用力。

四、研究设计

(一)数据来源

本文使用的个体层面数据来自于2017 年全国流动人口动态监测数据(CMDS),该调查按照随机原则在全国31 个省(区、市)和新疆生产建设兵团流动人口较为集中的流入地抽取样本点,调查对象为全国在调查前一个月来本地居住、非本区(县、市)户口且在调查阶段年龄在15 周岁及以上的流入人口。该数据的一大优势在于给出了流动人口户籍地和居住地所在区县的准确信息,样本量大,覆盖面广,对于全国流动人口基本状况具有较好的代表性。本文选取CMDS 数据库提供的个体特征信息,城市层面数据来自《中国城市统计年鉴》,统计口径为全市,其中方言地域分布来自于CSMAR数据库。

(二)城际人口流动情况

近年来随着人口流动空间交织日趋复杂化,人口流动的网络特性逐渐成为趋势,复杂网络分析方法为人口流动研究提供了更为科学的研究视角和方法参考,通过社会网络分析技术,我们对人口流动网络整体和局部特征有了更为清晰的认识(王珏等,2014;陈锐等,2014;蒋小荣、汪胜兰,2017;潘竟虎、赖建波,2019;叶明确、任会明,2020;Zhang,2020)。因此,本文利用大型微观数据构建城际人口流动网络,以样本中374 个城市为网络节点,人口流向和流量构成了节点之间的连接。基于城际人口流动网络探析人口流动过程的路径与强度,构建人口流动网络的空间关系矩阵,进而将全国各城市人口流动可视化,以此来分析人口流动的集聚扩散过程,描述真实空间格局中各地区节点间的关系。

本文根据2017 年CMDS 数据,构建城际人口流动矩阵,即将个体户籍地与现居住地的所在城市构建二维交叉表,生成以流出地为行、流入地为列的人口流动矩阵,其中矩阵的单元格对应流出地流向流入地的人数。通过统计分析,我们发现以下特征化事实。第一,人口流入地比较集中,人口流出地则呈现多极化。30%的城市为净流入,其中前十大城市占了总流动人口的近1/4,70%的城市为净流出。图1 是按照流动人口总量(流入与流出之和)排名前50 的城市的流入人口占总流动人口比例(上)和流出人数占比(下)的柱状对比图,左侧和右侧对应着相同的城市。可以看出,前40 位的城市基本呈现明显净流入(其中,重庆、阜阳、周口、绥化、乌兰察布等是净流出),而40 位之后的城市基本以净流出为主。沿海经济发达地区、省会城市及部分都市圈核心城市是人口净流入地区,比如位于长三角地区的上海市、南京市、苏州市、无锡市等。

图1 中国城市人口流入(上)与流出(下)的柱状对比图

第二,人口流出表现出较强的空间相邻性。在迁移居民中,迁移的平均距离为467千米,省内迁移的比例为38%。同一省份的跨市人口流动较为活跃,跨省城市间的联系较弱,跨省的距离越远则联系越弱。比如,在广西的流动人口中,29%流向南宁,14%流向柳州,9%流向佛山,7%流向东莞,4%流向广州,3%流向深圳。这种空间的邻近性,一方面表明空间距离是影响人口流动的重要因素,另一方面也体现了文化上的相似性。

第三,人口流动的单向特征明显,网络的互反系数为0.1,即10%的城市存在相互流入。同时,流动的等级特征明显,网络的同配系数(assortativity)只有0.04。这表现为流动人口更多地是从小城市流向大城市,城市的等级差异造成了相连城市的度的相关性比较低。

第四,人口流动网络的社团特征明显。首先,城际人口流动整体呈现东南部密集而西北部稀疏的特征,与“胡焕庸线”的全国人口分布格局相一致,反映了人口流动空间分布的相对稳定性。其次,根据流动网络将城市划分为9 个社团,社团内部的城市间人口流动紧密,流动人口占总流动人口的87%,而社团之间的城市间人口流动较为稀疏,占流动人口的13%。而且,人口流动空间格局的经度分割效应明显弱于纬度分隔效应,即南北分界比东西分界更加明显。南方和北方区域内部彼此融合更为紧密,这也说明社会作用力大于自然地理的划分(李毅等,2017)。除部分一线城市是全国范围内主要的人口流入城市外,其他次要的人口流入地呈现出多极化特征,比如北京市周边的石家庄市和天津市,广州市周边的珠海市、佛山市,以及川渝地区、武汉市等地,并且形成了长三角、京津冀、珠三角三大都市圈为主,而以中西部地区少数省会城市为辅的格局。

五、方言距离、同乡网络对个体流动决策的影响分析

(一)主要变量及其测度方法

1. 核心解释变量

(1) 方言距离(D)。经济学文献对于语言距离的测量方法通常分为两种。一种是基于“谱系树理论”,利用“结点数法”,基于语言分化的先后顺序,以两种语言是否属于同一语系、同一语族或同一语支等来构造语言距离的虚拟变量,这种方法虽然以较为粗糙的形式刻画了语言距离,但因其数据可得性强而得到了广泛应用。另一种是基于语言同化的视角,强调方言之间相互影响而出现趋同来构建方言互通性相关指标(林建浩,2017;鲁永刚,2019),这种定量分析方法最开始由Cheng(1997)构建,根据汉字在不同方言中的发音,计算出方言间的音韵相关系数,在此基础上根据普通话词汇在不同方言中的说法计算出方言两两间的词汇相关系数,最终合成相应指数。本文借鉴刘毓芸(2015)做法,参照方言层次划分直接进行人为赋值、加权的方法,但稍有不同的是,考虑到相同的方言片下仍存在地域性语言差异,因此进一步细分至方言小片,将汉语方言依次划分为方言大区方言区、方言片、方言小片,各地区方言情况统计来自于CSMAR 数据库。鉴于此,本文对相应区县所属方言进行编码整理分类,细化到方言小片,最终得到169 个组别,按照方言片划分,得到99 种方言组,而按照方言区和方言大区分别得到18 个组和10 个组别,总共2709 个观测值。另外,各城市区县人口数来源于第六次人口普查分县数据(2010 年)本地人口(户籍人口)统计。由于近年来区县行政区划变迁,无法实现各地区方言数据与2010 年区县完全匹配,通过手动调整和百度检索,最终匹配出共计3102 个区县行政单位的方言属性,赋值得到区县之间的方言距离,再用人口加权得到两两城市之间的方言距离。具体方法如下,两个区县属于同一方言小片时,方言距离为0;属于同一方言片的不同方言小片时,方言距离为1;属于同一方言区的不同方言片时,方言距离为2;属于同一方言大区的不同方言区时,方言距离为3;属于不同方言大区时,方言距离为4。再采用各区县2010 年的人口占比,利用式(14)加权得到两两区县集群之间的方言距离。相应计算公式为:

其中,i ∈ C,j ∈ C,A ≠ B,S为城市A 中任一区县i 的人口比例,S为城市B中任一区县j 的人口比例,d为区县i 和区县j 之间的方言距离。

(2) 同乡网络规模(P,)。对于同乡网络的界定,普遍从省籍、市籍、区县籍等地缘概念出发,以同一原籍或出生地的流动人口确立同乡聚集程度(张春泥,2013;魏万青,2016;Bredtmann 等,2020)。魏万青(2016)以跨县市流动农民工所在生产线班组工友是否来自同一乡镇,界定工人同乡聚集程度。Bredtmann 等(2020)以同一流出地和流入地的前期人口流动规模对数值作为移民网络;另外,考虑到可能会受到母国人口规模效应的影响,进一步地以母国流入某一东道国的流动人口数占母国所有流动人口比例来构建相对移民网络。本文借鉴大多数文献做法,一方面,考虑到流出地和流入地的人口规模效应的影响,以户籍地向外流动人口中进入现居住地城市人口的占比来度量;另一方面,只有先转移的人口才会对潜在流动者产生影响,故选取在个体流动之前已经实现流动的同乡来构建网络。其具体公式为:

2. 控制变量

参考已有文献,本文控制了两两城市之间的地理距离,其中地理距离是城市间的驾车距离,相比直线距离更为真实地衡量了人口流动的距离。另外,截至2017 年底,“四横四纵”的高铁网络基本形成,随着网络化特征逐渐加强,区域间联系更为紧密。借鉴赵康杰(2020)的做法,本文利用省会城市2014—2017 年高铁频次数据建立城市层面的高铁网络,在城际结点赋值矩阵中,是否处于同一高铁线路的城市之间的关系用0~1 表示,其中,1 指两个城市存在直达的高铁联系,0 则说明不存在直达的高铁联系。同时,经济要素方面包括了人均GDP、第二产业占GDP 的比重、第三产业占GDP的比重、人均小学老师数、人均医师数以及人均公共图书馆图书藏量,以上城市层面数据来源于《中国城市统计年鉴》。经济发展水平越高的地区,城市公共服务越好,社会保障水平越高,人口越易于流入,能对人口流动产生巨大的“拉力”,而相反地则会形成“推力”。因此,本文进一步计算得出两两城市之间的差距作为影响人口流动的经济因素指标。各变量具体定义和描述性统计见表1。

表1 变量设置及描述性统计

(二)计量模型构建

针对本文的研究问题,为了更直观地反映人口流动微观决策行为特征,利用随机效用函数对个体的选择行为做出解释。借鉴Bredtmann 等(2020)构建随机效用最大化框架,对于来自城市s 的个体i 而言,其面临多个流动选择地K,相应选择流入地r ∈K的效用为 u。其具体模型为 u=v+。其中,i 表示流动个体,i=1,2,…,N;r 表示流动人口备选城市,r=1,2,3,…,K;V指影响流向某个城市r 效用的一系列个人偏好与流入地的特征变量;为未观测因素。流动个体会在备选城市中选取使其效用最大化的城市r,即满足条件为 u>u,∀ r ≠ k。

由于方言距离和流动人口同乡网络均表现为流入地和流出地之间的特征。可以看出,效用不仅取决于决策者个人的特征,更多地取决于备选城市的特征,个体在多个城市间进行选择,相应的被解释变量是定性变量。因此,本文用微观数据和条件Logit 模型(Mcfadden,1974)取代加总数据来研究方言距离和移民网络对个体空间流动决策行为的影响效果。对于流动个体而言,选择流入城市r 的概率如式(17)所示,被解释变量y是0~1 虚拟变量,当其等于1 时表示流动个体i 在第t 年从s 地流动至r 地,而等于0 则指个体当年流动没有选择该城市。由于每个潜在流动人口i 都面临包含K 个城市的城市选择集,实际观测备选方案数为个体样本数乘以城市个数(N × K)。其具体模型估计式为:

在式(17)中,下标i 指流动人口个体;s 代表户籍地,r 代表备选城市,在本文中指代地级及以上城市;t 指年份,本文具体指个体流入本地的年份;P是前文描述的同乡网络规模,即指个体在本次流动到备选城市r 地之前所有同乡流动到该地的比例,因而这一指标会在不同时间上存在变动,其下标包含时间维度,而D表示户籍地和备选城市之间的方言距离,方言代表的是一个区域长期传承下来的文化,其存在具有较强的稳定性。另外,本文选取的样本流动年份仅涉及3 年,因而在这一区间方言距离可视为恒定,故其下标不含时间维度。由于方言距离和同乡网络指标的构建都选取人口流动发生年份滞后数据,尽量避免了由于双向因果带来的内生性问题。另外,X,是一系列可能影响人口流动的其他城市特征变量,考虑到个体在进行流动决策时,当期决策受到前期宏观经济效果的影响,因而对备选流入城市的经济因素采用滞后一期的形式,以更准确地反映这一影响。

本文选取了2015—2017 年流动的人口作为样本,通过将个体微观数据和城市层面数据进行匹配和筛选后,2015—2017 年的样本量总共有37751。另外,对于每一个流动人口而言,所有城市都是其流入地的备选方案,只有当流动人口对城市掌握了比较充分的信息,才会在备选城市中选出流入城市。因此,本文结合《中国城市统计年鉴》2015—2017 年中统计的地级市及以上城市与微观数据进行匹配,得到了282 个备选城市集合。这282 个城市构成的备选集合分布于全国30 个省(自治区、直辖市),能较好地代表人口流向选择集。

(三)基准回归及分析

其回归结果报告于表2 之中。在表2 中,第(1)列仅考虑方言距离和同乡网络对外来人口流向选择的影响,结果显示方言距离阻碍了人口流动,而同乡网络规模越大越能促进劳动者流动;第(2)列在第(1)列的基础上加入方言距离和同乡网络的交互项,可以看到交互作用能显著提高城市被选择的概率,说明同乡网络关系能有效“弥补”方言距离带来的文化差距、信任隔离等负向影响;第(3)列进一步将户籍地与备选流入城市两两之间的人均GDP、第二产业占比、第三产业占比、高铁开通以及医疗资源、教育资源等经济、公共服务方面的差距作为控制变量,结果表明二者及其交互项对流动决策的作用依然显著,同时城市特征变量对于人口流动决策的影响基本符合预期。人均GDP、第二产业占GDP 比重、第三产业占GDP 比重、城市医疗公共服务水平的差距以及高铁开通都对人口流动决策有显著的正向影响,这说明较高的经济发展水平、产业结构越高级以及高质量的公共服务越能吸引更多的人口流入。地理距离越远,流动成本越高,越不利于人口流动,而城际高铁的开通缩短了时空距离,对人口流动具有极为显著的促进作用。产业结构的影响存在差异,第三产业占比差距比第二产业占比差距对流动决策影响系数更高,可能的原因是第三产业需要的就业人口更多,市场更大,能提供更多的就业机会,因此越容易吸引流动人口。表2 第(4)列进一步控制了个体的备选城市所在省份的固定效应,方言距离和同乡网络对流向决策的作用与之前结果保持高度一致。

表2 条件Logit模型回归结果

综合而言,方言作为地域标识和文化的重要载体,方言距离越大说明文化差异越大,认同感、信任感也会明显减弱,会导致个体在流入地文化适应成本更高,为寻求“安身立命”要付出更高昂的流动成本,因此方言距离所带来的“外来劣势”会导致个体流向距离更远城市的概率更小。而同乡社会网络能有效激发流动人口的内群体效应,以“抱团”的形式提供和识别有效的市场信息、资源、机会等,保障了流动人口在新的环境下快速生存和发展,促进流动者实现流动。因此,在方言距离更远的流入地,同乡网络会发挥更强的外部性,进而加大其流入该地的可能性,这也就是二者交互项显著正向的缘由所在。

(四)模型的拓展

1. 方言距离与同乡网络影响人口流向的异质性

不同人口特征的个体对方言距离和同乡网络可能表现出异质性反应,已有文献证实了劳动力流动决策在人力资本、户口类型等方面的差异。本文在基准模型之上加入核心解释变量和人口特征的交叉项来考察个体的异质特征(夏怡然、陆铭,2015;张海峰,2019)。其模型设定为公式(18)。

在公式(18)中,Z表示流动人口的个人特征向量,包括年龄、受教育年限和健康状况,其他变量同前文。表3 中的第(1)列~第(3)列分别报告了3 个结合个体特征的异质性回归结果。其结果显示,方言距离和同乡网络及其交互项对流动决策的作用与之前结果保持高度一致。从其第(1)列看,年龄数值大小对个体流动决策行为不易受到方言距离和同乡网络的影响,不存在年龄上的差异化表现,可能的原因在于本文研究对象中样本普遍较为年轻化,且年龄的差异小。从其第(2)列看,受教育年限与方言距离的交互项系数显著为负,以往的研究表明,受教育程度越高,人力资本水平越高,向外流动更为容易,而本文结果与之不一致的原因可能在于研究对象的平均受教育情况是高中或中专学历,这类人群从事的工作更偏向劳动密集型产业,并且随着近年来各地区纷纷表现出对人才的偏好及加大人才引进的力度,会不利于受教育程度低的个体流动。表3 第(3)列报告了健康状况的异质性作用,健康状况与方言距离的交叉项系数为正,说明健康状况越好,流动决策受方言距离负向影响程度也会越弱一些,这也从侧面印证了表3 第(2)列受教育异质性及产业结构的影响。劳动密集型产业生产需要大量使用劳动力,而对技术和设备的依赖程度偏低,此时身体的健康状况构成个体人力资本的重要因素,一方面可以采取更远距离的流动决策,另一方面更强的身体素质会有更多机会选择就业。但是,同乡网络规模对流动决策的影响不存在年龄、人力资本上的差异,可能的原因在于本文度量的同乡网络规模是一个更加宏观层面的区域间社会网络,衡量的是在不同备选流入地方案下同乡的社会嵌入程度,与潜在流动者没有直接社会网络关系,因此不存在明显的个体异质性影响。

表3 方言距离与同乡网络影响流动决策的个体异质性

2. 普通话的重要性

在中国,普通话的推广使得普通话作为通用语言有效降低了语言沟通障碍。鲁永刚、张凯(2019)和黄宗晔、杨静(2020)等研究方言距离对劳动力流动的影响时发现,随着普通话的普及能削弱方言距离对流动的抑制影响,促使人口进行跨方言区的流动。因此,本文也将考察不同普通话普及率下方言距离和同乡网络影响的差异。鉴于数据的可得性,本文采用《中国语言文字使用情况调查资料》(2006),由于该资料仅提供到省级层面的数据,本部分以流入地备选城市所在省份的普通话普及率代替衡量城市普通话推广程度。本文将普通话普及率按平均值大小分为高、低两类,将所有备选城市分成两个子样本。表4 中第(1)列和第(2)列分别报告的是普通话普及率低的子样本和普通话普及率高的子样本的回归结果。结果显示,方言距离和同乡网络对流动决策的影响依然显著,但其影响会因普通话普及率的不同而存在差异。

表4 按普通话普及率分样本回归

续表4

六、结论与建议

本文考察了方言距离、同乡社会网络对流动决策的影响。方言作为地域文化的重要载体和符号,除了发挥交流沟通的功能外,更为重要的是表征了语言背后所蕴含的多样化文化传统和差异化思维习惯。同乡网络作为社会网络的一项重要组成部分,其形成依赖于地缘,在注重“差序格局”的社会里,地缘形成的网络关系具有“脱域”的形态,这对于流动人口群体而言,其影响是更为深远的。从本文的分析可知,方言文化的差异会拉大流动人口和流入地社会群体的距离,使流动人口容易被边缘化,由此会减弱流动人口的身份认同感和归属感,进而增加个体流动的成本和难度,阻碍自由流动;而传统的地缘社会网络作为一种非正式制度性力量,能有效打破户籍地身份隔离等障碍,同乡聚集形成的社会网络有助于潜在流动人口获得城市就业和生活的机会,有利于其顺利实现流动。可以肯定的是,中国传统文化和社会关系对个体微观决策行为具有重要影响,但更要关注正是流入地城市缺乏对外来人口初期流动的社会支持和社会保障才使得社会网络关系发挥作用。

由于个体是否能实现充分、自由流动对劳动力空间优化配置等起到非常重要的作用,因而本文提出以下政策建议。①方言文化的相似利于彼此进行有效沟通和互动,而方言背后体现的文化背景的相似会拉近彼此的心理距离,加强地方文化建设,推广普通话,让民众对文化多样的包容度更大,加强交流沟通,打消潜在流动者的心理障碍,促进人口自由流动;②当地政府部门应为外来群体构建亲缘、地缘之外的城市主流社会支持体系,搭建用工单位与劳动者个体间的信息平台,为流动人口进入城市提供良好的生活与工作条件,尽量削除个体流动所面临的各种隐形壁垒。

不可避免的是,本文也有局限和不足。首先,囿于数据来源,本文的方言距离测算时仅涉及汉语方言,没有考虑少数民族地区方言数据。我国少数民族文化各具特色、源远流长,也会存在沟通障碍、隔阂等,后续可以考虑加入少数民族地区及方言。其次,本文选用2017 年全国流动人口动态监测调查数据的主要原因在于,仅此次调查精确地提供了流动个体的户籍地和现居住地所在市、区县,以往年份的调查问卷缺乏相应的统计结果,但由于近年来人口流动趋势的变化加之我国社会变迁速度很快,可能难以完全清晰地刻画当前人口流动的整体和结构的动态变化。

方言文化、社会网络对人口流动的影响仍然是一个有待发掘的研究领域。多角度理清二者影响人口流动的机制能有助于我们进一步理解这一重要课题,尤其在中国这样一个多民族、多方言且注重“差序格局”的社会更为必要。

猜你喜欢
流动人口方言流动
基于双变量probit的流动人口社会融入研究
流动的画
方言文化在初中生物学教学中的渗透
试析陕西方言中的[]与大同方言中的
有一个讲方言很重的老师是种什么体验?
数说流动人口
为什么海水会流动
偃师方言里的合音词
偃师方言里的合音词