基于ERGM模型的城际人口流动研究

2022-07-25 09:25王群勇张乃丹
商业研究 2022年3期
关键词:人口流动网络结构

王群勇 张乃丹

内容提要:本文利用2017年全国流动人口动态监测数据,采用社会网络分析方法研究中国城市间人口流动的空间结构特征。从流向上来看,人口流入分布更为集中,人口流出的分布则相对“多极化”。其次,人口流动网络具有明显的地域分布特征和群体性特点,一方面,流动空间格局的经度分割效应明显弱于纬度分割效应;另一方面,人口倾向于较短距离的省内流动,流动规模随着省级行政区域之间距离的增加而降低。进一步分析人口流动网络形成机制,研究发现,样本城市间互惠关系普遍存在;城市经济发展水平、第三产业占比、人口密度、城市公共服务水平以及空气质量均会促进人口流动;地理空间网络对人口流动的影响逐渐式微。因此,为了促使人口自由流动,实现资源的优化配置,政府既要顺应市场经济力量形成的人口空间分布和城市体系格局,也要通过优化产业结构、提供优质的城市公共服务等引导人口合理流动。

关键词:人口流动;网络;结构;指数随机图模型

中图分类号:F126;C92文献标识码:A文章编号:1001-148X(2022)03-0142-11

收稿日期:2021-07-01

作者简介:王群勇(1976-),男,天津人,南开大学经济学院教授,博士生导师,经济学博士,研究方向:理论与应用计量经济学;张乃丹(1994-),本文通讯作者,女,四川眉山人,成都信息工程大学统计学院讲师,经济学博士,研究方向:应用计量经济学、人口流动。

基金项目:贵州省哲学社会科学重大专项课题,项目编号:21GZZB14。

一、引言

20世纪80年代以来,劳动力在城乡和区域之间进行着大规模流动,伴随着中国经济的发展,不同阶段呈现出的特征也有所区别。1984年10月国务院发布《关于农民进入集镇落户问题的通知》后,国家放松了对农村人口进入中小城镇就业生活的限制,人口流动规模随着工业化、城镇化快速发展而不断扩大。20世纪90年代以来的20年内,流动人口规模持续增长,且增速迅猛,年均增长率约为12%。根据国家卫生健康委员会发布的《中国流动人口发展报告2018》显示,2010年以来我国流动人口规模增长进入相对缓和阶段,从2015年起人口流动规模开始逐渐步入调整期。另外,中国人口流动受到各区域经济发展的影响,存在明显的城乡、区域间不平衡,从微观个体理性经济人角度来看,沿海经济发达地区的就业机会和经济机遇是吸引劳动力空间转移的原动力,大规模的人口流动与聚集便是特征化事实的体现。同时,人口流动对于城市及区域经济的影响举足轻重,被视为是生产要素在空间上再配置的过程,在一定程度上推动了区域间物质、资本、信息、技术等要素的快速流动和优化,因此,人口流动和城市的发展壮大存在作用与反作用的双向关系[1],人口流动在推动我国经济高速发展的同时,改变了区域人口的结构分布,也引起了产业结构和劳动力市场的不断变化。

近年来,国家也出台了一些全国性的宏观政策来引导流动人口。2014年中共中央、国务院印发《国家新型城镇化规划(2014-2020年)》,随后国务院印发《关于进一步做好农民工服务工作的意见》和《关于进一步推进户籍制度改革的意见》,以及党的十九大报告特别要求“破除妨碍劳动力、人才社会性流动的体制机制弊端,使人人都有通过辛勤劳动实现自身发展的机会”。

随着地域分割被打破,区域经济一体化进程不断发展,人口大范围的流动时刻在上演。在人口流动的过程中,自然而然地将流动人口户籍所在地与现居住地联系起来,构建出一条条无形的“边”,形成了一张张紧密的“网”。另外,流动人口与城市的经济特征、传统文化以及地方制度环境等独特背景交织融合,致使传统的线性分析框架无法分析人口城市流动网络形成的内在机理。为研究这一复杂网络,学界的主要思想是将人口流动空间格局的各个地区及地区间流动人口的关系转化为网络的节点和边,通过网络的形式描述真实空间格局中各地区间的关系。由此,可以推测复杂网络分析方法在人口流动空间格局中占有重要的地位。基于上述现状,对于人口流动网络的形成来说,人口流动格局如何影响整个流动网络?其他网络如何引导人口流动网络的发展?城市的社会和经济特征如何作用网络关系形成?这一系列问题直接影响到人口要素区域结构分布和劳动力供需问题。本文通过运用复杂网络理论对人口流动的探索来解释中国流动人口城市分布的特征,为制定更有效的人口流动政策提供参考依据。

二、文献综述

国内外学者对于人口流动进行了大量的研究,集中于人口流动的因素分析、空间分布特征、政策制定与研究等,而且多聚焦城乡流动人口分布、省际流动人口分布。首先,人口流动的影响因素一直是人口学、经济学、社会学的重点研究议题,其相关理论经历了宏观、微观、宏-微观结合的发展历程。推拉理论作为人口学上最重要的研究人口流动的系统性宏观研究,最早可以追溯到Ravenstein的“人口迁移法则”,最终由埃弗雷特·李使其完善,提出了系统的人口迁移理论——“推拉理论”,强调流动会受到流出地、流入地拉力和推力以及中间障碍因素等的影响,其中中间障碍因素主要包括距离远近、物质障碍、语言文化的差异。经济学领域对于人口流动的理论探索可以从结构主义研究方法中尋得,其典型代表包括刘易斯二元经济理论、费景汉-拉尼斯模型以及乔根森模型,其基本观点可概括为经济发展的不均衡性导致人口在不同部门间流动。虽然这对于把握人口流动的宏观动因和机理给予了经济学阐释和模型论证,但是这种结构主义方法对人口流动的研究只有从结构的角度入手才能做出正确的理解和评价。上述宏观视角由于缺乏对现实情况的合理解释,后来研究逐渐拓展到微观分析,以托达罗模型、李的推拉理论、人力资本理论和新劳动迁移经济理论为代表的新古典主义研究方法,弥补了早期模型没有考察作为当事人的决策行为过程,包括对家庭式流动、异质性个体流动的研究。随着行为主义研究方法的运用,流动人口主体性受到关注。

在进行理论研究的同时,关于人口流动动因的实证研究也受到广泛关注,现有研究将人口流动空间分布的非均衡归因于区域经济的非均衡,其中受空间经济结构变动影响已然成为共识。以推力——拉力理论为基础,拓展引力模型,突出强调流入地和流出地的人口基数、工资和失业率等因素产生的拉力和推力。另外,除了传统社会经济因素的影响外,城市公共服务水平、空气污染、城市房地产价格以及方言文化等也成为影响人口流动的重要方面[2-6]。王珏(2014)系统性地提出对于城市间形成的人口迁移流可从认知层、物理层和关系层三个层次来把握,其中物理层是一直公认的经济势能,包括信息和交通可达性等外部条件,认知层则关注个体的迁移偏好,强调人们倾向于有共同文化、历史和认同感的区位,而基于关系层的人口流动淡化了对空间的依赖性,强调人口迁移流是在物理层基础上基于亲缘、地缘等人际关系和企业间生产关系形成的[7]。张耀军(2014)研究发现产业发展、就业率、职工工资、社会公共资源以及城市化水平都能显著影响人口流动[8]。童玉芬(2015)基于成本收益的切入点分析发现,可能正是出于超大城市高收入能抵消高生活成本的挤出效应,流入地的高净收入能显著提升流动人口选择超大城市的可能[9]。

其次,关于人口流动的空间特征,学者们基于不同的尺度和采用不同的方法进行实证研究。早期研究人口流动多使用传统研究理论和统计方法,近年来,随着信息技术和数据平台的推进和运用,空间模型以及逐渐发展起来的网络分析方法为人口流动提供了新的途径与视角,以社会网络分析技术为重要研究方法被广泛应用在人口学中,以关系数据的视角来分析人口流动的空间特征。有研究发现,我国的人口流动空间格局呈现出无标度特性、小世界现象以及群集结构的特征,揭示了人口流动网络的整体性与层次性。沈诗杰(2020)研究中国省际人口流动的空间结构特征后指出,省际人口流动网络存在整体密度不大、区域内流动为主、以及具有相对优势省份等特征[10]。陈锐(2014)基于复杂网络理论研究省际实际流动人口网络,认为网络的小世界特征明显,具有较强的局部聚集性和整体连通性,进一步地建立流动人口测度模型后发现,较高经济发展水平和较大人口总量更能吸引外来人口[11]。除了肯定我国省际人口迁移网络中群集和部分中心枢纽的特征化事实,李毅(2017)通过链路预测发现人口流动在受到经济因素影响的同时,也会受社会文化方面的影响[12]。省际人口流动特征和因素已经受到广泛关注,随着信息技术的发展和一体化进程的推动,各类要素资源在城市间实现流动,省级行政区划的界限愈发模糊,以城市为节点的市际联系得到促进和深化,因此,基于城市网络研究人口流动成为新的方向。朱鹏程(2019)利用腾讯人口迁徙大数据,结合城市腹地的概念对长三角地区人口流动网络进行分析,指出该地区人口流动具有显著层级特征,并且利用两种关联测度方法发现各中心城市网络腹地空间结构与人口流动网络特征相对应,强调空间可达性和地理区位的重要性[13]。WeiliZhang(2020)利用ERGM模型考察证实了地理、人口、经济、自然和语言因素的作用,同时也肯定了居住环境、公共服务水平和基础服务设施等因素对人口流动网络发挥着更为重要的作用[14]。

上述文献主要基于静态的视角分析了中国人口流动迁移结构特征和影响因素。但近年来,人口流动区域模式也在发生着局部变化。王桂新(2012)利用2000年和2010年的人口普查数据证实了经济发达地区是中国省际人口迁移的主流,而且人口迁出分布与迁入分布差异明显,以及人口迁移模式具有整体相对稳定、局部性变化等特征[15]。同样,夏怡然(2015)发现东南沿海城市的流动人口吸纳能力有所下降,而直辖市的人口流入快速上升,通过建立回归模型发现,经济发展水平对人口流入的作用虽仍重要但开始减弱,第三产业吸纳人口流入的能力日渐加强,且城市规模存在收敛的趋势[16]。

通过对文献的梳理可以看到,利用复杂网络分析方法研究人口流动的网络特性逐渐成为趋势,一方面,对流动人口的网络拓扑结构进行统计分析能对网络整体和局部特征有更为清楚的认识;另一方面,需要识别出城市间人口流动空间依赖关系形成的关键因素,而传统回归模型无法解释人口流动网络的形成机制和多种网络的交互影响。因此,本文在研究主体方面,聚焦于城市主体作用机制的研究对象,利用大型微观数据构建城市间人口流动网络,分析网络节点中心性、聚类分析等;在研究方法方面,以城市行政区和流动人口构建指数随机图模型(ExponentialRandomGraphModel,ERGM),厘清流动人口更倾向于流入的城市在经济发展水平、人口密度、产业结构、地理空间和方言文化等方面具有哪些特征。对于以上问题的探索与回答,将有助于准确把握城市间人口流动的空间结构特征,丰富和拓展城市间人口流动的研究,将对我国社会经济的稳定和持续发展有着极为重要的意义。

三、研究设计

(一)数据来源

本文的个体层面数据来自于2017年国家卫生和计划生育委员会(以下简称“卫计委”)开展的全国流动人口动态监测数据(CMDS),该调查按照随机原则在全国31个省(区、市)和新疆生产建设兵团流动人口较为集中的流入地抽取样本点,采用分层、多阶段、与规模成比例的PPS方法进行抽样,调查对象为全国在调查前一个月前来本地居住、非本区(县、市)户口且在调查阶段年龄在15周岁及以上的流入人口。该数据的一大优势在于给出了流动人口户籍地和居住地所在区县的准确信息,样本量大,覆盖面广,对于全国流动人口基本状况具有较好的代表性。除了CMDS数据库提供的个体特征信息,城市层面的经济要素和人口等来自于《中国城市统计年鉴》,统计口径为全市。另外,流入地和流出地之间的地理距离以高德地图中两地驾车的推荐路线距离衡量,以此更为准确地体现实际上的流动距离。方言情况统计来源于CSMAR數据库,其中方言地域分布源于《中国语言地图集(第二版)》(2012),各城市区县人口数来源于《中国人口和就业统计年鉴》中的全国各地按户籍统计。ERGM估计结果借助R语言的statnet包实现[17]。

(二)网络结构特征分析

本文采用网络结构分析方法出于以下考虑:一是网络分析方法能够从全局视角对人口流动网络特征进行识别,以此弥补传统计量方法的局限;二是网络分析方法能够有效揭示人口流动的空间网络关联特征。通过本节对网络特征的分析,为下文采用ERGM研究网络形成机制奠定基础。

城际人口流动网络指依托城际网络并以各城市为节点、人口流向和流量连线构成节点间关系的网络结构。本文用前述邻接矩阵绘制图对象G=(V,E)的方式对城市间人口流动网络进行描述,其中,V(G)为所有城市的集合,包括288个城市;E(G)为所有城市之间连接的集合,即城市间的人口流出、流入关系,这些城市节点及其流动关系构成了城市间人口流动网络G。具体的做法如下:首先,根据个体户籍地与现居住地所在城市信息,做二维交叉表,生成以流出地为行,流入地为列的人口流动矩阵,其中,矩阵的单元格值对应流出地流向流入地的人数。在网络研究时,通常根据数据分布设置二分阈值,本文使用不同城市流动人数高四分位数为阈值,当流动人数大于该数值时设为1,此时区域间存在大规模人口流动关系,低于该数值时设为0,即不存在大规模人口流动关系,至此将人口流动矩阵转换为0-1邻接矩阵。鉴于人口流动数据是根据抽样数据得来,不同省份城市的抽样数量存在差别,同时不同城市人口规模效应存在差异,如果仅设置一个固定值为阈值,会低估部分小规模城市间的流动关系。

为加深对网络整体特征的认识,多数学者会利用社会网络分析方法对网络的拓扑结构特征进行分析,本文分别使用中心性分析和社团分析研究人口流动网络的结构特征。

1.中心性分析

衡量网络中节点的重要性,取决于其在社会网络居于什么样的中心位置,或者说其具有怎样的权力,具体可以量化为点的中心性和图的中心势。其中,常用的表示点的中心性的指标包括程度中心度、中间中心度、特征向量中心度和接近中心度等,而度中心性能有效反映节点的发出和接收能力。因此本部分以城市为节点形成的城际人口流动网络进行度中心性分析,以点入度和点出度体现该城市在所处网络中的地位和功能。参考WeiliZhangalet(2020)的做法,对于规模越大的社会网络而言,点度中心度的最大可能值也会越高,为消除网络规模变化对点度中心度的影响[14],本文使用标准化中心性值来强调城市的相对价值,具体用CO,i、CI,i相对点中心度来表示点出度和点入度,分别体现了网络中各节点“发出”和“接收”所形成的社会关系,即利用城市间流动构成的社会网络反映各个城市吸引人口流入的能力。具体公式如下:

CO,i=∑Nj=1,j≠1popijN-1(1)

CI,i=∑Nj=1,j≠1popijN-1(2)

Insurplus=CI,i-CO,i(3)

Outsurplus=CO,i-CI,i(4)

其中,在计算CO,i时使用的popij表示从区域i流动至区域j的总人口数,而在计算CI,i时使用的popij是指从区域j流向区域i的总人数,N指所有节点个数,具体到本文就是所有城市总数。进一步地构建Insurplus相对净流入和Outsurplus相对净流出指标,反映城市吸收和流失人口的能力,当Insurplus为正数时,则说明该城市人口流入情况为净流入,城市的人口规模是增加的,此时,其对应的Outsurplus指标就为负值。经过计算,得到各城市的净流入、净流出情况,除烟台市净流入为0以外,本文识别了84个人口净流入市和203个净流出市。由于涉及的城市较多,限于篇幅,不一一赘述每个城市节点入度、出度中心性和净流入情况,仅展示净流入位序前10个城市和位序后10个城市(见表1)。可以发现,北京、上海、广州和深圳等一线城市的人口净流入辐射效应明显。其次,在全国人口流动网络中占据前10的城市较为均匀地分布在我国三大经济圈中。位于长三角地区的上海市位居所有城市第一,由于上海是我国经济发展中心,也是资本密集的地区,能为流动人口带来更高的就业机会和经济收入,可见其不仅是长三角地区的人口流动核心,也是整个人口流动网络的中心枢纽;另外,苏州市、南京市、无锡市外来人口流入规模大,这些城市在长三角地区经济水平靠前,企业众多,能提供较多的就业岗位和更高的收入,同时受上海经济的辐射,因此也能极大吸引外来人员流入。在净流入前5名的城市中有两个来自京津冀地区,分别是北京市、天津市,这两座城市在华北地区乃至全国人口流动网络中的地位是不容忽视的。另外广州、深圳市作为珠江三角洲中心城市,也是一直以来都吸引着外来人员流入。

为了更为直观地了解各城市吸引人口流动的能力,使用Arcgis软件提供的自然断点法(Jenks)将前述测算的288个城市净流入情况进行5级分级,具体分别為主要流入、次要流入、相对均衡、次要流出以及主要流出,划分等级结果如表2所示。可以看出,相对于净流出城市,位于城市等级结构顶层的主要、次要流入城市数量较少,而次要流出和主要流出城市数量较多,说明人口流入的分布更为集中,人口流出的分布则相对“多极化”。其中,主要流入城市包括上海、北京、天津等35个城市,而次要流入城市包括海口、南昌、嘉兴、哈尔滨等35个城市,上述两个等级的城市所形成的一二线城市大都市圈及部分区域中心城市是人口聚集阵地,对于全国人口流动具有强吸引力;其次,追溯人口流动历程,现如今的城市净流入等级划分在全国范围内分布较为均匀,侧面印证了人口流动从“孔雀东南飞”到“回流中西部”的转折。位于结构中间层即流入流出规模相对均衡的城市数量较多,包括唐山、晋城、东晋、临沧等81个城市。而次要流出的城市数量最多,处于这类等级的城市包括安顺、牡丹江、池州、巴彦淖尔等104个城市;主要流出城市处于等级结构最下层,数量最少,包括泰安、宜春、宿州、临沂等33个城市则为主要流出城市。这些流出城市大都是四、五线城市,经济发展滞后,一直以来就是传统的人口输出地区。

2.社团分析

前述网络节点度中心性分析加深了人口流动网络的认识,但不能反映网络的微观结构。本文利用社区发现算法对复杂网络进行聚类分析,研究网络局部相互连接的特定模式,解析网络的微观结构,并利用社会网络图对象展示复杂网络的直观方式,有助于分析复杂网络的功能,探索复杂网络的隐藏规律以及预测其发展趋势。社区划分的算法较多,主要分为两大类,一是拓扑分析,其遵循社区内部连边密度高于社区间的准则,这种算法适用于无向无权网络;二是流分析,即通过发现在网络的某种流动中形成的社区结构,如物质、能量、信息等的流动,这种算法一般用于有向有权网络。本文根据网络数据描述的对象和想要获得的信息,采用Pons和Latapy(2005)提出的随机游走的划分算法(Walktrapalgorithm)来发现人口流动空间各城市节点相似性,进而寻找子群[18]。其基本思想是使用两点到第三点的距离之差来衡量两点之间的相似性,进而来划分社区。具体步骤如下:对网络G对应的邻接矩阵A按行归一化,得到概率转移矩阵P,不同状态之间的转移概率为:

Pij=Aij/di(P=D-1A)(5)

其中,A是邻接矩阵,D是度矩阵,t步随机游走从i到j的概率是Pij的t次幂。

对于节点i和节点j之间的距离公式如下:

rij=∑nk=1(Ptik-Ptjk)2dk(6)

在社区C中随机均匀地选取顶点i,那么t步随机游走从社区C到j的概率为PtCj,具体公式如下:

PtCj=|1C∑i∈CPtij|(7)

除了对人口流动网络按上述算法划分社团外,通过一定的布局让节点和边可以根据某种策略进行排布,而布局算法有多种,其中最有用且最常用的是力导向布局算法中的Fruchterman-Reingold布局,在这样的力导向布局中,节点如同带电粒子,而边充当弹簧,当节点靠得过近时会相互排斥,同时共同连接的边又会将节点吸引在一起。所以,节点会均匀分布,且连线边上相互联系越多的节点分布会越近。

综上可以发现,我国城市间人口流动网络的社团特征明显,人口流动空间格局结构具有区域性特征。城市间人口流动网络中各城市被划分为不同的社团,社团内部的城市间人口流动紧密,而社团间的城市间人口迁移较为稀疏,即同一省份的跨市人口流动较为活跃,城市省际联系较弱,说明了我国人口流动规模随着省级行政区域之间距离的增加而降低,省内城市联系更为紧密。另外,不考虑北京等个别城市在全国范围内占据着中心枢纽位置,新疆、甘肃、内蒙古等西部省份的较多城市处于网络布局的边缘位置,而东部省份及一些中西部省会城市位于网络核心位置,说明人口流动规模呈现出明显的东西部差异,且省际联系主要集中在东部地区,东部地区人口流动的频繁程度更高,人口流动分布基本与“胡焕庸线”是相一致。但是同时,人口流动空间格局的经度分割效应明显弱于纬度分隔效应,即南北分界明显,可以看出南方和北方区域内部彼此更融为一体,这也说明了社会作用力大于自然地理的划分[12]。另外,除了以北京、上海、广州等一线大城市是所处省份、邻近省份乃至全国人口流入的主要城市外,人口流动的流入地也呈现出多极化特征,比如北京周边的石家庄和天津,广州周边的珠海、佛山以及川渝地区、武汉等地也成为了人口流入的重要城市,并且形成了长三角、京津冀、珠三角三大都市圈为主、中西部地区少数省会城市为辅的格局。

(三)ERGM分析方法

前文论述的网络分析方法主要是描述性的,无法解释人口流动网络形成的内在机理。传统的计量分析方法建立在研究对象相互独立的假设上,然而这种假设明显与现实不符,实际上人口流动呈现出空间聚集区域性特征,因此有必要将人口流动的空间关联纳入到实证分析中。指数随机图模型(ERGM)是研究网络结构的统计模型,以关系为基础,通过类似逻辑回归的形式解释影响因素对网络的形成机制,并对模型进行统计检验。在这类模型的使用中,与社会网络的一些基本理论假设是一致的:社会网络是局部涌现的,网络关系不仅是自组织的或是彼此依赖,同时它们也会受到行动者属性和其他外生因素的影响[19]。

ERGM模型允许有各种变形和扩展,通过将多类可能影响节点间关系形成的因素纳入模型中,根据前文所述,影响因素可分为以下三类,具体为:(1)网络自组织的形成模式也称为“纯结构”效应,这种“内生”效应强调网络模式的出现来源于网络关系系统的内部过程,并且是通过基于度的效应而出现,比如,两个节点之间新的关系的产生会受到共同连接边的节点的影响。(2)行动者属性会通过影响网络中行动者的参与来发挥作用,从单个行动者层面,属性可能会促进个体建立更多的关系(扩张性),或促使该行动者收到更多的关系(聚敛性);而从跨越两个行动者层面来看,当节点的属性匹配时,会产生促使节点倾向于与自己相似的其他节点联系的趋同性过程。因此,也可以看出行动者属性影响网络关系存在着不同的过程,发挥着多重效应。(3)其他的外生情境因素对关系形成也需要重点考察,研究中常把这类因素看作二元关系协变量,基于不同网络关系往往存在相互间共生的事实,将其他的外生网络或更为一般的二元关系以附加统计量的方式加入到模型中,主要从多维邻近性进行考虑,包括地理空間因素、共享隶属关系、语言文化邻近、制度邻近等。

给定真实网络随机图G=(V,E),J={(i,j):i∈V,i≠j}表示网络中各节点之间所有可能存在关系。由于E为真实网络中存在的边,因此E是J的子集,也就是各个节点存在的某种可能集合关系。建立一个随机变量Y表示J中元素,如果i,j∈E,那么yij=1,意味着行动者i和j之间存在网络关系,否则不存在相应关系。在此基础上形成邻接矩阵Y,y=[yij]定义为Yij的观测值。基于以上,ERGM的一般形式如下:

Pr(Y=y|θ)=1kexp{∑HθHgH(y)}(8)

其中,Pr(Y=y|θ)是指在条件θ下,y在矩阵Y中出现的概率。k为归一化常数:k=k(θ)=∑yexp{∑HθHgH(y)}。对于ERGM模型而言,结构类型H不同表示不同的模型。θH为网络统计参数,gH(y)为与结构类型H有关的统计量,可进一步拓展为由全局网络结构统计量gα(y)、节点属性变量gβ(y,x)、协变量网络统计量gγ(y,g)组成。相应的表达式如下:

Pr(Y=y|θ)=1kexp{θαgα(y)+θβgβ(y,x)+θγgγ(y,g)}(9)

其中,θ为各统计量的系数,其他统计量同前文描述。

ERGM检验过程主要借助马尔科夫蒙特卡洛极大似然估计法对模型进行估计检验,通过t统计量检验参数的显著性,在模型中解释变量按网络结构变量、属性变量和网络协变量依次加入,借助AIC和BIC评价模型的优劣。最终选取能较好解释人口流动网络形成机制的模型。表3是本文ERGM模型中参考的主要统计量。

四、我国城市人口流动空间关联的影响因素

(一)ERGM模型变量选择

1.网络自组织效应

ERGM模型通过加入多种网络内生结构统计量拓展模型,如边数、互惠性、聚敛性和扩张性、传递性、交互k三角、几何加权项等。受模型自由度限制,全部288个城市节点的发出者效应和接收者效应不能加入模型中。另外,研究表明在聚集性较强的网络中,三角形构局引入ERGM模型中可能导致模型的退化。由于三角形构局用于拟合数据是十分有限的,另外,实际上三角形关系往往聚集在多重三角形关系较密集的区域,因此采用更高阶k-三角形能更好地建模。因此,为了弥补前述问题所导致的模型中内生结构变量的缺失,本文以几何加权项衡量观测网络内存在的复杂依赖关系,出于本文研究对象是有向网络,以及考虑到几何加权项算法复杂性所导致的估计过程过长,本文借鉴刘华军(2018)的做法,将几何加权边共享伙伴统计量纳入ERGM模型中作为评价关系依赖性的工具,借此检验人口流动网络中多个节点之间的流动关系是否存在传递性[20]。然而根据实证结果发现,几何加权边共享伙伴统计量纳入模型中,估计结果不够理想。因此,最终只考虑边数和互惠性估计结果。

2.行动者属性

行动者属性即网络中各城市节点的社会经济属性,按照网络统计量分类,包括同配性和异配性、流入地属性和流出地属性。由于人口流动涉及流出地和流入地,因此不同城市的属性异同在人口流动网络的形成中起了作用,比如,相较于偏远落后地区,经济发达地区就业机会更多、劳动报酬更高,城市间经济发展水平的差异会形成人口流动的“拉力”和“推力”,进而促进区域间流动关系的形成。因此,为衡量经济发展不均衡的主效应和趋同效应,借鉴刘华军(2018)的思路[20],将城市GDP分为高、中、低三类,其中288个城市中GDP排名前25%的设为GDPHigh,25%—75%定为GDPMid,后25%归为GDPLow。除了考察经济发展水平在人口流动网络中发挥的作用外(主效应),还将检验处于不同或相同经济发展水平的城市之间(趋同效应)是否更容易形成流动关系。

而在节点协变量方面,研究表明人类活动以及自然因素可能对人口空间流动网络的形成发挥重要作用。一般而言,人口密度高的城市确实能吸引人口流入;同时,第二、三产业的发展对于劳动力、资源、信息等生产要素的需求也同样会影响人口区域分布;另外,基于城市舒适度的迁移理论(amenity-ledmigrationtheory),强调城市“软”“硬”件配备带来的吸引力在一定程度上解释了人口流动,比如交通基础设施作为一项重要的反映城市生活便利状况的重要标志,尤其是近年来,中国各大城市陆续开通高铁后,在很大程度上缩短了城际间的地理距离,促使人口流动;又比如,城市所提供的公共服务、地区自然因素(地形、气候、环境质量)也会影响个体的流动决策。基于此,主要将城市人口密度、第二、三产业占GDP比重、政府的人均教育和科技支出、该城市是否开通高铁、平均坡度、平均降水量以及PM25浓度等引入ERGM模型,以厘清这些变量在人口流动网络形成中发挥的作用。

3.外生网络效应

根据前文描述可知,相较于传统计量方法,ERGM模型可以将区域间人口流动以外的其他外生网络联系纳入其中,以此来考察不同类型的二元关系的相互依赖。为了检验各相关网络对人口流动空间关联的影响,将地理空间因素、方言文化作为网络协变量引入ERGM模型中,地理空间上的远近直接影响人口流动成本,而方言作为文化载体,能产生认同感和归属感,进而影响流动。其中,地理空间因素通过高德地图中两地驾车的推荐路线距离而构建关联网络。而方言距离参照刘毓芸(2015)[3],进一步将汉语方言细化到方言小片。具体如下,将汉语方言从上到下依次划分为方言大区、方言区、方言片、方言小片,对相应区县所属方言进行编码整理分类,由于近年来区县行政区划变迁,通过手动调整和百度检索,匹配出各区县行政单位的方言属性,对方言距离人为赋值,具体如下,两个区县属于同一方言小片时,方言距离为0;属于同一方言片的不同方言小片时,方言距离为1;属于同一方言区的不同方言片时,方言距离为2;属于同一方言大区的不同方言区时,方言距离为3;属于不同方言大区时,方言距离为4。通过将城市各区县方言距离进行人口加权,得到两两城市之间的方言距离,相应计算公式如下:

di,j=∑Ii=1∑Jj=1SAi·SBj·dij(10)

其中,i∈CA,j∈CB,A≠B,SAi为城市A中任一区县i的人口比例,SBj为城市B中任一区县j的人口比例,dij为区县i和区县j之间的方言距离。

本文借助ERGM,研究人口流动网络受到网络结构、行动者属性和外生网络的综合作用,表4是模型中使用的各变量。

(二)ERGM模型拟合结果

通常采用逐步添加变量方式,测度不同变量组合的ERGM最佳估计值。

首先考察只包含边、互惠性等内生结构变量,证实了人口流动网络存在自组织性。在网络结构因素中,边数在01%的水平上显著为负,表明人口流动网络密度较低。互惠性估计系数均正向显著,各城市间人口流动网络显著的互惠性和双向性,表明许多城市间人口流动互相影响。

其次,行动者—关系效应体现了城市社会、经济和环境水平对人口流动网络的重要影响,人口密度、第二产业占比、第三产业占比、政府科技教育支出以及高铁开通都具有正向显著影响,而以PM25浓度表征的空气污染系数显著为负。具体来看,经济发展水平估计系数显著为正,说明相较于低经济水平的城市,经济水平越高越容易与其他城市构建人口流动网络。同时,Homophily(GDPHigh)和Homophily(GDPLow)分别在1%水平上负向显著和1%水平上正向显著,表明如果两个城市的经济发展均处于低水平,则形成人口流动网络的概率会增加;而如果两个城市均处于经济发展高水平,这一概率会下降。由此,结合GDP的主效应与趋同效应可以看出,经济发展水平高的城市是其他外来人口,尤其是来自于低经济水平城市的首要流入地。人口密度系数显著为正,表明外来人员倾向于流向人口密集的城市,人口更密集的城市通过聚集经济可以带来更高的工资和更多的就业机会。第三产业占比系数为正数且显著,表明人口流动受到第三产业发展水平的影响,城市的第三产业占比越高,越能吸引人口流入,可能的原因在于第三产业需要更多的就业人口,能提供充足的就业环境与更多的发展机会,由此会吸引外来人员选择三产业更发达的城市流入。地方政府科技教育支出水平越高,说明城市公共服务水平越高,人们为了享受当地提供的公共资源、服务而流向这些城市。另外,城市平均坡度的系数显著为正,即平均坡度越高,构建城市间人口流动网络联系的概率就会增加,说明人口会倾向于主要集中在平原或地形平坦的地区活动。PM25浓度的系数显著为负,表明城市空气污染越严重对人口的流入产生阻力作用。

增加了地理空间网络和方言文化网络协变量,发现空间邻近性和语言邻近性都有助于人口流动网络的形成和发展。城市嵌入的两种控件变量对人口流动的影响,证实了人口流动存在邻近性。根据列7估计结果可知,地理距离的系数均显著为负,意味着人口流动网络和地理空间网络具有明顯空间重叠,即城市间地理位置越接近,更易于形成人口流动的空间关联网络。可能的原因在于:地理距离越近,流动风险降低,相应地减少了流动过程中的交通成本,但这种影响逐渐式微。而方言距离未通过显著性检验,说明方言文化并非城市间人口流动网络的主导因素,可能的原因在于,一方面,随着普通话的普及,人们的交流沟通更为方便;另一方面,人口大量频繁流动,地方文化交融,同时人们身处信息爆炸的时代,方言作为地区文化载体的表现力也会下降。

表5最后一栏列出了模型的AIC和BIC值,相较于考虑部分变量的模型,同时加入了网络自组织结构、行动者属性和外生情景因素的模型,其AIC和BIC值最低,表明模型7拟合度更好。

五、结论与启示

(一)结论

本文将复杂的理论与社会网络分析方法引入到城市间人口流动研究中,根据实际的人口流动建立复杂网络,分析流动人口的网络拓扑结构和空间分布特征。通过构建指数随机图模型(ERGM),研究网络的自组织性、行动者属性和外生网络对人口流动网络产生的重要影响,得出如下研究结论:

(1)从人口流动网络的结构分析结果可以看出,整体上,人口流动规模与“胡焕庸线”一致,呈现出明显的东西部差异,同时人口流向呈现出明显的南北分割。并且,流动空间格局的经度分割效应明显弱于纬度分割效应;从流向上来看,人口流入的分布更为集中,人口流出的分布则相对“多极化”。

(2)其次,通过对网络中的子群划分发现,人口流动网络具有明显的地域分布特征和群体性特点,受空间、人口、经济等因素的影响,部分子群之间联系频繁,“南北”“东西”帮派性相对较为明显。而且人口流动规模随着省级行政区域之间距离的增加而降低,说明流动人口倾向于较短距离的省内流动。上海、北京、天津、厦门等区域的节点中心性排在前列,在人口流动网络中占据重要地位,发挥着中心枢纽的作用。对于35个主要流入的一二线城市所形成的大都市圈及部分区域中心城市是人口聚集阵地,对于全国人口流动具有强吸引力。

(3)从ERGM模型实证分析结果可知,人口密度、经济发展水平、产业结构、交通基础设施水平、空气质量等对外来人口流动有显著影响。一般来说,经济发展水平高、第三产业发达、城市公共服务水平高以及环境质量优良的城市更容易吸引人口流入。同时,在协变量网络中,地理空间因素对人口流动网络形成具有显著影响,但相比之下这种影响趋弱。

(二)启示

人口流动逐渐打破空间限制的同时当前中国国内经济进入到转型升级的发展阶段,构建“双循环”的新发展格局成为现实需要,而在促进国内大循环的进程中,仍存在各种显性与隐性的要素流通障碍。人口在城市间流动构成了城际网络格局,承担着信息交流、资源交换和资本聚集与扩散等重要的载体作用。因此,各级政府仍需要制定相应的促进人口流动的有效政策,确保人口在城市间自由流动,实现资源的优化配置。政府在制定城市发展战略时应该顺应市场经济力量形成的人口空间分布和城市体系格局。其次,优化产业结构是吸纳人口就业的重要途径,第三产业是吸引人口流动的重要因素,因此推动产业结构省际,培育现代服务业为主的产业体系,能促进人口与经济结构相匹配。另外,提高城市公共服务的供给和改善环境质量也是提升城市吸纳人口流入能力的重要途径。

参考文献:

[1]潘竟虎,赖建波.中国城市间人口流动空间格局的网络分析——以国庆-中秋长假和腾讯迁徙数据为例[J].地理研究,2019,38(7):1678-1693.

[2]夏怡然,陆铭.城市间的“孟母三迁”——公共服务影响劳动力流向的经验研究[J].管理世界,2015(10):78-90.

[3]刘毓芸,徐现祥,肖泽凯.劳动力跨方言流动的倒U型模式[J].经济研究,2015,50(10):134-146,162.

[4]刘降斌,刘秋明.房地产价格、人口流动以及城镇化水平相互作用机制研究[J].哈尔滨商业大学学报(社会科学版),2021(3):3-17.

[5]孙伟增,张晓楠,郑思齐.空气污染与劳动力的空间流动——基于流动人口就业选址行为的研究[J].经济研究,2019,54(11):102-117.

[6]毛丰付,郑芳.人才引进政策如何影响了劳动力市场?[J].商业经济与管理,2021(11):62-77.

[7]王珏,陈雯,袁丰.基于社会网络分析的长三角地区人口迁移及演化[J].地理研究,2014,33(2):385-400.

[8]张耀军,岑俏.中国人口空间流动格局与省际流动影响因素研究[J].人口研究,2014,38(5):54-71.

[9]童玉芬,王莹莹.中国流动人口的选择:为何北上广如此受青睐?——基于个体成本收益分析[J].人口研究,2015,39(4):49-56.

[10]沈诗杰,沈冠辰.中国省际人口流动的空间结构特征研究[J].人口學刊,2020,42(4):103-112.

[11]陈锐,王宁宁,赵宇,等.基于改进重力模型的省际流动人口的复杂网络分析[J].中国人口·资源与环境,2014,24(10):104-113.

[12]李毅,刘雅楠,金勇进.基于复杂网络视角下省际人口迁移空间格局及趋势研究[J].统计研究,2017,34(9):56-64.

[13]朱鹏程,曹卫东,张宇,等.人口流动视角下长三角城市空间网络测度及其腹地划分[J].经济地理,2019,39(11):41-48,133.

[14]WeiliZhang,ZhaohuiChong,XiaojianLi,etal.SpatialPatternsandDeterminantFactorsofPopulationFlowNetworksinChina:AnalysisonTencentLocationBigData[J].Cities,2020,99.

[15]王桂新,潘泽瀚,陆燕秋.中国省际人口迁移区域模式变化及其影响因素——基于2000和2010年人口普查资料的分析[J].中国人口科学,2012(5):2-13,111.

[16]夏怡然,苏锦红,黄伟.流动人口向哪里集聚?——流入地城市特征及其变动趋势[J].人口与经济,2015(3):13-22.

[17]EricD,Kolaczyk,GaborCsardi.StatisticalAnalysisofNetworkDatawithR[M].NewYork:Springer,2014.

[18]PonsP,LatapyM.ComputingCommunitiesinLargeNetworksUsingRandomwalk[M].Berlin:Springer,2005:284-293.

[19]DeanLusher,JohanKoskinen,GarryRobins.ExponentialRandomGraphModelsforSocialNetworks:Theory,MethodsandApplications[M].CambridgeUniversityPress,2013.

[20]刘华军,杜广杰.中国雾霾污染的空间关联研究[J].统计研究,2018,35(4):3-15.

ResearchonPopulationMobilityNetworkAmongCitiesBasedonExponential

RandomGraphModels

WANGQun-yong1,ZHANGNai-dan2

(1.SchoolofEconomics,NankaiUniversity,TianJin300071,China;

2.SchoolofStatistics,ChengduUniversityofInformationTechnology,Chengdu610103,China)

Abstract:Thispaperusesthedynamicmonitoringdataofthenationalfloatingpopulation(2017)tostudythespatialstructurecharacteristicsofChina’sinter-cityflowsofpopulationbyusingtheanalysismethodofsocialnetwork.Intermsofdirectionofpopulationflows,thedistributionofpopulationinflowismoreconcentrated,whilethedistributionofpopulationoutflowisrelativelymulti-polar.Secondly,thepopulationflownetworkhasobviousgroupcharacteristicsandgeographicaldistribution,that’stosay,ontheonehand,thelongitudesegmentationeffectisobviouslyweakerthanthelatitudesegmentationeffectoftheflowspatialpattern;Ontheotherhand,migrantstendtomovewithinashortdistance,andthescaleofthemovementdecreaseswiththeincreaseofthedistanceamongprovincialadministrativeregions.Furthermore,theexponentialrandomgraphmodel(ERGM)isusedtoanalyzethefactorsaffectingthespatialrelationshipofpopulationmobilityanditsmechanism.Resultsshowthatthereciprocalrelationshipamongthesesamplecitiesiswidespread;theurbaneconomicdevelopment,proportionoftertiaryindustry,populationdensity,urbanpublicserviceandairqualitywillpromotepopulationmobility;andthegeographicalspatialnetworkgraduallyweakens.Therefore,inordertopromotepopulationflowandrealizetheoptimalallocationofresources,thegovernmentshouldnotonlyconformtothespatialdistributionofpopulationandthepatternofurbansystemformedbymarketeconomicforces,butalsoguidetherationalmigrationbyoptimizingindustrialstructureandprovidinghigh-qualityurbanpublicservices.

Keywords:populationflow;network;structure;ERGM

(責任编辑:赵春江)

猜你喜欢
人口流动网络结构
《史记》类传结构论
当型结构与直到型结构的应用
我国农村留守儿童教育问题及路径探究
物质结构规律归纳
通向城市户籍制度改革的阶梯
大湘西地区人口流动对经济发展的影响研究
油气集输系统信息化发展形势展望
基于网络的信息资源组织与评价现状及发展趋势研究
基于网络的中学阅读指导
新形势下地市报如何运用新媒体走好群众路线