失地农民土地流转意愿与再就业问题的统计分析与研究

2014-10-26 00:47孙善辉李壮壮黄梦琪
宿州学院学报 2014年1期
关键词:宿州失地农民回归方程

孙善辉,李壮壮,黄梦琪,吴 玲

1.宿州学院智能信息处理实验室,安徽宿州,234000 2.宿州学院数学与统计学院,安徽宿州,234000;3.宿州学院管理工程学院,安徽宿州,234000

失地农民土地流转意愿与再就业问题的统计分析与研究

孙善辉1,2,李壮壮2,黄梦琪2,吴 玲3

1.宿州学院智能信息处理实验室,安徽宿州,234000 2.宿州学院数学与统计学院,安徽宿州,234000;3.宿州学院管理工程学院,安徽宿州,234000

分析了影响失地农民再就业过程中的主要因素,并结合失地农民对土地流转意愿的调查,运用最优量表回归分析方法,给出了失地农民土地流转意愿与其再就业问题的相关性。利用最优量表回归分析结果,结合统计检验,得出失地农民土地流转意愿与其再就业问题的最优量表回归方程。在最优量表回归分析的基础上,使用二元Logistic回归分析理论,对失地农民土地流转意愿与其再就业问题进行了全变量二元Logistic回归,在满足统计检验的条件下,得到了失地农民土地流转意愿与再就业中两个主要问题间的二元Logistic回归方程。

土地流转;再就业;最优量表;二元Logistic回归

在当今经济快速发展的大背景下,城市化进程逐步深入发展,大量失地农民的再就业成为困扰地方政府的棘手问题。对农民而言,土地能够提供生活的基本保障,提供就业的机会,并能够取得土地资产的增值效益[1]。目前,地方政府在处理失地农民问题上大都选择货币补偿安置的办法。货币补偿具有可操作性强、效果显著等特点。但是,很多失地农民有钱不敢花,失地农民的再就业问题及其相关的保障制度建设与完善就变得非常重要和紧迫了。

笔者通过借鉴其他问卷调查的基本设计思路和方法,经过有关专家的指导,结合调查统计工作的实际,经过反复修改和完善,最终制定了调查问卷[2-3]。调查问卷主要调查获取失地农民的个人基本信息以及在失地后再就业和社会保障方面的基本数据。调查范围包括河南、山西、湖北、湖南、安徽、江西等省的40余个城市,共采集样本1 000余份。调查方法主要是从每个城市随机选择两个县或者区,然后从选择的县区中挑选若干个失地农民进行问卷调查。调查问卷回收后,再经过筛选,分地方随机选择部分问卷进行电话随访,并对重点调查地区开展实地回访[4]。

对调查问卷进行统计发现,在土地流转问题上,非常愿意、比较愿意和愿意的人占调查总数的56%;而不太愿意流转与不愿意流转的占44%。由此可知,在土地流转问题上,持反对以及不太愿意意见的农民还占有较大的比例。本文通过研究失地农民再就业过程中六个方面的指标体系,使用最优量表回归分析方法,运用SPSS16.0软件,对失地农民再就业与其土地流转意愿展开了实证分析,并得出了相应的结论。基于最优量表回归分析结果,对失地农民的土地流转意愿进行了Logistic回归[5],并得出了失地农民的土地流转意愿和再就业六个因素中两个最重要因素之间的回归方程。

1 最优量表回归分析原理及其指标选择

1.1 最优量表分析(Optimal Scaling)原理

传统线性回归要求变量为数值型,如果变量是分类变量或者定序变量,一般可以把分类变量看作哑变量进行线性回归。在实际统计调查中,定序变量一般包括非常不满意、不满意、一般、满意、非常满意等选项。定序变量因为起始点难以确定,并且各分类数据之间距离也不完全相等等原因,使得使用传统回归分析有很多误差和先天的不足。此时,通过最优量表回归法可以有效地解决上述问题。

最优量表回归分析作为传统回归方法的扩展,能够有效地处理传统回归分析不容易解决的分类变量和定序变量的回归问题。最优量表回归使用连续的整数对定类变量或定序变量进行编码,使用数值1作为定类变量、定序变量的起始点。该模式允许使用一个因变量和小于200个的自变量,每个变量或数据中至少包括3个样本,每个样本数据都是从1开始,尽量不带小数。最优化量表分析按比例换算定类变量、定序变量和数值型变量,在分析过程中使用量化的手段,可以尽最大可能地反映定类变量和定序变量的属性。最优量表回归分析还可以使用非线性转化方法,来确定回归分析的最佳方程。

1.2 最优量表分析指标选择

为了研究失地农民的土地流转意愿与其再就业之间的关系,调查问卷中特别设计了与再就业相关的六个方面进行调查统计。在失地农民再就业影响因素设计过程中,从政府角度而言,失地农民的主要诉求体现在再就业计划的来源、有没有风险以及再就业过程中是否受歧视等;从失地农民自身角度而言,最关心的问题诸如自身的就业预期、是否会换工作以及没有就业的原因等。为了统计分析的方便,各个统计变量对应如下:x1,选择就业机会来源;x2,从事工作的失业风险程度;x3,是否更换过工作单位;x4,没有就业的主要原因;x5,就业预期;x6,就业过程中是否受到歧视。其中,x1,x3,x4,x6为分类变量,x2,x5为定序变量。针对上述六个方面,对失地农民失地后的就业问题进行了重点调查和研究。经过统计分析,研究失地农民土地流转意愿与再就业问题的相关系数与回归分析。

2 基于最优量表回归的失地农民再就业与土地流转意愿的实证分析

2.1 基于最优量表回归的统计分析

基于有效调查样本数据,本文运用SPSS16.0统计软件,对调查资料进行整理。首先对所有数据进行审查,然后将数据录入SPSS,最后利用SPSS中Analyze中的Categorical Regression功能,对失地农民再就业与其土地流转意愿进行最优量表回归分析。具体分析结果如表1所示。

表1 最优量表回归模型摘要

注:因变量:y;预测指标:x1x2x3x4x5x6。

从表1最优量表回归模型摘要分析表来看,因变量对自变量复相关系数为0.675,由此判断最优量表回归模型的拟合优度较高。拟合优度为0.455,修正拟合优度达到0.450,由此判断使用最优量表回归得出的回归方程拟合程度较高。

表2 最优量表回归方差分析表

注:因变量:y;预测指标:x1x2x3x4x5x6。

从表2最优量表回归分析的方差分析表可以看出,P值为0.000,回归效果非常显著。

由此可以判断,基于失地农民再就业的六个方面对失地农民土地流转意愿的最优量表回归是显著的。使用最优量表回归分析可以有效地分析失地农民土地流转意愿和再就业之间的相关性。下面研究使用最优量表回归分析方法,对失地农民土地流转意愿与再就业因素之间的分析结果。

表3 最优量表回归系数表

注:因变量:y。

从表3最优量表回归系数表可以看出,六个影响失地农民再就业因素的值都在有效范围之内。根据最优量表回归系数表,可以得到失地农民土地流转意愿与再就业的最优量表回归方程为:

y=0.0092x1+0.107x2+0.074x3+0.093x4

+0.168x5-0.118x6

(1)

2.2 基于最优量表回归统计分析结果的解读

由最优量表回归系数表可以看出,前五个因素的回归系数都是正的,说明前五个因素与失地农民的土地流转意愿是正相关的;第六个因素的回归系数是负的,说明第六个因素与失地农民的土地流转意愿是负相关的。第六个因素是就业过程中是否受到歧视,它与土地流转意愿呈负相关的分析是符合实际情况的,体现了统计分析结果的客观性。

由六个因素的回归系数可以判定,x5,x6与x2对失地农民的土地流转意愿影响最大,排名影响因素的前三位;其他三个因素对失地农民的土地流转意愿影响依次减少,排名依次为x4,x1与x3。

3 二元Logistic回归理论及其在土地流转意愿中的应用

3.1 二元Logistic回归理论

在社会科学调查中,存在很多二值状态,如社会保险参加与否、是否支持某项措施、明天是否下雨、某领导是否胜任等问题。此时如果研究因变量受哪些自变量的影响,影响的程度又如何,就需要使用二元Logistic回归[6]。

二元Logistic回归理论中因变量必须是二值变量。如果y为1,则表示出现结果为真,如死亡、感染、成功;反之,y为0表示出现结果为假,如生存、未感染、不成功[5]。

假设p表示出现“真”的概率,1-p表示出现“假”的概率,真出现的概率比上假出现的概率得到的,叫作优势比、发生比、比值等[7],即

odds=p/(1-p)

(2)

显然,优势比介于0与1之间。当p→1时,odds→∞;当p→0.5时,odds→1;当p→0时,odds→0。

因为odds=p/(1-p),所以

y=logit(p)=ln(odds)=ln(p/(1-p))

(3)

此时有,当p→1时,y→∞;当p→0.5时,y→0;当p→0时,y→-∞。

由此可见,p值在区间(0,1)时,对应y值在区间(-∞,+∞)。

由此得到二值多元Logistic回归模型为:

y=logit(p)=ln(odds)=ln(p/(1-p))

=b0+b1x1+b2x2+…+bixi

(4)

3.2 基于二元Logistic回归的统计分析

本文在最优量表回归分析的基础上,使用二元Logistic回归来研究失地农民土地流转意愿与其再就业之间最主要因素之间的关系及其回归方程[8]。在SPSS中,利用Analyze中的Logistic Regression功能,将土地流转意愿作为自变量选入值,把影响失地农民再就业的六个因素全部选择一次性进入回归方程。

从表4二元Logistic回归模型摘要分析表来看,主要模型参数分别为962.706、0.018和0.024。

表4 二元Logistic回归模型摘要

注:参数估计迭代了3次,因为两次之间的估计值相差0.001。

从表5二元Logistic回归预测值分类表可以看出,如果切割值为0.5,那么新建模型针对失地农民愿意进行土地流转的拟合率将提高到80.8%,回归效果非常显著。

由此可以判断,基于失地农民再就业的六个方面对失地农民土地流转意愿的二元Logistic回归是显著的。使用二元Logistic回归分析可以有效地分析失地农民土地流转意愿和再就业之间的相关性。下面研究使用二元Logistic回归分析方法,对土地流转意愿与再就业因素之间的分析结果。

表5 二元Logistic回归预测值分类表

表6 二元Logistic回归方程中的变量表

注:在第一步引进的变量:d1,d2,d3,d4,d5,d6。

从表6二元Logistic回归方程中的变量表中可以看出,六个影响失地农民再就业因素的值,只要在有效范围之内,就可以选择作为失地农民的土地流转意愿的主要因素。基于二元Logistic回归方程中的变量表,得到失地农民再就业与土地流转意愿的二元Logistic回归方程为:

y=0.129x2+0.139x5-1.199

(5)

3.3 基于二元Logistic回归的统计分析结果的解读

根据二元Logistic回归方程中的变量表,可以看出二元Logistic回归方程中的回归系数是正的,由此可以判定与失地农民的土地流转意愿是正相关的。比较最优量表回归方程和二元Logistic回归方程,可以发现有四个影响因素没有在二元Logistic回归方程中体现。

研究最优量表回归方程结论,发现x5、x6与x2是影响最优量表回归的前三个主要因素。x6是失地农民再就业过程中是否受到歧视,这个分类变量在二元Logistic回归中没有体现出来。由此可以对比得出,两种不同的回归模型得出了大致相同的结论。因为二元Logistic回归模型的原因,最后只得出再就业方面影响失地农民土地流转意愿的最重要的两个问题。

4 结束语

最优量表回归模型和二元Logistic回归模型,是处理社会调查关于分类变量与定序变量的重要手段。通过最优量表回归分析,成功地解决了失地农民再就业过程中的分类变量、定序变量与其土地流转意愿之间的相关性,并给出了相应的最优量表回归方程。此外,通过二元Logistic回归分析,不仅给出了失地农民土地流转意愿和再就业之间的相关性,并且成功地挖掘出影响失地农民再就业的两个主要问题,进而给出了相应的二元Logistic回归方程。

[1]王顺喜.我国失地农民的现状分析及政策建议[J].中国软科学,2009,4(4):1-9

[2]陈超,黄玲.城市化进程中失地农民的可持续发展研究:以重庆市巴南区为例[J].安徽农业科学,2008,36(3):1228-1231

[3]丁魏魏.吉林省失地农民再就业问题研究:基于长春市光明村及南关区灵活就业市场的失地农民的调查报告[J].长春理工大学学报:社会科学版,2011,24(1):30-33

[4]王猛.民生视角下失地农民的再就业问题研究[D].长沙:湖南师范大学公共管理学院,2011:24-33

[5]黄润龙.数据统计分析:SPSS原理及应用[M].北京:高等教育出版社,2010

[6]王顺喜.基于Logistic回归的犹豫判区别模型研究[J].交通标准化,2009(12):43-46

[7]李琪,崔睿.C2C环境下信用服务对卖家售出行为的影响研究:基于二元logistic模型[J].统计与信息论坛,2013,28(6):108-113

[8]万婷,蒲春玲,刘志有.农户耕地利用影响因素二元logistic回归模型分析:以新疆阿瓦提县为例[J].新疆农业科学,2012,49(7):366-370

2013-12-01

国家社会科学基金“完善农村土地流转制度研究——中部农业大省失地农民市民化风险及对策研究”(09BJY061);国家级大学生创新创业训练计划项目“宿州市物价水平的统计调查及其与居民消费价格指数的数学建模”(201210379022);宿州学院智能信息处理实验室开放课题资助项目“国际石油价格的数据挖掘及其预警预测研究”(2013YKF15)。

孙善辉(1979-),安徽萧县人,硕士,讲师,主要研究方向:分形几何、经济统计。

10.3969/j.issn.1673-2006.2014.01.002

[C82]

A

1673-2006(2014)01-0004-04

(责任编辑刘小阳)

猜你喜欢
宿州失地农民回归方程
安徽宿州灵璧县:多措并举发展特色产业
采用直线回归方程预测桑瘿蚊防治适期
线性回归方程的求解与应用
线性回归方程要点导学
宿州学院
宿州绿地城基坑防洪安全设计
走进回归分析,让回归方程不再是你高考的绊脚石
西藏城郊失地农民市民化研究
“钻”研40年 宿州地下终于挖出钻石
失地农民在土地征收中的救济失范及司法回应——以司法权的适度介入为视角