基于spss主成分的因子分析对于全国各省经济发展水平的分析

2020-04-19 09:01
福建质量管理 2020年8期
关键词:载荷变量因子

张 瑜

(武汉大学经济与管理学院 湖北 武汉 430000)

一、引言

经济发展,是整个人类社会追求的目标之一。在宏观经济理论中,经济的发展主要受到消费,投资,政府购买的影响。通常用GDP来描述经济的发展,同时GDP也会受到价格水平的影响。衡量价格水平,一般用居民消费价格指数,商品零售价格指数来描述;投资一般用固定资产投资和工业总产值来衡量。中国作为世界经济的重要组成部分、近年来在经济建设中取得重大成就,但省内部却存在由北至南经济发展不平衡的现象,如何客观、定量的对全国各地区经济差异做出评价,提出有效解决国内经济发展不平衡的政策建议,促进全国全面经济协调发展,是目前有待解决的问题。经济实证研究离不开现代统计分析方法的运用,SPSS作为统计分析工具,理论严谨、内容丰富,具有数据管理、统计分析、趋势研究、制表绘图、文字处理等功能,为经济管理研究提供了有力的工具。

我国国土辽阔,各地区所处自然环境、所拥有的自然资源不尽相同,各地区的经济发展的基础也不尽相同,因此我国各省市的社会发展状况也出现了较大的差异。因而寻找一种方法来衡量各省市社会发展状况,从而使各地区依照各地的发展程度来科学制定发展战略就显得越来越有必要。本文利用因子分析的方法,综合考虑影响社会经济发展状况的各项指标,给出了一种衡量社会经济发展状况的方法,为各地区制定相应的发展战略提供依据。

因子分析:因子分析的基本目的就是用少数几个因子去描述许多指标或因素之间的联系,即将相关比较密切的几个变量归在同一类中,每一类变量就成为一个因子(之所以称其为因子,是因为它是不可观测的,即不是具体的变量),以较少的几个因子反映原资料的大部分信息。因子分析法就是寻找这些公共因子的模型分析方法,它是在主成分的基础上构筑若干意义较为明确的公因子,以它们为框架分解原变量,以此考察原变量间的联系与区别。它的基本思想是将观测变量进行分类,将相关性较高,即联系比较紧密的分在同一类中,而不同类变量之间的相关性则较低,那么每一类变量实际上就代表了一个基本结构,即公共因子。因子分析模型描述如下:

x1=a11F1+a12F2+…a1mFm+a1ε1

x2=a21F1+a22F2+…a2mFm+a2ε2

xp=ap1F1+ap2F2+…apmFm+apεp

即X=AF+aε模型中,F为因子变量或公共因子,可以理解为在高维空间中互相垂直的m个坐标轴;A为因子载荷矩阵,aij称为因子载荷,是第i个原有变量在第j个因子变量上的负荷。相当于多元回归分析模型中的标准回归系数;ε为特殊因子,表示原有变量不能被公共因子所解释的部分,相当于多元回归分析模型中的残差项。次模型称为因子分析模型,由于该模型是针对变量进行的,各因子又是正交的,所以也称为R型正交因子模型。

二、我国各省份城市经济发展水平实例研究

自1978年中国实行改革开放以来,全国各地区都有一定程度的经济增长。中国的对外开放已经从沿海向内地发展,形成经济特区——沿海开放城市——沿海经济开放区——内地的对外开放格局。改革开放以来,我国经济迅猛发展取得了举世瞩目的成就。目前,我国人民生活总体上已达到小康水平,但是也出现了收入差距不断拉大和贫富分化现象。各地区发展的差距不断扩大,经济发展以及资源配置出现明显的不均衡,给国家整体经济的增长带来一定的影响。本文主要选取了2016年我国31个省市自治区的多项经济指标,并进行因子分析来研究影响各地区经济发展的主要指标(数据来源中国统计局),对各地区经济发展做出较合理的分析评价。本文选取全国31个省市的数据包涵地区生产总值(X1),居民消费水平(X2),固定资产投资水平(X3),职工工资水平(X4),居民消费价格指数(X5),商品零售价格指数(X6),工业增加值(X7)等七项指标,选取的原因如下:

地区生产总值是指在一定时期内(一个季度或一年),一个地区的经济中所生产出的全部最终产品和劳务的价值,常被公认为衡量地区的经济状况的最佳指标。它不但可反映一个地区的经济表现,还可以反映地区的竞争力与财富。

居民消费水平,通过消费的物质产品和劳务的数量和质量反映出来。居民消费水平可以反映居民的消费能力以及生活与富足程度,以及当地的经济发展状况。

固定资产投资,是指投资主体垫付货币或物资,以获得生产经营性或服务性固定资产的过程。由于固定资产投资在整个社会投资中占据主导地位,通常所说的投资主要是指固定资产投资。固定投资可以反应一地区的后续的经济发展潜力。

职工平均工资,指企业、事业、机关单位的职工在一定时期内平均每人所得的货币工资额。它表明一定时期职工工资收入的高低程度,是反映职工工资水平的主要指标。同时也是反映了此地区人们的工资水平的重要指标。

居民消费价格指数,是一个反映居民家庭一般所购买的消费商品和服务价格水平变动情况的宏观经济指标。其变动率在一定程度上反映了地区通货膨胀或紧缩的程度,也反映当地经济发展状况。

商品零售价格指数,是指反映一定时期内商品零售价格变动趋势和变动程度的相对数。零售物价的调整变动直接影响到城乡居民的生活支出和国家的财政收入,影响居民购买力和市场供需平衡,影响消费与积累的比例。因此计算零售价格指数可以对上述经济活动进行观察和分析。

工业增加值是指工业企业在报告期内以货币形式表现的工业生产活动的最终成果,企业全部生产活动的总成果扣除了在生产过程中消耗或转移的物质产品和劳务价值后的余额。它反映的是一个地区在一定期时期内所生产的和提供的全部最终产品和服务的市场价值的总和,同时也反映了生产单位或部门对生产总值的贡献。

为了消除量纲影响和变量自身变异大小和数值大小的影响,故将数据标准化。本文采用对变量的离差标准化,离差标准化是将某变量中的观察值减去该变量的最小值,然后除以该变量的极差。对标准化的数据进行KMO和Bartlett检测。检验结果的KMO值为0.654,Bartlett的球形度检验的Sig.值为0.00,检验通过,表明该数据样本中的变量之间具有较强的相关性,可以进行主成分分析。

由公因子方差表可以得到公因子提取输出的结果,从变量共同度表上看出七项指标的变量共同度都大于80%,保留了较多的原始信息,指标数据能很大程度上被公因子提取,损失的信息比较少,本次因子提取的总体效果比较理想。从累积方差贡献率表可以看出,前三个的特征值大于1,且累计方差贡献率为92.9%,因此产生了三个主成分,这三个主成分涵盖了原来7项指标几乎全部的信息,达到了降维的目的。各主成分方差贡献率为44.13%,30.48%,18.28%,最终确定为3个主成分。

因子载荷矩阵,是因子分析的核心内容,地区生产总值,固定资产投资水平,工业增加值在第一主成分的系数比较大,第一主成分与这几个变量的相关性较大,对这几个变量的解释程度较大。

采用方差最大法对因子的载荷矩阵实行正交旋转,并输出旋转后的因子载荷图,旋转在4次迭代后收敛,写出旋转后的因子模型:

表1 旋转因子载荷图

地区生产总值(X1)=0.968F1+0.199F2+0.038F3

居民消费水平(X2)=0.274F1+0.881F2-0.242F3

固定资产水平(X3)=0.950F1-0.162F2+0.042F3

城镇单位就业人员平均工资水平(X4)=-0.171F1+0.93F2-0.027F3

居民消费价格指数(X5)=0.184F1+0.622F2+0.687F3

商品零售价格指数(X6)=0.045F1-0.326F2+0.899F3

工业增加值(X7)=0.98F1+0.094F2+0.102F3

从因子载荷矩阵和因子模型可以看出,地区生产总值(X1),固定资产水平(X3),工业增加值(X7)在第一个因子有较高的载荷,第一个因子主要解释了这几个变量,反应的经济发展状况,可解释为地区经济发展潜力因子。居民消费水平(X2),城镇单位就业人员平均工资水平(X4)在第二个因子有较大的载荷,反应的是居民的消费能力方面,可以解释为消费水平因子;居民消费价格指数(X5),商品零售价格指数(X6)在第三个因子上有较高的载荷,主要反应的是地区物价方面的状况,可以解释为价格水平因子。与旋转前相比,因子的含义比较清晰了。采用回归法估计因子得分系数,并输出因子得分系数表

表2 因子得分系数表

根据因子系数得分矩阵可以得到因子得分函数:

Y1=0.328*X1+0.068*X2+0.341*X3-0.108*X4-0.021*X5-0.036*X6+0.333*X7

Y2=0.042*X1+0.382*X2-0.124*X3+0.438*X4+0.307*X5-0.114*X6-0.005X7

Y3=-0.037*X1-0.166*X2-0.049*X3+0.033*X4+0.533*X5+0.664*X6+0.006*X7

计算因子的得分变量的变量值时,由于数据经过了标准化处理,因子得分的均值为0,标准差为1,正值表示高于平均水平,负值表示低于平均水平。这里从数量上考虑各公因子方差贡献率占总的累计方差贡献率的比重作为权重,最终除以三个因子的总的方差贡献率得到综合评价各个省市地区经济发展状况的指标。得到公式如下:

Y=(44.134%Y1+30.484%Y2+18.283%Y3)/92.9%

然后得到各个地区的因子得分以及最后的综合得分,并从高到低进行排序。

三、结语

各个因子得分表以排名可以看出,华东地区,江苏,上海,山东,浙江等地区经济发展比较有优势,尤其是在第一因子经济发展潜力方面的分相对较高,这可能华东地区工业相对发达,无论是从GDP,还是固定投资方面都有比较明显的优势。但是相比较而言,海南,宁夏,西藏,青海以及一些其他西部地区在第一因子方面的排名相对靠后,这些地区可能工业基础相对薄弱,固定投资相对落后,因此我国要继续坚持西部大开发战略,在进行资源配置的时候,注重扶持相对落后的地区,东西部平衡发展。在第二因子消费水平得分方面,上海,江苏,北京,天津几个地区得分排名相对靠前,这些地区从工资水平来看也是相对比较高的,有比较大的消费能力。同时河南,河北,湖南,湖北等地区综合排名相对靠前,但是此因子得分相对较低,这些地区的工资水平应做相应的调整,增大居民的消费能力。内蒙,江西,青海地区的此项因子得分相对靠后,可能与其整体的经济发展水平有较大的联系,工资水平相对较低,居民的购买力和消费能力相对落后。从第三因子价格水平来看,上海,江苏,浙江,天津,广东等地区的因子的得分相对靠前,表明这些地区的CPI和CRI指数相对较高,物价水平也比较高,从整体上看,与其相对的整体的经济发展水平还是大体相符合。

猜你喜欢
载荷变量因子
交通运输部海事局“新一代卫星AIS验证载荷”成功发射
因子von Neumann代数上的非线性ξ-Jordan*-三重可导映射
抓住不变量解题
也谈分离变量
一些关于无穷多个素因子的问题
影响因子
我的健康和长寿因子
滚转机动载荷减缓风洞试验
一种基于白噪声响应的随机载荷谱识别方法
分离变量法:常见的通性通法