基于SPSS21的我国主要产业增加值统计分析

2021-09-05 00:17李严
中国集体经济 2021年26期
关键词:主要因素聚类中国

李严

摘要:经济发展新常态背景下,对我国经济发展和产业结构调整提出了新的要求,我国产业升级面临新压力和新机遇。基于此,文章对我国所有省份的九大主要行业产值增加水平进行聚类分析,了解不同区域的主要产业与优势产业所在。在此基础上对不同地区的主要因素进行横向比较,有利于政府了解各地区发展优势,能更为有效、有目的性地制定适合地区发展的政策目标,促进我国经济更快更好的继续发展。

关键词:行业增加值;中国;聚类;主要因素

一、引言

目前我国正处于经济转型阶段,需要对各省份的各产业数据十分了解的同时,还应当通过数据统计分析对各省的潜在优势产业或是红利产业进行挖掘。基于此,本文利用SPSS軟件对我国2017年的全省数据进行聚类、主成份等统计分析,力图阐述不同省份之间的产业优势差异,为我国制定政策提供参考。

二、统计分析

(一)数据选取与说明

本文选取2017年我国31个省(市)的各行业产业增加值,具体变量设定如下:(单位亿元)Xl:农林牧渔业增加值,X2:工业增加值;X3:建筑业增加值;X4:批发和零售业增加值;X5:交通运输,仓储和邮政业增加值;X6:住宿和餐饮业增加值;X7:金融业增加值;X8:房地产业增加值;X9:其他行业增加值。

(二)聚类分析

本文利用系统聚类分析对所有数据进行统计分析处理,选择输出相应的树状图与统计矩阵等,采用Squared Euclidean distance欧氏距离平方以及组间聚类方法估计,并且对其进行标准化要求处理。

分析可以发现,除江苏、广西及宁夏外的28个省(市)被划分为四个主要类别。其中1类的省份最多,2类次之,3类与4类则更少。根据相应的群集数可以发现第一类涵盖的省(市)有西藏自治区、青海省、海南省、甘肃省、天津市、山西省、贵州省、新疆维吾尔自治区、黑龙江省、辽宁省、安徽省、江西省、陕西省、重庆市、云南省、内蒙古自治区等17个样本;第二类的省(市)有北京市和上海市等2个样本;C类包括河北省、福建省、湖北省、四川省、湖南省、河南省、浙江省等7个样本;D类包括山东省和广东省等2个样本。

但由于此处未进行主成份得分统计分析,所以无法通过此处直接说明第一类省份产业一定优于其他省份,仍然要通过得分情况来具体观察其变化。

(三)判别分析

在对上述28个省(市)数据完成相应聚类分析后,对生育的江苏、广西以及宁夏进行判别分析,观察其属于哪一类。本文中利用了FISHER判别法进行判别。

由判别分析结果可以发现,江苏省属于2类,广西以及宁夏属于1类。

(四)主成分分析法

对31个省(市)的数据进行KMO与BAR检验,其结果如表1所示,从中可以发现,KMO=0.857>0.6,这说明选取的样本数据适合做主成份分析;同样的BAR球形检验结果显著性P=0.000<0.05,表示数据样本适合做主成分分析。

本文中选取的共同度值均大于0.5,这说明提取的主成份对于原始变量的解释程度很高。

在所有的产业中,提取除了特征值大于1的一个主要成分,其特征值为7.527,对于方差的贡献率为83.636%,累积贡献率为83.636%。这说明该成分已经足以解释大部分的方差。

根据数理统计的相关知识,主成份分析的变换矩阵亦即主成份载荷矩阵U与因子载荷矩阵A以及特征值λ的数学关系如下面这个公式:

U=A/λ^0.5

故可以得到相应的主成份载荷矩阵如表2所示。

因此可以得到主成份Y的表达式为:

Y=0.408×农业+0.537×工业+0.487×建筑业+0.521×批发与零售+0.522×交通运输+0.52×食宿+0.474×金融+0.511×房地产+0.519×其他

由该表达式可以计算得到主成份Y的值,但是在计算之前要对原始变量进行标准化处理。随后可通过计算变量得到主成份Y,在主成份得分的基础上可以再一次进行聚类分析或是综合评价。由于本次分析仅存在一个主成份,故不需要对其进行权重加总获得最终评分,可以Y的数值进行直接的综合评价。

故根据主成份得分可以发现,其中广东省、江苏省、山东省的得分高于5分,为全国31个省市之首,说明这三个省份在2017年产业总增加水平最高;而宁夏、青海与西藏三个地区得分均小于-4.5,这说明三个省份在2017年产业总增加水平最低。得分的高低说明省份的产业增加值水平高低。

(五)相关性分析

本文对31个省(市)的九大主要行业产出增加值进行一个简单的相关性PEARSON分析,其分析结果如下所示。从中发现,农业、工业、建筑业、批发业、交通运输业、食宿、金融业、房地产业及其他行业彼此之间存在一定的相关性,但好在所有行业两两之间的相关关系并不十分高,及各自的数据之间不存在高度共线性,相关系数均小于0.9,故而上述所作的数据分析是有效的。

参考文献:

[1]王小明.区域传统优势产业与战略性新兴产业协同融合发展研究[J].经济体制改革,2017(04):50-55.

[2]景跃军,张昀.我国劳动力就业结构与产业结构相关性及协调性分析[J].人口学刊,2015,37(05):85-93.

[3]张建清,张燕华.不同空间尺度下优势产业选择研究——以西三角经济区为例[J].科技进步与对策,2014,31(10):19-23.

[4]刘洪玉,郑思齐,许宪春.房地产业所包含经济活动的分类体系和增加值估算[J].统计研究,2003(08):24-27.

(作者单位:福州大学经济与管理学院)

猜你喜欢
主要因素聚类中国
基于模糊聚类和支持向量回归的成绩预测
基于流形学习的自适应反馈聚类中心确定方法
基于密度的自适应搜索增量聚类法
加强房建工程安全管理的措施分析
线损波动主要因素分析与控制措施探究
农村初中英语口语教学之我见
肯尼·格雷特,爵士的“中国”调子