进出口贸易对长三角地区产业产出影响幂率分布的实证研究

2010-05-22 08:07吴国蔚
统计与决策 2010年9期
关键词:投入产出残差进出口

薛 健,吴国蔚

(北京工业大学 经济与管理学院,北京 100124)

0 引言

大量的研究发现现实世界中很多量服从幂律分布,幂律分布也称为Pareto分布或Zipf律,描述了一种小事件极其普遍而大事件相当稀少的概率分布特征。如城市人口数、地震发生次数、太阳光耀斑数、月球上的凹坑直径、网页被点击次数、科学论文被引用次数、战争数、以及生物物种数等等,这些量的分布都服从幂律分布。

幂率分布的其随机变量概率密度函数为p(x)=cxn(c,n为常数),可以证明幂律分布是唯一满足无标度特征p(bx)=g(b)p(x)的分布。研究发现现实世界中的随机变量所服从的大多是负幂律分布,记为:p(x)=cx-r(c,r为正的常数),两边取对数得lnp(x)=lnc-rlnx,所以在双对数坐标下,幂率分布是一条直线。

进出口贸易对一个国家或地区各产业的产出都具有不同程度的影响,以往的研究多集中于进出口贸易对经济总量的影响,而对不同产业产出的影响以及影响程度的分布却鲜有研究。

1 进出口波动对产业产出的影响

1.1 模型设定

利用投入产出分析中的平衡关系推导建立能够定量描述进出口波动对产业产出影响的模型。(1)式描述了各产业产品的最终流向。表1列出了模型中所涉及变量的定义。

将产品的最终使用部分分解为来自本地生产与进口两个部分,得到(2)式。

对(2)式中的X进行求解即可得到如(3)式所示的进出口对各产业产出的影响模型,等式右边两项分别表示进口与出口对产业产出的诱发额。进一步,将等式右边两项分别除以我国总进出口额即可得到进口生产诱发系数IIPC与出口生产诱发系数EIPC,即每1单位的进口或出口将引致的产业产出变化量。诱发系数的正负分别表示每单位进出口使该产业增加或减少的产出量①虽然从诱发系数的符号看,进口引起产出减少而出口引起产出增加,但由于产业的进口品与出口品不一定相同,因此,进出口对产业产出的综合影响不能通过将两种诱发系数的算术和来表示。。

表1 变量定义表

1.2 数据来源与处理

本文原始数据分别来自江苏省,浙江省及上海市三省市公布的2005年投入产出表。为得到长三角地区投入产出表,首先将三省市的投入产出表统一划分为40个产业部门,最终使用部分划为最终使用、出口与进口3个部分②由于三省市投入产出表属于地区投入产出表,因此除进出口项外还有调入与调出项,本文分别将调入与调出项并入进口项与出口项计算,且仍称为进口与出口。,之后将3表的对应项相加得到长三角地区2005年40部门投入产出表。依据前述模型计算得到如表2所示的各产业进出口诱发系数。

表 2 长三角地区2005年40产业进出口生产诱发系数表

2 聚类分析

2.1 K-Means聚类分析

聚类分析是根据数据样本之间的距离(相似程度),将样本进行分类的一种方法。本文利用K-Means方法对40个产业依据指标IIPC与EIPC进行分类。K-Means法的具体计算过程如下:

(1)人为确定分类数目 k(本文取 k=7),将所有样本(产业)任意分为k类,计算各类的中心,并将其做为凝聚点。

(2)将n(n=40)个样本到各类的距离依次计算,每进入一个样本,将它归为距离它最近的凝聚点所代表的类,重新计算类重心,以新的类重心作为凝聚点。

(3)重复(2),直至所有分类不再改变。

表3 聚类分析结果

2.2 分类结果及解释

由于在K-Means方法中类重心定义为类中所有样本各项指标均值组成的向量,所以在本文研究的问题中,类重心的本质就是类中各产业的进口及出口诱发系数均值所构成的二维向量,也就是当进出口分别出现1个单位的波动时,此类中的产业产出所受到的进出口平均影响。样本与类的距离是类重心与样本各项指标所确定的欧氏距离。因此,被归为同一类的产业所受进出口波动的影响强度相似。

为能够从进口与出口两个方面综合评价进出口波动对某类产业的影响,本文将类重心向量在由IIPC与EIPC构成的欧氏空间中确定的向量模作为进出口波动对该类中产业产出影响的度量,记为TIPC。TIPC值越大表明此类中产业产量受进出口波动影响也越大。表3列出了按分类数目为7进行聚类分析后的结果,其中频数是此类中包含的产业数占总产业数的比例。

由直观分析可见,TIPC高的类中包含的产业数目远小于TIPC低的类中所包含的产业数目。由于TIPC的大小表示了类中产业产出受进出口波动的影响程度,因此由分类结果来看进出口贸易波动对产业产出的影响只集中在极少数产业上,而对其它大多数产业产出的影响则迅速降低。受进出口波动影响最大的类的TIPC值是最小值类TIPC值的23.77倍,而所包含的产业数仅为其1/14,且数量为1。

可见,类中的产业数与类的TIPC值之间符合幂率分布对小事件极其普遍而大事件相当稀少的描述。如图1所示,我们在双对数坐标系下利用得到的TIPC值及其对应的频数做出了产业类属概率分布图。由于概率分布图接近于一条直线,因此考虑其是否满足幂率分布p(x)=cx-r,其中x取各类的TIPC值,p(x)取相应TIPC值对应的频数。

3 幂率分布检验

3.1 随机误差假设的验证

图1 产业类属概率分布图

本文拟采用画出概率密度曲线,在双对数坐标下,用直线去拟合的方法验证产业类属概率分布是否满足幂率分布。对拟检验的幂率分布取对数得到Inp(xi)=1nc-r1nxi+εi,由于幂率指数r需采用最小二乘法估计。所以我们首先要验证误差εi项之间服从期望为0的正态分布N(0,δ2)。

利用spss统计软件包对残差项做K-S拟合检验来检验残差项是否服从正态分布。

假设H0:残差项服从正态分布

H1:残差项不服从正态分布

利用spss进行K-S检验,计算出z=0.400样本容量为7,在给定显著水平a=0.05时,根据K-S单样本检验的D临界表得到否定域为{D|D>0.483},由于z值没有落入否定区,所以不能拒绝原假设,所以残差项是服从正态分布的。然后利用单样本t检验检验误差项的期望是否为零。

假设H0:残差项期望为零

H1:残差项期望不为零

利用spss软件,进行单样本t检验,得到显著水平为1>0.05,因此t值没有落入否定域,无法拒绝原假设。

3.2 直线拟合

利用spss软件包对图1所示的产业类属概率分布做直线拟合,结果如表4所示。

表4 拟合结果

从表4可以看出,样本决定系数为0.854,表明回归方程拟合较好,同时通过了显著水平为0.01的F检验,表明线性关系显著,常数项与r系数全部通过显著水平为0.01的拟合系数t检验,因此得到直线拟合方程为1nP(x)=-2.648+0.9621nx,即P(x)=0.070793x-0.962。因此从统计意义上讲,在基于K-Means分类条件下验证了进出口波动对产业产出的影响服从幂率分布。

4 长三角地区产业产出分析

通过以上的研究可以看到长三角地区中的化学工业与通信设备、计算机及其他电子设备制造业这两个产业分别是类重心最大的两个类中的唯一元素,表明在所有40个产业中,这两个产业的产出受进出口波动的影响最为显著,对进出口的依赖性最强。另外由于这两个产业的TIPC指标均大于1,所以存在乘数效应,产业产出的波动幅度会大于进出口的波动幅度。TIPC指标大于1的还有金属冶炼及压延加工业、通用、专用设备制造业、电气、机械及器材制造业、建筑业以及批发和零售贸易业所属的两个分类。

从总量来看,以上7个产业的2005年产值为7493亿美元,占当年长三角地区总产值的46.33%,接近一半的水平,而进出口额分别达到了1438亿美元与1380亿美元占当年总进出口水平的65.72%与53.23%。③根据合并后的2005年长三角地区投入产出表计算。可见这7个产业无论是从受进出口波动的单位影响水平还是产业自身的总量水平来看,受进出口的影响十分显著,是在应对进出口市场变化时应重点关注的产业。

除以上7个产业外,其余33个产业所属分类的TIPC指标均小于1,分别为0.61、0.38与0.1,进出口波动对这些类中产业产出的影响程度迅速减弱。

5 结论

本文提出了一种按受进出口波动影响程度对产业进行分类的方法,能够找出所研究区域内产出受进出口波动影响较大的产业。同时证明了进出口贸易波动对长三角地区产业产出的影响分布为幂率分布,说明在区域外市场的供需发生变化时只有极少数的产业会受到较大的冲击,而其余绝大部分产业所受的影响较小,这就为应对外部市场变化时选择重要产业提供了理论基础。

[1]H·钱纳里等.工业化和经济增长的比较研究[M].吴奇等译.上海:上海三联书店,上海人民出版社.

[2]魏巍贤.中国出口增长的激励机制——实证分析[J].系统工程学报,1999,(9).

[3]王岳平.我国产业结构的投入产出关联分析[J].管理世界,2000(4).

[4]高运胜,陆宝群.中国对美漱口与美国GDP增长的相关性分析[J].上海经济研究,2003,(7).

[5]王耀中,王梓安.中国高新技术产品出口的分布特点及其启示[J].国际贸易问题,2002,(1).

[6]吴畏.我国最终需求与总产出的诱发依存分析——基于中国1997、2002、2005 年投入产出表[J].工业技术经济,2008,(12).

[7]乐为,钟意.我国产业结构与出口结构的相关性研究[J].统计与决策,2009,(4).

猜你喜欢
投入产出残差进出口
今年上半年我国化肥进出口双双下降
前两个月我国化肥进出口量均减少
基于双向GRU与残差拟合的车辆跟驰建模
进出口经理人
《进出口经理人》征订
基于残差学习的自适应无人机目标跟踪算法
基于递归残差网络的图像超分辨率重建
无锡高新区制造业投入产出分析
基于DEA模型的省域服务业投入产出效率评价
基于DEA-Tobit模型的我国2012—2013年群众体育投入产出效益评价与影响因素研究