聚类模型在地方税收分析中的应用
——以贵州省经济强县为例

2012-01-05 03:15崔海波余杨
湖北大学学报(自然科学版) 2012年1期
关键词:强县税收收入招商引资

崔海波,余杨

(湖北大学数学与计算机科学学院,湖北 武汉 430062)

0 引言

1999年初,贵州省委、省政府下发《关于建设经济强县的实施意见》,建设“经济强县”[1]与实施西部大开发战略同时被列为了贵州省委、省政府的重要议程.“将贵阳、遵义、六盘水、安顺等市的20个基础条件较好、经济实力较强、资源比较富集、工业化城镇化水平相对较高、有望发展成为带动效应较大的中心城区和市县列入全省首轮经济强县建设”[1].2008年,贵州省第三轮经济强县建设启动,到2009年上半年,贵州省经济强县已扩展到了27个,贵州省27个经济强县(市、区)GDP占全省上半年GDP总额的近70%,“不足县级行政单位总数三分之一的经济强县承载着全省三分之二的经济总量”[1].

在地方税收分析中使用聚类分析,国内已有很多学者进行过研究.《税源监控管理及其数据应用分析》编委会[2]运用增值税税负和增值税增幅作为聚类指标,建立了全国各地区增值税税负的聚类模型,分析各地区增值税的税负差异.曲冰[3]通过对大量的经济指标和税收收入数据进行相关性分析,对德州市招商引资与地方经济、地方经济与税收、招商引资与税收之间的互动关系进行实证分析,得出了招商引资与税收之间相互关联、互相影响、高度相关的结论.张伦俊[4]从经济增长、宏观税负、边际税负角度,运用回归模型、聚类分析等方法,讨论分析了区域经济发展与税收贡献的联系与差距,探讨在区域发展过程中解决这些差距的途径,逐步实现区域间经济、税收的协调发展.胡广运[5]使用聚类分析的方法,兼顾定性分析研究税收竞争与区域经济发展的影响,通过对税收负担、税收结构以及税收竞争这3方面的研究,深入分析了税收对区域经济的影响.王春甫[6]通过大量税收统计指标,对辽宁省各市2000—2002年3年税收与经济(GDP)规模、税收与经济增长、税收弹性和宏观税负等4个方面进行了聚类研究,探求了全省不同区域经济税收增减变化的规律.张伦俊等[7]根据2006年全国31个地区(省、自治区、直辖市)的税收收入及主要税种收入完成情况的排序,从数据分析角度采用因子分析、聚类分析等多元统计方法,对地区税收的贡献与差异作分析评价.罗天勇等[8]以贵州省88个县域作为实证研究对象,利用固定资产投入、财政支出的变化导致GDP、居民收入、税收变化的比率作为效率指标,对效率系数进行聚类分析,将区域经济运行效率划分为7种类型.

本文中主要研究地方税收分析中的聚类模型.“地方税收”是指地方税务局系统负责征收的税收收入.进行地方税收分析时,既要考虑税收收入的变化规律,也要考虑地方税收收入的地域特点以及地方经济发展趋势,而不同地方经济发展趋势可以用地方经济的相关数据进行描述.

在进行税负分析时,可以根据地区国内生产总值(GDP)的增幅这一经济指标,利用聚类模型的结果分析探索地区经济总量与地方税负之间的关系,找出经济发展水平与地方税负不匹配的地区.在分析地区税收优惠水平时,可以利用地区招商引资到位资金这一经济指标,利用聚类模型的结果分析探索地区招商引资到位资金与地区税收优惠水平之间的关系,找出招商引资与地区税收优惠协调较好的地区.在分析27个经济强县的税收贡献差异时,可以利用地区税负、税收弹性、边际税负等税收经济指标,利用聚类模型的结果分析探索27个经济强县的税收贡献差异,并且根据税收贡献差异对27个经济强县分类.

1 数据和模型指标的选取

本文中使用的数据包括2009年贵州省27个经济强县的地方税收收入(亿元)、各经济强GDP(万元)、各经济强县招商引资到位资金(亿元)以及以上3个指标的2009年比2008年增长数据(%).所有数据来源于2009年《贵州统计年鉴》.

聚类分析是一种多元统计方法,所谓类,就是相似元素的集合.聚类分析主要有系统聚类法(hierarchical cluster procedures)和K-均值聚类法(K-means cluster procedures)等.本文中采用的是K-均值聚类法,分析使用简单欧式距离计算距离,如果以不同的刻度测量变量(例如一个变量以万元为单位而另一个以%为单位),则结果可能令人误解.在此类情况下,应在K-均值聚类分析之前对变量进行标准化.K-均值聚类的步骤为:

(1)数据标准化,本文中采用的是原始数据的Zscore得分;

(2)假设类别数为K,确定每一类的初始中心位置;

(3)计算各个样品与K个初始中心的距离,根据最近距离准则将所有样品逐个归入初始中心,得到初始分类结果;

(4)重新计算类中心;

(5)所有样品归类后即为一次聚类,产生了新的类中心,如果满足一定的条件如聚类次数达到指定的迭代次数,或者两次计算的最大类中心的变化小于初始类中心之间最小距离的一定比例,则停止聚类,否则就转到第3步.

我们对贵州省经济强县进行地方税收分析聚类,主要是以各经济强县税收指标和相关经济指标为聚类指标建立聚类模型.本文中的聚类分析结果由IBM SPSS19计算得出.

1.1模型1:按地区国内生产总值(GDP)增幅与税负聚类[2]本文中的税负是指一定时期某地区的税收收入与该地区国内生产总值(GDP)的比值.因此,以地区国内生产总值(GDP)为分母计算的税负与以地区国内生产总值(GDP)为分母计算的地区国内生产总值(GDP)增幅必然存在着相关关系,即:税负与地区国内生产总值(GDP)增幅应保持同步变化.GDP增幅越高,税负越高;GDP增幅越低,税负也越低.因此,可以以GDP增幅和税负这2个指标作为聚类指标建立相应的聚类模型1,结果见表1.

1.2模型2:按税收优惠率和招商引资到位资金聚类[3,5]经济决定税收,税收反作用于经济.投资是拉动经济发展的三驾马车之一,招商引资所带来的投资必然促进地方经济的发展.招商引资对经济产生影响,经济与税收又高度关联,因此,招商引资对于税收具有十分重要的影响,大量招商引资的资金带动了地方经济各方面的发展,形成了地方税收新的税收增长点.

模型1中,我们分析税收负担(税负)、GDP增幅对贵州省27个经济强县区域经济发展的影响,但是我国各地方政府为了实现各地经济的发展,往往会在税收负担和税收结构之外通过运用各种税收优惠途径来吸引外来资金的投入.在模型2中,定义税收优惠率=税负与全部27个经济强县税负平均值的差值.因此,地区税收优惠率与地区招商引资到位资金必然存在着相关关系,即:税收优惠率越高,地区税负与税负均值的差越大,地区税负越高于税负均值,招商引资到位资金吸引力越低;税收优惠率越低,地区税负与税负均值的差越小,地区税负越接近税负均值,招商引资到位资金吸引力越高.因此,可以以税收优惠率和招商引资到位资金这2个指标作为聚类指标建立相应的聚类模型2,结果见表2.

1.3模型3:按多指标分税负、边际税负、税收弹性和地税收入增幅聚类[4,7]边际税负常常用来反映GDP增量对税收的贡献程度,边际税负=地区税收增量/地区生产总值增量.税收弹性是指税收收入的变化与经济发展变化的比率.税收弹性可以反映地区经济对税收变动的适应能力.

为了综合反映贵州省27个经济强县的税收贡献差异,我们综合利用税收分析绝对数指标和相对数指标,用2009年的地税收入、税收增长率(地方税收收入增幅)、税负、边际税负以及税收弹性等指标进行聚类,将全省27个经济强县的税收贡献划分为4类,结果见表3.

2 模型结果及结果解读

将2009年贵州省27个经济强县地方税收收入(亿元)、各经济强县GDP(万元)、各经济强县招商引资到位资金(亿元)以及以上3个指标的2009年比2008年增长(增幅)(%)等数据利用SPSS软件进行标准化,然后将标准化的数据分别代入上述3个模型,计算结果分别见表1、表2和表3.

表1 模型1:按地税收入增幅与税负聚类结果

注:第4、5行数据是根据标准化之后的结果反推计算出的聚类中心数据.P值<0.05,说明类间差异具有统计学意义,所进行的分类合理.

2.1模型1结果及解读按地税收入增幅与税负得到的聚类模型1结果见表1.

第一类包含的地区有2个:汇川区、钟山区.

第二类包含的地区有16个:云岩区、南明区、花溪区、乌当区、白云区、开阳县、仁怀市、赤水市、遵义县、桐梓县、西秀区、平坝县、都匀市、福泉市、凯里市、兴义市.

第三类包含的地区有6个:清镇市、修文县、息烽县、红花岗区、毕节市、铜仁市.

第四类包含的地区有3个:小河区、盘县、金沙县.

模型1的结果解读如下:第一类为低GDP增幅低税负区,第二类为低GDP增幅高税负区,第三类为高GDP增幅低税负区,第四类为高GDP增幅高税负区.值得注意的是位于高GDP增幅低税负区的第三类地区的6个区县,它们的地区经济增量较大,GDP增幅高于27个经济强县GDP增幅均值1.62亿元,但是税负却较27个经济强县税负均值低1.36,这个结果可以解释为什么这6个区县的税收收入在27个经济强县税收收入的排名都比较靠后(修文县和息烽县的地税收入在27个经济强县地税收入排名中居最后2位).

2.2模型2结果及解读按税收优惠率和招商引资到位资金得到的聚类模型2结果见表2.

表2 模型2:按税收优惠率和招商引资到位资金聚类结果

注:第4、5行数据是根据标准化之后的结果反推计算出的聚类中心数据.P值<0.05,说明类间差异具有统计学意义,所进行的分类合理.

第一类包含的地区有6个:云岩区、清镇市、红花岗区、汇川区、遵义县、桐梓县.

第二类包含的地区有3个:南明区、白云区、小河区.

第三类包含的地区有9个:花溪区、修文县、息烽县、仁怀市、赤水市、钟山区、平坝县、毕节市、铜仁市.

第四类包含的地区有9个:乌当区、开阳县、盘县、西秀区、都匀市、福泉市、凯里市、兴义市、金沙县.

模型2的结果解读如下:第一类为高招商引资到位资金低税收优惠率,第二类为高招商引资到位资金高税收优惠率区,第三类为低招商引资到位资金低税收优惠率区,第四类为低招商引资到位资金高税收优惠率区.值得注意的是位于高招商引资到位资金低税收优惠率区的第一类地区的6个区县,它们的地区招商引资到位资金高于招商引资到位资金均值7.44亿元,但是税收优惠率却较税收优惠率均值低0.88,因此这6个区县的招商引资到位资金在经济强县招商引资到位资金的排名都比较靠前.(云岩区、红花岗区和汇川区的招商引资到位资金分别位列27个经济强县第3、5、7名.)

2.3模型3结果及解读按税负、边际税负、税收弹性和地税收入增幅等多指标得到的聚类模型3结果见表3.

表3 模型3: 按多指标分税负、边际税负、税收弹性和地税收入增幅聚类结果

注:第7-11行数据是根据标准化之后的结果反推计算出的聚类中心数据.P值<0.05,说明类间差异具有统计学意义,所进行的分类合理.我们分别取K=3和K=4,以F统计值最大者对应的分类数4为最终分类.

第一类包含的地区有1个:福泉市.

第二类包含的地区有2个:钟山区、毕节市.

第三类包含的地区有15个:花溪区、白云区、清镇市、修文县、息烽县、开阳县、红花岗区、汇川区、仁怀市、赤水市、遵义县、桐梓县、西秀区、平坝县、铜仁市.

第四类包含的地区有9个:云岩区、南明区、乌当区、小河区、盘县、都匀市、凯里市、兴义市、金沙县.

模型3的结果解读如下:第一类地区是福泉市,其特点是地方税收收入增幅、税负、税收弹性和边际税负高,地税收入总量较少,福泉市的地税收入较27个经济强县地税收入均值少1.43亿元.第二类地区包含钟山区和毕节市.其特点是地方税收收入增幅、税收弹性和边际税负都超过27个经济强县相关数据均值,地税收入总量接近地税收入总量均值,地方税收有很大增收潜力.此类地区的特点地方税收收入增幅、税负、税收弹性和边际税负都较低,地税收入总量也较少,第三类地区包含个15个区县,它们的税收弹性小于1,说明税收增长不及经济增长.第四类地区的特点地方税收收入增幅、税负、税收弹性、边际税负和地税收入总量都处于较高水平,地区经济和地方税收能够协调发展.

3 模型评价和结论

对模型1、 模型2、 模型3根据聚类指标不同建立不同的税收分析聚类模型.根据基于不同税收经济指标建立的聚类模型可以从不同侧面多角度地诠释地方税收与地方经济之间的关系,较好地解释相关经济因素以及税收政策对地方税收的影响.

从以上3个聚类模型还可以看出,聚类指标选取不同,聚类结果以及对结果的解释也随之变化,同一地区在不同聚类模型中的解读也会不同,而这正好体现了不同地区经济的特性以及这种经济发展特性对地方税收的影响.

本文中建立贵州省27个经济强县的地方税收分析的3个聚类模型,并对这3个模型的聚类结果进行了解读.由于不同聚类模型选取的聚类指标不同,因此对每个聚类模型的结果解读也不相同.进一步我们可以探讨进入聚类模型中聚类指标的选择方式以及聚类模型聚类个数等做深入研究,从而建立更全面的地方税收分析聚类模型.

[1] 27个经济强县在金融危机中发挥领头羊作用.http://www.gz.xinhuanet.com/2008htm/xwzx/2009-08/17/content_17423089.htm,2011-8-15.

[2] 《税源监控管理及其数据应用分析》编委会.税源监控管理及其数据应用分析[M].北京:中国税务出版社,2005.

[3] 曲冰.在招商引资中的税收职能作用分析[D].哈尔滨:哈尔滨工业大学,2008:24-29.

[4] 张伦俊.区域经济发展与税收贡献的比较分析[J].财贸经济,2006(2):69-74.

[5] 胡广运.我国税收与区域经济发展的实证研究[D].上海:上海交通大学,2009:47-51.

[6] 王春甫.关于辽宁省税收状况聚类分析的报告[J].税务,2003(10):10-13.

[7] 张伦俊,申山宏.2006年地区税收收入的差异分析[J].税务研究,2007(12):38-43.

[8] 罗天勇,余菁菁,黄曦子.区域经济运行效率分类研究——以贵州省为例[J].贵州财经学院学报,2011(4):95-98.

猜你喜欢
强县税收收入招商引资
工业强县 文旅兴县
做大湖南省税收收入规模的对策分析
招商引资新思路:精、专、优
都什么年代了还招商引资
从招商引资、选资到引才
南县稻虾产业富民强县
老促会“添油加醋” 助推英山旅游强县
中国最具竞争力特色经济强县
各项税收收入(1994 ~ 2015年)
农业主要税收收入