关于T型关联度的正负性探讨

2012-09-26 09:11冯鹤林陈勇明
统计与决策 2012年19期
关键词:消费性关联系数度量

冯鹤林,陈勇明,杨 淼

0 引言

灰色关联度是灰色系统的重要组成部分,也是灰色系统分析、灰预测、灰决策的基础。灰色关联度主要是就两序列之间的几何相似程度进行比较,描述其相近程度。序列越接近,关联程度也就越大;反之,越小。自灰色系统的创始人邓聚龙提出邓氏灰色关联度以来,很多专家和学者依照灰色关联度的思想,提出了不同的关联度算法。唐五湘[1]于1995年通过引入符号函数提出了能够刻画正负相关性的T型关联度。其后,查金茂[2]于1997年就唐五湘提出的T型关联度,提出相关缺陷如不满足规范性以及增量为零时没有意义;孙玉刚[3]于2008年重新给出了T型关联系数算法并补充了T型关联度的性质。2010年冯鹤林[4]提出一种改进的T型关联度,分析了量纲化问题,从传统上优化了关联度的取平均的固定思维模式。T型关联度是最早能够反映出关联度的正负性的关联度之一,但在正负性上并不十分完善,主要是通过序列的自增和自减来刻画,与序列的空间位置有很大关系。其后曹明霞[5]就关联度模型的正负性问题进行了研究,取到了很多的效果,通过介入变异系数,更加准确的反映出灰关联思想。但由于运用的是斜率做为基础,而斜率是关于角度的正切值,对同一自变量,函数值存在着不均匀性。即同一个斜率差反映两个序列相近程序不一致性。本文主要针对冯鹤林2010年取出的改进T型关联度,做进一步完善。

1 预备知识

1.1 T型关联度思想

灰色关联度是依据关联度思想提出的各种算法。最根本的源头是关联度思想。最早也是最权威的T型关联度是唐五湘提出的。下面介绍一下唐五湘的T型关联度的基本思想[1]。

按照因素的时间序列曲线相对变化势态的接近程度的来计算关联度。对于离散时间序列,所谓两曲线的相对变化势态的接近程度,是指两时间序列在对应各时段Δtk=tk-tk-1(k=2,3,…,n)间原始变量经标准化后的增量的大小来判定的。若在时段Δtk间两增量相等或接近于相等,则这两时间序列在时段Δtk间的关联系数就大;反之,就小。两时间序列的关联度定义为:各时段Δtk间的关联系数的加权平均数。

1.2 T型关联度的计算方法

按照T型关联度的基本思想,冯鹤林针对关联度的计算做了进一步修正。给出了对于量纲和意义相同的两时间序列X1={ }X1(t1),X1(t2),…X1(tn),X2={X2(t1),X2(t2),…,X2(tn)}T型关联度的具体的计算步骤。

步骤1:求增量序列

步骤2:求两序列间的关联系数

设[a,b]上的两时间序列分别为:

为序列X1与X2的在从tk-1到tk时间段Δtk内的关联系数。

其中:

步骤3:求两序列X1={ }X1(t1),X1(t2),…X1(tn),X2={X2(t1),X2(t2),…X2(tn)}间 的 关 联 度,称 r=为X1与X2改进的灰色T型关联度。

r不仅能够反映正负关联程度,更能够确切的表明某一时间段Δtk内,增量对整体相似的贡献程度。避免了以前所定义的T型关联程度出现的,局部关联系数不同,但总体关联度可能相同,对应的图形与事实相差甚远的情况。

2 T型关联度的正负性

T型关联度能够很好的反映两时间序列的正负相关性,这是很多其它关联度不具备的特征之一。从关联系数的公式中,能清楚得看到反映正负相关性是由符号函数sgn(ΔX1(tk).ΔX2(tk))决定的。其中的ΔX1(tk),ΔX2(tk)分别是两时间序列的自增量。

从T型关联度的基本思想可以看出,T型关联度是反映两时间序列的接近程度,接近程度越高,关联程度也就越高;反之,越小。从这里,可以得出如下的基本结论:两时间序列的接近程度不以空间位置的相对变化而变化,而只与两时间序列的相对距离相关。这里的相对位置的度量可以采用相交后的夹角,夹角越小,关联程度越大;反之越小。同样也可采用先平移使相交于一点,从原始序列上取一点,作这点到比较序列的距离来衡量。距离越近,关联程度越大;反之越小。见图1、2。

图1

图2

接下来,开始将等时间序列推广到非等时间序列。实际数据中有很多这样的例子,当一个数据已经结束记录时,另一个数据还在继续。这样的数据实际上是可以讨论它们的关联程度的。无论上面哪种方式的度量都可以反映出关联程度的大小与时间序列的长度无关,是与时间序列所在的直线所在的相对位置相关。这里的相对位置是比较时间序列相对于原时间序列的相对位置。在接受这样的观点以后,开始阐述T型关联度衡量正负性的缺陷。

T型关联度的度量只与比较序列与原始序列的相对位置相关,也就表示与他们的初使位置无关。在此基础上,对这组序列进行旋转,它们的关联度依然是可以度量的。以两序列所在直线的交点进行旋转。旋转后,从理论上说没有任何改变,它们关联度不会发生任何改变。但是,它们的意义发生了很大的变化。从图形(图3、4)上看,它们并非等时间序列。关联程度之前是无法度量的,现在可以度量了。当然度量的方式还是采用夹角或点到直线的距离来度量。当然前面刚刚引入了两时间序列的关联度与它们的长度无关而是与它们所在的直线相关。初始位置发生改变后,可能导致原来一些序列自身的增加量、减少量发生改变,从而改变它们的增量序列正负性,进而影响它们的关联系数。这样就影响了这个关联度的正负性。举一个具体的例子来说明这个问题。

图3

图4

原始序列op1,对比序列为op2,将该图形绕O点进行旋转450度后,得到新的序列op1',op2'。但原始序列相对于比较序列的相对位置并未发生任何改变,只是相对于初使位置的相对位置发生了移动。因此它们的关联度不会发生任何改变。但是比对序列op2的位置由初始的位于经x轴下方旋转到x轴的上方op2'。对比序列对应的增量ΔX2(tk)由负数变更为正数,而原始序列对应的增量ΔX1(tk)符号一直没有发生改变。这样符号函数判断关联正负性的sgn(ΔX1(tk).ΔX2(tk))函数就发生了改变。从关联度的基本思想上看,两个时间序列的接近程度不会因为它们相对于初使位置的相对变化而发生改变,只会因为它们之间的相对位置发生改变。但如果用符号函数sgn(ΔX1(tk).ΔX2(tk))来定义原始序列与比较序列的正负相关性,是达不到这点的。

3 T型关联度的改进

在量纲相同和意义一样的两时间序列,按照因素的时间序列曲线的相对变化势态的与原始序列的接近程度来计算关联度。反映原序列X1={ }X1(t1),X1(t2),…X1(tn)与比较序列X2={ }X2(t1),X2(t2),…X2(tn)正负相关性的符号函数sgn(ΔX1(tk).ΔX2(tk)) 更 正 为 sgn(ΔX2(tk)-ΔX1(tk)) 或-sgn(ΔX1(tk)-ΔX2(tk))。其可理解为以原始序列的增量为一标尺,增量大于这个标尺的视为正相关,小于这个标尺的视为负相关。原始序列的增量相当于在数轴上的原点,在原点右侧的为正,原点左侧的为负。从本质上讲,原始序列的增量序列和对比序列的增量序列,可以绕它们所在直线交点进行旋转,将原始序列增量所在直线旋转到与x轴重合。此时,对比序列增量旋转后的位置决定它们的正负相关性。ΔX1(tk)-ΔX2(tk)>0,说明对比序列增量小于原始序列增量,旋转后位于x轴下方;ΔX1(tk)-ΔX2(tk)<0,说明对比序列增量大于原始序列增量,旋转后位于x轴上方。对照唐五湘提出的T型关联度,原始序列增量为正,比较序列增量为负的关联依然是负关联。但原始序列和比较序列增量同时为正或同时为负时,此次的关联度已经不再是以前提出的那种正关联,而要比较两序列增量的大小。

步骤1:求增量序列若量纲不统一的情况下,先对两序列进行量纲化处理后,再求增量序列。

步骤2:求两序列间的关联系数

设[a,b]上的两时间序列分别为X1={X1(t1),X1(t2),…X1(tn)}和X2={ }X2(t1),X2(t2),…X2(tn),称

为序列X1与X2的在从tk-1到tk时间段Δtk内的关联系数。

其中:

步骤3:求两序列X1={ }X1(t1),X1(t2),…X1(tn),X2=X2(t1),{X2(t2),…X2(tn)}间的关联度,称为X1与X2改进的灰色T型关联度。

r更能够准确地反映正负关联程度,更正后的符号函数不会因为原始增量序列与对比增量序列相对于初始位置的改变发生改变,只与原始增量序列相对于对比增量序列的相对位置有关。

4 重新定义正负性后的T型关联度实例

下面将用重新定义正负性后的T型关联度分析一个具体实例。西南地区城镇居民家庭平均每人全年消费性支出增量表如表1。(数据来源于统计年鉴)

表1 西南各地区城镇居民家庭平均每人全年消费性支出表

由于数据的结构与类型一致,因此无需采用无量纲化处理。可以求出增量序列如表2。

依据关联系数的计算公式

表2 西南各地区城镇居民家庭平均每人全年消费性支出增量表

可求出西南各地区与全国平均消费性支出的关联系数见表3。

表3 西南各地区城镇居民家庭平均每人全年消费性支出与全国平均水平的关联系数表

为了体现整体相似的贡献程度的关联度,用

求关联度得到:

上面的数据可以看出,在西南地区,重庆的消费性支出趋势与全国的消费性支出趋势最为相似,贵州的消费性支出趋势与全国的消费性支出趋势在负相关里面差异最大。主要原因是贵州与全国的消费支出关联系数每一个均为负(每一个增量均小于全国的水平),加上整体相似的贡献程度的综合作用,使得贵州的消费性支出趋势与全国的消费性支出趋势差异性明显。

[1]唐五湘.T型关联度及其计算方法[J].数理统计与管理,1995,14(1).

[2]查金茂.T型关联度的缺陷[J].武汉交通科技大学学报,1997,21(2).

[3]孙玉刚,党耀国.灰色T型关联度的改进[J].系统工程理论与实践,2008,(4).

[4]冯鹤林,陈勇明.一种改进的T型灰色关联度及应用研究[J].统计与决策,2011,(5).

[5]曹明霞.灰色关联度模型正负性问题的研究及其改进[J].系统工程与电子技术,2008,30(6).

猜你喜欢
消费性关联系数度量
鲍文慧《度量空间之一》
基于灰色关联度对山东小麦新品种(系) 综合表现评价分析
“新主流”引领下的现实拓展、多元类型与“想象力消费”
应用灰色关联度法分析稠油热采油井生产主控因素
代数群上由模糊(拟)伪度量诱导的拓扑
网络文学评价中的两个倾向性问题
突出知识本质 关注知识结构提升思维能力
大豆产量及主要农艺性状的相关性及灰色关联度分析
产业关联视角下北京市交通运输业经济效应测算研究
大众文化语境下当代文学创作的世俗化特征