基于图模型方法的我国股市网络结构分析

2017-11-30 10:10熊巧巧蔡风景
关键词:度值牛市关联性

熊巧巧,蔡风景

(温州大学数学与信息科学学院,浙江温州 325035)

基于图模型方法的我国股市网络结构分析

熊巧巧,蔡风景

(温州大学数学与信息科学学院,浙江温州 325035)

提出基于图模型的网络结构识别方法,并应用于我国深证行业股票指数.图中的点表示行业股票收益率,边表示存在相依关系,建立带有权重的我国股市社会网络模型,并计算网络密度和中心度等特征.实证结果表明,地产、建筑和金融指数关联性较强,制造指数、IT指数、水电指数和地产指数在网络中起着引领作用.市场行情阶段分析,证实我国股票网络结构密度熊市要高于牛市.

图模型;深证行业股票;社会网络;市场行情

近年来,越来越多的学者利用复杂网络工具在不同领域描述了复杂网络,例如社交网络、交通网络、食物网络以及股票网络等,并且分别用不同方法研究了网络的拓扑性质,例如最小生成树、过滤技术、线性(非线性)Granger因果检验、相关系数阈值的方法等.

国外学者Mantegna等[1-4]提出用最小生成树来构建股票网络,由于最小生成树的拓扑结构比较简单,因此会出现过度过滤现象从而丢失一些有用的边信息.为了弥补最小生成树的缺陷,Tumminello等[5-6]用过滤技术来构建股票网络模型,这样得到的股票网络的拓扑结构非常明显.Tomas等[7]提出利用 Granger因果关系对股票市场构建网络,得到各股票之间的因果相依关系.Lee等[8-9],①Raeesi M, Jalali M, Shajari M. Using influential nodes of stock network to measure Tehran Stock Exchange index[C] // Information and Knowledge Technology. IEEE, 2013: 457-462.提出相关系数阈值法来构建股票网络.

国内也有很多学者运用复杂网络的理论和方法对股市进行研究.黄玮强等[10]运用最小生成树算法和平面最大过滤图算法,针对我国股市的价格收益率建立关联网络,并对拓扑结构、中心性等进行了分析.周璞等[11]采用线性及非线性Granger因果检验的方法,实证研究了中国大陆股票市场和世界其他主要股票市场之间不同阶段的信息溢出现象.杨治辉等[12-14]用相关系数和阈值构建了股票网络模型.

目前国内外学者主要运用相关系数阈值法来对股票构建网络,但相关系数阈值法只能识别两者间的相关性,不能说明条件独立.基于此,已有学者提出运用图模型方法来构建网络[15-16].图模型是统计学中一个崭新的研究领域,它将传统的多元统计中描述多个变量之间关系的统计模型图形化.近年来,图模型方法已成为高维数据统计分析的重要工具,其主要思想就是通过揭示图中多维随机向量的相依结构来刻画向量之间的条件独立性.图模型方法已被广泛应用于社会,科学及经济领域[17],但鲜有文献将图模型方法应用于社会网络分析.本论文利用图模型方法,在偏相关分析基础上构建社会网络关系,并应用于深证行业股票市场进行实证分析.

1 基于图模型方法的网络构建

1.1 图模型理论

我们这里重点研究无向图,因此,无序对(i, j)∈E表明i与 j之间有连边;节点Whittaker[18]提出了基于多元正态假设的无向图模型,下面定义偏相关网络.让X表示一个n维多元随机变量,图中的每个节点对应X的每个元素,如.对任意的i、表示变量xi基于除了xi和xj所有的变量的最佳线性近似值.

定义:xi和xj的偏相关系数被定义为在之间普通的相关系数.意思就是,xi和xj的偏相关性等于两个线性回归模型的残差之间的相关性.为了简便,我们用符号ρij表示xi和xj的偏相关系数.

当两个随机变量的偏相关系数不为零时,偏相关网络的边缘有连边,也就是偏相关系数对应边的权重,直觉上,偏相关网络的可视化依赖于任意两个随机变量对所有其他变量之间的线性相关性.当随机变量X是多元正态分布时,偏相关系数为零意味着条件独立性.

下面我们给出相应的计算公式:

其中,mi是xi的无条件均值,是一个零均值残余.Σ代表残差向量的协方差矩阵.Σ的对角元素是元素X的条件方差,.正交性条件为j≤n,意味着它给出了回归系数的

偏相关系数也与X协方差矩阵有关.对于零均值的多元正态分布 n维随机变量记其协方差为Σ,协方差的逆的偏相关系数为:

由于在多元正态分布中xi和xj不相关与它们独立是等价的,当kij=0时,可以得到xi和xj不相关,所以是条件独立的,即根据条件独立性,所以xi和xj之间的边不存在,

1.2 网络中心性分析

中心性(centrality)是度量整个网络中心化程度的重要指标,在股票群网络中,处于中心位置的股票更易获得资源和信息,拥有更大的权力和对其他股票更强的影响力.

衡量网络中心性的最简单的核心措施之一是程度中心性.对于加权无向图,程度中心性是测量一个节点与图中其它相连接节点的边缘权重.程度中心性是测量网络中一个节点与所有其它节点相关联的程度.对于一个拥有n个节点的无向图,节点i的程度中心性既与i与其它n-1个节点的连边有关系,又与连边的权重有关.

用矩阵表示如下:

1.3 网络密度分析

网络密度反映的是网络中各个区域之间联系的紧密情况的指标,描述的是网络的集团化程度.可以通过网络中实际拥有的关系数与理论上做多拥有的关系数相比得到,区域之间的联系越多,该网络的密度越大.整体网的密度越大,该网络对其中个体的态度、行为等产生的影响可能越大.密度是图中实际拥有的连线数与最多可能拥有的线数之比,其计算公式可表示为

其中k表示网络结构节点数,e表示网络结构中邻接点之间实际存在的边数.

密度值介于0和1之间,值越接近1则代表彼此间关系越紧密.密度反应了成员参与和交流的积极程度.密度依赖于两个网络结构参数,是图的内含点和图中各点的度数总和.

2 深证行业股票网络实证分析

2.1 数据来源与处理方法

数据来源于同花顺 iFinD数据库①参见:http://www.51ifind.com/.,选取深证行业股票指数,研究股票之间网络的性质,采取的数据是样本股从2013年3月5日到2016年12月30日所有交易日的日收盘价,每只股票有934个交易日的数据.

然后我们结合上述所给计算偏相关系数的方法得出偏相关系数矩阵,省略偏相关系数绝对值比0.1小的边缘.最后给出基于图模型方法的带权重社会网络图,见图1.从图1可以看出地产指数、建筑指数和金融指数的边缘比较粗,这说明地产指数和建筑指数、金融指数的关联性比较显著,地产指数的波动能引起建筑指数和金融指数的较大波动.反过来,建筑指数和金融指数的波动也能引起地产指数的波动.制造指数、采矿指数和IT指数的边缘也比较粗,这说明制造指数、采矿指数和IT指数的关联性比较显著,制造指数的波动能引起采矿指数和IT指数的较大波动.文化指数、商务指数和IT指数三者的关联性也比较显著.其它行业股指间的关联性较小.这与行业间的实际关系是一致的,同时也说明股票市场大体可以反映行业间的真实关系.从投资组合的角度看,选择资产关联性较小的资产进行组合,可降低投资的风险.

图1 基于图模型方法的社会网络图Fig 1 Social Network Based on Graph Model Diagram

2.2 网络特性分析

基于上述计算网络中心性的方法给出基于图模型方法的网络密度和中心度,其中网络密度为0.358,表1是网络中心度值.

表1 基于图模型方法的网络度值Table 1 Network Degree Value Based on Graphical Modeling

从网络密度值可以看出股票间关系比较紧密.表1显示制造指数度值最大,IT指数、水电指数和地产指数的度值也比较大.从上述度值的计算方式可知,度值的大小是衡量一支股票对深证其它行业股指的关联性大小的.制造指数度值最大说明制造指数核心地位非常强,它不仅与其它股票的连接边最多,而且与所有连边的偏相关系数也最大,说明这只股票与其它股票的联系紧密,更易获得资源和信息,拥有更大的权力和对其他股票更强的影响力.IT指数、水电指数和地产指数的核心地位也比较显著.从图1中我们可以看出制造指数、IT指数、水电指数和地产指数处于中心地位,能够有效控制及影响网络中其它行动者的活动,这四支股票引领着整个深证行业指数的动态变化.

2.3 市场行情的影响分析

在研究期间,中国的股票市场经历了熊市和牛市的多次交替,我们在研究股票网络结构的时候必须考虑市场行情的阶段.基于此给出分段,T1从2014年6月19日到2015年6月12日这段时间属于牛市行情,此间深证综合指数涨达202%;T2从2015年6月13日到2016年1月28日这段时间属于熊市行情,此间深证综合指数跌达48%;T3从2016年1月29日到2016年12月30日这段时间股票属于平稳期,涨跌幅都较小.

首先给出不同市场行情下的社会网络图,见图2 - 图4.通过分析我们发现T1段网络密度为0.383,T2段网络密度为0.483,T3段网络密度为0.408.网络密度的大小说明股票之间的紧密性,网络密度越小股票之间联系越小,股票独立性越强.反之,股票之间的相关性越大.通过网络密度值我们发现,在熊市行情网络密度比牛市行情网络密度大,说明熊市股票之间相关性比较高,牛市相关性比较低,这与一些学者关于熊市高相关、牛市低相关性的结论比较吻合[19-20],①Ma J, Wang L, Wang T. Dynamics of Chinese stock market from a complex network perspective [C] // Control and Decision Conference. IEEE, 2015: 238-243..

从图2可以看出在牛市行情下,金融指数和地产指数的关联性非常大,商务指数和IT指数、批零指数和制造指数的关联性次之.这与行业间的关系也是符合的.在牛市行情下,地产业的发展离不开金融的支持,同时也能带动金融业的发展.这两者是相互支持,相互促进的关系.从图3可以看出在熊市行情下,制造指数和IT指数、水电指数的关联性最大.而地产指数和金融指数的关联性就没有牛市行情下那么大.从图4可以看出在平稳期下,金融指数和水电指数、采矿和制造指数的关联性最大.

图2 牛市行情社会网络图Fig 2 Social Network Diagram of Bull Market

图3 熊市行情社会网络图Fig 3 Social Network Diagram of Bear Market

图4 平稳期社会网络图Fig 4 Social Network Diagram in Stationary Phase

表2 基于图模型方法分段网络度值Table 2 Segmented Network Degree Value Based on Graphical Modeling

表2为基于图模型方法分段网络度值,通过表2我们发现每个时间段的度值有所改变,但股票度值排名前五的股票相似度比较高,其中制造指数、IT指数、水电指数在每个时间段度值都排名都较高,这与我们前面对整体时间做出来的结果比较吻合.说明,熊市和牛市行情及平稳期中核心股票基本不变.不同的是科研指数在熊市行情中度值比较高,但在牛市行情中度值比较低.

3 结 论

本文运用一种新的方法即图模型方法,对深证行业股票之间的关联性进行了实证研究.首先,采用一种新的计算偏相关系数的方法识别图模型结构来构建有权重的社会网络图.然后,计算出网络密度和中心度,分析各股票的关联性和核心地位.最后,通过市场行情的考虑对时间分段,分为牛市行情、熊市行情和平稳期.分别构建带权重的社会网络图,并计算出股票密度和中心度来考察不同行情下股票关联性的变化.

得出结论如下:(1)地产指数和建筑指数、金融指数的关联性比较显著,制造指数和采矿指数、IT指数的关联性比较显著,文化指数、商务指数和IT指数三者的关联性也比较显著,其它行业股指间的关联性较小.从投资组合的角度看,选择资产关联性较小的资产进行组合,可以降低投资的风险.(2)制造指数度值最大,IT指数、水电指数和地产指数的度值也比较大.制造指数、IT指数、水电指数和地产指数处于中心地位,能够有效控制及影响网络中其它行动者的活动.这四支股票引领着整个深证行业指数的动态变化.(3)通过对市场行情分类,发现熊市行情下股票之间的关联性高,牛市行情下股票之间的关联性低,而平稳期下股票之间的关联性介于二者之间.在牛市行情下金融指数和地产指数关联性强,而熊市行情和平稳期下较弱.这说明,在牛市行情下金融业与地产业比较活跃.不管熊市行情、牛市行情或平稳期,核心股票基本不变.

[1] Mantegna R N. Hierarchical stmctrxre in financial markets [J]. Eur Phys J B, 1999, 11(1): 193-197.

[2] Kim H J, Lee Y, Kahng B, Kim I M. Weighted scale-free networkin financial correlations [J]. J Phys Soc Jpn, 2002,71(9): 2133-2136.

[3] Onnela J P, Kaski K, Kertesz J. Clustering and information in correlation based financial networks [J]. Eur Phys J B,2004, 38(2): 353-362.

[4] Micciche S, Bonanno G, Lillo F, et al. Degree stability ofa minimum spanning tree of price return and volatility [J].Physica A, 2003, 324(1/2): 66-73.

[5] Tumminello M, Matteo T D, Aste T, et al. Correlation based networks of equity returns sampled at different time horizons [J]. Eur Phys J B, 2007, 55(2): 209-217.

[6] A Garas, P Argyrakis, S Havlin. The structural role of weak and strong links in a financial market network [J]. Eur Phys J B, 2008, 63(2): 265-271.

[7] Výrost T, Lyócsa Š, Baumöhl E. Granger causality stock market networks: temporal proximity and preferential attachment [J]. Physica A, 2014, 427(1): 262-276.

[8] Lee K E, Lee J W, Hong B H. Complex networks in a stock market [J]. Computer Physics Communications, 2007,177(1/2): 186-201.

[9] Namaki A, Shirazi A H, Raei R, et al. Network analysis of a financial market based on genuine correlation and threshold method [J]. Physica A, 2011, 390(21/22): 3835-3841.

[10] Huang W Q, Zhuang X T, Yao S. A network analysis of the Chinese stock market [J]. Physica A, 2009, 388(14):2956-2964.

[11] 周璞,李自然.基于非线性Granger因果检验的中国大陆和世界其他主要股票市场之间的信息溢出[J].系统工程理论与实践,2012,32(3):466-475.

[12] 杨治辉,贾韩梅.股票收益率相关性的网络结构分析[C] // 中国自动化学会控制理论专业委员会. 中国自动化学会控制理论专业委员会B卷.北京:科学出版社,2011:5732-5736.

[13] 吴翎燕,韩华,宋宁宁.基于相关系数和最佳阈值的股票网络模型构建[J].复杂系统与复杂性科学,2014,4(11):49-55.

[14] 张筱梅,朱家明.基于 Pearson相关系数模型对股票间相关性研究[J].赤峰学院学报(自然科学版),2015(10):32-33.

[15] Geng Z, Guo J H, Lau T S, et al. Confounding, homogeneity and collapsibility for causal effects in epidemiological studies [J]. Stat Sinica, 2001(11): 63-75.

[16] Fan J Q, Liu H. Statistical analysis of big data on pharmacogenomics [J]. Adv Drug Deliver Rev, 2013, 65(7):987-1000.

[17] Sprites P, Glymour C, Schemes R. Causation, prediction, and search [M]. Cambridge: MIT Press, 2000: 1-13.

[18] Whittaker J. Graphical models in applied multivariate statistics [M]. New York: Wiley, 1990, 9(1): 159-160.

[19] Ang A, Bekaert G. International asset allocation with regime shifts [J]. Rev Financ Stud, 2002, 15(4): 1137-1187.

[20] Longin F, Solnik B. Extreme correlation and international equity markets [J]. J Financ, 2001, 56(2): 649-676.

(编辑:封毅)

Network Structural Analysis on China Stock Market Based on Graphical Modeling

XIONG Qiaoqiao, CAI Fengjing
(College of Mathematics and Information Sciences, Wenzhou University, Wenzhou, China 325035)

The network structure recognition method based on graph model is proposed in this paper and applied in China’s Shenzhen Industrial Stock Index. The nodes in the graph represent the industry stock returns, and the edges indicate a dependency relationship. The social network model in China’s stock market with weights is therefore established and followed by the network density and the characteristics of centrality.Empirical results show that real estate, architectural industry and financial index linked much stronger, while the manufacturing index, IT index, hydroelectric index and real estate index play a leading role in the network.It is verified in submarket phase analysis that the network density in our stock market structure density in bear market is much higher than in bull market.

Graphical Model; Industrial Stocks in Shenzhen Stock Exchange; Social Network; Market Quotation

O212.4

A

1674-3563(2017)04-0021-08

10.3875/j.issn.1674-3563.2017.04.004 本文的PDF文件可以从xuebao.wzu.edu.cn获得

2017-03-06

国家社会科学基金(15BTJ030)

熊巧巧(1992- ),女,湖北随县人,硕士研究生,研究方向:应用统计与数理金融

猜你喜欢
度值牛市关联性
探讨公路项目路基连续压实质量检测技术
基于相关分析和显著性检测的图像缩放方法
科技巨头:如何理解最近的科技股牛市 精读
牛市或延续至全年,甲鱼接下来还会再涨一轮吗?
利剑能否终止美股十年牛市
四物汤有效成分的关联性分析
如何准确认定排污行为和环境损害之间的关联性
微博网络较大度值用户特征分析
CRP检测与新生儿感染的关联性
抗磨白口铸铁化学成分自关联性分析