基于函数型数据分析的股票资金流强度研究

2021-05-26 04:03周若其李俊林董安强
太原科技大学学报 2021年3期
关键词:资金流个数股票

周若其,李俊林,董安强

(太原科技大学 应用科技学院,太原030024)

1965年美国芝加哥大学著名教授尤金·法玛(Eugene Fama)在《商业学刊》发表论文《股票市场价格行为》,1970年对该理论进行深化并提出有效市场假说(efficient markets hypothesis),并因此获得2013年诺贝尔经济学奖。

有效市场假说理论认为,在一个充满信息交流和信息竞争的社会里,一个特定的信息能够在股票市场上迅即被投资者知晓。资产价格反映了一种资产价值的所有公开的、可获得的信息。根据这一理论,股票市场表现出信息有效,即以理性方式反映所有可获得的信息的有关资产价格的描述。当信息改变时,股票价格就会变动。但是,在任何一个时点上,市场价格是以可获得信息为依据的公司价值的最好估算[1]。

对于有效市场假说理论,美国宾夕法尼亚大学沃顿商学院金融学教授、经济学家Jeremy Siegel认为,这个假说并不认为市场价格总是正确的。相反,它意味着市场上的价格经常是错误的,但在某一既定时点上,根本不能轻易地判断这些价格是太高还是太低[1]。

这表明有效市场假说的缺陷。国内学者[2]认为,除了地震、战争等突发事件外,绝大多数新的信息形成都需要一段时间,新的信息整合到股价中需要一个过程。资金是证券市场的唯一驱动力,新的股价不是一蹴而就的,它是由连续不断的资金买入推高或资金卖出压低。新的信息被整合到股价中的过程就是资金的流动过程。目前反映国内外股票市场波动的指数全部都是“价格”类的,称为股票价格指数,简称股价指数。它们是以个股的股价为变量,应用综合指数计算公式而计算得出一个数字。然而,由于证券市场的驱动力是资金,反映股票市场波动和趋势的应该是以资金为变量的“资金”类指数。李俊林提出的股票资金流强度(strength of stock fund flows)指数就是一种“资金”类指数。它是为了能够更全面地洞察股票市场的运行特征和市场信息而提出的一种同时考虑股票价格与成交量的综合性指标[2-3]。

1 股票资金流强度的优化

1.1 股票资金流强度

文献[3]中的股票资金流强度的模型为:

股票资金流强度=

其数学表达式为:

(1)

其中:Sj为第j天股票资金流强度;Pj(i)为第j天的第i次成交价;Qj(i)为第j天的第i次成交量;L为流通量,指股票的流通总股,是确定的常数;φ为参考价,是人为选择的常数,一经确定便固定不变;n为时间T内成交总次数。

文献[3]中有详细的介绍与说明。文献[4]-[7]在基于上述模型得到的股票资金流强度基础上对其进行一系列的统计分析,包括验证其有效性,研究与股票收益率等常用指标的相关性,及其自身的波动性等等。

但是该模型亦有自身缺陷。首先,计算结果的精度不够,导致计算结果大量为0;其次,无法处理高频数据。尽管文献[8]对模型进行一定的优化,但依然无法克服这些问题。

本文致力于解决这些问题。

1.2 模型优化

针对上述所提的问题,对模型进行如下优化。

式(1)中Pj(i),Qj(i)是离散函数,连续化后记为Pj(t),Qj(t)。Pj(t)和Qj(t)分别为连续的价格函数与成交量函数。

记:

将式(1)积分化,即为:

(2)

计算式(2)得:

(3)

只需计算积分:

(4)

(5)

即可。

同时需要指出式(3)是协变量为函数,响应变量为标量的函数型线性回归模型。

2 函数型数据分析

2.1 预处理

函数型数据分析的首要工作是将得到的离散数据转化为函数[9]。基本解决方法是基函数拟合。

基函数拟合是将采样得到的有限多个离散的数据值转化成函数。对比于传统的拟合方法,基函数拟合往往可以更好地拟合数据分布复杂的曲线图形。

函数型数据分析的数学前提是无穷维函数空间,且是Hilbert空间。它将离散的数据转化为函数,该函数是函数空间中的一个元素,可以用空间的基进行线性表示。

设无穷维函数空间的基为:{φk(t),k=1,2,…},则对于任意属于该空间的函数可表示为:

f(t)=c1φ1(t)+c2φ2(t)+…+ckφk(t)+…

注意到无穷维函数空间是Hilbert空间,即完备的内积空间,故有[10]:

∃k∈N+, s.t.

f(t)=c1φ1(t)+c2φ2(t)+…+ckφk(t)

基函数拟合是通过求解系数{ck(t),k=1,2,…},进而得到f(t)的表达式。

常用系数计算方法是最小二乘法。

其中{ck,k=1,2,…,K,K∈N+}为基所对应的系数。

最小二乘法计算ck:

即:

解得:

Cp=(Φ′Φ)-1ΦP

同理:

Cq=(Φ′Φ)-1ΦQ

进而式(4),式(5)为:

其次,需要考虑所选的基函数,即上述中的φk(t).常用的基函数系统有:多项式基函数(Polynomial basis function),傅里叶基函数(Fourier basis function)和B-样条基函数(B-Spline basis function).

最后,需要考虑选取的基函数个数,即上述中的K。一般选取的原则有模型选择(model selection)和交叉验证(Cross-Validation).

本文有不同的观点。本文选取基函数个数的原则:单个函数的数据个数等于基函数个数。

例如,五分钟均衡价格数据,一天有48个数据,则选取48个基函数。

对比来看:

设有限维欧氏空间F和无穷维Hilbert空间E.且有x∈F,f(t)∈E.

F的基为:{ek,k=1,2,…,n}

E的基为:{φk(t),k=1,2,…,n,…}

对于F而言:

dim(F)=1时:

x=(x1)=〈x·e1〉·e1.

dim(F)=2时:

x=(x1,x2)=〈x·e1〉·e1+〈x·e2〉·e2.

dim(F)=n时:

x=(x1,x2,…,xn)=〈x·e1〉·e1+〈x·e2〉·e2+…+〈x·en〉·en.

对于E而言:

f(t)=〈f(t)·φ1(t)〉·φ1(t)+〈f(t)·

φ2(t)〉φ2(t)+…+〈f(t)·φk(t)〉φk(t)+…

〈·〉是内积运算,指元素在基上的投影。

当dim(F)每多一个数据时,便多一个基。对于无穷维函数空间E而言,函数的数据意味着函数在基上的投影。最小二乘法逼近问题本质上是用空间E中一个有限维子空间逼近空间E中无穷维的函数,理论上,子空间维数越高越接近原函数。如果采集到的单个函数数据个数为n,则意味着函数在空间E中的n个基上有投影,进而可以用这n个基构成的子空间逼近空间E中无穷维的函数。

另一方面,以此为准的拟合结果显示,数据会全部落到函数中。本文并不认为这是包含干扰信息或者是过拟合现象,而这恰恰是和有效市场假说形成相互印证,即资产的价格(成交量)表达了市场的全部信息。

2.2 计算

介绍两种计算方法。

直接计算:

得到价格函数和成交量函数的估计表达式后直接利用式(3)计算。

基函数展开:

则式(3)为:

(6)

(7)

2.3 估计

首先阐明一个观点。函数型线性回归模型最为直接的应用是预测。在回归中的问题是系数函数的估计。利用部分数据估计出系数函数,即可得到回归模型。预测是指在得到回归模型中,将剩余数据作为协变量带入回归模型中得出响应变量[12]。按照此过程,本文的估计可以理解为预测。不同的是,式(3)所代表的函数型线性回归模型中的系数函数是有具体现实意义的,是人为规定的。

对于基函数展开法的计算,若为非正交基,则用式(6)计算;若为正交基,则用式(7)计算。实际上,正交基的运算效率要高于非正交基的运算效率,为此可通过Karhunen-Loève展开即主成分分析得到新的正交基,即主成分基。

Karhunen-Loève展开:

以Pj(t)为例。

即有:

Pj(t)=μp(t)+

令Xj(t)=Pj(t)-μp(t),则有:

故有Pj(t)和Qj(t):

(3)式变为:

(8)

取前K个主成分时:

(9)

关于K的选择采取累计贡献率的方法.

易知,通过函数型主成分分析,得到的主成分基{fi(t),i=1,2,…,K,K∈N+}是正交基。进而股票资金流强度可以利用式(9)估计。

3 实证分析

3.1 实证对象

股票名称:贵州茅台。

股票代码:600519.

时间范围:2018年7月2日至2018年9月28日,共64天。

数据结构:五分钟均衡数据,包括股价数据和成交量数据。

基函数选择:傅里叶基函数。

累计贡献率:95%

数学软件:MATLAB.

3.2 计算结果

由于数据杂多,仅展示9月份的计算结果,如表1所示。

表1 600519股票资金流强度(9月)

两种计算方法耗时如表2所示:

表2 两种方法耗时

3.3 估计结果

采用滚动估计的方法。

先对前60天的价格函数和成交量函数做函数型主成分分析,得到主成分函数;然后计算第61天的价格函数和成交量函数的主成分得分,最后利用式(9)估计第61天的股票资金流强度。

以此类推,估计后四天的股票资金流强度。结果如表3所示:

表3 估计结果

相对于文献[3]的计算结果,优化后的模型提高了股票资金流的计算精度,同时解决无法处理高频数据的困境。另外相比文献[4],利用函数型主成分分析估计股票资金流强度的结果更为准确。

4 结论

函数型数据分析是近些年蓬勃发展的新型非参数统计方法,相比于传统的统计方法有着得天独厚的优势。本文首次将函数型数据分析的方法应用于股票资金流强度的研究。将求和模型优化为积分模型,优化后的模型是协变量为函数,响应变量为标量的函数型线性回归模型。实证结果表明,优化后的模型可以提高股票资金流的计算精度,克服无法处理高频数据的问题,同时在估计方面也更为精确。此外,对于基函数个数的选择上,笔者也有着不同的看法。对于函数型数据分析的最小二乘问题,就是在无穷维空间中找一个有限维子空间来逼近无穷维空间的元素。基函数的个数其实就是有限维子空间的维度。通过与有限维空间的对比,笔者认为采集的数据实际上是函数在无穷维空间基上的投影,那么有多少个数据即意味着在多少个基上有投影,所以选取基函数的原则是数据个数。

猜你喜欢
资金流个数股票
怎样数出小正方体的个数
怎样数出小木块的个数
最强大脑
怎样数出小正方体的个数
本周创出今年以来新高的股票
本周创出今年以来新高的股票
企业ERP系统的构建
本周连续上涨3天以上的股票
近期连续涨、跌3天以上的股票
管理中资源要素的协同作用