基于一种炒股行为生成的随机变量与分布估计

2017-06-07 08:04程丛电马晶鑫
关键词:金融学股票股市

程丛电, 马晶鑫

(沈阳师范大学 数学与系统科学学院, 沈阳 110034)



统计学

基于一种炒股行为生成的随机变量与分布估计

程丛电, 马晶鑫

(沈阳师范大学 数学与系统科学学院, 沈阳 110034)

从大数据、机器学习和行为金融学的角度出发,通过设计一个算法定义了一个表现按照某种初级炒股行为买卖一支股票的收益状况的随机变量R,并进行有关研究。基于这支股票的一定的折现历史数据运用所设计的算法求出R的一个样本;根据该样本做出R的一个经验分布;再根据该经验分布建立关于R的近似解析分布的一个序,并进而给出一种求优化近似解析分布的方法。基于R的生成方式及相关探讨展示它的意义,并揭示出一些值得进一步研究的问题。所做工作可为炒股提供一定的启示,可为从大数据、机器学习和行为金融学的角度出发进一步研究股市提供一定的启示。

股市; 大数据; 行为金融学; 随机变量; 分布; 估计

0 引 言

股票是股份公司为融资而发行给股东作为持股凭证并借以取得股息和红利的一种有价证券。股票市场是一个非常庞大而且复杂的体系,每天都有着巨额财富“产生和幻灭”,社会上各方面因素错综复杂的运转无时无刻不影响着股市的变化,而股市的状况又与国民经济发展乃至股民的利益息息相关。因此,关于股市的研究具有重要的意义,在过去的十几年里从各种不同的角度出发研究股市的文献层出不穷。

Kim等[1](2004)运用带有优化变换的神经网络考虑了股市预测问题;Fonseka等[2](2008)发展了一个运用滞后相关分析现阶段我国对股市数据的数据挖掘算法;李涛等[3](2009)考察了城市居民的风险态度与其投资行为的关系;徐新新[[5](2015)展示了统计分析方法在股票最优投资方面的应用;张力[6](2016)给出了一种股票市场投资组合策略构造并讨论了相关模型检验问题。随着大数据[7-8]受到广泛的关注,学者们开始从数据挖掘的角度研究股市。唐滔[9](2013)研究了云计算在股票数据分析领域的应用与实现问题;王春峰[10]等研究了伴随互联网的发展衍生的媒体关注度与股票收益之间的关系。另一方面,受到新兴边缘科学行为金融学的影响,近年来有不少学者从行为金融学的角度研究股市问题。李静[11](2012)从行为金融学的角度出发研究了股票市场投资者的行为;杜 飞[12](2014)从行为金融学的视角出发考查了股票市场动量效应和反转效应的形成机制; 李涛等[13](2015)探讨了人格特征与股票投资的关系。

受到以上几方面研究动态的启发,本文尝试建立一个能够在一定程度上表现某种炒股行为收益状况的随机变量,并根据一定的实际数据生成样本、估计分布暨给出一些值得探讨的问题。

1 模 型

在实际中不少刚刚步入股市的人这样炒股:瞄准一支股票(或板块),观察一段时间后估算出其平均价格,然后见到其价格一定程度低于平均价格时买入,再见到一定程度高于平均价格时即卖出,若是过一定阶段不出现卖点的话,便不管多少也就抛了。称此为初级炒股行为(Junior actions of speculation on stocks,简记JASS)。为了研究按照JASS方式炒作某支股票X的收益状况及其与股市其他方面的关系,拟通过算法1与其输出R来抽象地刻画该炒股行为及其收入状况。

算法1

输入: 正整数l和s,正实数ε和δ;股票X的股价:

输出: 收益值R。

3) 若k

6) 输出R,然后停机。

易知,算法1和输出R抽象地刻画了JASS方式与其收入。 所以,可以通过它们研究JASS与其收益,以及从某一特定的角度研究股市,在一定程度上揭示股市这个巨复系统的奥秘。

2 分布估计

定义收益随机变量R后,自然要考虑R的分布状况。本节专门讨论这一问题。

2.1折现

有效地估计R的分布状况,需要较大的样本,由于利率关系,当观察期较长时间前后的数据具有某种较大的“异质性”,即同是1个单位的货币前后的实际价值差异较大;为了消除利率的这种不良影响,应首先统一“单位”,即进行“折现”。如下的算法2可用于完成该项任务。

算法2

1) 令t:=0,I=1。

2)t:=t+1,I:=I×(1+it)。

ⅰ)i:=0;

ⅲ) t

运用算法2可将过去T年中每日的股价折成初始时刻的现值,从理论上讲,这就在一定程度上消除了利率的不良影响。

2.2 分布估计

以沪市的大连热电为例,选取2011年初至2015年末每日的开盘价、收盘价、最高价和最低价作为数据,并取l=30,s=60,ε=0.2,δ=0.1,先用算法2进行折现处理,再按上述方式重新排序,然后用下面的算法3便可获得R的一个容量为(365T-90)的一个样本{Rj}(由于存在周六、周日,及其他一些缺失值,按每年244天进行统计与计算,得到的样本的容量实际上为(244×5-90)=1130) )。

算法3

输出: 收益值R的样本{Rj},l

1) 令j:=l。

2) 置j:=j+1。若j≥365T-s, 转3,否则置i:=-l,继续往下进行。

ⅱ)i:=i+1,返回(1),否则继续往下进行。

ⅲ) 调用算法1。

ⅳ)Rj=R。

3) 输出{Rj},然后停机。

由{Rj}可以得到关于R的如表1所示的分组不完全数据;根据该组数据又可做出R经验密度曲线(参见文献[14]第154页的6.3),分别见下面的表1与图1。

表1 MATLAB数据分析结果

图1 数据的经验密度曲线

图1中折线所表示的函数f(x)为“沪市大连热电这支股票的收益随机变量”R的基于前5年数据的经验密度曲线。根据样本{Rj}和该曲线走势可以发现:收益率为0的情况高达85% 以上;收益率为负值的情况为14.34%;而收益率为正值的情况所占的比例相当小。

该结果与大部分股民炒股收益非正这一实际情况是一致的;另一方面这也说明了模型基本上可刻画初级炒股者行为的本质。

注2: 计算是通过在一台Intel(R) Pentium(R)(Dual E2160 @ 1.80GHz 1.80 GHz, 0.99GB RAM)的个人计算机上运行算法3的Matlab语言程序而完成的.

虽然经验分布易求、直观,但不利于理论研究,为了便于理论研究,可进一步根据样本{Rj}与所求R的经验分布,利用某种分布估计方法,探索R的具有较好拟合度的理论分布。例如可按下面(A)、(B)、(C)这3步获取R的近似分布。

1) 按文献[15-16]的方法求出R的近似g-h分布;或先根据以往的经验及有关思考,

设R服从某类参数分布f(x,θ1,θ2,…,θk),然后用最大似然估计法求出相应最大似然估计;或用其他某种方法求出R的某近似解析分布。

2) 设g,h是R的2个近似解析分布的密度,f为图1中经验密度,若

认为g优于h。运用这种方法比较R的近似分布。

(C) 运用(A)多求出几个R的近似分布,f1,f2,…,fk,然后通过(B)求出最优的f*。

运用(A)、(B)和(C)所展示的方法,根据样本{Rj},可以求出R的优化近似解析分布;为了突出主题与节省篇幅,细节和具体计算在此从略。

注3: 1)在实践中,可根据实际情况用适当的a与b分别替换式(1)中的-∞与+∞;2)因为f是分段函数,

由此可通过计算机进行相关计算。

3 展 望

本节展示基于上述已完成工作可进一步研究的问题。

1) 探索R的解析分布;

2) 寻求R的数字特征,如均值,方差,峰度和偏度等;

3) 讨论R的半方差,VaR和TvaR等风险度量;

4) 考虑算法1中参数l和s,ε和δ的最优值;

5) 研究相应于不同股票的收益变量R之间的关系;

6) 研究R与其他技术指标,如沪市的综合指数、K线等的关系;

7) 通过对于R的研究预测股市的走势;

8) 从机器学习的角度出发,研究开发能够跟踪股市行情,自动生成R的当前值,并经过一定运算,为股民提供有效参考建议的应用软件。

4 结 语

受以往股市研究,大数据与行为经济学热潮的影响,本文建立了一个表现某种初级炒股行为收益状况的随机变量并给出了一种基于以往股价记录获取其样本的方法,此外还提出了一些值得进一步研究的问题。

[ 1 ]KIMK-J,LEEWB.Stockmarketpredictionusingartificialneuralnetworkswithoptimalfeaturetransformation[J].NEURALCOMPUTAPPL, 2004,13(3):255-260.

[ 2 ]FONSEKA C, LIYANAGE L. A data mining algorithm to analyse stock market data using lagged correlation[C]∥ICIAFS08, 2008:163-166.

[ 3 ]李涛,郭杰. 风险态度与股票投资[J]. 经济研究, 2009(2):56-67.

[ 4 ]徐新新. 基于ARIMA模型的股票价格变动规律和预测的研究[J]. 经济研究导刊, 2016(19):77-78.

[ 5 ]郑薇,开璇,谢心庆. 统计分析方法在股票最优投资的应用[J]. 贵州商业高等专科学校学报, 2015,28(1):49-52.

[ 6 ]张力. 股票市场投资组合策略构造及模型检验[J]. 海南热带海洋学院学报, 2016,23(5):108-113.

[ 7 ]FAN Jianqing, HAN Fang, LIU Han. Challenges of big data analysis[J]. National Science Review, 2014,1:293-314. Aug 2013.

[ 8 ]FAN Wei, BIFET A. Mining big data: current status, and forecast to the future[J]. SIGKDD Explorations, 2013,14(2):1-5.

[ 9 ]唐滔. 基于云计算的股票数据分析研究与实现[D]. 长沙:湖南大学, 2013.

[10]王春峰,李嘉毅,房振明. 大数据下媒体关注度与股票关系研究[J]. 天津大学学报(社会科学版), 2016,18(2):103-108.

[11]李静. 基于行为金融学的股票市场投资者行为研究[D]. 北京:中国社会科学院研究生院, 2012.

[12]杜飞. 行为金融学视角下的股票市场动量效应和反转效应形成机制[J]. 时代金融, 2014(8):114-114.

[13]李涛,张文韬.人格特征与股票投资[J]. 经济研究, 2015,6:103-116.

[14]肖争艳. 精算模型[M]. 2版. 北京: 中国人民大学出版社, 2015:154-164.

[15]陈倩,李金林,邹庆忠. 基于g-h分布的股票收益率风险价值研究[J]. 兵工学报, 2009,30(增刊1):175-180.

[16]钟波,山宇. 基于随机模拟与g-h分布的VaR计算方法[J]. 统计与决策, 2013(15):8-11.

A random variable generated based on a behavior of investing in stocks and its estimation of distribution

CHENG Congdian, MA Jingxin

(College of Mathematics and Systems Science, Shenyang Normal University, Shenyang 110034, China )

From the perspective of big data, machine learning and behavioral finance, by designing an algorithm, which models the process that a person buys and sells a stock in a primary trading behavior, define a random variable R that represents the result of the process and make some related discussions. A sample ofRis made out with the designed algorithm basing on some discounted history data of the stock and further a empirical distribution ofRis made according to the sample. An order relation of the approximate analytical distribution ofRis defined according to the empirical distribution and further approach to obtain the approximate analytical distribution of optimization is proposed. Finally the significance of the defined random variable is demonstrated and some problems deserved to further research are revealed basing on the way by which we define the random variableRand the related discussions. What we done can provide some enlightenments for investing in stocks, and can also provide some ideas for scholars to study market of stocks from the perspective of big data, machine learning and behavioral finance.

stock market; big data; behavioral finance; random variable; distribution; estimation

1673-5862(2017)02-0161-05

2016-10-02。

国家自然科学基金资助项目(11401393); 辽宁省科技厅自然科学基金资助项目(2014020120)。

程丛电(1960-),男,四川隆昌人,沈阳师范大学教授,硕士。

O213; F832; F222

A

10.3969/ j.issn.1673-5862.2017.02.007

猜你喜欢
金融学股票股市
浅述行为金融学
行为金融学在价值投资中的应用分析
浅析数学方法在金融学中的应用
中国金融学面临的挑战和发展前景
股市日历
股市日历
本周创出今年以来新高的股票
本周创出今年以来新高的股票
本周连续上涨3天以上的股票
股市日历