一阶混合整数值二项自回归模型

2021-11-26 07:47刘子健桂尚珂金虹桥
吉林大学学报(理学版) 2021年6期
关键词:样本量整数证明

刘子健, 桂尚珂, 陈 硕, 杨 凯, 金虹桥

(长春工业大学 数学与统计学院, 长春 130012)

整数值时间序列广泛应用于通信保障、医疗卫生、保险精算等领域. Al-Osh等[1]提出了一阶整数值自回归模型; 对于取值范围无上限的相依计数数据, Du等[2]提出了p阶整数值自回归模型, 即INAR(p)模型; Neal等[3]和张哲等[4]先后研究了该类模型的估计问题; 对于有上限的整数值时间序列, 例如某个城市的失业人口数等, McKenzie[5]提出了一阶整数值二项自回归模型, 即BAR(1)模型; Weiβ[6]研究了BAR(1)模型的性质并将其推广到高阶情形.

1 模型的定义和性质

1.1 模型的建立

定义1设{Xt}是非负整数集上的时间序列, 若

(1)

设{Dt}是一个随机变量, 且与{Xt-l}l≥1独立, 满足P(Dt=1)=1-P(Dt=0)=p, 即Dt~B(1,p), 则MBAR(1)模型可等价表示为

Xt=Dt·(α1∘Xt-1+β1∘(n-Xt-1))+(1-Dt)·(α2∘Xt-1+β2∘(n-Xt-1)).

(2)

由式(2)可知, MBAR(1)过程的转移概率为

(3)

1.2 MBAR(1)的随机性质

命题1模型(1)定义的MBAR(1)过程是遍历的, 且有唯一的平稳分布.

证明: 由模型(1)可知, MBAR(1)过程{Xt}是状态空间I={0,1,…,n}上的Markov链. 由式(3)可知, MBAR(1)过程的转移概率pk|l恒大于0, 即{Xt}是一个不可约且非周期的Markov链. 又因为I是一个有限集合, 故模型(1)是正常返的. 从而MBAR(1)过程是遍历的, 且存在唯一的平稳分布.

命题2设{Xt}是模型(1)的平稳解, 则对于t≥1, 有:

证明: 只需证明式(7),(8). 首先证明式(7). 由条件方差公式可知,

在平稳意义下, 有Var(Xt)=Var(Xt-1), 于是

其次证明式(8). 直接计算可得

2 参数估计

本文采用极大似然法进行参数估计. 设{X1,X2,…,XT}为来自MBAR(1)过程的一组样本, 令θ=(α1,α2,β1,β2,p)T为待估参数. 则样本的对数似然函数为

(9)

(10)

(11)

其中θ0为参数真值,I(θ)为Fisher信息阵.

证明: 首先, 需验证文献[11]中的条件5.1是否成立:

1) 令(k,l)∈D, 使得pk|l(θ)>0且不依赖于参数θ, 其中D∶=I×I;

2) 每个转移概率pk|l(θ)在参数空间Θ上都有连续的三阶偏导数;

4) 对任意θ∈Θ, 只存在一个遍历集, 且不存在瞬态.

由于MBAR(1)过程的状态空间I是一个有限集, 因此对∀k,l∈I, 恒有转移概率pk|l>0, 取D=I, 则条件1)和4)成立; 又由于pk|l是关于θ的多项式, 因此关于参数的偏导到任意阶都存在且连续, 则条件2)成立. 此外, 转移矩阵为不可约的. 不失一般性, 下面假设n>4. 由条件3)可知, 只需找到一个w×w阶方阵, 证明其满秩即可. 通过计算可知, 矩阵

的行列式不为零, 即该矩阵是可逆的, 则条件3)成立. 其中

综上可知, 文献[11]中条件5.1成立. 证毕.

3 数值模拟

本文选取如下两组不同的参数进行数值模拟, 并取样本量T=100,300,500,n=50:

(Ⅰ)α1=0.4,α2=0.3,β1=0.3,β2=0.2,p=0.6;

(Ⅱ)α1=0.3,α2=0.2,β1=0.6,β2=0.4,p=0.8.

MBAR(1)模型在(Ⅰ),(Ⅱ)两种不同参数下样本量T=100时的样本路径分别如图1(A),(B)所示. 由图1可见, 两个序列均为平稳序列. 对于每组参数, 在R软件环境下进行500次重复实验, 分别计算其均值、偏差和均方误差, 模拟结果列于表1. 由表1可见, 在不同参数组合下, 估计的效果都较理想, 且随着样本量增大, 估计效果越来越好, 验证了极大似然估计的相合性.

图1 两组参数的样本路径Fig.1 Sample paths for two sets of parameters

表1 两组参数的估计结果

4 实例分析

在欧盟成员国中, 欧元价格稳定是根据消费者价格协调指数(HICP)衡量的, 即通货膨胀率应低于2%. 2009年, 欧盟成员国家数量为n=17. 因此, 应选用一个有上限的整数值模型分析这些欧元区价格稳定国家的数量. 本文选取欧盟统计局发布的17个国家2000—2006年每月的通货膨胀率(https://appsso.eurostat.ec.europa.eu/nui/show.do?dataset=prc_hicp_manr)作为实验数据. 对于每个月份t,Xt表示17个国家中通货膨胀率低于2%的国家数量. 数据的样本路径和自相关函数(ACF)如图2所示. 由图2可见, 所分析的数据是一个平稳的时间序列. 结合数据实际背景, 分别用BAR(1)模型和MBAR(1)模型对数据进行拟合, 利用极大似然估计法得到BAR(1)模型和MBAR(1)模型的参数估计值, 计算其相应的标准差, 并基于AIC(Akaike information criterion)[12]对两种模型进行比较, 其中AIC=2k-2ln(L), 这里k为参数个数,L为模型的极大似然函数值, 结果列于表2. 由表2可见, MBAR(1)模型比BAR(1)模型有更小的AIC值, 表明MBAR(1)模型的拟合效果优于BAR(1)模型. 实验结果表明, 本文提出的模型有一定的应用价值.

图2 价格稳定国家数量的样本路径和自相关函数Fig.2 Sample paths and ACF of number of countries with stable prices

表2 两类模型拟合结果的比较

猜你喜欢
样本量整数证明
医学研究中样本量的选择
获奖证明
判断或证明等差数列、等比数列
航空装备测试性试验样本量确定方法
一类整数递推数列的周期性
证明我们的存在
证明
样本量估计及其在nQuery和SAS软件上的实现——均数比较(二)
自适应样本量调整中Fisher合并P值法和传统检验法的模拟比较
答案