带有相依稀疏算子的一阶随机系数二项自回归模型

2023-09-27 01:37邰志艳王佳聪
吉林大学学报(理学版) 2023年5期
关键词:相依样本量整数

邰志艳, 王佳聪, 杨 凯, 张 洁

(长春工业大学 数学与统计学院, 长春 130012)

0 引 言

α◇θX=U1+U2+…+UX,

其中Ui=ViZ, 且非负整数值随机变量X与{Ui,i∈+}相互独立, {Vi,i∈+}是独立同分布的、 以θ∈(0,1)为参数的Bernoulli随机变量序列,Z是服从参数为的Bernoulli分布的随机变量, 且0<α≤θ<1.Zhang等[5]将“◇θ”算子应用到BAR(1)模型中, 建立了带有可替代相依稀疏算子的一阶二项自回归(ADCBAR(1))模型. 上述模型的稀疏参数均固定不变, 但在实际问题中, 稀疏参数有时会随着时间的变化而变化. 为体现参数的动态变化性, Zheng等[6]将INAR(1)模型推广到随机系数情形, 建立了一阶随机系数整数值自回归(RCINAR(1))模型; Yang等[7]提出了由Logistic回归驱动的随机系数整数值门限自回归(RCTINAR(1)-X)模型; 张睿[8]提出了协变量驱动的二项自回归(BAR(1)-X)模型. 本文针对有限范围内存在相依性及零堆积性质的整数值时间序列数据, 在文献[5]的基础上, 考虑将ADCBAR(1)模型推广到随机系数情形, 并给出其相应的统计推断.

1 模型定义和性质

1.1 模型建立

定义1设{Xt}是取值于非负整数集的时间序列, 若满足以下方程:

Xt=αt◇θXt-1+βt◇θ(n-Xt-1),

(1)

RCADCBAR(1)模型的转移概率为

其中k和l分别为t和t-1时刻的状态,IA是条件A的示性函数, 即当满足条件A时IA=1, 否则IA=0.

1.2 RCADCBAR(1)模型的概率统计性质

命题1由式(1)定义的RCADCBAR(1)过程是遍历的, 且有唯一的平稳分布.

证明: 由式(1)可知RCADCBAR(1)过程{Xt}是状态空间I={0,1,…,n}上的Markov链.RCADCBAR(1)过程的转移概率Pk|l恒大于0, 即{Xt}是一个不可约且非周期的Markov链.又因为I是一个有限集合, 因此式(1)是正常返的, 从而由文献[9]中定理4.3.3可知, RCADCBAR(1)过程(1)是遍历的, 并存在唯一的平稳分布.

命题2设{Xt}是模型(1)的平稳解, 则对于t≥1, 有:

1)E(Xt|Xt-1)=(a-b)θXt-1+nbθ;

证明: 只需证3).因为

Var(Xt|Xt-1)=Eat,bt(Var(Xt|Xt-1,at,bt))+Varat,bt(E(Xt|Xt-1,at,bt)),

E(Xt|Xt-1,at,bt)=atθXt-1+btθ(n-Xt-1),

所以

从而可得3)的表达式.

2 参数估计

假设at~Beta(a1,b1),bt~Beta(a2,b2), 则可得模型的转移概率为

在进行旧建筑风格的设计师时要贯彻整体性原则,按城市规划的要求进行宏观控制,使建筑设施和其周围的环境保持高度的一致。除建筑风格保持统一外,尚应考虑在色彩方面的统一、呼应。各单体建筑具有自身的特点,应按照单体符合总体的要求开展设计,把单体建筑放在共性的框架之中,彰显出既有个性,又有统一的设计特征。

(2)

(3)

其中η0为参数真值,I(η)为Fisher信息阵.

证明: 只需验证文献[10]中条件5.1是否成立:

(i) 令(k,l)∈I, 使得Pk|l(η)>0且不依赖于参数η;

(ii) 每个转移概率Pk|l(η)在参数空间Θ上都具有连续的三阶偏导数;

(iv) 对任意的η∈Θ, 只存在一个遍历集且不存在瞬时状态.

RCADCBAR(1)过程的状态空间I是一个有限集, 因此对∀k,l∈I, 恒有转移概率Pk|l>0, 则条件(i)和(iv)成立.注意到Pk|l是关于η的多项式, 关于参数的偏导到任意阶都存在且连续, 则条件(ii)成立.此外, 转移矩阵不可约, 不失一般性, 下面假设n>4.由条件(iii)可知, 只需找到一个w×w阶方阵, 证明其满秩即可.通过计算可知, 矩阵

的行列式不为零, 即该矩阵是可逆的, 因此条件(iii)成立, 其中

综上可知, 文献[10]中的条件5.1成立, 因此定理1得证.

3 数值模拟

选取下列3组不同的参数进行数值模拟, 分别取样本量T=100,200,300,500:

1) (n,a1,b1,a2,b2,θ)=(10,0.8,0.1,0.2,0.6,0.85);

2) (n,a1,b1,a2,b2,θ)=(7,0.9,0.3,0.1,0.7,0.9);

3) (n,a1,b1,a2,b2,θ)=(5,0.2,0.7,0.8,0.1,0.7).

图1为RCADCBAR(1)模型在上述3组不同参数下样本量T=200时的样本路径图及自相关函数(ACF)图. 由样本路径图可见, 3个序列均为平稳序列并具有零堆积的性质. 由ACF图易见, 本文模型不仅能刻画正相关数据, 对负相关数据同样适用. 对于每个参数组合, 在R软件环境下进行1 000次重复试验, 分别计算其偏差(Bias)和均方误差(MSE), 模拟结果列于表1. 由表1可见, 随着样本量的增大, 估计值的偏差和均方误差均逐渐减小, 估计值逐渐收敛到真实参数, 表明估计的效果越来越好, 同时验证了条件最大似然估计的相合性和有效性.

表1 不同样本量下3组参数的估计结果Table 1 Estimated results of three groups of parameters with different sample sizes

图1 3组参数下的样本路径图及ACF图Fig.1 Sample paths and ACF diagrams under three groups of parameters

4 实例分析

本文将RCADCBAR(1)模型应用于南京2015年1月到2020年12月每周下雨天数数据集中(数据来源于https://lishi.tianqi.com). 该数据集上限n=7, 包含T=312个观测值, 样本均值和方差分别为1.705和2.569.

图2为数据集的路径图、 ACF图及偏自相关函数(PACF)图. 由路径图可见, 数据中包含较多的零数据, 由ACF图可见, 数据集具有自相关特征. 本文将RCADCBAR(1)模型与ADCBAR(1)模型[5]、 BAR(1)模型[11]及零膨胀模型[12]进行比较, 结果列于表2. 由表2可见, RCADCBAR(1)模型与ADCBAR(1)模型的对数似然函数值近似相等, 由于RCADCBAR(1)模型的参数个数比ADCBAR(1)模型多, 因此其AIC(Akaike information criterion)与ADCBAR(1)模型的AIC有些差距, 但两者的AIC均小于BAR(1)和ZT0-BAR(1)模型. 且RCADCBAR(1)模型的均方根(RMS)小于其他模型的RMS, 因此RCADCBAR(1)模型拟合效果相对较好. 本文对ADCBAR(1)模型的随机系数推广有意义, 它能更好地刻画个体之间具有相依性的有上限零堆积整数值时间序列的数据.

表2 不同模型对南京2015-01—2020-12每周下雨天数数据集的拟合结果比较Table 2 Fitting results comparison of different models on dataset of weekly rainy days in Nanjing from 2015-01 to 2020-12

图2 南京2015-01—2020-12每周下雨天数数据集的样本路径图、 ACF图和PACF图Fig.2 Sample paths, ACF and PACF diagrams of dataset of weekly rainy days in Nanjing from 2015-01 to 2020-12

猜你喜欢
相依样本量整数
医学研究中样本量的选择
家国两相依
相守相依
航空装备测试性试验样本量确定方法
一类整数递推数列的周期性
Sample Size Calculations for Comparing Groups with Binary Outcomes
相依相随
相依相伴
自适应样本量调整中Fisher合并P值法和传统检验法的模拟比较
答案