部分线性模型的光滑样条推断

2010-09-04 08:22卢一强陈中威

山西大同大学学报(自然科学版) 2010年1期

关键词：假设检验样条线性

卢一强，陈中威

(解放军信息工程大学电子技术学院，河南郑州 450004）

部分线性模型的光滑样条推断

卢一强，陈中威

(解放军信息工程大学电子技术学院，河南郑州 450004）

运用光滑样条估计部分线性模型中的非参数函数，利用限制最大似然或广义交叉验证(GCV)的方法选择光滑参数，主要考察了部分线性模型的光滑样条估计以及有关非参数函数部分的假设检验.基于光滑参数的选择方法，提出了部分线性模型中的非参数函数是否为多项式函数的假设检验方法，并通过模拟例子研究本文提出的推断效果.

部分线性模型光滑样条限制最大似然(RML)广义交叉核实法(GCV)假设检验

部分线性模型为{yi，Xi，ti}ni＝1为观察数据，εi～N（0，σ2）为随机误差，yi为响应变量，Xi＝（xi，…，xip）T和ti为回归变量，ti是标量，β＝（β1，…，βp）T为未知的回归参数，（f t）为非参数函数.模型(1)由Engle et al.[1]首先提出，相对于线性回归模型，模型(1)能够显著减少模型偏差，同时保持线性模型的易于解释等优点.模型(1)的估计及性质在文献中得到了深入的研究和广泛应用，如Heckman[2]和Speckman[3]分别研究了模型(1)的光滑样条估计和核估计，Chen[4]讨论了模型(1)中参数估计的收敛速度，Cuzick，Severini and Staniswa[5]和Carroll etal.[6]分别将模型(1)推广到部分线性可加模型和广义线性模型等，还有许多该模型的应用，可参考相关文献.但是，有关部分线性模型的检验研究的不是很多，本文运用Gu[7]中介绍的光滑样条方法估计模型(1)中的非参数部分，将Liuand Wang[8]中非参数回归的一些检验方法推广到部分线性模型(1)，基于限制最大似然 (RML)和广义交叉验证(GCV)的方法提出了检验模型(1)中的非参数函数是否为多项式函数的检验方法，并做了大量的模拟研究，模拟研究表明利用本文的方法能够对部分线性模型进行很好的估计和检验.

1 部分线性模型的光滑样条估计

不失一般性，假设t∈［0，1］，f（t）为未知非参数函数，且f(·)∈Wm，其中Wm＝{g｜g，…，g（m-1）绝对连续g(m)∈L2［0，1］}.

最小化

可得部分线性模型的光滑样条估计，其中λ为光滑参数.设φv（t）＝tv-1／（v-1）！

当m＝1时，R（x，y）＝x＞y，当m＝2时，R（x，y）＝（x＞y）2（3（x＜y）-（x＞y））／6，其中x＜y＝max（x，y），x＞y＝min（x，y）.由Gu[2]，f（t）的光滑样条估计可表示为

令T＝（φj（ti））n×m，T的（i，j）元为φj（ti）.Σ＝（R（ti，tj））n×n，Y＝（y1，…，yn）T，X，t，c，d，ε可类似定义.由光滑样条方法估计的性质，惩罚项等于

由此可得(2)式等价于

令Z＝（X，T）T，θ＝（βT，dT）T，则θ和c是下列线性方程组

2 光滑参数的选择

在光滑样条估计中，光滑参数在所估函数的光滑性与数据的拟合度之间起调节作用.因此，光滑参数的选择是至关重要的.常见的有限制最大似然(RML)和广义交叉验证(GCV)等光滑参数的选择方法.

2.1 限制最大似然法

仔细分析可得，由最小化(3)式得到的θ和c的估计等价于混合效应模型

的最小二乘估计，其中θ＝（βT，dT）T为固定参数，

为随机效应，ε～N（0，Inσ2）为随机误差.由此可知，

其中b＝σ2／（nλ）.在选择光滑参数时，为了消除固定参数的影响，常作变换W＝F2TY，其中F2见(5)式.由式(8)易见

其中q为W的列数.设F2TΣF2的谱分解为

其中U为正交矩阵，T＝diag（λ1，…，λq）为对角矩阵，λν为F2TΣF2的特征值.令

3 非参数部分的假设检验

实际应用中，我们经常需要检验模型(1)中的非参数函数是否为某一个参数模型.特别的，检验(1)中f（x）是否为m-1次多项式.由(7)可知，当λ＝∞或b＝0时，c＝0，f（x）为m-1次多项式.因此，检验(1)中f（x）是否为m-1次多项式等价于检验

基于限制似然函数(12)式，定义似然比检验统计量TL越小，越不利于假设H0.拒绝域的形式为{TL＜c}.

TGCV越小，越不利于假设 H0.拒绝域的形式为{TGCV＜c}.

(1)生成Z～N（0，Iq）；

(2)由(13)或(14)计算出λ^；

(3)计算检验统计量TL和TGCV；

(4)重复 (1)～(3)l次，可得检验统计量在H0下的l个样本x1，…，xl，H0的P值近似为

其中x0为基于实际数据计算的检验统计量的值.

4 模拟研究

为了检验文中所提出的方法的推断效果，我们作如下模拟研究.设

ε～N（0，0.32）.t～U（0，1），X1，X2，X3服从均值为0，方差为1，相关系数为0.70的正态分布.对于模型(15) a分别选为a＝0，3，5.当a＝3，f（t）的光滑样条估计见图1-a，β的估计为1.194(0.026)，3.006(0.023)，-2.002(0.027).对于模型(16)分别选为a=0，0.5，1.

当a=0.5，f（t）的光滑样条估计见图1-b，β的估计的经验均值和标准差为1.200(0.030)，3.003 (0.027)，-2.003(0.028).

我们作了非参数部分是否为线性函数的检验，即取m＝2，检验

当a＝0时，H0成立.a值越大，H0越不可能是线性.取样本容量为300，重复500次实验，每次实验中Boostrap样本为10000.假设检验的显著水平取为0.05，表(1～2)列出了模拟实验中H0拒绝的比例.

图1 模型(15)在a＝3以及模型(16)在a＝1.5的估计：实线为真实函数，虚线为光滑样条估计.

表1 在500次研究中模型(15)的拒绝比例

表2 在500次研究中模型(16)的拒绝比例

从表中可以看出，当a＝0时，H0拒绝的比例接近显著水平，随着a的增大，检验的功效明显增大.

从以上的模拟研究可以看出，部分线性模型不仅能够运用光滑样条的方法得到很好的估计，而且也能够运用本文的方法对非参数部分进行有效的检验，基于RML和GCV两种检验方法得到相似的检验功效.

[1]EngleRF，GrangerCW J，Rice J，etal.Semiparametricestimatesof the relation betweenweatherand electricity scales[J].JAmer Statist Assoc，1986，81：310-320.

[2]Heckman N E.Spline smoothing in paitial linearmodels[J].JRoy Statist Soc Ser BVol，1986，48：244-248.

[3]Speckmen P.Kernel smoothing in paitial linearmodels[J].JRoy Statist Soc Ser B Vol，1988，50：413-436.

[4]Chen H.Convergence rates for parametric components in paitial linearmodels[J].Ann Statist，1988，16：136-146.

[5]Severini T A，Staniswalis JG.Quasilikelihood estimation in semiparametricmodels[J].JAmer Statist Ass，1994，89：501-511.

[6]Carroll R J，Fan J，Gijbels I，etal.Generalized partially linear single-indexmodels[J].JAmer Statist Assoc，1997，92：477-489.

[7]Gu C.Smoothing spline ANOVA models[M].New York：Springer-Verlag，2002.

[8]Liu A，Wang Y D.Hypothesis testingin smoothing splinemodels[J].Journal of Statistical Computation and Simulation，2004，70 (8)：581-597.

The Smoothing Sp line Inference Test o n Partially Linear M odel

LU Yi－qiang，CHEN Zhong－wei
(Institute of Electronic Technology，PLA Information Engineering University，Zhengzhou Henan，450004)

This article mainly considers the smoothing spline estimate of partial linear model and the test of the hypothesis whether the nonparametric function in partially linearmodel is some polynomial.The nonparametric function partially linearmodel are estimated by the use of smoothing spline.The smoothing parameter is selected using the methods of restricted maximum likelihood (RML)or generalized cross-validity(GCV).Based on the procedure of selection of the smoothing parameter，the testingmethodswere developed.Simulations show that the methods developed in this paper have the good performance for inference on partially linear model.

s emiparametricmodel；smoothing spline；restrictedmaximum Likelihood(RML)；generalized cross-validity(GCV)；hypothesis test

O212.7

〔编辑高海〕

2009-10-06

国家自然科学基金项目[10501053]

卢一强(1971-)，男，河南济源人，博士，教授，研究方向：概率统计.