加法风险模型的半参数估计方法

2015-07-12 14:57金凌辉郭丽莎

淮阴师范学院学报（自然科学版） 2015年1期

关键词：参数估计湖北向量

金凌辉,郭丽莎

(1.武汉科技大学城市学院公共课教学部,湖北武汉 430083;2.中南民族大学数学与统计学院,湖北武汉 430074; 3.武汉大学数学与统计学院,湖北武汉 430072)

加法风险模型的半参数估计方法

金凌辉1，3,郭丽莎2，3

(1.武汉科技大学城市学院公共课教学部,湖北武汉 430083;2.中南民族大学数学与统计学院,湖北武汉 430074; 3.武汉大学数学与统计学院,湖北武汉 430072)

加法风险模型是生存分析中的一种重要回归模型,但传统的偏似然方法却不能直接用于该模型的估计,因此本文介绍加法模型的一种半参数估计方法,并讨论估计的渐进性质.

生存分析; 加法风险模型; 伪得分; 渐进性质

0 引言

在生存分析中,应用最多的回归模型无疑是Cox[1-2]于1972年提出的比例危险率模型.然而在相关研究中,人们往往还会关注所暴露的风险差异(risk difference),因此Aalen[3]提出了适用于此目的的加法风险模型.虽然后来Cox和Oakes[4],Buckley[5],Breslow和Day[6]等许多学者都对加法模型进行了研究,但直到1994年Lin和Ying[7]给出了该模型的半参数推断方法,才使得其参数估计的大样本性质得以更直接地证明,加法风险模型也得到了更广泛的应用.

1 记号和模型

令t表示观测时间,τ为观测截止时间,T表示失效时间,C表示删失时间,X=min(T,C),δ=I(T≤C),Z(t)表示p维随时间改变的协变量向量,λ0(t)为基准危险率,β为p维回归参数向量,若在给定协变量Z的条件下,危险率函数λ(t)满足关系

λ(t;Z)=λ0(t)eβT Z(t)

(1)

则模型称为Cox模型或比例危险率模型,由于其危险率函数表现为乘积的形式,故也称为乘法模型.

对于该模型,Cox运用所谓的偏似然方法(Partial likelihood approach)给出了未知参数的β的估计,现简介如下:

再将所有时间点的概率都乘起来后,便得到偏似然函数

(2)

两边取对数后并求导,便可得到关于β的得分函数

(3)

再由U(β)=0可解得β的极大偏似然估计.而当危险率函数λ(t)满足关系

λ(t;Z)=λ0(t)+βTZ(t)

(4)

2 半参数估计方法

假定观测对象为n个独立个体,对每个个体i,定义其相应的计数过程{Ni(t);t≥0}和在险过程{Yi(t);t≥0},其中N(t)=I(T≤t,δ=1),Y(t)=I(T>t),这里I(.)是示性函数.再令Λ(t)为累积风险率函数,则Λ(t)和λ(t)满足关系

(5)

对于Cox模型(1),有

dNi(t)=Yi(t)dΛ(t;Zi)=Yi(t)eβT Zi(t)dΛ0(t)

(6)

(7)

这实际上便是累积风险率函数的Breslow估计.

(8)

再定义

(9)

从而得分函数(8)进一步可表示为

(10)

Andersen和Gill[8]证明了Mi(t)是一个局部平方可积鞅,并用标准计数过程理论给出了Cox模型估计值的大样本性质.现在我们将上述方法运用于加法模型(4),显然有

dNi(t)=Yi(t)dΛ(t;Zi)=Yi(t){dΛ0(t)+βTZi(t)dt}

(11)

(12)

相应于加法模型的局部平方可积鞅则为

(13)

从而可定义该模型的估计方程为

(14)

将Λ0(t)的估计式(12)代入上式,有

(15)

这便是Lin和Ying在1994年给出的加法模型的伪得分函数(pseudo-score function).

由伪得分函数(15),可得到β的估计

(16)

(17)

3 估计的渐进性质

由伪得分函数(15)有

(18)

即U(β)是一个鞅积分,从而由Andersen和Gill关于标准计数过程的结论知随机向量n-1/2U(β)弱收敛于一个零均值的p维正态随机向量,其协方差矩阵的相合估计为

(19)

(20)

(21)

从而有

(23)

(24)

其中

这与Lin和Ying的结论是一致的.

4 结语

生存分析是近几十年来统计研究的一个热点,相关问题受到了国内外许多统计学家的关注.但目前关于加法风险模型的研究成果主要还是出自外文文献,国内文献中系统介绍加法风险模型的还几乎没有,希望本文能对国内关于该模型的研究起到参考作用.

[1]Cox D R.Regression models and life-tables[J].J R Statist Soc B,1972,34:187-220.

[2]Cox D R.Partial likelihood[M].New York:Biometrika,1975.

[3]Aalen O O.A model for nonparametric regression analysis of counting processes[M].New York:Spring,1980.

[4]Cox D R,Oakes D.Analysis of Survival Data[M].Lnodon:Chapaman Hall 1984.

[5]Buckley J D.Additive and multiplicative models for relative survival rates[J].Biometrics 1984,40:51-62.

[6]Breslow N E,Day N E.Statistical Methods in Cancer Reserch,2,The Design and Analysis of Cohort Studies[M].New York:Lyon IARC,1987.

[7]Lin D Y,Ying Z.Semiparametric analysis of the additive risk model[J].Biometrika,1994,81:61-71.

[8]Andersen P K,Gill R D.Cox's regression model for counting processes:A large sample study[J].Ann Statist,1982,10:11-20.

JIN Ling-hui1,3,GUO Li-sha2,3

[责任编辑：李春红]

Semiparametric Estimating Approach the Additive Hazards Model

(1.Department of General Education,Wuhan University of Science and Technology City College,Wuhan Hubei 430083,China)
(2.Department of Mathematics and Statistics,South-Central University for Nationalities,Wuhan Hubei 430074,China)
(3.School of Mathematics and Statistics,Wuhan University,Wuhan Hubei 430072,China)

Additive hazards model is an important regression model in the survival analysis,but the partial likelihood approach cannot be directly used for the model.So we introduce one Semiparametric estimating approach for the Additive hazards model in this paper and discuss the asymptotic properties of the estimator.

survival analysis; additive hazards model; pseudo-score; asymptotic properties

2014-11-04

湖北省教育厅科研计划资助项目(B2013260); 中央高校专项青年资金资助项目(CZQ12015)

金凌辉(1979-),男,瑶族,广西金秀人,讲师,博士生,研究方向为生物统计. E-mail:jinlinghui163@163.com

O212

:1671-6876(2015)01-0009-05