如何正确运用χ2检验——高维表资料相对危险度分析与SAS实现

2021-07-20 07:00胡纯严胡良平
四川精神卫生 2021年3期
关键词:危险度置信区间高维

胡纯严 ,胡良平 ,2*

(1.军事科学院研究生院,北京 100850;2.世界中医药学会联合会临床科研统计学专业委员会,北京 100029*通信作者:胡良平,E-mail:lphu927@163.com)

为了分析来自队列研究设计的g×2×2表资料,需要完成以下3项主要任务:其一,检验各层2×2表资料相对危险度是否满足齐性;其二,当资料满足齐性要求时,估计共同相对危险度及其95%置信区间;其三,当资料不满足齐性要求时,估计共同相对危险度及其95%置信区间。本文将首先介绍有关的计算方法,然后,结合实例并基于SAS软件完成前述提及的3项主要任务。

1 高维表资料共同相对危险度分析的概念

1.1 高维表g×2×2表的表达模式

设高维表g×2×2表的表达模式如下,见表1。

表1 队列研究设计下g×2×2表的第h层2×2表资料的表达模式

1.2 高维表资料共同相对危险度的含义

在分析“队列研究设计”的二维表资料时,可以很方便地依据公式“RR=a(c+d)/c(a+b)”计算出相对危险度RR的数值。然而,面对“g×2×2表资料”,却无法直接计算出RR的数值。从概念上来说,似乎可以采取某种举措,将“g×2×2表资料”降维或压缩成一个“2×2表资料”。但事实上,这种理想的“2×2表资料”是无法直接呈现出来的。于是,统计学家通过统计学方法来体现出各层“2×2表资料”之间的“微小差别”,这就是求出各层“2×2表资料”的“权重系数wh”。通过它将各层“2×2表资料”进行加权平均,从而间接获得合并后的相对危险度RR的数值。在SAS/STAT的FREQ过程中,将“合并后的结果”称为“common relative risk[1]”,常译成“共同或普通或合并相对危险度(以下统称为‘共同相对危险度’)”。

【说明】基于“g×2×2表资料”估计共同相对危险度的前提条件是高维表资料应满足齐性。针对“相对危险度”的齐性检验(也称为异质性检验)的具体方法参见本期“科研方法专题”中的《如何正确运用χ2检验——高维表资料齐性检验与SAS实现》,此处从略。

1.3 SAS中FREQ过程估计共同相对危险度及其置信区间的方法概述

SAS/STAT中的FREQ过程[1]采用2种方法估计校正的共同相对危险度及其置信区间,它们分别是:①校正的计算方法,Mantel-Haenszel估计法;②校正的计算方法,logit估计法。严格地说,这两种方法仅适用于“资料满足齐性要求”的场合。

2 高维表资料相对危险度分析及SAS实现

2.1 高维表资料相对危险度分析的具体算法

2.1.1 高维表资料相对危险度分析的具体内容

高维表资料相对危险度分析的具体内容包括以下4项:其一,检验资料是否满足齐性要求;其二,估计共同相对危险度;其三,估计共同相对危险度的置信区间;其四,检验共同相对危险度是否等于1。其中,第4项任务可以通过第3项任务间接完成。也就是说,当置信区间不包含1时,就等于接受“H1:共同相对危险度RR≠1”这个备择假设。

2.1.2 高维表资料共同相对危险度的点估计及置信区间估计

2.1.2.1 Mantel-Haenszel估计量

基于Mantel-Haenszel估计量(简称MH估计量)估计高维表资料共同相对危险度[1],见式(1):

2.1.2.2 Logit估计量

式(6)中分母的定义由式(3)给出。

如果nh11或nh21为 0,在计算RRh和wh之前,需要给第h层的2×2表所有格加上0.5。

2.1.3 高维表资料共同相对危险度是否等于1的检验

2.1.3.1 概述

文献[3-4]介绍了高维表资料共同相对危险度是否等于1的检验方法。根据资料齐性检验结果,可采用“Z检验(满足齐性)”和“χ2检验(不满足齐性)”两种方法。

2.1.3.2Z检验

当g×2×2表资料满足齐性时,高维表资料共同相对危险度是否等于1的检验可采用以下Z检验(即基于固定效应模型推导出的公式),见式(7):

在式(7)中,Z为服从N(0,1)的标准正态分布的检验统计量。其中,分子与分母中的部分统计量分别见下式:

式(10)中分子与分母的部分统计量分别见下式:

2.1.3.3χ2检验

当g×2×2表资料不满足齐性时,高维表资料共同相对危险度是否等于1的检验可采用下面的χ2检验[基于随机效应模型推导出的公式,即基于DerSimonian-Laird法(简称DL法)],见式(14):

在式(14)中,χ2为服从自由度为df=1的χ2分布的检验统计量;分子与分母中的部分统计量分别见下式:

在式(16)中,τ2的定义见下式:

在式(17)中,Q为齐性检验的检验统计量;q为高维表的层数。

RRDL的 100(1-α/2)%置信区间计算方法见下式:

2.2 高维表资料共同相对危险度分析的SAS实现

2.2.1 问题与数据

【例1】文献[5]提供了如下资料,试对7项研究的共同相对危险度进行分析。见表2。

表2 阿司匹林预防心肌梗死后患者死亡与否的7项随机对照研究结果

【例2】文献[6]提供了如下资料,试对13项研究的共同相对危险度进行分析。见表3。

表3 BCG疫苗与对照疫苗预防结核病疗效的随机对照研究结果

2.2.2 对例1资料共同相对危险度分析的SAS实现

【例3】沿用例1中的“问题与数据”,试对7项研究的共同相对危险度进行分析。

【分析与解答】设所需要的SAS程序如下:

【SAS输出结果及解释】

以上输出的是“普通优比和相对风险”的计算结果,其中,“普通”也叫做“共同或合并”。实际上,就是基于“Mantel-Haenszel法”和“logit法”计算出来的校正“共同相对危险度”的估计值及其95%置信区间。在本例中,应看“相对风险(第1列)”的两种方法计算的结果(因为第1列上的结果为“死亡”,是研究者特别关注的结局)。RRMH=0.9143,其95%置信区间为[0.8664,0.9649];RRL=0.9145,其95%置信区间为[0.8665,0.9651]。

以上是基于“优比的齐性检验”结果,可作为基于“相对危险度的齐性检验”结果的参考。结果显示:资料满足齐性要求。

【统计与专业结论】在本例中,因95%置信区间不包含1,说明共同相对危险度与1之间的差别具有统计学意义。由于RR=0.9145<1,说明阿司匹林组的死亡率低于安慰剂组的死亡率。也就是说,相对于采用安慰剂而言,采用阿司匹林预防心肌梗死可明显降低心肌梗死患者的死亡率。

2.2.3 对例2资料共同相对危险度分析的SAS实现

2.2.3.1 基于固定效应模型推导出公式进行计算

【例4】沿用例2中的“问题与数据”,试对13项研究的共同相对危险度进行分析。

【分析与解答】设所需要的SAS程序如下:

【说明】因FREQ过程只能基于“优比OR”进行齐性检验,且检验结果显示此资料不满足齐性,可将其视为基于“相对危险度RR”的齐性检验的近似结果,说明由此SAS程序输出的关于“共同相对危险度”的点估计及其置信区间估计结果不可用,故此处不呈现SAS输出结果。

2.2.3.2 基于随机效应模型推导出公式进行计算

【例5】沿用例2的“问题与资料”,重新对13项研究的共同相对危险度进行分析。

【分析与解答】因SAS/STAT的FREQ过程不能直接对各层2×2表资料的“相对危险度”进行齐性检验,而且,在资料不满足齐性的条件下,也没有基于随机效应模型推导出公式来估计“共同相对危险度及其置信区间”,故需要改用SAS语言编程来间接实现[7]。

采用SAS语言编程所需要的程序语句较多,因篇幅所限,此处从略,读者只需要对文献[7]P392-394上的SAS程序略加修改即可。

【SAS输出结果及解释】

以上分别为满足齐性条件下MH方法计算的结果、满足齐性条件下logit方法计算的结果和不满足齐性条件下DL方法计算的结果。输出的结果中各项含义如下:

齐性检验结果:各层2×2表资料的“相对危险度齐性检验”结果为:Q=152.229,df=12,P<0.0001,表明该资料不满足齐性;I2=92.12%>50.00%,此统计量也表明资料不满足齐性。

满足齐性条件下的分析结果之一:基于MH法估计共同相对危险度RRMH及其95%置信区间分别为:RRMH=0.63528,[0.58814,0.68619]。注意:本例资料不满足齐性要求,故不适合保留这部分计算结果。

满足齐性条件下的分析结果之二:基于logit法估计共同相对危险度RRL及其95%置信区间分别为:RRL=0.65033,[0.60070,0.70405]。注意:本例资料不满足齐性要求,故不适合保留这部分计算结果。

不满足齐性条件下的分析结果:基于DL法估计共同相对危险度RRDL及其95%置信区间分别为:RRDL=0.48966,[0.34495,0.69508]。注意:本例资料不满足齐性要求,故可以基于这部分计算结果来下统计结论和专业结论。

【统计结论与专业结论】因RRDL=0.48966<1,并且,95%置信区间[0.34495,0.69508]不包含1,说明共同相对危险度与1之间的差别具有统计学意义。结合题目中的临床问题可知,BCG疫苗的死亡率低于对照疫苗的死亡率。

3 讨论与小结

3.1 讨论

在SAS/STAT的FREQ过程中,只给出了针对“优比”的齐性检验,未给出针对“相对危险度”的齐性检验(一般来说,对同一个资料而言,前述提及的两种齐性检验结果基本接近,故在要求不高的前提下,可以将“优比的齐性检验结果”作为“相对危险度的齐性检验结果”的近似解);当资料满足齐性时,SAS给出了基于“MH法”与“logit法”校正的共同相对危险度及其置信区间的估计(等价于“基于固定效应模型进行Meta分析”的结果);而当资料不满足齐性时,SAS未给出基于“DL法”的共同相对危险度及其置信区间的估计(这就是所谓的“基于随机效应模型进行Meta分析”的结果)。解决的办法有两种,其一,基于相应的公式和 SAS 语言编程[1,7]实现计算;其二,使用专门用于Meta分析的RevMan软件[6,8-9]实现计算。

3.2 小结

本文对g×2×2表资料进行了相对危险度分析,其内容包括“针对相对危险度的齐性检验”,资料满足齐性条件和不满足齐性条件下的“共同相对危险度的点估计和区间估计”;还介绍了资料满足与不满足齐性条件下的“共同相对危险度是否等于1的假设检验方法”。通过两个实例并基于SAS软件实现了相对危险度分析,并对SAS输出结果进行了解释,做出了统计结论和专业结论。

猜你喜欢
危险度置信区间高维
基于贝塔分布的最优置信区间研究
胃间质瘤超声双重造影的时间-强度曲线与病理危险度分级的相关性研究
基于相关子空间的高维离群数据检测算法
基于模糊集合理论的船舶碰撞危险度模型
双冗余网络高维离散数据特征检测方法研究
定数截尾场合Pareto分布形状参数的最优置信区间
基于预警自适应技术的监控系统设计
基于深度学习的高维稀疏数据组合推荐算法
效应量置信区间的原理及其实现
基于模糊理论的船舶复合碰撞危险度计算