张 蕊郑黎强潘国伟△
疾病发病风险预测模型的应用与建立*
张 蕊1郑黎强2潘国伟1△
在医学研究领域中,“预测模型”常被用来预测某种疾病未来的发病情况。具体来说就是以疾病的多病因为基础,建立统计模型,用来预测具有某些特征的人群未来某种结局事件发生的概率。最早应用疾病风险预测模型(以下简称“预测模型”)的领域是弗明翰心脏病研究(Framingham heart study)[1-2]。这些模型使得多危险因素和未来心血管病的发生之间确定为一种定量关系,通过多危险因素的水平来预测某一个体未来心血管病的发病概率。本文主要以心血管病(cardiovascular disease,CVD)发病风险预测模型为例,就预测模型在医学领域中的应用、以及如何建模进行综述。
预测模型使流行病学研究获得的成果更好地与临床实践接轨,并通过高危筛检、临床循证指南等途径促进疾病的三级预防,降低疾病发病率和死亡率。预测模型的应用主要体现在以下几个方面。
1.临床指南
预测模型很重要的一个应用是对人群疾病发病风险按照概率大小进行分层,如高危、中危和低危,对风险概率不同的群体进行有针对性、强度不同的治疗。这一点可以看作是未来进行“个体化治疗”迈出的第一步。因此,很多预测模型被应用到了临床实践指南中,如弗明翰风险评分(Fram ingham risk score,FRS)就被用在美国胆固醇教育计划成人治疗组(adult treatment panel,ATP)血脂治疗指南Ⅲ[3]。我国近年也开发了适用于我国人群的10年缺血性心血管病风险(ischemic cardiovascular diseases,ICVD)预测模型[4]并应用于我国临床血脂治疗指南[5]。
2.临床实践
临床医生在临床实践中应用预测模型,尤其是简易评分系统,可以快速准确地确定高危患者,进行有针对性的治疗。还可以加强医患之间的沟通和交流,使患者能够更加明白和信任医生采用的治疗方案。此外,通过预测模型,临床医生能够在诊疗过程中强化“综合危险干预”的思想,避免只重视一种或几种危险因素而使疾病无法得到更有效的医治。
3.个体或社会
从个人角度,预测模型有助于患者更清楚地了解自己的发病风险,认识自己疾病危险等级,提高对疾病危险因素防治的认知,并建立“综合危险干预”的防治理念,从而更好的依从药物治疗或生活方式性干预。而在社会的角度,可以通过高危人群的筛查,使有限的卫生资源得以合理化应用,降低疾病的发病率和死亡率。
4.流行病学研究
模型是流行病学病因学研究中的重要组成部分。通过建立多因素统计模型,可以在繁杂的病因链中找出与疾病发病相关的危险因素,并了解其对疾病发展的作用大小。通过模型还可以寻找到能预测疾病发生的标志物,为发病机制研究提供线索并指导临床诊断和筛查。此外,还可以对人群进行高危筛查,更好地实施高危人群策略,开展三级预防。
首先,建立模型需要有可靠的数据(通常是代表性较好的大样本前瞻性队列研究),能够较准确地预测未来某段时间内(通常为10年)疾病的发病概率。其次,研究疾病有较为公认的多种危险因素,或与疾病发病密切相关的标志物。第三,要有相关的统计学方法用于建模,评价及比较。第四,也是最重要的一点,预测模型一定要和临床实践联系起来,只有那些给社会和个人带来严重疾病负担,且病因可以通过有效手段进行防治的疾病建立的预测模型才能在临床实践和公共卫生领域得以应用。最后,通常一种疾病分布及其危险因素作用大小可能存在性别上的差异,故男性和女性分别建立各自的模型,Framingham心血管病预测模型和我国缺血性心血管病预测模型都是如此。
此外,对于结局事件的选择上,应注意要有明确的定义。如心血管病预测模型中,Framingham研究先后发表了多个模型,其中1998年的模型选取的终点事件包括冠心病(coronary heart disease,CHD)死亡、心肌梗死(myocardial infarction,MI)、不稳定性心绞痛和稳定性心绞痛[2]。而2008年的模型除了CHD,还包括了脑卒中、心衰和跛行在内的所有心血管病[6],即所谓的硬终点和软终点之分。对于危险因素的选择要注意指标是否在临床上广泛应用,是否能够进行精确测量(如饮食和运动虽然与心血管病有关,但由于不能准确测量而不能引入方程),要结合预测模型的适用范围和临床医疗背景来选择。
上世纪八十年代的循证指南主要用“相对危险度”(relative risk,RR)来区分那些血压或血脂的高危患者[7-8]。但是单纯的RR值不能对疾病发病的概率进行描述。如对于一个发病率接近于0的疾病来说,即使RR为10,高危人群的发病率实际上仍然非常小。而对于一个发病率较高的常见病而言,RR即使只有1.5,这个危险因素仍然很重要。因此,需要一种能够反映人群在未来一段时间内疾病发生绝对危险概率的评价方法。Framingham研究率先在多元回归方程的基础上建立了包括年龄、高血压、高血脂和吸烟等传统心血管病危险因素在内的心血管病发病风险预测模型[1-2,6],并在其它队列人群中得以验证[8]。
之后,SCORE、PROCAM、Reynolds、QRISK等心血管病发病风险预测模型相继发表,用以建立针对世界上不同国家和区域人群的准确性更高的模型[9-13](表1)。我国在2006年也开发了适用于我国人群的10年缺血性心血管病发病风险预测模型,以此解决了用国外模型易高估我国人群发病率的问题[4]。这些预测模型很快应用于临床实践指南,用以指导临床诊疗[5,14]。
表1 当前世界范围主要的心血管病发病风险预测模型
为了进一步完善传统预测模型对心血管病的预测能力,近年来一些新的标志物不断被发现,如纤溶酶原激活物抑制剂-1(plasminogen-activator inhibitor type 1)、C-反应蛋白(C-reactive protein)、谷氨酰胺转移酶(gamma glutamyl transferase)、B型利钠肽(B-type natriuretic peptide)、尿白蛋白肌酐比(urinary albumin-tocreatinine ratio)以及颈动脉粥样硬化等[15-17],但比起血压、血脂等传统危险因素,这些新的危险因素与未来心血管发病风险之间的关联性较弱。寻找新的有价值的标志物是未来疾病预测模型发展的趋势,但是需要有敏感、准确的统计学方法用于评价。
一个完整的预测模型的建立需要建模及验证两个步骤,因此,预测模型的建立需要两个队列人群,一个用于建立模型,称为来源队列或建模队列;一个用来对建立的模型进行验证,称为验证队列。常用于建模的统计学模型主要有两种:Cox比例风险函数和Weibull回归函数。
Cox回归模型预测方程如下:
Cox预测模型中各字母代表的含义分别是:βi为Cox回归模型中第i个危险因素的回归系数,Xi则为个体第i个危险因素的具体值是队列人群第i个危险因素的均值,而函数S0(t)则为t时点队列人群的生存率(根据Kaplan-Meier法估计)。
Weibull回归模型预测方程如下:
Weibull预测模型中各字母代表的含义分别是:βi为Weibull回归模型中第i个危险因素的回归系数,Xi则为个体第i个危险因素的具体值,而σ则为Weibull回归模型的尺度参数。
这两种回归都适用于生存分析,不同的是Cox回归是非参数检验,对数据的分布情况没有要求,而Weibull回归是参数检验,需要数据服从Weibull分布,所以若一个数据符合Weibull分布,那么采用Weibull回归能最大限度地利用数据资源。但在实际应用中多以Cox回归为主,如以上所提到的模型中,除了SCORE评分以外,采用的都是Cox回归建模。根据预测方程可以计算出具有某种特征的人群在t时段某疾病的发病概率。
过去的30年中,预测模型在公共卫生领域和临床医学领域不断发展,除了最初的心血管病外,癌症、高血压、糖尿病等其他疾病研究领域也都开始了对预测模型的探索[18-21]。疾病风险预测模型得到了越来越多的关注。相应的模型统计方法也在逐步地完善和发展,预测模型的发展将很好地推动未来临床实践的发展。
[1]Anderson KM,W ilson PW,Odell PM,etal.An updated coronary risk profile.A statement for health professionals.Circulation,1991,83(1):356-362.
[2]W ilson PW,D′Agostino RB,Levy D,et al.Prediction of coronary heart disease using risk factor categories.Circulation,1998,97(18):1837-1847.
[3]Executive Summary of The Third Report of The National Cholesterol Education Program(NCEP)Expert Panel on Detection,Evaluation,And Treatment of High Blood Cholesterol In Adults(Adult Treatment Panel III).JAMA,2001,285(19):2486-2497.
[4]Wu Y,Liu X,Li X,etal.Estimation of10-year risk of fatal and nonfatal ischemic cardiovascular diseases in Chinese adults.Circulation,2006,114(21):2217-2225.
[5]中国成人血脂异常防治指南制订联合委员会.中国成人血脂异常防治指南,2007:35,390-419.
[6]D′Agostino RS,Vasan RS,Pencina MJ,et al.General cardiovascular risk profile for use in primary care:the Fram ingham Heart Study.Circulation,2008,117(6):743-753.
[7]Report of the National Cholesterol Education Program Expert Panel on Detection,Evaluation,and Treatmentof High Blood Cholesterol in Adults.The Expert Panel.Arch Intern Med,1988,148(1):36-69.
[8]The 1984 Reportof the Joint National Committee on Detection,Evaluation,and Treatment of High Blood Pressure.Arch Intern Med,1984,144(5):1045-1057.
[9]Conroy RM,Pyorala K,Fitzgerald AP,et al.Estimation of ten-year risk of fatal cardiovascular disease in Europe:the SCORE project.Eur Heart J,2003,24(11):987-1003.
[10]Assmann G,Cullen P,Schulte H.Simple scoring scheme for calculating the risk of acute coronary events based on the 10-year follow-up of the prospective cardiovascular Munster(PROCAM)study.Circulation,2002,105(3):310-315.
[11]Hippisley-Cox J,Coupland C,Vinogradova Y,et al.Derivation and validation of QRISK,a new cardiovascular disease risk score for the United Kingdom:prospective open cohort study.BM J,2007,335(7611):136.
[12]Ridker PM,Buring JE,Rifai N,et al.Development and validation of improved algorithms for theassessmentof global cardiovascular risk in women:the Reynolds Risk Score.JAMA,2007,297(6):611-619.
[13]Ridker PM,Paynter NP,Rifai N,et al.C-reactive protein and parental history improve global cardiovascular risk prediction:the Reynolds Risk Score for men.Circulation,2008,118(22):2243-2251,4p-2251p.
[14]Grundy SM,Cleeman JI,Merz CN,etal.Implications of recent clinical trials for the National Cholesterol Education Program Adult Treatment Panel IIIguidelines.Circulation,2004,110(2):227-239.
[15]Lee DS,Evans JC,Robins SJ,et al.Gamma glutamyl transferase and metabolic syndrome,cardiovascular disease,and mortality risk:the Fram ingham Heart Study.Arterioscler Thromb Vasc Biol,2007,27(1):127-133.
[16]Ridker PM,Buring JE,Rifai N,et al.Development and validation of improved algorithms for the assessmentof global cardiovascular risk in women:the Reynolds Risk Score.JAMA,2007,297(6):611-619.
[17]Wang TJ,Gona P,Larson MG,etal.Multiple biomarkers for the prediction of first major cardiovascular events and death.N Engl J Med,2006,355(25):2631-2639.
[18]Parikh NI,Pencina MJ,Wang TJ,et al.A risk score for predicting near-term incidence of hypertension:the Fram ingham Heart Study.Ann Intern Med,2008,148(2):102-110.
[19]Gail MH,Brinton LA,Byar DP,etal.Projecting individualized probabilities of developing breast cancer forwhite femaleswho are being exam ined annually.JNatl Cancer Inst,1989,81(24):1879-1886.
[20]Meigs JB,Shrader P,Sullivan LM,et al.Genotype score in addition to common risk factors for prediction of type 2 diabetes.N Engl J Med,2008,359(21):2208-2219.
[21]Schnabel RB,Sullivan LM,Levy D,et al.Development of a risk score for atrial fibrillation(Fram ingham Heart Study):a community-based cohort study.Lancet,2009,373(9665):739-745.
(责任编辑:郭海强)
*国家自然基金项目(项目编码:81302495)与辽宁省科技厅社会发展攻关计划项目(项目编码:2013225089)
1.辽宁省疾病预防控制中心慢病信息监测所(110005)
2.中国医科大学附属盛京医院临床流行病学教研室,图书馆(110004)
△通信作者:潘国伟,Email:pangw@163.com