决策树模型对糖尿病合并急性心肌梗死行急诊PCI患者术后不良事件的预测价值

2022-03-01 09:52刘志煜孔亚伟张扬辉张亚豪王喆路新源郑颖颖沈德良张金盈
中国循证心血管医学杂志 2022年11期
关键词:降糖药决策树分层

刘志煜,孔亚伟,张扬辉,张亚豪,王喆,路新源,郑颖颖,沈德良,张金盈

糖尿病(DM)是冠状动脉粥样硬化性心脏病(CHD)最常见的高危因素,而急性心肌梗死(AMI)作为CHD最严重的发病分型,是全球排名前位的致死疾病[1]。冠状动脉介入治疗(PCI)是对AMI的有效治疗方式[2],但目前研究发现,DM作为AMI人群中的极高危因素,行首次PCI后的DM人群仍有30%~50%的患者在院外治疗期间可出现主要不良心脑血管事件(MACCE)事件并可导致如心血管死亡事件、心功能不全、脑卒中、再发急性心肌梗死(re-AMI)、恶性室性失常(VT/VF)等多种严重并发症[3,4]。因此对于PCI术后的DM-AMI患者进行早期筛查和制定强化治疗方案尤为重要[5],既往多数研究采用 Logistic模型构建AMI患者的预测模型,但目前机器学习,尤其是决策树分析被逐渐运用到高危人群分层筛查中,如在脑卒中、肺动脉高压人群有较好的效果[6,7]。因此,本研究比较两种分析方法建立模型预测不良终点事件的作用,并进行后者的分层亚组风险计算,为AMI合并DM的患者行急诊PCI的术后人群不良终点事件建立预测模型提供较新的分析思路。

1 资料和方法

1.1 研究对象选择2016年1月至2017年1月于郑州大学第一附属医院心脏重症科(CCU)住院AMI患者;信息采集来自一项大型研究——“冠心病患者PCI术后临床结局及其影响因素分析:CORFCHD-ZZ研究(3561例CHD患者)”,注册信息、入组人群、临床收集资料信息见本研究已发表的前期报道[8,9]。本次分析对象纳入标准:年龄≥18岁;急诊冠状动脉(冠脉)造影证实急性心肌梗死,至少有一支冠脉血管狭窄程度≥95%[10];发病12 h内行急诊PCI并至少植入1枚冠脉支架;已确诊2型糖尿病。经过纳入排除标准筛选后,本研究最终纳入DM-AMI初次急诊PCI患者共525例(图1)。本研究遵循Helsinki宣言,经医学伦理委员会批准。

1.2 随访随访首要终点事件包括:主要不良心血管事件(MACE)(心血管死亡事件、急性心功能不全住院),和脑血管意外、再发心肌梗死事件并行PCI、全因死亡、频发室速/室颤(VT/VF)和接受择期CABG手术。

1.3 统计学分析①建模步骤:采用SPSS 24.0统计软件。计量资料的分组(cutoff值)均用受试者工作特征曲线(ROC)曲线进行拆分。单因素变量入选多因素回归、或决策树的检验水准为α=0.05。多因素回归分析采用似然比检验的Forward:LR;决策树模型选用CHAID算法进行变量筛选,使用Pearsonχ2检验筛选出最佳分类结果。②树模型:父节点和子节点的最小案例数分别设置为100和50,树深度限制为6;检验方式为“交叉检验(样本群数=10)。③模型评价:Logistic回归模型采用似然比χ2和Hosmer-Lemeshow拟合效果检验,ROC曲线对多因素回归预测效果和决策树模型效果进行评价,并采用MedcalcV 18.2软件对两个模型的ROC曲线进行绘制与对比。

2 结果

2.1 随访人群基本资料随访患者的一般临床分层资料如表1所示,不良终点发生率在年龄>60岁(51.9%vs. 22.2%)、糖尿病病程>5年(46.9%vs. 29.9%)、合并脑血管病史(54.8%vs. 33.7%)、心力衰竭NYHA Ⅱ~Ⅳ级(45.3%vs.29.2%)、BNP>350 ng/L(48.0%vs. 26.4%)、CRP>8.3 mmol/L(50.3%vs. 33.5%)、院外使用他汀药物(34.0%vs. 71.2%)、院外使用降糖药物(32.4%vs. 62.2%)基线资料中的差异有统计学意义(P均<0.001),表1。

表1 随访患者的临床资料和不良终点发生率

2.2 随访人群的结局事件共525例患者完成随访,随访时间为24个月,图1。其中发生不良终点事件203例,发生率38.7%。MACE事件、脑卒中、再发心肌梗死事件行PCI术、全因死亡、频发室速/室颤、接受择期CABG手术等分别发生:45例、8例、85例、71例、35例、30例,分别占比总人群8.6%、1.5%、16.2%、13.5%、6.7%、5.7%,图2。

图1 入组随访流程图

图2 随访人群的结局事件分布图

2.3 单因素Logistic回归分析“年龄≥60岁”、“糖尿病病程≥5年”、“脑血管病史”、“心力衰竭”、“BNP≥350 ng/L”、“CRP≥8.3 mmol/L”、“院外不使用他汀药物”和“院外不使用降糖药物”等8个单因素是不良终点事件的危险因素,差异有很强的统计学意义(P<0.001)。其余临床资料单因素分析均无明显差异。

2.4 不良终点事件的多因素Logistic回归分析和回归模型评价将单因素Logistic分析的8个危险因素纳入自变量中,共线性分析提示无共线性(表2),VIF分别为1.068、1.031、1.070、2.495、2.675、1.155、1.110、1.096。 以2年发生不良终点事件为因变量,使用多因素Logistic向前逐步回归发分析,发现“年龄≥60岁”、“脑血管病史”、“糖尿病病史≥5年”、“BNP≥350 ng/L”、“CRP≥8.3 mmol/L”等是不良终点事件的独立危险因素,“院外使用他汀”、“院外使用降糖药物”是不良终点事件的独立保护因素(P<0.05),表3。

表2 单因素Logistic回归分析

表3 多因素Logistic回归分析

Logistic回归模型似然比卡方(likeihoodratioχ2)=133.966,DF=7,P<0.001,构建的模型具有统计学意义。同时Hosmer-Lemeshow拟合优度检验显示模型拟合较好,χ2=11.976,DF=8,P=0.152。

2.5 不良终点事件的决策树模型将有单因素Logistic分析的8个危险因素作为预测因子纳入决策树CHAID模型,得出的模型包括3层,共11个节点(0~10),其中终端节点6个。共筛选出5个解释变量,分别为“年龄≥60岁”、“BNP≥350 ng/L”、“CRP≥8.3 mmol/L”、“不使用降糖药物”和“糖尿病病程≥5年”。结果显示年龄是DM-AMI整体人群随访时不良终点事件最重要的影响因素(第一层):它将样本分为2个亚群,其中“年龄≥60岁”的患者发生不良终点事件的概率是51.9%,远高于“年龄<60岁”患者22.2%的发生率,是DM-AMI行急诊PCI术后患者出现不良终点事件时间的高发人群,说明年龄是不良终点事件的首要危险因素,图3。相同的,第二层“不使用降糖药物”和“BNP≥350 ng/L”分别成为了“年龄≥60岁”和“年龄<60岁”的人群分层的重要影响因素。在第三层,“CRP≥8.3 mmol/L”和“糖尿病病程≥5年” 分别成为了“年龄≥60岁+使用降糖药物”和“年龄<60岁+BNP≥350 ng/L”人群分层的重要影响因素。

图3 糖尿病急性心肌梗死人群急诊PCI术后2年内不良终点事件危险因素的决策树模型

模型拟合情况指示模型良好,具体见图4,增益图从0开始快速增长,逐渐趋于平稳到达100%平台;指数图从高于100%开始,沿移动维持较高的稳定水平后,快速降低至100%。CHAID决策树模型的决策点收益分析见表4,决策点4、7、9、8的指数值>100%,提示这些节点所涉及的影响因素与未来不良结局事件具有很强的联系。模型风险统计量为0.309±0.020,表示用该模型的总体正确百分比为69.1%,并且院外治疗后未发生不良终点事件的正确预测率为84.8%,拟合效果较好。

表4 DM-AMI人群PCI术后的不良终点事件决策点收益表

图4 不良终点事件决策树模型增益图和指数图

2.6 以决策树流程模型划分的分层亚组风险根据树模型分割亚组后,图3和表5所示,分别以每一层最左侧节点:节点1、节点3、节点7分别为每一层的参考组(OR=1.00),计算每一层其余各个节点的不良终点事件生存风险。三维OR风险图(图5)。

综合图3,表5和图5,继第一层以年龄分为亚组后,第二层中同时符合“不使用降糖药物”和“年龄≥60岁”两个特点的人群具有最严重的不良终点事件发生风险,相对于决策点3的OR为1.988(P=0.004),发生不良终点事件的概率为72.9%。

图5 不良终点事件决策树对应节点OR相对生存风险对比

表5 以决策树流程模型划分的分层亚组生存风险

第三层,决策点7同时有“CRP≥8.3 mmol/L”、“不使用降糖药物”和“年龄≥60岁”三种特征的人群具有最严重的不良终点事件发生风险,并且发生不良终点事件的概率为56.5%:当决策点7的相对OR为1.00的时候,决策点8、9、10的OR风险只有0.516、0.398、0.158,发生不良终点事件的概率分别为40.1%、40.4%和21.6%。

2.7 多因素Logistic回归与分类树模型预测结果和评价对多因素Logistic回归预测模型,和分类树模型的个体发生2年内不良终点事件发生率分别绘制ROC曲线。决策树模型灵敏度高于Logistic回归预测模型,为77.6%和73.9%,但Logistic回归模型的特异度高于决策树模型,为70.2%和60.1%。分别对两模型绘制ROC曲线,结果显示多因素回归模型AUC为0.784(95%CI:0.746~0.818),决策树模型AUC为0.765(95%CI:0.727~0.818),两模型的预测价值均为中等(0.7~0.9);两个模型的AUC相差使用De Long等的Z检验[12]对其进行比较,结果显示两个模型的差异无统计学意义(Z=1.122,0.2619),(图6,表6)。

表6 Logistic回归与分类树模型的拟合指标比较

图6 Logistic回归与分类树模型的ROC曲线图

3 讨论

本研究发现,经过单因素分析筛选后,Logistic多因素回归模型显示,“年龄≥60岁”、“脑血管病史”、“糖尿病病史≥5年”、“BNP≥350 ng/L”、“CRP≥8.3 mmol/L”、“院外使用他汀”、“院外使用降糖药物”是预测糖尿病急性心肌梗死行急诊PCI术后人群的不良终点事件发生的独立预测因子;通过决策树模型进一步证实,“年龄≥60岁”、“糖尿病病史≥5年”、“BNP≥350 ng/L”、“CRP≥8.3 mmol/L”和“不使用降糖药物”参与不良终点事件的发生。对比两模型后发现,Logistic回归模型的灵敏度低于决策树,但特异度高于决策树模型,AUC未见统计学差异。

Logistic回归模型和决策树模型各有优势,但在直观展示分层亚组中决策树更有优势:①决策树模型可以揭示各个因素对结果变量的重要程度,其表现形式以直观分层形式展现。“年龄≥60岁”为本研究决策树模型第一分层因素,提示高龄糖尿病患者对病情预后的最重要影响。②依据决策树模型的流程分层情况,简单高效地识别急诊PCI术后的高危事件发病人群。本研究结果提示,长期优化治疗方案及随访应重点关注高龄人群、不使用降糖药物/控制血糖不佳人群、心肌持续损伤人群(BNP≥350 ng/L)和高全身炎症指标人群(CRP≥8.3 mmol/L);而年轻人群、规律使用降糖药物人群、非心肌持续损伤人群和低炎症指标人群发生不良终点事件的发生风险较小。因此前者应为长期治疗的高危事件预防观察对象。③决策树模型能够清楚地显示各因素间相互作用的关系。比如高炎症人群的预测意义仅在老年患者、使用糖尿病药物的人群中具有预测意义。④另外,由于Logistic回归只能对整体人群构建预测模型,无法对样本进行逐步切割,从而无法找到一个目标结果可能性最大的亚组,亦无法针对自变量的重要程度进行分层排序:如表5和图5所示,决策树的分层切割后在每一层中形成了不同亚组,使用三维直方图可以直观展示出对应的不同亚组的生存风险,而Logistic回归无此种优势。本研究中,Logistic回归模型中的脑血管病史和他汀药物的使用没有进入决策树模型,造成这一差异的原因可能为脑血管病史与降糖药物有交互作用(交互性P=0.019),并且他汀与降糖药物也有交互作用(交互性P=0.023),因此决策树在纳入变量时使用了降糖药物作为分层因素的主效应,导致其他两者没有进入最终的树模型,但是Logistic回归模型表明这两种因素时不可忽视的。因此,如果在未来能够将上述算法扩充到考虑多属性、扩大样本量或生成树时调整父节点和子节点的案例限制数,有可能填补决策树对于主效应忽略这一缺陷。

随访时终点事件风险评估模型是从疾病的筛查角度出发,需要较高的诊断灵敏度。决策树作为一个有效的未来事件预测工具,可在快速对DM-AMI的PCI术后人群进行不良终点事件的预测。决策树CHAID模型和Logistic回归分析结果均显示高龄、长糖尿病病史、高BNP、高炎症反应CRP和不使用降糖药物是糖尿病急性心肌梗死PCI术后人群不良终点事件的危险因素。Shreenidhi等的PROCEED前瞻性研究发现[14],高龄人群和糖尿病的持续时间是MACE事件(全因死亡、非致死性心肌梗死或晚期冠脉血管重建)的独立危险因素,在经过校正后前者每十年风险升高2.45倍,后者每五年风险升高1.59倍;同时,Aurora等[14]的多中心临床试验纳入了1400例已发生急性冠脉综合征(ACS)的糖尿病患者进行5年随访,发现其中783例(55.9%)患者出现了至少一次的不良终点事件,并且高龄、外周血管性疾病、充血性心力衰竭均为可预测的危险因素。近期,免疫炎症反应已被证实在加重动脉粥样硬化作用中具有重要作用[15],秋水仙碱随机对照COLCOT临床试验发表于《The New England Journal of Medicine》杂志,首次证实了秋水仙碱抗炎效果的心血管获益,其中慢性冠脉综合征(CCD)患者的不良终点事件风险相对下降了31%(HR=0.69,95%CI:0.57~0.83,P<0.001)[16]。当不使用降糖药物作为多因素Logistic回归和决策树模型均出现的主要危险因素,提示临床医师在制定患者长期治疗方案时应进行心血管、内分泌等多学科合作,提升患者的治疗依从性,华思敏等随机抽取了国内三级诊疗中心的DM门诊患者发现[17],78.1%的患者采用行为、生活方式调整和药物治疗相结合的方法来控制DM,仅20.3%采用药物治疗,且34.7%的患者服药依从性不佳。因此改善患者的药物认知,建立门诊随访团队,使其得到更加全面的PCI术后干预,提高对DM疾病的预后认知,改善其血糖控制率,可进一步优化患者的生存质量。

本研究存在的不足:①本研究为单中心回顾性研究,可能仅能代表部分地区;②CORFCHDZZ研究收集了3561例CHD患者的临床资料,但本研究在使用了严格的纳入排除标准后,最终纳入的DM-AMI患者525例(不良终点事件203例,38.7%),对于决策树危险因素进行更多深度或更宽的分层构建可能会影响预测质量;③纳入的影响因素多为入院时的基线水平生化资料及随访的临床药物资料。因此,多中心、前瞻性的试验亟待进行。

综上所述,采用决策树分析结果能更为直观、形象地反映DM-AMI行急诊PCI手术人群的术后生存风险特征,还能直观比较各种不良因素对终点事件的影响强度,自动分层和切割亚组、并明确重要决策点。应用分层因素对AMI患者分类可快速找到对不良终点事件影响最大的因素组合;我们使用了之前较少的三维分组立方图展示了分层、亚组的患者风险,有利于临床医师对高危人群进行PCI术后风险预测和制定随访方案。本研究旨在评估不良终点事件并提供一种较新的直观预测方法,未来将通过进一步追踪患者的动态资料以完善对终点事件的预后评估,从而为院外治疗的防治提供更有价值的临床指导方案。

利益冲突声明:本文作者均无利益冲突。

猜你喜欢
降糖药决策树分层
长效胰岛素联合口服降糖药治疗2型糖尿病的疗效与安全性
关于口服二甲双胍类降糖药联合长效胰岛素治疗2型糖尿病疗效及安全性探究
一种针对不均衡数据集的SVM决策树算法
一种沉降环可准确就位的分层沉降仪
雨林的分层
决策树和随机森林方法在管理决策中的应用
健康用药:糖尿病患者应掌握好停药日
有趣的分层
基于决策树的出租车乘客出行目的识别
口服降糖药血糖控制不佳患者加用降糖药或胰岛素的疗效及对抑郁情绪的影响