机器学习在预测重症急性胰腺炎发生急性呼吸窘迫综合征中的作用

2023-12-27 12:18邹康任文森蒲鑫鑫吕应琴徐劲史孝敏石蕾彭燕汤小伟
中华胰腺病杂志 2023年6期
关键词:机器变量频率

邹康 任文森 蒲鑫鑫 吕应琴 徐劲 史孝敏 石蕾 彭燕 汤小伟

西南医科大学附属医院消化内科,泸州 646000

【提要】 回顾性分析214例SAP患者的资料,构建5种SAP并发急性呼吸窘迫综合征(ARDS)的机器学习预测模型,并筛选出最优模型。结果显示,5种机器学习模型中,极端梯度提升(XGBoost)为最优模型。XGBoost在测试集中的AUC值为0.851(95% CI 0.739~0.963),灵敏度为0.840,特异度为0.793,阳性预测值为0.842,阴性预测值为0.743。最重要的4个预测变量为呼吸频率、血清淀粉酶、年龄和总蛋白。表明机器学习模型能够很好地预测SAP相关ARDS的发生,为临床早期识别高危患者提供了思路。

AP是消化系统最常见的疾病之一,大约20%的AP患者因持续性器官功能衰竭发展为SAP[1]。急性呼吸窘迫综合征(acute respiratory distress syndrome,ARDS)是SAP最常见和最严重的并发症之一,大约1/3的SAP患者会并发ARDS,约占SAP第1周死亡人数的60%[2]。尽管近年来ARDS的治疗取得了一些进展,但其预后仍不乐观,早期识别高风险患者并及时采取干预措施以阻断ARDS的发生发展对改善其预后至关重要。目前,机器学习已广泛应用于不同类型的临床研究,在AP的严重程度和并发症预测中展示出了良好的效果[3]。本研究旨在利用SAP患者的临床资料开发和验证多个机器学习模型,并筛选出最优模型对SAP并发ARDS进行预测,为临床早期识别SAP相关性ARDS提供思路。

一、资料与方法

1.研究对象:收集2013年7月至2022年4月间西南医科大学附属医院住院治疗的214例SAP患者的临床资料。其中79例发生ARDS(ARDS组),135例未发生ARDS(非ARDS组)。SAP的诊断基于2012年修订的亚特兰大分类共识[4];ARDS的诊断标准符合柏林定义[5]。排除标准:(1)年龄<18岁;(2)SAP合并慢性肺部疾病;(3)SAP合并妊娠;(4)SAP合并恶性肿瘤;(5)起病时间超过48 h;(6)首诊医院非西南医科大学附属医院;(7)数据缺失者。本研究经医院伦理委员会批准(20210223-146)。

2.观察指标:记录患者的性别、年龄、病因、吸烟史、饮酒史、体温、脉搏次数、呼吸频率、白细胞、中性粒细胞、中性粒细胞率、红细胞、血红蛋白、红细胞比容(hematocrit,HCT)、红细胞分布宽度变异系数(coefficient of variation of red cell distribution width,RDW-CV)、血小板、丙氨酸氨基转移酶(alanine aminotransferase,ALT)、天冬氨酸氨基转移酶(aspartate aminotransferase,AST)、AST/ALT、总蛋白、白蛋白、总胆红素、血淀粉酶、尿素、肌酐、肾小球滤过率(glomerular filtration rate,GFR)、血清钙、凝血酶原时间(prothrombin time,PT)、活化部分凝血酶原激酶时间(activated partial thromboplastin time,APTT)和降钙素原。所有临床资料均为入院后24 h内的首次结果。

3.机器学习多模型筛选:比较ARDS组和非ARDS组的临床资料,将所有临床特征纳入为输入变量以观察模型的最高效能,以是否并发ARDS作为输出变量。所有患者按照8∶2的比例随机分为训练集和验证集。通过训练集构建极端梯度提升(extreme gradient boosting,XGBoost)、logistic回归、随机森林、多层感知器神经网络(multilayer perceptron,MLP)、支持向量机(support vector machine,SVM)共5种分类模型。绘制各个模型的受试者工作特征曲线(receiver operating characteristic,ROC),并计算Brier分数,通过5次重复采样计算各个模型的ROC曲线下面积(area under curve,AUC)的均值,比较各模型训练集及验证集的AUC值及Brier分数,挑选出最优模型。

4.最优模型预测性能评价:采用Lasso CV回归对上述输入变量进一步进行特征筛选,以提高最优模型的精简性与临床实用性。随后,将筛选出的特征作为预测变量,同样以是否并发ARDS作为结局变量,在总体样本中随机抽取20%作为测试集,剩余样本作为训练集进行5折交叉验证,并在测试集中对模型的预测性能进行评价。绘制该模型简化后的ROC曲线,并计算AUC值、cutoff值、准确度、灵敏度、特异度、阳性预测值及阴性预测值。此外计算SHAP(SHapley Additive exPlanations)值并绘制SHAP特征重要度图对模型进行局部解释。

二、结果

1.一般资料:ARDS组与非ARDS组的临床特征比较见表1。相较于非ARDS组,ARDS组年龄更大,有更高的呼吸频率、脉搏次数,RDW-CV、AST、AST/ALT、总胆红素、血淀粉酶、尿素、肌酐、血清钙、PT、降钙素原水平更高,但血小板、总蛋白、白蛋白、GFR水平更低(P值均<0.05)。两组间其余指标差异无统计学意义。

表1 ARDS组与非ARDS组患者临床特征比较

2.多模型筛选结果:以训练集构建的XGBoost、logistic回归、随机森林、MLP、SVM 5种分类模型预测SAP相关性ARDS的ROC曲线见图1。除MLP和SVM模型外,其余3个模型均表现良好。5种模型的Brier分数分别为0.145、0.147、0.151、0.226、0.221。XGBoost在训练集和验证集中的AUC值均最高,且Brier分数最小,故其为最优模型。

图1 5种模型在训练集(1A)和验证集(1B)的受试者工作特征曲线 图2 XGBoost模型在训练集(2A)、验证集(2B)、测试集(2C)的受试者工作特征曲线 图3 XGBoost模型的特征重要度图(注:ALT为丙氨酸氨基转移酶;AST为天冬氨酸氨基转移酶;GFR为肾小球滤过率)

3.XGBoost模型预测结果:XGBoost模型在训练集、验证集、测试集中的ROC曲线见图2。其AUC值均超过0.8,表明XGBoost模型在训练集、验证集、测试集中均有良好的区分度。XGBoost 模型在测试集中的特征重要度图见图3,其最重要的4个预测变量分别是呼吸频率、血淀粉酶、年龄和总蛋白。无论在训练集、验证集还是测试集,XGBoost模型均展示出了出色的预测价值。当剔除呼吸频率再次分析时,其整体预测性能明显下降(表2)。

表2 XGBoost预测模型在训练集、验证集、测试集中的预测性能

讨论ARDS不是一种原发疾病,它是各种直接或间接因素引起肺损伤的最终结果。AP是ARDS最常见的间接因素之一[6]。目前没有治疗ARDS的特异性药物,患者预后受到干预时机的影响。尽管近年来ARDS的治疗方案有所发展,但其死亡率却未明显改善,中度及重度ARDS患者的病死率可达40.3%和46.1%[7]。研究表明,针对ARDS高风险患者,采取降低潮气量及限制液体输入[8]、抗血小板[9]、雾化肝素[10]等干预措施可显著降低ARDS的发生率。但是,缺乏有效评估发生ARDS风险的方法仍是改善患者预后的重大阻碍。

虽然目前已开发出一些早期预测ARDS的方法,但均存在一定局限性。肺损伤预测(LIPS)评分[11]可用于早期诊断ARDS患者,但涉及变量多且计算复杂。此外,一项多中心研究采用LIPS评分识别ARDS高危患者,其阴性预测值虽然为97%,但阳性预测值仅为18%[12],这可能会导致相当程度的误诊。logitic回归作为临床最常用的统计学方法之一,可以探索ARDS的危险因素并进行预测[13]。logistic回归是一种线性分类器,容易受到预测变量之间非线性关系的干扰,并且当数据的维度较高时,其准确性不如机器学习[3]。随着记录的患者特征越来越多,机器学习可以充分利用高维数据,分析多个特征之间的复杂关系,从而达到最佳预测效果[14]。Fei等[2]已经开发了一种人工神经网络模型来预测ARDS的严重程度,但该模型需要纳入基于CT计算的胰腺坏死率,而大多数AP患者早期胰腺坏死并不明显。此外,一些新的生物标志物例如P物质、IL-18、胰腺炎相关蛋白、microRNA-127等也可用于预测ARDS[15-16],但这些指标均不是临床常规检查,加重了患者的医疗负担,限制了其在临床上的应用。因此,需要一种预测变量简单且可快速获取、不依赖影像学结果的模型来评估SAP患者发生ARDS的风险。

本研究通过比较5种机器学习模型,筛选出最优的XGBoost模型预测SAP相关性ARDS,并且采用Lasso CV回归进行特征筛选,该模型最终纳入15个预测变量,且所有指标均为入院常规血液检查结果。XGBoost是一个优化的分布式梯度增强库,它集合了多种学习算法的性能,因而比任一单独的算法表现更佳。XGBoost也因其运算速度快、可调参数多、适用于大样本数据计算等特点而广泛应用于多种领域[17]。一项基于多种机器学习模型预测AP患者发生急性肾损伤的研究指出,在SVM、随机森林、分类和回归树、logistic回归和XGBoost 5种机器学习模型中,XGBoost预测性能最优,其AUC值达到0.919[18]。Luo等[19]在预测ICU患者的死亡率时,比较了SVM、logistic回归、人工神经网络、朴素贝叶斯法和XGBoost 5种机器学习模型,最终同样XGBoost表现最佳,其AUC值为0.81。因此,在众多机器学习模型中,XGBoost可能具有独特的优势。

本研究最终的XGBoost模型中,呼吸频率、血淀粉酶、年龄和总蛋白是最重要的4个预测因素。研究表明,呼吸频率>30次/min是SAP患者发生ARDS的独立危险因素[20]。但是呼吸频率变化较快,并且在未进行心电监护的患者中,呼吸频率的记录有很强的主观性。本研究去掉呼吸频率进行敏感性分析后显示,XGBoost的总体预测性能明显下降,可见呼吸频率的确对预测SAP相关性ARDS十分重要。因此,加强记录生命体征相关的医护人员的教育,提高呼吸频率记录的准确性对早期发现SAP并发ARDS有很大帮助。

本研究为首次采用多种机器学习模型预测SAP相关性ARDS的研究,共比较了5种机器学习分类模型,挑选出最优的XGBoost模型,并对其预测性能进一步评估,同时绘制了SHAP特征重要度图对机器学习的“黑盒模型”进行解释。本研究所有的预测指标均为入院常规血液检查,并且不涉及影像检查结果,可在患者入院后快速获取,达到早期预测、早期干预的效果。本研究也存在一些局限性。首先,研究模型是基于单中心数据建立的回顾性研究,样本量较少。其次,虽然本研究采用了五折交叉验证提高模型可靠性,但仍需外部验证以提升证据水平。

利益冲突所有作者声明无利益冲突

猜你喜欢
机器变量频率
机器狗
机器狗
抓住不变量解题
也谈分离变量
振动与频率
未来机器城
极限频率
SL(3,3n)和SU(3,3n)的第一Cartan不变量
导航频率源的同步与控制
分离变量法:常见的通性通法