何 雄,陈艳丽,帕哈提·吐逊江,夏雨薇,刘文亚,郭 辉
1新疆医科大学第一附属医院影像中心,新疆 乌鲁木齐 830054;2新疆医科大学第四临床医学院,新疆 乌鲁木齐 830054;3慧影医疗科技(北京)有限公司,北京100089
结核性脊柱炎(TS)与布鲁菌性脊柱炎(BS)是两种 不同细菌侵袭感染脊柱而引起的感染性脊柱炎,在骨关节感染中以脊柱最为常见[1-3]。TS的影像学表现与BS较为相似,易发生误诊、误治,不利于患者治疗,导致患者病情加重,致患者瘫痪甚至死亡。目前,国内外主要通过临床表现、实验室检查及影像学表现对TS与BS进行鉴别诊断,必要时行穿刺活检术或开放手术病理检查。但临床表现和实验室检查对于脊柱结核和化脓性脊柱炎鉴别诊断的特异性不高,往往依靠医生的临床经验,误诊率高[4]。寻找TS与BS的早期诊断和鉴别诊断方法十分重要。随着医学影像人工智能技术的迅速发展及大数据的日积月累,传统医疗模式向精准医学模式的过渡,影像组学逐渐成为量化影像图像中各类数据及辅助诊疗疾病的新手段。影像组学是近年来应用于研究疾病早期诊断、鉴别诊断、医学模型建立等方面的热点,这种新的技术方法应用于MRI分析中,可以获取一些肉眼观察不到的信息,它是从医学影像图像中获取丰富的特征指标,通过一系列的处理获取有用的特征信息,最后建立机器学习模型[5-6],从而获取有价值的诊断结论。迄今为止,影像组学已广泛应用于肺癌、乳腺癌、直肠癌、胶质瘤的研究中,而在脊柱感染性病变方面缺乏系统研究,有较少研究局限在解剖结构识别、常规诊断方面[7],本研究旨在探讨MR T1WI影像组学的机器学习在鉴别诊断TS与BS中的效能,以此来提高这两种疾病的诊断准确性和检出率,为精准医疗提供更为丰富的依据。
回顾性收集2019年3月~2021年12月在我院经临床和实验室确诊的TS与BS患者病例。纳入标准:临床和实验室确诊证实为TS或BS;接受脊柱MRI检查;确诊前有完整的T1WI且资料完整、影像清晰。排除标准:患者同时患有TS或BS以外的其他脊柱感染性病变;影像资料不全、伪影较多;图像质量不能满足对感兴趣区域(ROI)的勾画;在MRI检查前接受了治疗。本研究最终共纳入111例患者,其中男性85例,女性26例,年龄24~73岁,包括77例TS与34例BS。以0.8:0.2的比例将全部患者随机分组到训练集(n=88)与验证集(n=23),训练集侧重于对诊断模型的建立,验证集则侧重于对模型鉴别诊断TS与BS的作用大小。训练集包括61例TS和27例BS,验证集包括16例TS和7例BS。训练集和验证集患者的性别、年龄差异均无统计学意义(P>0.05,表1)。本研究经我院伦理委员会审核,获得所有患者知情同意,并签署临床研究协议书。
表1 训练集与验证集患者性别、年龄比较Tab.1 Comparison of gender and age of patients in training set and verification set
采用1.5T MR扫描仪(西门子)进行扫描,采用体线圈接收信号,予以T1WI序列扫描,具体数据如下:TR 400~700 ms,TE 11~15 ms,层厚3.0 mm,层距0.5 mm。
将显示TS或BS所有层面的MR T1WI序列图像上传至放射组学云平台,由2名从事感染性脊柱疾病诊断经验为5年与10年的影像医生各自对影像图片进行筛选,优先选取矢状位图像,沿病灶边缘逐层手动勾画病灶ROI(图1),提取整个病灶的图像信息。将分割的病灶ROI在放射组学云平台上进行特征信息的提取,然后对得到的结果进行组内相关系数分析,组内相关系数>0.75表明一致性良好,最终获得观察者间一致性。首先采用方差选择法对提取的组学特征进行初步降维,然后采用单变量特征选择法对组学特征再次降维,最后通过最小绝对收缩与选择算子算法(LASSO)对组学特征信息进行选择和降维处理(图2),选择出最优特征信息(8个)并构建模型(图3)。所应用的机器学习算法模型方法包括极限梯度增强法(XGBoost)、Logistic 回归法(LR)、支持向量机法(SVM)、K邻近法(KNN)。
图1 MR T1WI上手动勾画感兴趣区前后对比Fig.1 Comparison before and after manual delineation of ROI on MR T1WI.A: Before the outline;B: After the outline.
图2 在特征选择上的套索算法Fig.2 LASSO algorithm on feature selection.
图3 LASSO降维后通过模型选择筛选出的特征及其权重Fig.3 Features and their weights filtered through model selection after LASSO dimensionality reduction.
采用SPSS22.0软件对数据进行处理。计量资料以均数±标准差表示;计数资料的组间比较行卡方检验或Fisher确切概率法。使用准确度、ROC曲线及其95%CI评估各训练模型和验证模型对TS与BS的诊断效能。P<0.05为差异有统计学意义。
4种机器学习算法预测模型的AUC由大到小的顺序为:XGBoost>SVM>KNN>LR;准确度由大到小的顺序为:XGBoost>SVM=LR>KNN(表2)。所构建的4种机器学习算法预测模型在训练集中的ROC曲线(图4)。
图4 4种机器学习算法预测模型在训练集中的ROC曲线Fig.4 ROC curve of four machine learning algorithm prediction models in training set.A: LR;B: SVM;C:KNN;D:XGBoost.
表2 4种T1WI机器学习算法预测模型在训练集中的诊断效能Tab.2 Diagnostic effectiveness of four T1WI machine learning algorithm prediction models in training set
4种机器学习算法预测模型的AUC由大到小顺序为:LR>SVM>XGBoost>KNN;准确度由大到小顺序为:KNN=XGBoost>SVM=LR(表3)。所构建的4种机器学习算法预测模型在验证集中的ROC曲线(图5)。
图5 4种机器学习算法预测模型在验证集中的ROC曲线Fig.5 ROC curve of four machine learning algorithm prediction models in validation set.A:LR;B:SVM;C:KNN;D:XGBoost.
表3 4种T1WI机器学习算法预测模型在验证集中的诊断效能Tab.3 Diagnostic effectiveness of four T1WI machine learning algorithm prediction models in validation set
TS与BS症状非常相似,特别是在脊柱受累及方面[8-9],选择一种方法对两者进行鉴别诊断尤为重要。影像组学实现了将医学图像信息转化为丰富的数据信息,通过病灶分割、特征提取与模型建立,对病灶进行精准、客观、定量评估[10],间接帮助医生提高诊断准确率[11-12]。影像组学的机器学习算法有很多种,但它们有共同的工作流程[13-14]。本研究采用的是影像组学分析中较为常用的建模方法,建立的XGBoost、LR、SVM和KNN影像组学预测模型在TS与BS鉴别上均表现出较好的预测性能,训练集中准确度分别为0.97、0.83、0.83、0.78,测试集中准确度分别为0.83、0.78、0.78、0.83,这表明本研究所建立的影像组学预测模型对TS与BS病变具有较高的预测价值,可作为治疗病变TS与BS病变前的临床辅助工具。
有研究对50 例脊柱多发性骨髓瘤患者T1WI、T2WI和FS-T2WI图像提取分析了248个病灶(111个高危细胞遗传学异常和137个非高危细胞遗传学异常)的放射组学特征,并使用LR机器学习,预测了多发性骨髓瘤患者高危细胞遗传异常的可行性[15-16]。在验证队列中观察到放射组学模型和组合模型之间的AUC值,分别为0.863和0.870。放射组学模型的AUC为0.863,敏感度为0.789,特异性为0.787,阳性预测值为0.753,阴性预测值为0.824,准确度为0.788,与训练队列中的表现相当,表明常规脊柱MRI的放射组学特征反映了多发性骨髓瘤患者高危细胞遗传学异常和非高危细胞遗传学异常之间的差异。本研究中,LR模型在稳定性、准确度及AUC方面均表现最佳,明显优于其他3种模型,从侧面验证了LR机器学习算法所构建的模型具有良好的稳定性。既往文献中也可以看到类似的结果,构建预测模型的机器学习算法可以用于不同的部位,LR机器学习算法可能对骶骨肿瘤、四肢和骨盆软组织肿块、肺实性结节和乳腺癌有较高的诊断效能[17]。在本研究中,LR机器学习算法在鉴别TS与BS病变方面也表现出了较好的诊断效能。
本研究通过应用MR T1WI的影像组学来鉴别诊断TS与BS,联合人工智能机器学习的4种方法,构建了TS与BS的鉴别诊断模型,来提高对TS与BS鉴别诊断,为患者治疗提供更加可靠的诊断结果。通过研究结果表明,构建的TS与BS影像组学鉴别诊断模型有一定的价值(AUC均>0.75),特别是机器学习算法LR在鉴别TS与BS的验证集中诊断效能明显优于机器学习其他4种算法,同时LR检测准确度超过75%,展现出了非常优异的诊断效能。总体来看,本研究机器学习的4种算法比较结果为:LR>SVM>XGBoost>KNN,提示在本研究机器学习的4种算法中,机器学习LR算法不仅具有较好的诊断效能,还在稳定性、操控性、应用潜力方面具有更大的优势。
本研究的局限性:共搜集到77例TS与34例BS,样本量较少;样本未进行严格的图像标准化处理,对病灶感兴趣区的勾画,仍采用人眼识别、手工勾画的方式进行,可能存在一定的人为因素影响;本研究只选用了我院病例进行研究分析,会存在选择性偏倚的可能。目前影像组学虽处于初步应用阶段,但是随着研究的不断深入,在未来会有更多新的成果被发掘出来,将会为患者的精准医疗、个体化治疗提供强有力的帮助。影像组学的进步,不但推动着医学影像专业发展,而且对整个医学事业的发展具有重要促进意义。
综上所述,基于MR T1WI影像组学的机器学习在鉴别诊断TS与BS的应用方面有较高的应用优势,特别是LR构建的机器学习算法,可为诊断TS与BS的预测及预后评估提供一种较为可靠的诊断依据,具有较好的应用前景。