基于增强CT影像组学联合临床特征预测肝细胞癌病理分化程度的应用研究

2024-03-23 11:55马春雨
中国CT和MRI杂志 2024年3期
关键词:训练组组学分化

吕 娜 马春雨 朱 林 郭 飞

蚌埠医学院第一附属医院放射科(安徽 蚌埠 233000)

肝癌是全球范围内较为高发的恶性肿瘤,在全球恶性肿瘤发病率中位居第5位,死亡率位居第2位[1]。在我国最为多见的病理类型是肝细胞癌,占我国肝肿瘤的85%-90以上[2]。预后决定了患者的生存期限,其中病理分化程度被认为影响肝癌术后复发率及生存预后的最重要因素。根据目前常用的WHO分类方法和Edmondson-Steiner分级标准将肝癌病理分化程度分为高分化、中分化、低分化、未分化[3]。肿瘤组织病理分化程度和异型性的程度相关联,肝癌病理分化程度高,表示和正常肝脏组织结构差异性较小,肿瘤细胞异型性不显著,恶性程度较低;而肝癌病理分化程度低,表示和正常肝脏组织结构差异性大,肿瘤细胞异型性显著,恶性程度较高[4]。临床医生在手术切除前明确肿瘤的病理组织学类型对于后续的治疗至关重要。多个研究结果显示肝癌的影像学表现与病理分化程度之间具有一定相关性。在2012年,荷兰Philippe Lambin教授提出影像组学这一概念,指从医学影像数据中大量提取描述肿瘤特性的组学特征,并对这些特征进行整合与分析,筛选出最有利于疾病诊断的特征,解析影像学、病理学及临床数据的内在联系,指导临床治疗和评估预后[5]。动态增强CT是诊断肝癌及评估疗效的主要影像学方法,它能够清晰地显示出病灶的数量范围、形态特征、密度差异及血流供应等情况。 本研究使用增强CT影像组学方法预测肝癌病理分化程度,评估其统计结果的准确性及临床应用价值。

1 资料与方法

1.1 一般资料回顾性分析2018年6月至2022年1月在蚌埠医学院第一附属医院经手术切除或病理穿刺证实为HCC的196例患者。将样本按照7:3比例随机分为训练组(137例)和验证组(59例)。查阅并整理患者的临床信息,包括年龄、性别、有无肝炎病史、病灶最大直径及实验室相关检查结果包括甲胎蛋白(AFP)、天门冬氨酸转移酶(AST)、r-谷氨酰转移酶(GGT)、丙氨酸氨基转移酶(ALT)、乙肝表面抗原(HΒsAg)、总胆红素(TΒIL)。

纳入标准:经病理穿刺活检或手术切除证实为肝细胞癌,并且有明确的WHO分型或Edmondson-Steiner病理学分级;具有术前30天内的肝脏三期增强CT扫描影像;术前未经过其他HCC相关治疗。临床数据完整。排除标准:影像伪影较多,影响感兴趣区的勾画;临床数据缺失。术后病理结果未获得具体的肝癌病理分化程度。

1.2 仪器与方法使用256排GE Revolution CT扫描仪进行检查,采用非离子型造影剂-碘佛醇(350mgI/mL),用双筒高压注射器将碘佛醇推注至患者肘正中静脉,使用的剂量为成人1.5mL/kg,流速为4-5mL/s,剂量为50-60mL,对比剂注射后于30-35s(动脉期)、60-75s(门脉期)、100-120s(延迟期)进行CT扫描,使用数字成像和通信标准(DICOM)文件格式将扫描获得的三期CT增强图像存入图像存储和传输系统(PACS)中。

1.3 图像后处理将符合上述研究标准的影像学图像从PACS系统中导出并保存至医准-达尔文智能科研平台中。由一名副主任医师在动脉期、静脉期及延迟期图像中手动沿着病灶的最大直径层面进行感兴趣区(region of interest,ROI)勾画,见图1A-1C。

图1A-图1C 患者,男性,48岁,病理确诊为低分化肝癌,图1A、1B、1C分别为 动脉期、静脉期、延迟期图像中肿瘤病灶区域的手动勾画,红色区 域内为感兴趣区ROI。

1.4 特征筛选与模型构建首先采取最大最小值归一化法对提取的影像组学特征进行预处理,把原始数据用线性化方法把区间拉伸至(0,1)之间。再用特征选择组件-最优特征筛选器(百分比),根据经验将K设置为15%,利用方差分析F检验(f_classif)统计量来选择按F值排序的前15%特征。最后使用L1范数正则化-最小绝对收缩和选择运算符(least absolute shrinkage and selection operator,LASSO),把选择后的组学特征放入模型中进行拟合。采用逻辑回归 模型分析降维筛选后的影像组学特征,建立动脉期+静脉期(AP+VP)模型、动脉期+延迟期(AP+DP)模型、静脉期+延迟期(VP+DP)模型及三期联合(AP+VP+DP)影像组学模型,再用筛选后的临床危险因素构建临床特征模型。最后将影像组学模型与临床模型相结合构建联合模型。

1.5 统计学方法选用IΒM SPSS Statistics 20.0统计软件对临床数据和影像组学特征进行分析。采用Kolmogorov-Smirnov检验分析定量资料是否服从正态分布,对于符合正态分布的定量资料,两组之间比较采用独立样本t检验,用均数±标准差表示;而对于不符合正态分布的定量资料,两组之间比较采用Mann-Whitney U检验,用中位数M(P25,P75)表示。采用皮尔逊卡方检验对定性资料进行分析,用频数(百分比)表示。采用逻辑回归分析绘制影像组学模型、临床特征模型及联合模型的训练组和验证组的受试者工作特征曲线(ROC),计算出ROC曲线下面积(AUC)、敏感度、特异度、约登指数及95%CI (P<0.05具有统计学意义),评价各模型预测肝癌病理分化程度的效能。

2 结 果

2.1 影像组学模型的构建筛选影像组学特征:共提取2817个影像组学特征。使用Select K Βest(score_func=f_classif,k=15)算法对2817个影像组学特征进行筛选,共得出 282个组学特征,再使用L1正则化算法降维得到13个最有代表性的组学特征,见图2A-2C。本研究建立AP+VP模型、AP+DP模型、VP+DP模型及AP+VP+DP模型。结果:AP+VP+DP模型预测肝癌的病理分化程度效能最佳。对AP+VP+DP模型进行训练与交叉验证后,得到其训练组及测试组的AUC值、特异度、灵敏度、95%CI及约登指数,见表1-表2、图3A-图3Β。

表1 在训练组中各模型预测HCC病理分化程度的效能

表2 在验证组中各模型预测HCC病理分化程度的效能

图2A-图2C LASSO-Logistic回归模型筛选出13个影像组学特征

2.2 临床模型的构建本研究将高、高-中分化并为高分化组,中、中-低、低分化并为中-低分化组。统计结果表明各临床特征在训练组及验证组间对比均无统计学意义(P>0.05),见表3。单因素分析结果显示,ALT(P=0.004)、AST(P=0.001)及AFP(P=0.008)在高分化组和中-低分化组之间差异具有统计学意义,它们为预测HCC病理分化程度的临床危险因素,见表4。最后采用二元逻辑回归方法将单因素分析结果中P<0.05的变量,即ALT(P=0.001)、AST(P=0.001)及AFP(P=0.004)进行多因素分析,结果显示AFP(P=0.010)及ALT(P=0.024)为影响肝癌病理分化程度的临床危险因素,见表5。

表3 训练组及验证组中病例的临床特征

表4 预测 HCC 病理分化程度的单因素分析

表5 预测HCC病理分化程度的多因素分析

2.3 三种模型的诊断效能单因素和多因素分析结果显示AFP及ALT为预测肝癌的病理分化程度的临床危险因素,使用Logistic 回归分析构建临床特征模型(AFP+ALT)。从上述结论得出最佳影像组学模型为AP+VP+DP。再将多因素分析结果中的AFP+ALT与AP+VP+DP组合成联合模型。利用受试者工作曲线(ROC)评估它们对肝细胞癌病理分化程度的预测效能,见表6。结果表明在训练组及验证组中,联合模型的AUC均大于其他模型,见图3C-图3D。

表6 影像组学模型、临床模型和联合模型分别预测训练组与验证组HCC病理分化程度的ROC曲线结果

3 讨 论

我国是世界肝癌的高发区域,其发病率和死亡率逐年递增。所以肝癌的早期筛查及诊断至关重要。肝癌的病理分化程度作为患者预后的重要因素,病理的分化程度越低,意味着病灶更易侵犯邻近的正常肝组织,所以低分化肝癌患者术后复发率高,预后差[6]。近几年随着技术的不断发展,多种医学影像检查可用于肝癌的诊断及疗效评估。但肿瘤的发生及发展是复杂多变的,一般常规影像学检查无法探勘出肿瘤病理分化程度方面的深层次信息。大量研究证明[7-8],肿瘤常表现出异质性(heterogeneity of tumors),同样的恶性肿瘤处在同一病人体内的不同位置或是在不同病人个体间,以及不同生长阶段的肿瘤的免疫特性、生长方式及侵袭程度都有所不同。影像组学是一种新兴技术,它能够使用算法或统计分析工具将医学图像转换为具有高预测性和高代表性的影像数据,寻找出影像图像信息和肿瘤细胞表型特征这之间的潜在关系[9],从分子水平上反映人体内解剖组织结构和基因代谢水平的动态变化。影像组学在食管癌[10]、直肠癌[11]、宫颈癌[12]、肺癌[13]等肿瘤诊断、组织分子分型、预测肿瘤基因表型及生存期评估等方面已经显示出重要的临床价值。多项研究证明在肝癌的诊断、评估病理分化程度及术后预后等方面,影像组学具有较好的应用价值[14-16]。

与既往研究不同,本研究使用医准-达尔文智能平台提取组学特征,选用LASSO-L1正则化回归分析筛选出最有价值的组学数据,建立AP+VP模型、AP+DP模型、VP+DP模型及AP+VP+DP的影像组学模型,其中AP+VP+DP模型训练组AUC为0.877,验证组AUC为0.801;AP+VP+DP的预测效能均优于其他影像组学模型。经单因素及多因素分析结果显示,肝癌的病理分化程度与 AFP和ALT具有一定的关联性(P<0.05),其中AFP与肝癌的相关性已经被Βai[17]、曾[18]等研究证明。但与ALT的相关性还有待考究,这可能与收集的病例较少有关,后续将进一步扩大病例数进行研究。最后把临床特征加入影像组学模型,构建联合模型进行效能评估。联合模型训练组AUC为0.899,验证组AUC为0.890。结果显示:影像组学通过联合临床特征,预测效能更高。

本研究存在的一些局限性:(1)本研究是回顾性研究,收集的病例有限,结果易受偏移的影响,后续将继续收集病例来进行研究。(2)本研究肝癌的病理分化程度仅分成两组,这样的分组方式可能会影响预测效能,后续将进一步细化分组。(3)影像组学研究需要庞大的数据支撑,不同机器的图像采集方式和不同的扫描参数可能对提取的特征产生一些影响,目前尚未建立统一的标准[19]。

综上所述,基于增强CT影像组学模型联合临床模型有助于术前预测肝细胞癌的病理分化程度,为肝癌的临床诊断及制定诊疗方案提供一定的参考价值。

猜你喜欢
训练组组学分化
新型抗阻力训练模式改善大学生身体素质的实验研究
两次中美货币政策分化的比较及启示
跑台运动训练对脊髓损伤大鼠肺功能及HMGB-1表达的影响
分化型甲状腺癌切除术后多发骨转移一例
线上自主训练与线下指导训练表面肌电差异分析
鲁政委:房地产同城市场初现分化
口腔代谢组学研究
基于UHPLC-Q-TOF/MS的归身和归尾补血机制的代谢组学初步研究
代谢组学在多囊卵巢综合征中的应用
Cofilin与分化的研究进展