人工智能在甲状腺针吸细胞病理诊断中的应用进展

2023-12-30 10:13廉亚丽董律吏纪晓坤
癌变·畸变·突变 2023年5期
关键词:滤泡区分细胞学

刘 颖,廉亚丽,董律吏,郭 晓,王 蕊,纪晓坤,杜 芸

(河北医科大学第四医院癌检中心,河北 石家庄 050011)

近年来甲状腺癌发病率逐年升高,在中国女性新发癌症中位居第4位,在男性中位居第9位[1]。甲状腺癌的诊治越来越趋于精准化和个体化,人工智能(artificial intelligence,AI)深入结合医学技术有助于提高甲状腺癌精准治疗,提高诊断速度,避免医生主观因素导致的偏差。目前AI越来越多的应用于甲状腺结节的诊断,在甲状腺超声诊断领域发展最为迅速,有研究者将AI辅助模型应用于超声图像,显著提高了甲状腺结节诊断的准确性和特异性[2]。也有研究利用深度学习技术基于甲状腺乳头状癌(papillary thyroid carcinoma,PTC)术中冰冻病理切片构建淋巴结转移预测模型,指导临床手术策略[3]。

1 甲状腺结节细针穿刺诊断

细针穿刺(fine-needle aspiration,FNA)活检是诊断甲状腺结节的金标准,计算机分析无疑为甲状腺针吸细胞学检查提供更客观量化的指标,在一定程度上减少诊断的不确定性,AI的迭代发展可能实现超越普通诊断医师的精准诊断。

甲状腺细胞病理学Bethesda 系统包括6 类用于甲状腺FNA诊断的不同分类。每种分类均有相应的恶性风险分级,这在甲状腺结节的管理中十分重要,更准确的恶性肿瘤预测可以有效减少不必要的手术。大多数甲状腺结节经FNA 可以排除恶性,对于滤泡性肿瘤(包括腺瘤和癌),大多数针吸细胞学检查的结节最终被诊断为良性;对于甲状腺乳头癌,特别是具有典型细胞学特征的类型,甲状腺FNA是非常好的确诊手段。但对于滤泡型PTC 和具有乳头状核特点的非浸润性甲状腺滤泡性肿瘤(noninvasive follicular tumor with papillary like nuclear features,NIFTP),常常被细胞学归类到诊断不确定(Bethesda III-V 类)类型中。目前,分子检测可以对细胞学特征不明确的甲状腺结节进行分流,而AI辅助诊断也是减少细胞病理诊断不确定的潜在方法。

2 人工神经网络区分甲状腺结节种类

对于甲状腺癌,大多数研究集中在PTC与非PTC分类任务上。2018 年,Sanyal 等[4]开发了一种人工神经网络(artificial neural networks,ANN)来区分PTC 和非PTC,用186 张PTC 涂片和184 张其他甲状腺病变涂片的显微镜照片(放大10 倍和40倍)来训练,并用174张显微镜涂片来评估,结果ANN的应用显示灵敏度为90%,特异性为83%,总体准确率为85%。然而,由于训练数据潜在的“过拟合”局限性,导致良性滤泡细胞形成的模糊乳头状结构或厚胶质有时被错误归类为PTC。2019年,Guan 等[5]利用深层卷积神经网络(deep convolutional neural network,DCNN)模型VGG-16和Inception-v3将甲状腺乳头状癌与甲状腺良性结节进行区分,将279个病理证实的甲状腺结节细胞学图像建立数据集分为训练组和测试组。测试组VGG-16模型和Inception-v3 对碎片图像的准确率分别为97.66%和92.75%,对患者的准确率分别为95%和87.5%。使用大数据集训练后,DCNN VGG-16 模型在促进从细胞学图像中诊断PTC方面显示了巨大的潜力。

此外,甲状腺滤泡性肿瘤分类的研究已有报道。Savala等[6]利用甲状腺FNA 涂片细胞学和形态学特征建立ANN 模型来区分甲状腺滤泡性肿瘤,组织学证实的26 例滤泡腺瘤(follicular adenoma,FA)和31例滤泡癌(follicular carcinoma,FC),训练集39例,验证集和测试集各9例。结果显示9例测试集中区分FA和FC准确率达到100%。

3 机器学习算法评估甲状腺FNA标本

在迄今为止数据最大的甲状腺研究中,Range等[7]对908例病例进行Bethesda系统分类,此研究开发了一种机器学习算法(machine learning algorithm,MLA),通过全视野的数字化切片(whole slide image,WSI)评估甲状腺FNA 标本。选取908 例有明确完整病史的甲状腺FNA 病例中最典型的涂片扫描为WSI,其中799 例为训练集,109 例为测试集,按照Bethesda 系统分类,该算法在鉴别良性和恶性结节方面的敏感性为92.0%,特异性为90.5%。人工和MLA预测恶性肿瘤的曲线下面积分别为0.931和0.932。MLA预测恶性肿瘤方面的表现与人工相当。由于细胞病理专家在极端情况下(良性或恶性诊断)表现更好,因此MLA可以作为FNA活检的补充,以帮助细化不确定的类别。

3.1 数字图像的细胞核参数测量

除此之外,很多研究试图将甲状腺FNA诊断主观的细胞学标准转变为定量的分类参数,大多数此类研究集中在用于鉴别乳头状癌/滤泡性癌与良性甲状腺结节细胞核的参数上。2019年,Chain等[8]研究应用数字图像衍生的核测量客观地将PTC与良性结节和NIFTP 区分开来,使用Aperio 成像系统扫描每个病例的涂片,测量每个病例125个细胞核的长/短径,发现PTC的核面积大于良性,NIFTP 核面积小于PTC。核延伸率显示相似的结果,但各组间数据重叠率更大。2019年,Yashaswini等[9]使用Bethesda系统对FNA涂片中的甲状腺病变进行分类,并评估核参数在提高甲状腺恶性肿瘤预测中的意义,使用Aperio计算机软件对81 例经组织学诊断确诊的甲状腺FNA 病例进行核形态测量,对每个病例的100 个细胞核分析了8 个相关参数,结果表明恶性组最小核径、最大核径、核周长和核面积均高于非肿瘤组和良性组,证明了通过计算机图像分析进行的核形态测量可以用作辅助诊断工具。

总的来说,尽管在一些研究中与核形状和染色质特征相关的其他因素具有预测性,但核面积的测量似乎是鉴别PTC和良性结节的最可靠方法[8,10-11]。对于滤泡癌,核大小的变化可能是一个重要的鉴别特征[6]。

3.2 微观特征描述区分

然而,有研究未直接评估细胞形态学特征,而是根据FNA报告中包含的微观描述使用机器学习算法区分不同病例。2019年,Maleki 等[12]评估了机器学习算法(suport vector machine,SVM)使用各种细胞形态学特征描述区分经典性PTC和NIFTP/无包膜或淋巴管浸润的包裹性滤泡型甲状腺乳头状癌(encapsulated follicular variant of papillary thyroid carcinoma,EFVPTC)的性能,选取59 例(29 例经典型PTC 和30 例NIFTP/EFVPTCs)作为测试集,SVM 成功鉴别出经典型PTC 与NIFTP/EFVPTC 的概率为(76.05±0.96)%,检测经典型PTC 的敏感性为72.6%,特异性为81.6%。这种方法可能对开发数据驱动评分系统有价值,可以指导细胞病理学和外科病理学诊断。

大多数基于形态计量学的甲状腺FNA研究最大的不足是数据集太小,这些研究未来的探索需要更大的数据集,更专业的仪器设备。核形态测量研究通常需要人工识别和提取细胞核特征,费时费力。WSI的使用有望加快未来自动化进程,促进AI的应用,但其所需存储空间巨大。此外,训练过程要求具有强大的计算能力和庞大的训练集,为机器学习提供足够的数据,这可能容易出现数据过拟合。然而,计算能力、存储、成像和机器学习算法的进步表明,在不久的将来,该技术在解决甲状腺FNA标本的诊断不确定性方面可发挥重要作用,辅助人工显微镜诊断,并作为分子检测的潜在替代品。

猜你喜欢
滤泡区分细胞学
Efficacy and safety of Revlimid combined with Rituximab in the treatment of follicular lymphoma: A meta-analysis
区分“旁”“榜”“傍”
你能区分平衡力与相互作用力吗
超声诊断甲状腺滤泡型肿瘤的研究进展
高频甲状腺超声对滤泡性肿瘤的诊断价值
教你区分功和功率
质核互作型红麻雄性不育系细胞学形态观察
甲状腺乳头状癌滤泡亚型声像图及临床病理特征分析
肺小细胞癌乳腺转移细胞学诊断1例
罪数区分的实践判定