王一飞,吴琰婷,黄荷凤1,
1.上海交通大学医学院附属国际和平妇幼保健院妇产科,上海200030;2.上海市胚胎源性疾病重点实验室,上海200030;3.复旦大学附属妇产科医院生殖与发育研究院,上海200021
胎儿宫内生长发育的评估和出生体质量的预测是围产医学中一个非常重要的问题。对预测为低出生体质量儿(出生体质量<2 500 g)来说,正确估测胎儿估计体质量(estimated fetal weight,EFW)有助于医师评估胎儿是否存在宫内发育迟缓(intrauterine growth retardation,IUGR),并及时进行处理,计划分娩时间和方式。而对于巨大儿(出生体质量≥4 000 g)来说,分娩时母婴风险均相对较高,可能出现如第二产程延长、胎儿宫内窘迫、产伤、肩难产、臂丛神经损伤、产后出血等问题[1-3];故而降低估测EFW 的误差能够帮助减少母婴不良预后[4],并在出现可疑巨大儿、头盆不称等情况时,帮助医师决定分娩方式[5]。目前对EFW 的评估依然缺乏非常准确、便捷的手段和方法,在此领域不断有新的研究和报道。本文对国内外多种估测EFW 方法的准确性、易用性和研究进展进行综述。
不同文献报道中评估EFW 误差的方法不同,以下仅列举几种常用的评估预测准确程度的参数及其优劣。
平均百分比误差(mean percentage error,MPE)是先计算百分比误差,即每个个体实际出生体质量(actual birth weight,ABW)减去EFW 得到的差值(有正负)占ABW 的百分比,再计算百分比误差的平均值及标准差。此参数在比较同一公式或方法在不同胎儿体质量组中的准确率有一定意义[6]。但仅比较MPE 的平均值不能体现误差的大小,只能够显示预测值是否有偏倚,必须与标准差结合进行比较。
平均绝对百分比误差(mean absolute percentage error,MAPE)是指计算百分比误差取绝对值,并求其平均值及标准差[7]。MAPE 较MPE 可更准确地评估误差的大小,但不能体现预测的倾向性即偏倚。
有部分研究者直接计算ABW 与EFW 的差值后取绝对值,并计算平均值及标准差,即为平均绝对误差(mean absolute error,MAE)。MAE 的平均值和标准差均以g 为单位,与原始数据量纲一致,便于直接进行比较[8]。
均方根误差(root mean square error,RMSE)是回归分析中常用的评价指标,在使用回归分析等方法的研究中常出现,可准确评估误差大小[8-9]。RMSE 是计算每个个体ABW 与EFW 差值的平方和,再除以个体的数量。其量纲与原始数据相同,便于直接比较,但不能显示预测的倾向性。
在妇产科学的传统标准上,将EFW 与ABW 差值在±250 g 以内的预测作为准确的预测,将准确预测的样本数除以总体数计算预测符合率[10]。也有研究者将EFW 与ABW之间百分比误差不超过10%的作为预测符合率。
使用孕妇参数估计胎儿体质量的主要测量指标包括宫 高 (fundal height, FH)、 孕 妇 腹 围 (maternal abdominal circumference,mAC),预测准确率取决于医师的经验和测量的规范性。评估胎方位及胎头下降的程度对矫正公式也有重要作用。
Johnson 公式[9]是使用孕妇参数估计EFW 较常用的公式,适用于单胎头位胎儿。公式为:EFW=(FH−n)×155 (n=12,胎头高于坐骨棘;n=11,胎头不高于坐骨棘)。
Numprasert 等[11]报道的Johnson 公式的预测符合率(误差不超过10%为符合)为71.5%(n=400)。其他简便公式还包括:EFW=(FH×mAC)+500[12];EFW=FH×100[13];EFW=FH×mAC×1.076[14]等。三者报道[10]的预测符合率(误差不超过250 g 为符合)分别为52.20%、54.70%、65.90%。
Mgbafulu 等[15]的 研 究 表 明,使 用 孕 妇 参 数 的Johnson 公式的预测符合率较超声方法有明显的差距,且常常倾向高估胎儿体质量。误差主要的来源是难以保证测量方法的一致性和准确性,以及在肥胖、羊水过多等病理状态下产生的系统误差。但在没有条件进行常规产前超声检查的地区,以及紧急时难以进行超声检查等情况下,仍可被用于判断胎儿是否有巨大儿的风险。
超声检查测量的胎体参数较产前检查医师体检测量的更为精确,影响因素也更少,且超声检查所需时间短,方法无创、无放射性,简便经济,因此成为目前应用最为广泛的评估EFW 的方法。超声检查计算EFW 的方法通常是先测量样本胎儿的多个参数,将数据进行回归分析并建立经验公式,在应用时则直接将测量数据带入经验公式即可。最常应用的参数是双顶径(biparietal diameter,BPD)、头围(head circumference,HC)、胎儿腹 围(fetal abdominal circumference,fAC) 和 股 骨 长(femur length,FL)。最常用的经验公式是Hadlock 公式[16]和Warsof 公 式[17]以 及 根 据Warsof 公 式 改 良 的Shepard公式[18]。大多数超声设备均内置这些公式,测量出指标后可自动进行EFW的计算。
2018年Hammami等[19]在5 163名婴儿群体中对上述公式进行了验证,结果表明几种Hadlock公式的MAPE差别不大,平均值在6.3%~7.3%之间,标准差均在5%左右,预测符合率(<10%为符合)为73.3%~79.9%;而Shepard 公式的MAPE 为(9.8±7.6)%,预测符合率仅为58.6%。Dudley 等[6]进行的一项系统评价也表明,在正常体质量胎儿群体中,Hadlock 公式计算EFW 的MPE 在大多数研究中较稳定,平均值均在±3%范围内,与几种Hadlock 公式使用了BPD(或HC)、fAC、FL 3 个参数估计有关;仅在Sabbagha 等[20]的研究中为-6.7%,但标准差与其他方法区别不大。Shepard 公式及Warsof 公式在不同研究中的MPE 变化较大,可能是与这2 个公式多使用BPD和fAC 2个参数进行估计,在不同样本群体中发生了偏倚。另外,孕晚期胎头位置低,且胎头入盆后发生变形,难以准确测量BPD、HC 的切面,因此可能仅使用fAC、FL 的Hadlock公式能更准确地估计孕晚期的胎儿体质量。同时,系统评价[6]也表明,多种计算EFW 的方法随机误差均较大,约±10%,主要与测量者的随机误差有关;有经验的超声医师、多次测量、提高超声图像质量可以减小这方面误差。
在低出生体质量儿或小于胎龄儿中,大多数公式倾向于高估胎儿体质量。在低出生体质量儿的研究中,Hadlock 公式的稳定性较差,MPE 平均值在-3%~10%之间,标准差多大于10%。而Sabbagha等[20]的方法在低出生体质量儿或小于胎龄儿中表现最好;在使用此方法的Robson 等[21]和Jouannic 等[22]的研究中,MPE 分 别为(1.7±8.1)%和(2.8±9.1)%。
在巨大儿或大于胎龄儿中,Hadlock 公式等对EFW大多倾向于低估[6]。因此,相较于传统的未调整的公式,根据预产期、妊娠女性的体质量、身高和是否合并糖尿病等指标进行调整后的Hadlock公式,在诊断巨大儿方面具有更好的敏感度;在95%特异度时将诊断巨大儿的敏感度从71.4%提高到85.7%[23]。同样,Hart 等[24]的研究也表明,将妊娠女性体质量作为一个单独变量对巨大儿群体的EFW 公式进行调整,可提高预测的准确性,MAPE为3.69%。
目前,根据胎儿超声参数计算的EFW 因操作简便,标准明确,在临床应用最为广泛,但MAPE 仍在6.5%~10%,和临床需求仍有一定差距;且多在正常体质量胎儿群体中表现较好,而在大于和小于胎龄儿中误差相对较大。因此,需要进一步增加测量的准确性,减小随机误差,或增加更多的参数对公式进行调整和修正。
超声测量主要通过胎儿的各项长度指标计算EFW,忽略了胎儿各组织的密度差异。脂肪组织的密度较其他组织低,因而在脂肪组织较多的胎儿中,常规的超声方法可能会高估胎儿体质量。评估胎儿皮下脂肪厚度,可能有助于更准确地估计EFW,鉴别正常及异常胎儿。研究[25]表明,在妊娠期糖尿病产妇的新生儿中,产前体质量被高估的新生儿(n=22)与体质量被低估的新生儿(n=8)相比,新生儿皮褶厚度、脂肪含量等均更高。尽管如此,在比较使用软组织测量值与超声测量值计算EFW 在诊断巨大儿的研究中,软组织测量组并未获得曲线下面积(area under the curve,AUC)更大的受试者操作特征(receiver operating characteristic,ROC)曲线[26]。因此,也有研究者[19]认为,胎儿组织脂肪含量增加5%,胎儿总体密度变化仅有0.5%,不足以引起EFW 较大的改变。但EFW 的变化也可能与胎儿四肢部的脂肪累积关系更大,三维超声对胎儿四肢体积的精确测量可能有助于减少EFW的误差[27]。
除了胎儿皮下脂肪外,还有一些参数,如母亲孕期增重(gestational weight gain,GWG)[28]、脐带横截面积[29]、羊水指数(amniotic fluid index,AFI)[30-31]、胎盘质量[32]等均被认为可能与胎儿体质量有很大的相关性。研究[28]表明,新生儿出生体质量随着GWG 的增加而增加(β=24.17±2.28,P<0.000 1)。脐带横截面积较大的胎儿中巨大儿比例显著增高(54.7% vs 8.7%,P<0.000 1),以脐带横截面积预测巨大儿的敏感度为51.4%,特异度为91.3%[29]。孕晚期AFI百分位数在严重巨大儿组中也发生显著增高[(72.4±22.5)vs(53.5±19.6);P<0.000 1)],以AFI 百分位数诊断巨大儿的ROC 曲线的AUC 为0.76,以AFI 百分位数>60%为截断点效果最好,敏感度为74%,特异度为62%[30]。将新生儿按胎盘质量进行分组,胎盘质量过轻组出生体质量较正常组低,胎盘质量过重组则相反;Logistic 回归分析结果显示,胎盘质量每增长92.0 g,导致巨大儿出生的风险增加36%,而低体质量儿的出生风险则降低42%[32]。
使用以上指标对利用常规超声参数计算EFW 的公式进行调整,可能有助于更准确地预测胎儿体质量,但具体方法有待于进一步的研究证实。
使用超声影像学估测胎儿体质量的方法,是用二维物体参数对胎儿这个三维物体进行评估。胎儿身体各部位的不均匀生长可能对EFW 结果造成影响,而三维超声技术的出现,使我们可以更好地对胎儿的体积进行测量,对胎儿软组织进行更准确的分析。然而,验证性研究[33]显示,三维超声预测出生体质量的误差并未明显优于二维超声,但三维超声的预测符合率较高。
将三维体积测量值(双上臂、大腿及腹部的体积)和二维测量值BPD 进行联合计算可能有助于改善EFW 的准确性[34]。该方法计算出的EFW 的MAPE 为(6.1±5.00)%,而单纯进行二维测量以Hadlock 公式计算EFW的MAPE为(7.5±5.53)%(n=65)[35]。
核磁共振成像(magnetic resonance imaging,MRI)是最准确地估算胎儿体积的影像学方法。许多研究证实,MRI 扫描后进行回波平面成像(echo-planar imaging,EPI)并根据三维图像计算胎儿体积(MRI-EPI 法)可以更准确地预测胎儿体质量;使用该方法计算的EFW 的MAPE 为3%[36],与实测值的相关系数r=0.95,显著优于超声方法(Hadlock 公式)(r=0.77)[37]。以上研究均证明MRI-EPI 法确实能够增加EFW 的准确率,但该方法对硬件要求高,检查时间长,费用昂贵,难以大范围推广应用。
近年来,机器学习算法在语音识别、影像诊断等许多领域中取得了惊人的成果。人工神经网络(artificial neural network,ANN)是一种模拟人脑神经系统工作的机器学习模型,它通过在输入层和输出层之间建立联系,并使用大量数据进行“训练”,不断修正这些联系的权重,最终达到系统的自适应和稳态。该方法用于计算EFW 无需经验公式,可以根据不同地区、人种、测量方法等进行调整,也适用于将更多可能相关的参数,如母亲体质量、AFI等加入模型。
神经网络法用于计算EFW 的研究有一定历史,最早由Farmer 等[38]使用神经网络模型计算100 例可疑巨大儿的EFW,MAPE 为4.7%,明显优于超声方法的10%左右。但受限于当时的计算能力,未进行大规模的验证。
一 项 研 究[39]使 用BPD、枕 额 径(occipitofrontal diameter,OFD)、fAC、FL、胎龄(gestational age,GA)及胎位(fetal position,FP)6 项参数输入训练模型,训练组991 例,验证组362 例,结果显示MAPE 为6.15%,优于传统方法的7.50%。然而,当体质量小于2 500 g 或大于4 000 g时,该模型的准确度下降[39],这可能是由于训练组样本中巨大儿和低体质量儿比例偏低所致。
李昆等[40]尝试使用深度神经网络(deep neural networks,DNN)构建胎儿体质量预测模型,结果显示,DNN 模型对预测符合率提高不大,为57.94%(Hadlock公式法为57.48%)。朱海龙等[41]则利用孕妇产检数据,首先建立连续的体质量变化模型,然后使用遗传算法(genetic algorithm,GA)优化神经网络的初始权值和阈值,建立EFW 预测模型;研究结果表明,该方法将MAPE 从7.69%减少到5.95%,预测符合率由62.0%提高到75.9%,而且加快了模型的收敛。
机器学习算法理论上可以拟合任意非线性函数,一方面使得对EFW 的计算更加精细,另一方面也很容易发生过拟合。并且其所建立的模型可能仅在样本空间效果较好,但较传统公式可推广性差,需要进一步交叉验证及外部验证。
综上,本文汇总了计算EFW 的代表性方法及相关文献报道。目前国内外临床应用较广泛的方法是使用超声测量胎体参数的Hadlock公式,对指导产科临床工作有一定参考价值,但仍不及有经验的产科医师进行的评估。减小EFW 的误差、提高预测符合率的方法可能包括:探索减小测量误差的更简便、可操作性更强的方法;增加更多相关参数对现有的EFW 公式进行调整;使用新的三维超声及MRI 等技术对胎儿的体积进行估计;用新的统计学算法建立EFW 模型等。更为精确的计算EFW 的方法能够有效提高诊断IUGR及巨大儿的准确度,对选择分娩方式、减少产时并发症、提高围产儿存活率均具有重要的意义,对产科医师的工作及患者产前的自我评估有较大的价值。