神经肌肉疾病影像识别中机器学习算法性能的比较研究∗

2019-07-31 09:55章鸣嬛程爱兰刘晓青
计算机与数字工程 2019年7期
关键词:集上准确度卷积

陈 瑛 章鸣嬛 沈 瑛 程爱兰 刘晓青

(1.上海杉达学院信息科学与技术学院大数据分析与处理研究中心 上海 201209)(2.上海交通大学医学院附属新华医院 上海 200092)

1 引言

杜兴氏肌营养不良症(Duchenne Muscular Dystrophy,DMD)是严重的神经肌肉罕见疾病之一[1],由Duchenne于1868年描述。该疾病源发于肌肉组织,是一种致死性骨骼肌遗传疾病。患者的发病年龄几乎均在10 周岁以下,发病率约为男婴的1/3500~1/6000。

该疾病目前尚无有效的治疗方法,故高效的早期诊断显得尤为重要。DMD 的传统诊断流程中包含肌电图检查,这是一项创伤性检查,会令患儿极为痛苦,必然导致患儿的恐惧和不合作。因此,临床上亟需一种有效且无创的检测手段,来对DMD疾病进行早期诊断。

计算机辅助检测(Computer-aided Detection,CAD)是指综合运用影像学、图像处理及相关生化手段,利用计算机技术辅助医务人员发现病灶。磁共振成像(Magnetic Resonance Imaging,MRI)检查是临床上一项极具价值的影像学辅助手段[2~3],可以清晰地呈现出肌肉的组织结构和病灶的方位,安全有效。目前,一般仍由医生直接读片来获取MRI的信息,显然这种方式会受主观因素的影响。如能利用CAD 对图像进行分类识别,可减少主观因素带来的不利影响,则可提升诊断的可靠性,具有非常积极的意义。

目前已有多种CAD 方法可对医学图像进行识别,如统计学习方法、机器学习方法等。传统的机器学习方法一般先从图像中提取纹理特征参数,再基于这些参数进行数学建模,达到图像识别的目的。同时,由人工神经网络理论[4~6](Artificial Neural Network,ANN)不断深化而发展出的深度神经网络(Deep Neural Network,DNN),则可直接读取图像并作出判断。因DNN 具有识别准确度高、无损图像信息等优点,在图像识别领域有着广泛的应用[7~14]。

因此,课题组分别选用K 近邻(K Nearest Neighbors,KNN)、逻辑回归(Logistic Regression,LR)、支持向量机(Support Vector Machine,SVM)及深度神经网络DNN 算法对实验MRI T1 和MRI T2[15]进行分类识别。随着算法参数的不断优化或迭代次数的不断增加,最终得到四种算法下较优化的模型。分析比对模型的性能后发现,无论是对于T1 还是T2,本文所设计的10 隐层DNN 均具有最优的识别准确度。因此,该模型设计可为临床医师提供一种DMD 疾病的辅助诊断方法,这是人工智能在DMD无创检测中的尝试探索。

2 数据采集

本研究涉及的所有图像均来自上海交通大学附属新华医院神经内科,成像类型包括MRI T1 和MRI T2。患者组与对照组均为15 例,均为男性儿童。共获取有效的实验图像485 幅,其中患者组图像为249 幅(T1 和 T2 分别为127 幅和122 幅度),健康对照组图像为 236 幅(T1 和 T2 分别为 117 幅和119 幅)。图像样本类别的归属由神经肌肉科医师依据临床结果确定。本研究运用四种机器学习算法对图像进行自动识别,并结合医师给定的类别进行对比,对实验的技术路线做出评价。

对实验图像进行必要的预处理后,截取感兴趣的区域(Region of Interest,ROI),图像尺寸为256*256。图像样例如图1所示。

图1 图像样例

3 实验方法

3.1 KNN、LR和SVM

KNN[16]是分类算法的一种,通过计算新样本与历史样本中不同类别数据点之间的距离,来对新样本进行分类。即根据与新样本数据点最邻近的K个数据点的类别归属,来判断新样本的类别归属。

LR[17]属于广义线性模型,其因变量满足二项分布,故也属于分类算法。LR 与多重线性回归相比,增加了Sigmoid 或Softmax 函数,可将结果映射为二分类或多分类。该算法模型具有良好的可解释性。

SVM[18]是非线性分类算法,通过非线性映射算法将低维输入空间的线性不可分样本转换为高维空间的线性可分样本。SVM应用广泛,尤其对于小样本、非线性的分类问题有着优良的分类性能。

3.2 图像的纹理特征参数提取

以上三种机器学习算法均无法直接识别图像,须先从图像中提取纹理特征参数,再将参数记录划分成训练集和测试集进行交叉验证,达到分类识别的目的。课题组利用小波变换[19]从每幅图像中提取12 个特征参数,设置2、3、4 三种小波分解层数,根据各算法的分类准确度来判断何种分解层数最优。12 个纹理特征参数是:水平均值、水平方差、水平能量;垂直均值、垂直方差、垂直能量;对角均值、对角方差、对角能量;全部均值、全部方差、全部能量。以DMD 患者的T1/T2 图像为例,采用sym4小波基函数,对图像进行层数为4 的分解。部分小波系数如表1 所示(序号1~12 分别对应上述12 个特征参数)。

表1 小波变换提取纹理参数示例(DMD/level=4/sym4)

3.3 深度神经网络DNN和卷积神经网络CNN

相对于传统的浅层人工神经网络(ANN)而言,DNN 隐层数目更多,能学习到更复杂的处理函数。卷积神经网络(Convolutional Neural Network,CNN)是DNN 的重要结构之一,其卷积层可直接与二维数据进行卷积操作,能直接读取图像并识别其特征,因此在图像识别领域有着广泛的应用。

CNN的基本结构如图2所示。

图2 CNN基本结构

CNN 的基本网络结构可分为五部分:输入层(Input Layer)、卷积层(Conv Layer)、池化层/下采样层(Pooling Layer/Subsample Layer)、全连接层(FC Layer)和输出层(Input Layer)。在卷积层和池化层之间设有激励层。卷积层是CNN 的核心部分,用于提取输入数据的特征。该层的主要参数包括卷积核尺寸、步长及填充值等。卷积运算包括连续卷积运算和离散卷积运算,CNN的卷积操作属于离散卷积,其公式形式如式(1)所示。

卷积层的主要思想可描述为:当卷积核(滤波器)在数据窗口上滑动时,该滤波器可对局部数据进行计算。不同卷积核所提取的输入数据的特征也各不相同。在进行网络设计时,可根据实际情况来增减卷积层、池化层及全连接层的数目。

DNN 可直接识别图像并进行分类识别,故不必通过分析图像的纹理特征参数来间接判断样本的类别归属。

3.4 四类算法的模型设计

四类算法模型均分别尝试了训练集与测试集的取样比例为0.7:0.3和0.5:0.5两种情况。即分别从DMD 患者组和健康对照组中随机抽取70%(或50%)的样本作为训练集、30%(或50%)的样本作为测试集,将这两个数据集拼接后形成最终的实验数据。

设患者的数据标签为1,健康儿童的数据标签为0。采用五折交叉验证方式建立模型并测试。模型以训练准确度(train acc)和测试准确度(test acc)作为评价指标。“准确度”是指对所有受试者(包括患者和非患者)正确预测的概率,取值在[0,1]之间,取值越大则试验效果越好。

四类算法的关键参数设置可简述为

1)KNN

根据数据的类型和结构自动选择合适的内部算法。计算样本点与最近的5 个样本点之间的距离,用闵式距离家族中的欧氏距离进行度量。默认训练数据集和测试数据集的每行为一个样本,每列为一个属性。叶节点数目设置为30。当训练误差值为10e-3时停止训练过程。

2)LR

选择L2 正则化方法,采用交叉验证来选择正则化系数。损失函数优化算法选用‘ibfgs’方法,即利用损失函数的二阶导数矩阵(海森矩阵)来迭代优化损失函数。设置两种类别(0/1)的权重相等。

3)SVM

将内核参数gamma 设置为默认值(1/n_features)。核函数分别设置为‘linear’‘poly’,‘rbf’和‘sigmoid’,并比较惩罚因子C 固定时,各种核函数下的模型预测准确度。结论是‘rbf’为最优核函数。再在‘rbf’核函数下,分别设置惩罚因子C取不同值,比较模型预测的准确度。

4)DNN

试验DNN采用深度学习框架TensorFlow设计,网络包括1 个输入层、10 个隐层和1 个输出层。为加速训练过程,采用NVIDIA GPU 来训练网络。10隐层DNN的结构如图3所示。

原图尺寸为256*256,为减小网络输入的数据量,将图像尺寸转换成128*128。所有激励层均采用ReLU 激活函数,所有池化层均采用Max Pooling下采样方式。各层均使用标准差为0.01 的高斯分布函数来初始化网络权重。网络的损失采用交叉熵函数(cross entropy)来定义,并用AdamOptimizer方法来最小化损失函数。迭代次数设为100 次,Batch_size 设为30 幅图像。为进一步优化网络,试验设计时采用了dropout 方式来降低可能存在的过拟合现象,保留了80%的神经元。

图3 10隐层DNN的结构示意图

试验DNN 网络经多次参数调整后得到优良的网络结构。各层参数设置如表2所示。

表2 10隐层DNN的参数设置

DNN 模型除了以训练准确度和测试准确度作为评价指标外,还增设了训练误差(train loss)和测试误差两个指标。训练误差或测试误差分别指训练集或测试集上的预测值与真实值的误差绝对值,误差取值在[0,1]之间,且越小越好。

4 结果

4.1 KNN、LR及SVM算法的预测结果

KNN、LR 及SVM 算法在训练集和测试集上的分类准确度如表3 所示。“T1_L2”表示对T1 图像进行小波层数为2 的分解,并根据分解后的小波系数进行分类预测;“T2_L2”表示对T2图像进行小波层数为2 的分解,并根据分解后的小波系数进行分类测,以此类推。Train:Test 为训练集与测试集的样本数量之比,包括 0.5∶0.5 和 0.7∶0.3 两种比例。Train acc 为训练集上的准确度,Test acc 为测试集上的准确度。

表3 KNN、LR及SVM算法的预测准确度

可直观地看出:1)三种机器学习算法对T1 图像的训练及测试准确度明显高于T2 图像;2)对T1图像的三种小波分解中,以分解层数为2 时的分类效果最佳;3)取样比例 Train:Test 为 0.7:0.3 时的分类准确度优于取样比例为0.5∶0.5。经统计检验后可知,上述情况均存在显著性差异(P<0.05)。因此,下文在对结果作进一步分析讨论时,将择取每种算法最优的分类结果,作为该算法模型的预测准确度。

4.2 DNN迭代过程中误差及准确度的变化情况

利用上文设计的10 隐层深度神经网络对MRI T1和MRI T2进行分类识别。随着迭代次数的不断增加,测试集及训练集上的误差均不断下降,准确度则不断提升。最终误差均接近于0,准确度均接近于1。MRI T1 和MRI T2 在迭代过程中的误差及准确度变化曲线图,如图4所示。横坐标Iteration times为迭代次数,纵坐标Iteration trend为迭代趋势。

图4 迭代过程中的误差及准确度变化曲线图

由实验数据可知,对于MRI T1 图像来说,当迭代次数从30 次开始一直往后,测试集上的误差接近于0;同时测试集上的准确度稳定在99.2%左右;对于MRI T2 图像来说,当迭代次数从55 次开始一直往后,测试集上的误差接近于0;同时测试集上的准确度稳定在98.9%左右。

5 讨论

在所选用的四种分类算法中,KNN 是“懒惰”算法,没有训练数据的过程,也没有形成模型,是最基本的分类算法。LR 属于广义线性模型,与多重线性回归相比,增加了Sigmoid 或Softmax 函数,以便将结果映射为二分类或多分类,该算法模型具有良好的可解释性。SVM是非线性算法,通过非线性映射算法将低维输入空间的线性不可分样本转换为高维空间的线性可分样本,是一种优秀的分类算法。ANN 是另一种高效的非线性算法,通过计算网络误差并最小化误差函数,不断迭代得到优化的网络结果。DNN 在ANN 理论的基础上发展而有,其多隐层的网络结构大大提升了算法的性能。这四种机器学习算法均有一定代表性,各具特点,故选用其对同一数据对象进行比较分析。

四种算法在T1 和T2 上最优的训练及测试准确度如图5所示。Train acc_T1为T1训练集上的准确度,Test acc_T1 为T1 测试集上的准确度,Train acc_T2 为 T2 训练集上的准确度,Test acc_T2 为 T2测试集上的准确度。

图5 四种机器学习算法的训练及测试准确度对比图

经数据分析后可得出以下结论:

1)四类机器学习算法均对T1 图像有良好的分类效果,在训练集和测试集上的准确度均达到95%以上。

2)利用 DNN 对 T1 和 T2 图像进行分类识别,在训练集和测试集上均有很好的分类准确度。但从神经网络的收敛速度来看,T1明显优于T2。

以上结论究其原因,可以从两方面考虑:

1)机器学习(不包括DNN)在分类识别时,需先从图像中提取特征参数再进行分析。在提取特征的过程中可能会损失部分有效的信息,从而导致准确度下降。

2)机器学习或深度学习在处理样本量大的数据时效果较好。本课题所研究的DMD 属于罕见病,图像数量有限,机器学习算法以图像的绝对数量为研究对象,故限制了机器算法的准确度;但深度神经网络以图像的像素点为输入研究对象,每幅图像的尺寸均为128*128,保证了一定的输入神经元数目,因此可达到较好的识别准度。

6 结语

本文分别利用 KNN、LR、SVM 及 DNN 四种机器学习算法进行建模,用以识别儿童腿部罕见病DMD 的磁共振图像。试验结果表明,前三种算法模型对于受试者的MRI T1 均有良好的分类效果,但对MRI T2 的分类效果则不尽如人意;而对于DNN 模型,随着网络参数的不断优化和迭代次数的增加,模型在T1 和T2 数据集上的测试准确度均达到98.9%以上。模型稳定可靠,结果收敛。因此,论文所提及的方法路线是判断该受试者是否罹患DMD 的可行的辅助诊断手段,能有效降低患儿因有创检测带来的巨大身心痛苦,可作为DMD 罕见病无创检测的尝试探索。

猜你喜欢
集上准确度卷积
影响重力式自动装料衡器准确度的因素分析
关于短文本匹配的泛化性和迁移性的研究分析
基于3D-Winograd的快速卷积算法设计及FPGA实现
一种并行不对称空洞卷积模块①
基于互信息的多级特征选择算法
从滤波器理解卷积
基于傅里叶域卷积表示的目标跟踪算法
论提高装备故障预测准确度的方法途径
Word中“邮件合并”功能及应用
师如明灯,清凉温润