基于卷积神经网络的脑胶质瘤分级

2017-09-18 02:31黄中勇李江浩
湖北工业大学学报 2017年4期
关键词:胶质瘤分类器卷积

吴 聪,黄中勇,殷 浩,刘 罡,李江浩

基于卷积神经网络的脑胶质瘤分级

吴 聪,黄中勇,殷 浩,刘 罡,李江浩

(湖北工业大学计算机学院,湖北武汉430068)

针对脑胶质瘤人工分级难度大、费时费力的情况,提出一种改进的卷积神经网络方法来对脑胶质瘤进行分级。在传统的卷积神经网络结构上增加一层卷积层和采样层,同时使用支持向量机作为分类器;依据大脑结构自动定位肿瘤区域并输入网络进行分类。根据实验结果得出,网络的训练准确率为85.27%,测试准确率为83.79%,均优于传统的网络结构。

卷积神经网络;特征提取;脑胶质瘤分级;磁共振成像

肿瘤是对人体伤害巨大的多发性疾病,是危害神经系统的颅内肿瘤。通常颅内肿瘤发生于脑组织、脑膜、颅神经等,除此之外也可能从身体其他组织的恶性肿瘤转移而形成。根据世界卫生组织的分类[1],病理级为Ⅰ~Ⅱ级的少枝细胞胶质瘤、星型细胞瘤等为低级别胶质瘤;Ⅲ~Ⅳ级的成髓细胞瘤、星型细胞瘤等为高级别胶质瘤。最常见的颅内肿瘤为脑胶质瘤。低级别胶质瘤一般发展迟缓,容易治愈,但是高级别胶质瘤发病较快,难以治愈且复发率高。

磁共振成像(MRI,Magnetic Resonance Imaging)可用于对病人的检查,因其在人体内部器官成像清晰的优越性,常用于脑胶质瘤的检查。根据Provenzale[2]与Greene[3]等研究表明,MRI图像具有能反映胶质瘤级数的特征。现如今对于脑胶质瘤分级,绝大部分依靠富有经验的医生凭借肉眼来观察患者的MRI图像特征。但依靠人力来区分级数,不仅费力耗时,而且受医生主观影响较大,容易发生误诊情况。

卷积神经网络(CNN,Convolutional Neural Networks)[4]对识别扭曲复杂的几何形变有比较强的不变性,而且识别准确率相对于其他神经网络来说具有比较明显的优势。提出一种基于CNN的脑胶质瘤分级方法,克服了传统分级需要大量人力的缺点,把经过一定处理的MRI图像输入网络,让网络学习图片特征并准确分类。

1 卷积神经网络

近些年来,卷积神经网络发展迅速,并逐渐成为一些研究领域的热点,如:李健等[5]人把多尺度卷积神经网络应用于磁共振成像脑肿瘤分割中,分割精度优于传统的支持向量机模型;Sermanet等[6]人在交通信号识别中应用卷积神经网络模型取得了不错的效果;Chen等[7]人在改进CNN结构后,提高了网络的运算速度和鲁棒性,并在人脸识别中验证了其方法的有效性;Syafeeza等[8]人为了提高车牌识别的准确率,使用并优化了CNN,取得了98%的识别准确率。

典型的CNN结构有五层(图1),分别为卷积层C1,下采样层S2,卷积层C3,下采样层S4,全连接层(不包含输入层和输出层)[4]。其中K1×K1,K2× K2,K3×K3,K4×K4为各层间所使用的核。

图1 典型的五层CNN结构图

使用K×K的卷积核对前一层特征图进行卷积操作,所得到的数值经过一个激活函数后输出此层特征图的为卷积层,也称为特征提取层。一个卷积层可以由多个特征图组成,且一个特征图可以和前一层的多个特征图相连接。卷积层的神经元提取前一层局部特征,由于共享权值,大大减少了网络需要训练的参数个数,从而降低了CNN的复杂度。卷积层运算可由式(1)表达。

其中,F(x)为激活函数,通常有两种:双曲正切函数F(x)=tanh(x)和Sigmoid函数F(x)=。Clj为第l层的第j个特征图,Ml为

第l层输入数据集,Kijl为卷积核,bjl为第l层的第j个特征图所对应的偏置值。

一般地,特征提取层会后接特征映射层,也称作采样层。由卷积层输出的特征图经过采样层采样后,特征图数量一样,但每个特征图会变小。采样层通常有两种计算方式:最大值采样(式(2))和均值采样(式(3))。

其中,F(x)为激活函数,Sjl为第l层的第j个特征图,k(n,n)为输入窗口矩阵,通常取2×2窗口。函数D(x)表示均值抽样函数,ajl和bjl为每个输出特征图所对应的可训练参数和偏置值。

2 胶质瘤分级网络的结构

2.1 整体流程

基于卷积神经网络的脑胶质瘤分级方法主要分为肿瘤区域定位和分级两个步骤。医疗诊断中,医生为了能较好地观察病人的脑肿瘤情况,往往需要比较大的MRI图像,而实际上脑肿瘤在整个图像中只占了很小一部分(图2)。

图2 脑胶质瘤示意图(肿瘤为图中右上角)

如果直接把原始MRI图输入到CNN中进行训练,势必会造成网络负担过重,运行时间过长,分级准确率过低的情况产生。为了防止以上情况,需要对MRI图中的脑肿瘤区域进行定位并分割出肿瘤所在的区域,如可选择定位窗口为32×32大小或者44×44大小。肿瘤区域确认后,可将其输入到网络中进行训练;并且同时进行分类测试。图3为基于CNN的脑胶质瘤分级整体流程图。

图3 脑胶质瘤分级整体流程图

CNN输入层接收处理后的图片数据,多次通过卷积层和采样层提取特征,之后进入分类器得出图片的分级结果。网络的学习过程为有监督的,依据脑胶质瘤病情由轻到重的程度,分为Ⅰ、Ⅱ、Ⅲ和Ⅳ级,共四种分类。由于单次迭代并不能取得较好的分类准确度,所以卷积神经网络往往需要进行多次迭代并反馈结果以寻找最优参数。

2.2 图片前期处理

如图2所示,未经处理的MRI图包含脑、颅骨和其他一些无关特征,在进行实验之前需要对其进行处理。颅骨和其他一些无关特征为冗余信息,进行网络训练无意义且会加重网络负担,需要进行分割处理。脑和颅骨的灰度值相差不大,而且相互还有粘膜相连接,所以使用无交互分割算法会导致分割结果不太理想。使用Grabcut算法[10],此方法需人工画出少量辅助节点,进而算法依靠节点来对目标图像进行精确分割。图4为分割前后对比图,可以明显看出,分割有效地保留了大脑部分。

图4 分割前后对比图

分割前后肿瘤周围区域也可作为特征反映肿瘤的级数,所以相对于单独分割肿瘤与分割肿瘤所在区域来说,后者是理想的选择。定位肿瘤在大脑中的位置可以根据左右脑半球的对称性[11]。通常左右脑具有很高的对称性,而且脑胶质瘤一般位于其中一个脑半球。根据这一特性,以脑中轴线为基准,对比左右脑的灰度情况,假若某一区域灰度值相差太大,则可以确定此区域为肿瘤所在。定位窗口为44×44像素大小(图5),已经囊括肿瘤,此区域可输入卷积神经网络进行训练和测试。

图5 脑胶质瘤定位示意图(白框区域为44×44像素)

此次实验中,脑胶质瘤MRI图来自相关医院,经分割、归一化和定位处理后的MRI图像为128×128像素灰度图,均为横断面图,总共860张。

2.3 网络设计

前期处理后,将图片转化成44×44大小的二维矩阵,并标记每个矩阵所属的胶质瘤级数。网络的输入层特征矩阵为44×44(图6),经过卷积操作后,C1层产生8张特征图,大小是40×40,卷积核的大小为5×5;采样层为2×2均值采样,共有8张特征图,其大小是20×20。C2层产生16张特征图,大小是16×16,卷积核为5×5;均值采样层为16张特征图,其大小是8×8。C3层产生16张特征图,大小是4×4,卷积核为5×5;下接的均值采样层有16张特征图,其大小是2×2。

F4层为全连接层,其与前一层为全连接结构,类似于BP(Back Propagation)神经网络[12]结构中的隐层。F4层的神经元个数可由柯尔莫哥洛夫(Kolmogorov)定理得出,即神经元个数=2a+1,a为F4层的输入,a=16×2×2+1;由此可得出神经元个数为131个,为方便计算,可令其为132个。

传统的CNN分类器使用Softmax,可用于对手写字符这类比较清晰明显特征的分类,但对于脑胶质瘤分类效果不太理想。因此,本方法使用SVM(Support Vector Machine)分类器[13]。在解决“过拟合”问题上,SVM优于Softmax模型,因为其在多维模式识别与非线性识别中具有比较大的优势。

图6 胶质瘤分级网络结构

对于反向传播调整卷积核参数,传统的CNN使用的是批量梯度下降算法。虽然有助于寻找全局最优的解,但是训练耗时,网络负担也重。对此,本文方法使用了随机梯度下降算法(SGD,Stochastic Gradient Descent)[14]。卷积核参数调整公式为(4)和(5):

F*(x)为激活函数的导数,ax和bx为偏置值,Cx为采样层Sx-1所对应的上一卷积层; 代表元素相乘,U(x)表示上采样,D(x)表示下采样;δx为灵敏度,η是学习率;Δax代表本层的参数更新。

由此,基于卷积神经网络的脑胶质瘤分级算法可如下表述:

1)原始MRI图分割、定位等处理得到44×44大小含有肿瘤区域的二维图;

2)给二维图标签,并建立训练和测试数据集;

3)网络初始化(参数赋值,设置迭代数等);

4)随机抽取20个训练样本进行训练,计算相应的误差;

5)根据误差值,反向传播调整对应的参数;

6)判断网络是否已经收敛,是则往下一步,否则跳到4);

7)判断是否完成全部迭代,是则往下一步,否则跳到4);

8)把测试集输入训练好的网络进行测试,输出测试准确率。

3 实验与分析

3.1 网络训练与结果

实验所用的平台是Matlab 2014a,系统是Windows 10,硬件为Core I7CPU,8GB内存。经过前期处理后的图片共860张,其中作为训练集有680张,测试集为180张,均被处理为方便Matlab读取的“.mat”数据包。表1为网络迭代次数分别为1、10、20、30、40、50次的时候,训练准确率和测试准确率数据。从表中可以看出,迭代数1~40次时,训练和测试的分级准确率均逐渐提高;这说明了各层参数逐步收敛于最优值,网络也趋于成熟。但到第50次迭代时,训练准确率下降,测试准确率也有小幅度的滑落。由此可得出,网络的最佳迭代次数为40次,少则会导致网络没有充分训练,多则导致准确率下降而且费时。

表1 脑胶质瘤分级准确率

为了探究网络对胶质瘤四种级数的识别情况,从测试集中随机抽取出Ⅰ、Ⅱ、Ⅲ和Ⅳ级图各20张,经处理后分别输入已经训练好的网络中进行测试,得出结果见表2。

表2 四种级数分级准确率

由表2可知,本网络对脑胶质瘤级数为Ⅰ级和Ⅳ级的样本识别准确率高;但是对Ⅱ级和Ⅲ级的识别的准确率低,Ⅲ级准确率甚至刚达到65%。这是由于Ⅱ级与Ⅲ级胶质瘤在外形上相差不大,易于与其他级数混淆。

3.2 比较

前文提到分类器使用SVM比Softmax更有效,为了证实这一观点,进行以下实验。使用本文算法所用到的网络,分类器分别使用SVM(记为CNN-SVM)与Softmax(记为CNN-SM),并用训练集80张,200张,320张,440张和560张图片进行训练,迭代40次后使用80张测试集图片进行测试,得到的测试准确率见图7。

图7 SVM分类器与Softmax分类器对比

由图7可知,本文所使用的SVM分类器测试准确率好于Softmax分类器。在训练集图片达到560张的时候,使用SVM分类器对测试集图片的准确率达到了80%。

典型的CNN网络结构各有两层卷积层与采样层(记为算法一),而本文算法为了更好的识别肿瘤的特征采用了三层卷积层和三层采样层。为了对比两者方法的区别,使用相同的肿瘤训练集和测试集图片进行参照实验,并迭代40次,记录下准确率和所需时间(表3)。

表3 算法一与本文对比

表3说明:本文算法所用的网络结构在训练准确率与测试准确率均比算法一所用的网络结构高,但是在所需时间上,算法一所用的时间较少。这说明了,三层的卷积层和采样层有利于对脑胶质瘤特征进行提取,同时由于增加了层数,使网络更为复杂,把网络训练至收敛所花的时间也越多。

4 结论

基于CNN的脑胶质瘤分级使用了三层卷积层和采样层,并采用SVM分类器进行分类,同时增加了肿瘤的定位和分割,相对于典型的CNN结构有了一定的优化。在对比实验中,本文算法的准确率比典型的CNN结构有了提高,给以后的实际应用提供了参考。

因为网络结构的改变,训练所需的时间比较长。在往下的研究中,将着重优化网络,减少训练所需的时间。同一病人脑胶质瘤的MRI图片在不同层次显示的肿瘤大小不同,如何针对不同大小的肿瘤进行识别也是下一步重点研究内容。

[1] Kleihues P,Burger PC,Scheithauer BW.Histological typing of the central nervous system:World Health Organization international histological classification of tumours[M].Berlin:Springer,1993.

[2] Provenzale J M,Wang G R,Brenner T,et al.Comparison of permeability in high-grade and low-grade brain tumors using dynamic susceptibility contrast MR imaging[J].AJR,2002,178(3):711-716.

[3] Greene G M,Hitchon P W,Shelper R L,et al.Diagnostic yield in CT-Guided stereotactic biopsy of gliomas[J].Neurosurg,1989,71(28):494-497.

[4] LeCun Y,Bottou L,Bengio Y,et al.Gradient-based learning applied to document recognition[J].Proceedings of the IEEE,1998,86(11):2278-2324.

[5] 李健,罗蔓,罗晓,等.基于多尺度卷积神经网络的磁共振成像脑肿瘤分割研究[J].中国医学装备,2016,13(2):25-28.

[6] Sermanet P,LeCun Y.Traffic sign recognition with multi-scale convolutional Networks[C].Proceedings of the 2011International Joint Conference on Neural Networks.San Jose:IEEE,2011:2809-2813.

[7] Chen Y,Han C,Wang C,et al.A CNN-based face detector with a simple feature map and a coarse-to-fine classifier[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2009,31(3):1-12.

[8] Syafeeza Ahmad Radzi,Mohamed Khalil-Hani.Character recognition of license plate number using convolutional neural Network[J].IVIC 2011,Part I,LNCS 7066,2011:45-55.

[9] LeCun Y,Bottou L,Orr G B,et al.Efficient Back-Prop[J].Lecture Notes in Computer Science 1524,1998:9-50.

[10]Tang M,Gorelick L,Veksler O,et al.GrabCut in one cut[C].2013IEEE Internatonal Conference on Computer Vision.Sydney,VIC:IEEE,2013:1769-1776.

[11]Gering D T,Grimson W E L,Kikinis R.Recognizing deviations from normalcy for brain tumor segmentation[M].Springer Berlin Heidelberg,2002.

[12]Zhou W,Xiong S,Optimization of BP neural network classifier using genetic algorithm[J].Intelligence Computation and Evolutionary Computation,2013:599-605.

[13]Chu J L,Krzyzak A.Application of support vector machines,convolutional neural networks and deep belief networks to recognition of partially occluded objects[C].Artificial Intelligence and Soft Computing.Springer International Publishing,2014:34-46.

[14]Bottou L.Large-scale machine learning with stochastic gradient descent[C].Physica-Verlag HD,2010:177-186.

Brain Glioma Grading Based on Convolutional Neural Networks

WU Cong,HUANG Zhongyong,YIN Hao,LIU Gang,LI Jianghao
(School of Computer Science,Hubei Univ.of Tech.,Wuhan 430068,China)

Putting forward an improved convolution neural network method for classification of glioma since the glioma artificial classification is difficult and time consuming.In the traditional convolution,neural network structure adds a layer of convolution and sampling,using support vector machine as classifier at the same time.Classification is based on the automatically locating tumor area of the brain structure and the entering network.According to the experimental results it is concluded that,the network training accuracy is 85.27%,the test accuracy is 83.79%,which both were superior to the traditional network structure.

CNN;feature extraction;glioma grading;MRI

TP391.4

A

[责任编校:张岩芳]

1003-4684(2017)04-0060-05

2016-06-30

湖北省自然科学基金项目(2012FFB00701)

吴 聪(1982-),男,湖北武汉人,工学博士,湖北工业大学计算机学院副教授,研究方向为医学图像处理

黄中勇(1991-),男,广西南宁人,湖北工业大学硕士研究生,研究方向为图像处理

猜你喜欢
胶质瘤分类器卷积
基于3D-Winograd的快速卷积算法设计及FPGA实现
卷积神经网络的分析与设计
从滤波器理解卷积
基于傅里叶域卷积表示的目标跟踪算法
基于差异性测度的遥感自适应分类器选择
基于实例的强分类器快速集成方法
TGIF2调控胶质瘤细胞的增殖和迁移
DCE-MRI在高、低级别脑胶质瘤及脑膜瘤中的鉴别诊断
Sox2和Oct4在人脑胶质瘤组织中的表达及意义
99mTc-HL91乏氧显像在恶性脑胶质瘤放疗前后的变化观察