基于深度学习的肺结节检测

2018-07-28 20:11吴洪渝

神州·下旬刊 2018年7期

吴洪渝

摘要：目前，我国的医疗资源严重的分配不均匀。我国共有医疗卫生机构989，403个，其中基层医疗卫生机构占据了总体的9成以上，而医院仅有不到3万个，比例不足3%。并且如今就医的趋势进一步向三甲医院集中。根据统计，在因为癌症死亡的人数之中，肺癌也是目前世界上死亡率最高的癌症之一，并且这个数字还在不断的上升。肺癌有一个最主要的特征就是存在肺结节。如果能在早期发现肺结节的话，早期癌症的治愈率超过90%，手术后3-5天就可以出院，并发症少，而且手术费用低廉只要28000元左右。但是由于当今针对肺癌早期诊断效果非常不佳，通常患者被诊断出肺癌的时候都已经为时已晚，正常的患者往往只能存活5年的时间。但是在这个过程之中会产生大量的CT图片，会大大增加医生的工作压力，在这种情况之下，如何提高就医的效率以及更加合理的利用医疗资源成为了炙手可热的问题。本文提出一种，基于深度学习的肺结节检测方案，能够合理的利用CT片，并且有效的减轻医生的负担，同时也让患者更加明了自身的病情。

关键词：图像识别；卷积神经网络；深度学习；检测方案

1 前言

随着人工智能技术的发展，人工智能在生活中的各个方面的应用越来越多。可以说现在的人工智能技术取得了很大的发展，在某些领域已经超过人类的水平，比如说围棋。人工智能在医疗领域上的应用也逐渐增多。在医疗方面也不例外，目前主要分为“AI与影像辅助诊断”、“AI与药物开发”和“AI与医疗机器人”三个研究方向，在国内，阿里、腾讯、百度、科大讯飞、华大基因都在利用人工智能技术在医疗领域做一些相关的开发，比如2018年腾讯开启的“腾讯寻影”，2017年阿里在糖尿病这一领域的AI等不同领域的医疗AI。但是目前AI在整个大环境下都是处于一种研发和测试的状态下，暂时还没有在各大医院中盛行。一旦做到可以商用的地步，那对于整个医疗体系来说，都是一个翻天覆地的改革。

2 正文

2.1产品功能概述

在本文中，我们提出的肺结节检测AI中包括的功能主要有：对标记数据进行解析读取、对卷积神经网络模型进行训练、模型对读取CT片、对CT片进行识别并且标注和根据计算的结果给出一定的建议以及治疗方案。该模型的训练数据集来自LIDC-IDRI，该数据集是由美国癌症研究所（National Cancer Institute）收集并且公开的。数据集里面含有胸部CT图片、X光片（以512*512分辨率的形式存储）以及专家标注的病变的结果，结果以xml的形式进行储存。利用专家的标注，将病变的数据提取出来，作为模型的初始训练数据。在生活中，医生只需要将患者的CT图像输入到该模型中，就能够得到标注结果之后的图片。这样会让医生检验这张CT片的时候，会格外注意这些有标注的位置。在早期，由于数据的来源比较单一。会出现一些误检的情况，医生在确定之后，可以对其进行标准，作为下一次模型训练得数据。从而使得模型的正确率越来越高。

2.2产品原理

①医学影像输入到模型之中；

②模型对每一个切分单位进行识别；

③根据识别结果对图片进行标注；

④生成医疗报告；

2.3关键技术

2.3.1图像边缘填充算法

在整个产品的开发过程中，首先应该先对图片进行灰度化、二值化处理。然后根据数据集中的标注，对xml文件进行解析，获取到病变结节的一些主要的属性。比如图片的Id号、坐标、半径。根据统计病变结节在半径为28像素以下的占总的病变数目的95%，所以这里以28*28的分辨率为一个单位进行处理。在病变结节的半径大于28像素的时候，选择以缩放的形式对其进行处理。因为专家在数据集中只标注了病变结节的輪廓，导致要对轮廓进行填充，根据边缘填充算法实现填充。

2.3.2扫描式匹配算法

在对一张图片进行识别的时候，在模型中是将CT片或者X光片切割成许许多多的28*28为一个单位的图片。然后把每一张分割之后的图片作为输入，利用之前训练好的卷积神经网络进行计算。将分类为病变结节的图片保存为图片的编号、病变结节的中心位置、病变结节的半径等信息。之后再我们利用缩放技术进行更大像素的切割和匹配。

2.3.3 DBSCAN分类聚类算法

DBCSAN（Density-Based Spatial Clustering of Application with Noise）算法是一种非常经典的分类聚类算法，它是基于密度来进行分类聚类的。在该产品中，我们在上述技术之后得到的只是一个病变位置的大概区域，是以28*28为一个基本单位的范围。产品中想将病变结节很好的提取出来，选用了DBSCAN算法。图片经过二值化的处理，只存在为0和1的色素。根据九宫格的原理对密度进行设置，最终提取出结节形态，并在原图中进行展示。

3模型的正确率和产品正确率的检验

因为神经网络的学习能力非常之强，在项目中，总共提取了50000多张正样本以及等量的负样本。对整个网络重复训练5次，模型的正确率能够达到95%以上。但是在实际检测新的CT图片时候，10张中存在2、3张出现误检，正确率大概为70%-75%，这样的正确率肯定是不能够用以商用的。可能存在过拟合的问题，正在筹划与医学院进行合作。从而以更加专业的知识，对模型进行改进。

参考文献：

[1]周兵 CT影像中肺结节检测与识别方法的研究电子科技大学

[2]基于密度的分类聚类算法DBSCAN.https：//blog.csdn.net/google19890102/article/details/37656733

[3]LIDC-IDRI数据集以及说明.https：//wiki.cancerimagingar chive.net