天池大数据竞赛第一名,上海交通大学人工智能实验室如何用AI定位肺结节
- 2017-10-24 09:04:00
- 刘大牛 转自文章
- 231
癌症,犹如黑暗中的魔鬼,带给人们恐惧与绝望。而肺癌,在我国作为发病率、死亡率最高的一类癌症,伤害着无数家庭。在我国每年都有近60万人死于肺癌。然而,癌症的死亡率与首次发现癌症的时期紧密相关,早期肺结节筛查可以为无数人免去痛苦与折磨。上海交通大学人工智能实验室徐奕教授、倪冰冰教授、杨小康教授、朱禹萌同学等人与点内科技合作,利用深度学习搭建的肺结节自动定位筛查系统,能够有效检测肺CT影像中包含微小结节、磨玻璃等各类结节,并降低假阳性误诊的发生,实现“早发现,早诊断,早治疗,早痊愈”的愿望。该算法获得了天池大数据比赛的第一名,这个比赛吸引了全国两千多支参赛团队,总奖池高达百万,面向全社会各大医院、高校、公司、研究所参加。
团队利用计算机视觉领域卷积神经网络技术来解决肺结节检测问题,并在多个层面上进行创新。1)结合物体检测与分割算法提取候选结节,产生高召回率候选结节池。2)使用假阳性衰减网络,并采取多尺度集成学习的网络模型提高检测精度,衰减假阳性比例。3)在数据的处理上,采取生成对抗网络进行了数据增广,提高了训练的有效性。
算法框架如图
数据预处理
通过旋转平移等几何变换针对有限数量的正样本做数据多样性增广,类似于医生通过不同的视角、不同的上下文去分析结节区域,并利用生成对抗网络(GAN),从随机噪声中产生新的结节正样本,学习生成新形态的结节样本,深度增广数据的多样性,提升模型泛化能力。
结节预检测
建立3D-Unet网络结构,该分割网络主要功能是提取疑似候选结节,最大化敏感度,降低漏检率。 其网络输入三个维度的数据特征,可从多个Z轴维度”观察“,正如医生结合多个平面观察结节,从而充分学习肺内部正常纹理和非正常纹理的区别,捕捉到结节多样性特征,比如毛玻璃结节密度比周围略高、呈云雾状性,纯实性结节实性密度较高,类似单独分离的蛋黄等。
结节精检测
结节精检测采用三种模型分别预测候选结节概率,并根据模型间权重比例给出最终概率的方法。主要优势在于,负样本经历由易至难的学习过程,分割网络和后续假阳性衰减网络相辅相成。多结构类型的模型Ensemble,且单一网络性能良好,类似于多个医生独立阅片的过程,综合给出阅片结果。
结果
这一算法在阿里云与英特尔联合举办的天池医疗AI大赛中大获全胜,以0.732的成绩从两千多组强劲队伍中脱颖而出,在比赛最为重要的复赛赛程中排名第一。
根据算法训练出的模型能够更好地处理不同形态的结节特征,达到很好的检测效果,在400例小结节测试数据上,FROC曲线如图所示:
值得注意的是,该算法诊断20万张肺结节片需要10分钟,远远少于医生人工诊断的时间,在提升准确率的同时,节约了医生的时间,真正在诊断流程上做好了医生的助手。团队也将算法真正投入到上海各大医院进行试验与使用,嵌入医生诊断流程当中,真正造福患者。
联系人: | 透明七彩巨人 |
---|---|
Email: | weok168@gmail.com |