医学影像是指针对人体或人体某部分,以非侵入方式取得内部组织影像的技术与处理过程。在临床上,超过70%的诊断都依赖于医学影像。随着技术发展,医学影像检查手段逐渐多样化,包括超声、病理、内窥镜、CT(计算机断层成像)、CR(计算机X线摄影)、MRI(磁共振成像)、核素显像、PET-CT(正电子发射计算机断层显像)、DSA(血管造影)等(见图2-1)。
人工智能应用于医学影像,主要是通过深度学习,实现机器对医学影像的分析判断,是协助医生完成诊断、治疗工作的一种辅助工具,帮助医生更快地获取影像信息,进行定性定量分析,提升医生看图/读图的效率,协助发现隐藏病灶。人工智能通过影像分类、目标检测、图像分割、图像检索等方式,完成病灶识别与标注、三维重建、靶区自动勾画与自适应放疗等功能,应用在疾病的筛查、诊断和治疗阶段。
图2-1 主要医学影像种类
当前,医学影像辅助诊断被认为是人工智能最重要的潜在创新应用之一,主要原因在于:
首先,医学影像医生缺口大。以我国为例,医学影像数据年增长率约为30%,而放射科医师数量年增长率仅为4%,影像科医师数量增长远不及影像数据增长,且医师从业需要较长时间的培训和学习,这意味着影像科医师在未来处理影像数据的压力会越来越大,难以承担巨大的负荷。同时,随着分级诊疗政策的推进和基层医疗需求的释放,医学影像数据会更快增长,随之带来的放疗科/病理科医生缺乏的问题将更加严峻。
其次,医学影像诊断误诊率高、效率低。医学影像数据基本全部需要专业人员人工分析,而人工分析的缺点也显而易见:一是大量的脑力劳动和长时间的工作,容易视力疲劳及人为产生视觉误差;二是海量影像信息容易漏诊;三是全凭医生经验去鉴定,缺乏量化的标准,误诊率高,极容易出现不同医生判读结果不一致的情况。据统计,美国每年的误诊人数达到了 1200 万,中国每年误诊人数高达 5700 万。根据中华医学会的一份误诊数据资料显示,中国临床医疗总误诊率为 27.8%,其中恶性肿瘤平均误诊率为 40%,器官异位误诊率为 60%,肝结核、胃结核等肺外结核的平均误诊率也在 40%以上,这些误诊主要发生在基层医疗机构。
最后,医学影像信息化程度偏低。据中国医院协会信息管理专业委员会出据的数据显示,2015 年我国医院PACS系统(医学影像存档与通信系统)建设水平 50%~60%,同时由于我国信息化建设较晚,医学影像数据共享度仍较低。
综上所述,人工智能技术发展加快了医学影像诊断速度,提升了影像诊断的精准度,并给影像科医生的“阅片”方式带来改变,其主要表现在:(1)阅片方式改变。人工智能应用直接实现机器自动对片子进行初筛、判断、病灶勾选等,医生只需要最后负责判断即可。(2)阅片速度改变。人工智能自动快速初筛,并勾选病灶,医生只负责关键部位的复判,为医生节省大量烦琐的初筛过程。时间大为缩短,效率提高。(3)精准度改变。人工智能具备稳定性和全面性双面特点,不受工作时间长短影响,且能够做到片子全域完整观察无遗漏,快速稳定地完成初筛、判断,最后由专业医生对关键部位进行复判。因此,阅片的精准度得到双重保障。
目前人工智能在医学影像领域的应用方向主要有两类,即图像病例分类、目标或病灶检测分割。
(1)图像病例分类
病例分类主要是对一套典型多张图片进行分析,从而得出相应的病例的分类结果。在这一类问题中,通常存在着相应任务的病例图像数据量较少的问题,这也导致处理该类问题时通常会采用计算机视觉中的迁移学习算法。迁移学习算法大多会使用经过自然图像预训练好的网络模型,通常有把预训练模型作为特征提取器和在预训练模型中对医学图像数据进行微调两种用法。这两种用法都非常有效并且得到了广泛的应用,然而在部分分类问题上,存在着模型难以收敛、准确率不高的情况,甚至精度都无法超越古典的人工分析算法。其根本原因还是由于数据量不够充分,在迁移学习算法过程中出现过拟合现象。但是随着不同深度学习网络算法迭代更新,尤其是美国InceptionV3网络架构的出现,使得皮肤癌分类检测问题取得了超越人类专家的成绩。模型难以收敛、准确率不高等弊端逐渐得到了解决。
新一代人工智能技术在早期萌发阶段就已经被应用到了医学图像的病例分类中。早在2013年日本学者就发表了关于DBNs网络和SAEs网络应用于脑部的核磁共振图像分类。在卷积神经网络(CNNs)普遍应用于计算机视觉之后,图像分类问题的标配便成了卷积神经网络及其各类变种。在2015年至2017年间47篇关于医疗图像病例的文章中,有36篇是采用卷积神经网络模型、5篇是采用AEs模型、6篇采用RBMs模型,这些文章应用的医学图像领域非常广,从脑部核磁共振MRI到肺部CT扫描都有应用。总而言之,卷积神经网络是医疗图像中一个标准的模型算法,尤其是预训练模型迁移学习算法的技巧已经展示出了其强大的能力。
(2)目标或病灶检测分割
目标或病变分类与上述的图像、病例分类不同,其更加注重于图像的某一部分或细小的组织、病变等局部区别的分类,例如常见的肺结节检测与分类。对于很多任务来说,局部病变区域与全局的概念信息对这类分类结果起着非常重要的作用。很多学者采用了新型的多信息新融合架构进行网络拓扑(例如残差网络结构),以及不同尺度的信息结合,有针对性地对医疗图像做模型输入以及运算调整。
在医疗图像中,各类扫描图像、物理成像图像数据通常是以数据流的形式存在的,比如MRI大脑图像实际上是核磁共振多层扫描结果的图像,由50到70张不等的大脑横向切面图像从上到下表示大脑每一层的信息情况。这种类型图像信息在人工智能爆发之前通常是2D平面图像。对其一张一张地进行分析计算,不论是计算机还是人工,都无法直观地分析3D立体图像信息;而在深度学习算法中,起先是以分析视频流的方式,采用CNNs+RNNs模型算法进行分类。在2015年美国多名学者采用3D-CNNs网络对肺结节进行分类,并且单独选取候选结节,通过全连接层获得最终分类结果。同样在2016年3D-CNNs网络在脑部MRI图像中取得了较高的准确率。
基本上大多数的医学图像,都采用端对端的CNNs网络,但也存在一部分案例中,多次使用诸如RBMs、SAEs、CSAE等无监督网络模型的情况。另一个很有意思的进展是,由于很多图像目标的标记中,数据标记非常昂贵,因此多实例学习(MIL)的思想成了很多处理医学图像学者的常用手段之一。目前利用深度学习分类+检测算法的应用主要有以下几个方面。
早期肺癌筛查:肺癌是我国发病率和死亡率最高的恶性肿瘤,早期诊断和早期治疗能让患者的五年生存率提高到80%以上。基本步骤为,使用图像分割算法对肺部扫描序列进行处理,生成肺部区域图,然后根据肺部区域图生成肺部图像。利用肺部分割生成的肺部区域图像,加上结节标注信息生成结节区域图像,训练基于卷积神经网络的肺结节分割器,对图像做肺结节分割,得到疑似肺结节区域。找到疑似肺结节后,使用 3D 卷积神经网络对肺结节进行分类,得到真正肺结节的位置和置信度。目前腾讯觅影、图玛深维、依图科技、推想科技、阿里健康、汇医慧影等公司已经在临床上取得应用。
乳腺癌早期筛查:我国乳腺癌发病率、死亡率位居女性五大恶性肿瘤之首,且呈年轻化趋势。乳腺癌早期筛查可对乳腺癌进行早诊断早治疗,提高患者的生存周期。钼靶检查是乳腺癌早期筛查最有效的手段之一。目前人工智能对钼靶图像进行乳腺钙化检测、肿块检测和良恶性鉴别等功能提供辅助诊断工具。腾讯觅影该产品已经进入临床预试验。
靶区勾画:放射治疗、手术、化疗是目前肿瘤治疗的三大主要手段。利用医学图像引导,放疗病人不需要开刀,住院时间短,恢复快。在放疗前,每个病人需要拍摄医学影像(CT、MRI等)几十甚至上百张,放疗医生凭借经验勾画每个患者的放疗靶区需要半小时至几个小时,耗时耗力,导致治疗病人有限,勾画的精确度不理想。受医生经验、情绪、耐心等因素的影响,不同医生勾画同一个病人的医学影像靶区会产生不同的勾画效果。靶区勾画与治疗方案设计具有一定的技术含量并需要医生的经验,但是其中包含了大量的重复工作,这些劳动密集型的工作是人工智能的专长,利用人工智能做这些事情将节约肿瘤医生大量的时间。将人工智能技术应用在放疗领域,是很多人工智能+医疗公司的一大主要研发方向。目前,连心医疗、医诺科技、全域医疗、普润医疗、慧软科技等公司都在开发相关的产品。