医学影像是临床上常用的无创诊断方法,其角色已从一种主要的诊断工具逐渐演变为辅助医生进行个性化精准治疗的重要手段。目前临床医生凭借主观经验,根据影像中病灶的大小、形态、位置、密度等定性征象给予相应的诊断,但是这些定性征象数量有限,难以完整反映影像中患者疾病的特征。随着人工智能的发展以及医学影像数据的增加,医学图像分析的研究呈现增长趋势。
随着信息技术的发展,并受基因组学、蛋白质组学等组学概念启发,影像组学得以建立和发展。影像组学从影像(CT、MRI、超声、病理图像等)中高通量地提取深层定量信息,利用人工智能技术建立与临床目标(诊断、疗效评价和预后预测等)间的关联,进而辅助临床决策。影像组学自2012年由Lambin等提出以来,已经在辅助肿瘤精准诊断和治疗方案制定方面取得了系列突破。2014年,哈佛大学的Aerts等使用CT影像组学特征对肺癌和头颈癌患者进行无监督聚类,发现聚类结果与肿瘤的分期、分型和预后均高度相关,指出影像组学技术在量化肿瘤方面的优势。2016年,广东省人民医院的Huang等发表了在结直肠癌淋巴结转移诊断方面的研究工作,证明使用影像组学标签可以将淋巴结临床诊断70%的假阳性率降低到30%左右,该文不仅是影像组学优化临床关键诊断流程的典型应用,还规范了一套对模型临床效能的评价方案。2019年,由哈佛大学Aerts团队发表在权威期刊 CA : A Cancer Journal for Clinicians 的影像组学综述回顾了影像组学及人工智能在癌症等重大疾病中的最新技术及应用进展,表明影像组学在临床中日益凸显的重要价值和应用前景。影像组学技术的不断发展,为医学影像辅助诊疗和疾病的预测、预后带来了新的机遇,通过从不同模态的医学影像定量地提取具有代表性的影像特征,将医学影像转化为可挖掘的数字信息,利用算法进行分析处理,并将其与临床特征进行对比、分析、建模,从而实现病变诊断和预测等工作。
传统的影像组学研究的一般流程如图3-1-1所示,主要包括:使用人工勾画或计算机分割算法对影像中的病灶进行分割;再通过特定的算法对勾画的病灶提取定量的影像组学特征;借助机器学习或统计学方法对提取的影像组学特征进行特征筛选;然后将选择出的关键特征作为算法或模型的输入,构建影像组学模型。有时,研究者还会将影像中的瘤内和瘤周区域作为不同的感兴趣区域进行分析,以进行肿瘤原发和微环境的特征与目标之间的关联分析。同时,还可以将影像组学特征和临床分析结果进行比较和相关性分析。将具有显著差异的临床变量与影像组学特征融合,建立影像组学与临床融合的模型。最后使用统一的评价体系验证模型的性能,确定该模型的临床应用价值,从而达到利用医学影像辅助临床医生进行疾病诊断和预测预后的目的。此外,为了解释选取的影像组学特征潜在的生物学意义,可以运用基因、转录组学分析技术找出与影像组学特征关联的分子特征,从而推测出影像组学特征可能的工作原理。由于影像组学特征只能表征病灶组织层面的信息,很难全面反映疾病进展的过程和结局,因此结合影像和其他模态的信息来建立一个更完善、准确的疾病预测模型是该领域的发展热点。
图3-1-1 影像组学分析及建模示意图
影像组学分析的主要流程包括影像数据获取、图像分割、特征提取、影像组学标签构建和可指导临床的列线图构建
胃癌是全球最常见的恶性消化道肿瘤之一,每年约有100万新发病例。晚期胃癌的生存预后较差,而早期胃癌的5年生存率可以超过90%,因此及时、准确的诊断对于提高胃癌患者的生存期非常必要。Hu等采用深度学习方法构建并验证了针对早期胃癌的窄带成像放大内镜的智能诊断模型,提高了对早期胃癌的诊断准确率。模型在内部和外部测试集上的曲线下面积(AUC)均达到0.8以上,达到了与高级内镜医师相当的水平。此外,根据智能诊断模型的提示,8位内镜医师的平均诊断精度得到了显著提高( p <0.05),表明该模型具有良好的辅助诊断价值。深度学习为影像组学中特征提取以及模型构建等多方面的优化提供了有探索价值的新途径。最近已有研究指出,基于深度学习的影像组学可有效建模出胃癌图像与病理分期、组织分型、预后等临床事件之间的关联。
美国国立综合癌症网络(NCCN)指南推荐胃癌新辅助化疗结合手术作为局部晚期胃癌的常规治疗方案之一。但临床实践发现,新辅助化疗并不是对所有患者都有效,其治疗效果在患者之间存在明显的个体差异性。及时、准确地检测胃癌患者接受新辅助治疗的效果可为临床治疗决策提供重要参考。Cui等基于治疗前CT图像构建了深度学习影像组学列线图用于预测胃癌患者的新辅助化疗疗效。研究者在患者静脉期CT图像肿瘤最大层面提取肿瘤区域的人工定义特征和深度学习特征,并以预测治疗是否有效(将肿瘤消退等级0~1作为反应良好)为目标分别构建标签。随后,上述两个影像组学标签与显著的临床标志物通过多因素逻辑回归组合为列线图。实验结果表明,模型相比于常规临床指标对新辅助化疗疗效具有更高的预测精度。此外,模型对患者治疗后的无病生存期也有显著的预测价值。由于CT是胃癌最常用的诊断技术,被指南推荐用于的治疗前检查,该研究提出的模型有望为胃癌新辅助化疗方案的制定提供一个适用于临床的辅助诊断手段,有助于推动胃癌的个体化精准诊疗。
Jiang等提出了一个具备多水平(multi-level)特征融合功能的深度学习神经网络(S-net),极大地提升了网络对胃癌肿瘤表型综合图像特征的提取和融合能力。相比于传统的深度学习模型,S-net的多层次特征流融合和多尺度特征池化既能提取低水平的肿瘤局部边缘和纹理特征,又能提取高水平的肿瘤表型深度特征,显著提高了网络的预测精度;进而构建了预测胃癌患者预后深度学习模型(DeLIS模型)。结果显示,DeLIS模型与无病生存率和总生存率显著相关,在多变量分析中显示它是一个独立的预后因素( p <0.001)。而且DeLIS模型对传统临床病理特征有明显的预后预测补充价值,可以显著提升传统临床病理特征的预测能力( p <0.01)。Jiang等进一步探索了DeLIS模型对指导辅助化疗是否获益的参考价值。结果表明,在Ⅱ期和Ⅲ期患者中根据DeLIS分层分析辅助化疗和DeLIS间的关系:Ⅱ期患者,辅助化疗可显著提升高DeLIS患者的无病生存率;Ⅲ期患者,辅助化疗可显著提升高、中DeLIS患者的无病生存率。反之,辅助化疗不影响低DeLIS患者的生存,提示DeLIS对辅助化疗疗效有预测作用。
世界范围内,我国的广东、广西、福建等南方地区是鼻咽癌发病率最高的地区。作为我国特有的高发恶性肿瘤之一,针对鼻咽癌开展具有临床指导价值的影像组学研究具有重要意义。近年来,我国的研究团队对此已开展了多项影像组学研究工作。
在鼻咽癌治疗中,T 4 分期鼻咽癌患者的局部控制仍然具有挑战性,复发率为74%~80%。再程放疗、手术或全身化疗已被用作复发性鼻咽癌患者(rNPC)的抢救治疗方法。其中,再程放疗是主要的治疗方法,但常伴有严重的不良反应(如大出血、坏死等),再程放疗不良反应造成的患者死亡数量占鼻咽癌患者总死亡数量的34.7%。因此,如何区分高危和低危复发鼻咽癌患者,指导个体化治疗变得十分重要。Zhao等的一项研究收集了单中心的420例复发鼻咽癌患者的PET/CT影像和临床数据,以PET/CT联合影像分别训练深度学习模型,得到深度学习预后标签,再使用Cox比例风险回归模型融合临床信息,构建出对应的列线图。融合临床变量和深度学习标签的融合列线图在训练集[C指数(C-index):0.741]和测试集(C-index:0.732)上均与总生存期显著相关。使用融合列线图的危险分层显示在训练集上,高危组相比低危组有着更短的无失败生存期,这也在测试集上得到了验证。空间转录组测序的基因富集分析结果表明,深度学习标签和细胞骨架、细胞迁移等通路显著相关,和高危患者更差的预后效果相吻合。
肝癌是全世界范围内常见的恶性肿瘤之一,发病率和死亡率都位居前列。微血管侵犯肿瘤的程度,是肝癌的重要预后因素之一,但只能通过术后的病理检查评估。目前尚无可靠的肝癌微血管侵犯和无病生存期的术前预测手段,针对这一问题,Li等开发了基于FDG PET/CT的影像组学列线图,预测极早期和早期肝癌患者的微血管侵犯状态和无病生存期。研究纳入了80例手术前接受FDG PET/CT检查的极早期和早期肝癌患者,随机分为训练集和测试集,使用LifeX软件提取纹理特征、LASSO回归筛选特征,最后利用影像组学特征和临床特征构建影像组学列线图。结果显示,由5个PET纹理特征和6个CT纹理特征组成的影像组学标签与微血管侵犯状态显著相关,同时,与临床特征相比,构建的影像组学列线图能够更好地预测无病生存期。
另外,44%~62%的肝癌患者在诊断或随访期间发生大血管侵犯,导致严重的疾病恶化,为肝癌的治疗带来巨大挑战。在另一项多中心的研究中,Wei等探索了基于CT的影像组学模型,预测肝癌患者的大血管侵犯状态。研究纳入了来自5家医院的226名肝癌患者,通过多策略机器学习方法提取了1 217个影像组学特征,使用随机森林模型整合大血管侵犯相关的临床特征和影像组学特征,构建最终的临床-影像组学综合模型,使用Cox回归分析选择独立的风险因子。结果显示,临床-影像组学综合模型能够有效预测肝癌患者的大血管侵犯状态,在训练集和外部验证集中分别取得AUC = 0.986和AUC = 0.979的预测性能,在不同的CT扫描协议/制造商的外部队列中,模型表现出良好的泛化性,同时,Cox回归模型成功地将患者分为高危组和低危组。这些研究结果说明,影像组学能够基于术前影像,有效预测肝癌的微血管侵犯和大血管侵犯事件,有望改善传统的预后方法,实现个性化的精准诊疗。
肺癌作为死亡率最高的癌症,其中超过一半的患者在确诊时已是晚期,此时,表皮生长因子受体(epithelial growth factor receptor,EGFR)靶向治疗是推荐的一线治疗方案。在靶向治疗过程中,首先需对患者进行 EGFR 基因突变检测,进而筛选出可以接受靶向治疗的患者。现有的临床方法通过穿刺取出肿瘤组织再进行基因检测来确定基因突变状态,但穿刺只能获取肿瘤局部组织的信息,由于肿瘤的高度异质性可能产生假阴性结果。此外,一部分晚期肺癌患者其肿瘤所处的位置特殊,或由于癌症转移等因素,难以穿刺到合适的肿瘤组织,导致这部分患者错失靶向治疗的机会。因此急需一种无创、方便的 EGFR 基因突变检测方法,作为对穿刺的补充和辅助。
Wang等研发了一种全自动的人工智能系统FAIS,在大数据驱动下直接对CT影像进行全自动的分析。FAIS使用基于肺区引导注意力机制的全肺分析深度学习模型,无须人工辅助和标注图像,对全肺的异常征象进行自动分析,并使用 EGFR 基因型和基因通路信息对模型进行引导训练;最终,可利用CT影像无创地预测出患者是否存在 EGFR 基因突变,并且可对患者接受EGFR靶向治疗后的无进展生存期进行预测,进而筛选出靶向治疗的获益人群。该研究纳入了国内外9个数据集1.8万余例肺癌患者进行大数据的训练和验证。验证结果显示,FAIS可以对原本难以进行穿刺的患者无创地检测出 EGFR 基因型,并预测其靶向治疗疗效;可有效筛选出靶向治疗获益人群,进而提升肺癌患者的生存率。
国内的影像组学研究团队在其他常见肿瘤,如脑肿瘤、结直肠癌、乳腺癌也取得了诸多突破性进展。如Li等基于术前T 2 加权MRI影像构建了一个可靠的影像组学模型,用于预测脑胶质瘤的总生存期。该研究纳入3个独立研究队列共计652例脑胶质瘤患者,通过基于特征工程的方法建立影像组学预测模型。该研究还通过RNA测序(RNA-seq)数据,建立了生物学功能与关键影像组学特征之间的映射关系,并通过单细胞测序和免疫组化染色进行了进一步验证。研究结果表明,基于术前T 2 加权MRI影像构建的影像组学预测模型可以稳定预测脑胶质瘤患者的总生存期,并且有助于术前评估脑胶质瘤肿瘤中巨噬细胞的浸润程度。Wang等构建了一个结合机器学习病理组学、影像组学、免疫评分和临床风险因素的人工智能模型来预测结直肠癌肺转移患者的术后预后。该研究纳入了103例发生肺转移且接受根治性肺切除术的结直肠癌患者。研究结果显示,构建的病理组学和影像组学标签可成功预测患者的总生存期和无病生存期。预测总生存期和无病生存期的AUC均达到0.860以上。Zheng等基于乳腺癌常规超声、剪切波弹性成像和临床风险因素构建了一个深度学习影像组学模型,对早期乳腺癌患者术前腋窝淋巴结状态进行精准预测。在测试集中,该模型的AUC达到了0.902,并且可进一步区分患者的腋窝淋巴结转移风险。
在其他癌种中,中国国内的影像组学研究团队同样取得了较为丰硕的研究成果。值得注意的是,随着影像组学技术的不断发展,越来越多的研究尝试在其他疾病的诊断和治疗中,利用机器学习模型来挖掘潜在的影像信息,有望促成一种新的辅助决策工具,从而实现影像分析在疾病诊疗中的临床价值。
2019年12月以来,新型冠状病毒肺炎(COVID-19,简称新冠肺炎)的流行成为世界范围内关注的焦点。在COVID-19的防治中,AI方法主要聚焦于胸部CT异常征象的检测和评估,这可以有效用于COVID-19患者的管理。Dou等的研究认为,数据隐私机制对于捕获患者的数据分布并构建鲁棒且可泛化的机器学习系统至关重要,该研究纳入了来自全球7个中心的132名COVID-19患者以充分探索联邦学习方法在COVID-19相关CT异常征象检测中的可行性。研究结果表明,联邦学习方法构建的隐私保护AI模型在多中心数据集上具有良好的泛化能力,AUC达到0.90左右,克服了集中分析大量敏感数据的负担,并为疫情防治提供了一种跨中心、跨国家构建AI诊断模型的有效机制。另外,COVID-19已经造成了相当多的死亡病例,特别是在具有基础疾病的患者中。因此,迫切需要一种精确的预后评估工具来识别有基础疾病的COVID-19患者的不良预后情况。Wang等的研究从4个中心回顾性纳入了400例具有基础疾病COVID-19患者的首诊CT,通过融合基于一阶统计特征的影像组学模型和端到端的3D深度学习模型,实现了对有基础疾病COVID-19患者生存结局的预测。实验结果显示,融合模型在内部测试集和外部测试集中的AUC分别达到0.876和0.864,并被验证为患者死亡的显著风险因素。同时,融合模型的生存曲线可以将患者显著分为高风险组和低风险组,有助于对具有高死亡风险的患者进行预警,并规划合理的监测方案。
21-三体综合征又称唐氏综合征,是最常见的染色体异常疾病。该疾病不仅给患儿家庭带来了沉重的负担,也给社会带来了负担,现今对其尚无普及性较高且有效的治疗方法,提高产前筛查及诊断的水平、加大筛查力度对预防胎儿出生缺陷的意义重大。针对这一挑战性的临床问题,Sun等利用产前检查的超声影像指标建立机器学习模型,从而提高产前21-三体综合征的筛查准确率。该研究从合作医院收集624例回顾性临床数据和超声影像,按照收集的时间顺序选取400例作为训练集,224例作为验证集。该研究对每个入组对象标注15个影像组学特征,通过分析发现,用于筛选21-三体综合征的LASSO-model在训练集和验证集中的AUC分别为0.983和0.979。该研究构建的LASSO-model与基于目前认可的胎儿颈后透明层厚度(NT)指标和年龄的模型进行对比,在训练集和验证集中的AUC均有显著优势。因此,该研究提出的一种个性化的孕早期21-三体综合征筛查模型,可以作为一个方便和有效的工具,辅助妇产科医生做出更精确的临床决策。
(董迪 江玉明 李海林 方梦捷)