购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

第三节
影像基因组学研究进展

随着影像组学等人工智能技术的发展,通过影像可以实现对肿瘤病理亚型、分子标志物以及疗效和预后的个体化预测。但是人工智能模型所提取的高维影像特征较为抽象,其生物学机制尚不明确,特征的可解释性较差。近年来,研究者通过影像基因组学分析来解释人工智能模型所提取的影像特征的生物学意义,建立宏观影像与微观机制之间的联系。

一、影像基因组学在脑胶质瘤中的研究

Haruka等在来自斯坦福大学医院(121例患者,训练集)和TCIA数据集(144例患者,验证集)的脑胶质瘤患者数据中开展了影像-基因多组学研究。首先,对MRI影像中人工勾画的胶质瘤病灶提取了388维影像组学特征;然后使用一致性聚类根据影像组学特征将患者聚类成三个簇;在每个簇中,使用微阵列显著性分析(significance analysis of microarray,SAM)找出最能反映这个簇的特性的影像组学特征。SAM分析结果表明,第一个簇中最具有代表性的特征大多是描述肿瘤形状的不规则程度和肿瘤轮廓的凹陷程度;第二个簇的特征大多是反映规则且边界清晰的肿瘤边缘;第三个簇的特征大多是反映具有中央低信号且周围环绕着高信号边缘的肿瘤。为了验证该结论的可重复性,研究者在TCIA验证数据集中进行了相同的特征提取和聚类,得出了一致的结论。通过对TCIA数据集中的患者进行预后分析表明,这三个簇所包含的患者具有不同的预后,其中,第一个簇的患者预后较差,第二个簇的患者预后中等,而第三个簇的患者预后较好。最后,通过对TCIA数据集中患者的基因数据进行PARADIGM分析发现,第一个簇的患者与酪氨酸激酶受体(c-Kit)干细胞因子受体通路的上调有显著关联;第二个簇的患者存在21个通路的下调,包括c-Kit干细胞因子受体通路、血管内皮生长因子受体(VEGFR)通路、血小板源性生长因子受体α(PDGFR-α)通路、叉头框A(FOXA)转录网络以及血管生成素/酪氨酸激酶受体(Ang/Tie2)通路;第三个簇的患者存在31个通路的上调,包括典型的WNT和PDGFR-β通路以及很多在第二个簇中被下调的通路。该研究通过无监督聚类分析的方式,发现了影像组学特征与基因通路之间存在显著关联。

Sun等利用MRI影像和RNA测序数据进行了影像-基因的多组学分析以探索人工智能模型提取的影像特征与微观机制的关联。在该文章中,研究者搜集了198例脑胶质瘤患者的多参数MRI影像(T 1 、T 2 、T 2 -FLAIR、T 1 增强序列)和总生存期(overall survival,OS)随访数据;其中的95例患者同时具有RNA测序信息(定义为影像基因组学数据集)。首先,由一名医生在患者的多参数MRI影像中勾画出肿瘤病灶,包括肿瘤的实质区域和瘤周区域。然后,使用PyRadiomics工具包对4个MRI序列的肿瘤实质区域、瘤周水肿区域和肿瘤全部区域(包含实质和水肿区域)分别提取形状、强度、纹理等共计1 032维的影像组学特征。该数据集中132例患者作为训练集,66例患者作为验证集;在训练集中对影像组学特征进行了可重复性验证、单变量 p 值检验和LASSO进行特征筛选。最后构建了LASSO-Cox模型用筛选出的影像组学特征预测脑胶质瘤患者的总生存期。在影像基因组学数据集上,首先通过加权基因共表达网络分析将高度互联的基因聚类成可能参与常见生物学过程的几个基因模块;然后使用Zsummary统计检验每一个基因模块在影像基因组学数据集和TCGA数据集(159例患者)中的可重复性,筛选出可重复的基因模块(Zsummary≥10)。最后,根据基于样本的基因集变异分析,找出与影像组学标签(影像组学模型的预测值)显著相关的基因模块。对于每一个基因模块,通过基因通路富集分析检验该基因模块中的每一个基因通路是否与影像组学标签显著相关。对于筛选出的每一个具有预后价值的影像组学特征,都能找出与之对应的显著相关的基因通路。为了进一步验证在该数据集中找出的影像-基因对应关系是否稳定可重复,该文章使用了外部测试集(78例患者)进行验证。最终,该研究筛选出了13个影像组学特征,所构建的影像组学模型在内部验证集上预测脑胶质瘤总生存期的C-index为0.7。在影像基因组学数据集上,筛选出了27个基因模块,其中23个基因模块在TCGA数据集上通过了稳定性和可重复性验证;最后,有2个基因模块与影像组学标签显著相关,其中一个基因模块包含的是免疫、炎症和细胞增殖相关的基因,另一个基因模块包含的是与细胞信号通路有关的基因。最后,通过基因通路富集分析,在这两个基因模块中找到了30个重要的基因与13个具有预后价值的影像组学特征存在显著的对应关系。根据这些影像特征对应的基因通路特性,可以将这13个影像组学特征分为4类:①免疫相关的特征,这些特征与T细胞活化、CD4调节、白细胞介素、干扰素调节,Janus酪氨酸激酶-信号转换器和转录激活器(JAK/STAT)、肿瘤坏死因子受体2(TNFR2)等免疫和炎症相关的基因通路存在显著相关性;②细胞增殖相关的特征,这些特征与细胞黏附、血管内皮生长因子受体、整合素激活、KRAS、P53等癌细胞增殖相关的基因通路存在显著相关性;③疗效相关的特征,这些特征与紫外线反应、药物反应、氧化应激反应、G2/M检查点等基因通路显著相关,而这些基因通路与细胞对放疗和化疗药物的响应有关;④细胞功能相关的特征,这些特征与有丝分裂纺锤体、染色体重塑、染色体组织、组蛋白甲基化、mRNA转运等信号通路相关,这些信号通路都反映复杂的细胞功能活动。相比于之前的研究仅构建了影像组学模型预测脑胶质瘤的预后,该研究通过影像-基因多组学分析解释了影像组学特征潜在的生物学机制。例如,免疫和炎症反应的上调(反映在免疫相关的影像组学特征上)与多种促进肿瘤增殖的免疫抑制通路有关(反映在细胞增殖相关的影像组学特征上)。因此,影像组学特征可以预测炎症和免疫反应,这与患者的预后相关。此外,P53缺陷型肿瘤细胞对治疗诱导的DNA损伤有响应,而这与两个影像组学特征相关;因此,影像组学特征具有预测疗效的能力。这些研究结果表明,宏观的影像特征与微观层面的影响治疗和预后的多种基因都存在显著关联,因此,宏观的影像组学特征具有预后预测的价值,这很好地解释了影像组学特征的生物学机制。

二、影像基因组学在肺癌中的研究

Grossmann等通过影像-基因组学研究实现了对肺癌的预后预测以及对CT影像特征的生物学解释。该研究首先从262例肺癌患者的CT影像中人工勾画出肿瘤区域,然后从肿瘤区域的CT影像提取了636维影像组学特征。对于基因测序数据,首先通过基因富集分析找出基因通路,然后通过双向聚类寻找影像组学特征和基因通路之间的聚类关系和相关性。最终发现了13个基因模块,其中的210个影像组学特征与206个基因通路存在显著关联。不同的基因模块中包含了不同的影像组学特征以及与之关联的基因通路,其中一些基因模块表明,影像组学特征中的纹理熵、聚类特征以及强度变化特征与免疫系统相关的基因通路、P53通路、转化生长因子受体β(TGF-β)信号通路以及与细胞周期调节有关的基因通路存在显著相关性;另一些基因模块中则包含了与线粒体通路、转录、翻译和RNA调节机制相关的影像组学特征。

此外,Wang等也利用影像-基因组学方法解释了与肺癌靶向治疗相关的影像组学特征和微观基因通路之间的关联。该研究提出了全肺分析的深度学习算法,在无须人工辅助勾画图像的情况下,通过全自动的深度学习算法对全肺的CT影像进行特征提取和建模分析,实现了对肺癌 EGFR 基因突变的预测。在全肺深度学习模型中包含了768维从全肺CT影像中提取的深度学习特征,该研究从中筛选出了29个可以预测肺癌EGFR靶向治疗无进展生存期的预后特征。在TCIA数据集87例有CT影像和RNA测序数据的患者中,首先利用全肺深度学习模型对每个患者提取了29个具有预后预测价值的影像特征;然后通过基因富集分析找出与影像特征存在显著关联的基因通路;最终发现有4个影像特征与4个基因通路存在显著关联。例如,其中2个影像特征与ERBB和P53信号通路存在相关性,而这2个信号通路均与靶向治疗的耐药机制相关;另外2个影像特征分别与细胞黏附分子通路、细胞外基质(ECM)受体相互作用通路存在强相关性,而这2个基因通路与癌症转移机制相关。这表明,从全肺提取的影像特征之所以具有预后预测价值,是因为这些影像特征可以反映微观层面与靶向治疗耐药和癌症转移等机制相关的信息。

影像-基因多组学研究是对人工智能模型和影像特征进行可解释性研究的重要手段。目前已有越来越多的研究在构建影像组学等人工智能预测模型后,通过结合基因信息对影像特征和人工智能模型进行生物学机制的可解释性研究,有望让临床医生更好地理解人工智能模型所提取的高维影像特征的生物学和临床意义。

(王硕 唐振超 何秉羲) 0avTsLZfvsDcom2vgQFubzGVr1TuXe5YQtVpbnyZ3o988psWDgICGKVeSNQnEYnp

点击中间区域
呼出菜单
上一章
目录
下一章
×