与之前的转录组分析技术相比,RNA-seq技术以更快速、更简便、更稳定以及高效的方法分析和研究在某一特定时间或空间下细胞或组织中特定种类RNA的表达谱以及全部转录物的表达信息,从而更准确地获得细胞和组织在不同发育阶段,正常和病理状态下以及药物处理下的基因转录模式和差异的信息。同时,还可以通过已经建立的各种生物学信息网络软件,分析获得不同转录基因之间的表达网络关系,为阐明新的基因表达模式以及作用机制提供全面深入的数据信息。
在特定的细胞或组织分化发育阶段,细胞中的某种基因可能受细胞外微环境因子或细胞内调控分子的作用,其mRNA或ncRNA前体通过不同的剪接方式产生不同的mRNA剪接异构体或ncRNA。这种可变剪接是调节基因表达和产生蛋白质组多样性的重要机制,是导致人类基因和蛋白质数量较大差异的重要原因。与基因芯片技术相比,RNA-seq灵敏度高且检测范围广,因此通过RNA-seq检测,可以发现基因芯片技术探测不到的低丰度表达RNA或新种类RNA,以及等位基因特异的基因表达。
ncRNA虽然不能翻译成蛋白质,但其在细胞增殖、分裂、分化、迁移以及凋亡等生物学过程,以及在病理条件下发挥极其重要的生物学作用。因此通过ncRNA和全转录组高通量分析,结合生物信息,可以为研究ncRNA的作用机制以及病理现象的阐明提供关键的线索。
细胞异质性是生物组织的普遍特征,大体可分为正常组织细胞异质性和肿瘤细胞异质性,体现在基因表达谱上和细胞功能上的差异。通过分离纯化单细胞进行scRNA-seq,可以克服传统转录组高通量测序的弊端,为深入研究细胞异质性在组织和个体发育、病理变化中的作用以及为肿瘤的侵袭性、转移性和耐药性的作用,提供关键的转录组数据。
干细胞是组织中少量存在的、具有自我更新和分化潜能的特殊细胞。大体可分为正常组织干细胞和肿瘤干细胞。干细胞在特定组织的发育形成、组织更新和修复以及肿瘤形成、侵袭和耐药复发中起核心作用。因此分离纯化干细胞进行scRNA-seq,对研究组织的发育、损伤的再生修复以及肿瘤的细胞学和病理特征具有极其重要的科学意义和应用价值。
基因通过转录和翻译的过程,控制蛋白质的合成。所有生物现象中,基因和RNA的最终生物学功能要通过蛋白质来体现,同时,蛋白质表达谱的改变也能逆向影响基因和RNA表达谱的改变。可以说,基因、RNA和蛋白之间存在错综复杂的相互作用关系。RNA-seq对于揭示转录组复杂性、确定基因以及转录物结构、可变剪接、ncRNA和新转录物的作用非常强大。单纯转录组高通量分析面临的问题是,通过大数据筛查和生物信息学分析,虽然能够获得差异表达的RNA以及这些RNA调控的蛋白和信号通路相关的信息,但只能以此推测相关的作用机制及生物学信息。在转录组分析基础上,需要更深入研究的是:这些转录组表达发生差异是否由基因组基因序列或表观修饰发生改变引起;这些差异表达的RNA是否通过改变相关蛋白质表达以及信号通路发挥生理和病理学作用。
一切生物学和病理学现象的发生,涉及众多基因、RNA和蛋白质之间相互横向、纵向交叉的复杂的作用网络。应用传统的定量反转录PCR(reverse transcription-quantitative polymerase chain reaction,RT-qPCR)和蛋白质印记等方法验证,只能解答部分RNA和基因以及RNA和蛋白质之间的关系,不能给出全面的基因与RNA及RNA和蛋白质的作用关系而忽略全局,可能错失很多重要的信息,不利于发现和解决问题。高通量结构基因组学、功能基因组学和表观基因组学以及质谱为基础的高通量蛋白质组学技术的发展,弥补了这些问题,可以从整体、宏观和多角度分析、发现和解决问题。比如,将高通量转录组分析中获得的转录物映射回基因组数据中,确定转录物位置、剪切情况等更为全面的遗传信息,已广泛应用于生物学研究、医学研究、临床研究和药物研发。在同一批病理学样本上进行以基因组学和转录组学、转录组学和蛋白质组学或三种组合联合分析,将是高通量分析的必然趋势,对研究发现新的疾病病理学过程及其发病机制有重要的意义。