弓形虫需要在不同宿主中繁殖,并随宿主更换而发生阶段转换。这就决定了虫体必须要在不同生活阶段表达不同蛋白,以应对这种复杂的生活方式。在弓形虫中,2%~5%的编码基因被认为具有期特异性,仅在特定的发育阶段表达。此外,在虫体增殖过程中,还有一大部分基因会依序表达。这其中,有近40%的mRNA会循环表达,以达到在特定时间向子代虫体运送蛋白的目的。
弓形虫的细胞周期分为G1、S与M三个阶段,而G2期明显缺失,这一周期是细胞核分裂与新细胞器形成、并同步包装进入子代虫体中的高度协调过程(图4-2)。在弓形虫期转换过程中,棒状体和微线体这两个顶复门寄生虫所特有的细胞器会分泌一些重要的蛋白分子参与虫体入侵、胞内感染和调控宿主细胞蛋白表达等。这就决定了,在虫体的寄生过程中,这两个细胞器必须在短时间内进行转录和翻译调控,才能完成从头合成到包装入子代虫体这一过程。目前研究证实,大多数棒状体和微线体蛋白的mRNA在S期和M期(对应于细胞器从头合成的时期)的确有一个表达高峰。这一发现表明,弓形虫可能已经适应了一种“恰到好处”的表达方式,即mRNA转录和蛋白翻译会在虫体需要它们的时候才产生。
生物体可以从多个方面控制基因表达,其中包括染色质介导的修饰、转录和转录后调节以及翻译后调节。目前已明确证实,在弓形虫的发育过程中,基于核心启动子复合体的顺式作用元件-反式作用因子调节机制参与了ApiAP2转录因子家族成员的调控和染色质重构体。
顺式作用元件(cis-acting element)是存在于基因旁侧并参与调控基因表达的特殊DNA序列,按功能特性可分为启动子、增强子、沉默子以及其他可诱导元件等。顺式作用元件本身不编码任何蛋白质,仅仅提供一个反式作用因子结合位点,通过与反式作用因子相互作用而发挥功能。在单细胞真核生物(如酿酒酵母)中,启动子结构由位于转录起始附近的核心启动子和含有序列特异性转录因子结合位点的上游激活子序列组成。而在更高等的真核生物中,还包括了增强子、沉默子等顺式作用元件,可对基因表达进行更精准的调控。
图4-2 弓形虫细胞周期各阶段基因表达示意图
关于弓形虫如何进行基因调控目前还知之甚少。对少数特异性基因研究结果提示:弓形虫基因组中存在双重启动子结构的非经典顺式作用元件,这些元件可在下游基因表达中发挥作用。对全基因组序列分析发现,基因组中编码的已知专性转录因子很少,但在研究速殖子和缓殖子转换过程中的发育信号及不同时期优势基因表达的过程中,在期特异性表达基因的启动子区域存在顺式作用元件。因此,研究人员利用生物信息学分析对参与弓形虫糖酵解途径、核酸生物合成与补救途径的蛋白编码基因以及微线体、核糖体蛋白编码基因进行检索,共发现了8个潜在的顺式作用元件:GLYCA、GLYCB、NTBA、NTBB、MICA、MICB、RPA、RPB。其对应的序列分别为:GCTKCMTY、TGCASTNT、GCAAAMGRA、TTTYTCGC、GCGTCDCW、SMTGCAGY、CGGCTTATATTCG、YGCATGCR。通过点突变实验证实,除RPA还有待进一步确认,其余7个顺式作用元件均参与启动子活性调控。其中NTBA与NTBB可抑制启动子活性基因表达,而GLYCA、GLYCB、MICA、MICB与RPB则可增强启动子活性。对上述顺式作用元件在基因组中的位置进行判别,发现编码基因上游区域出现频率最高的是RPB,其余依次为NTBB、MICA、NTBA、GLYCB。而GLYCA与RPA在基因编码区与编码区的上游区域出现的频率相当(Mullapudi等,2009)。
反式作用因子(trans-acting factor)是参与调控基因转录效率的蛋白调节因子,包含DNA结合结构域和转录活化结构域两个重要的功能结构域,是其发挥转录调控功能的必需结构,可以通过直接或间接识别或者结合顺式作用元件的核心序列调控基因表达。根据反式作用因子的功能主要分为转录因子和转录调节因子两类。前者可通过识别启动子元件启动基因转录,而后者则通过识别增强子或沉默子调节基因转录的效率。介导转录调控的转录因子可以是参与基因特异性调控的序列特异性DNA结合蛋白,也可以是转录启动所需的RNA聚合酶Ⅱ组分等,其中的一些成分目前已在弓形虫体内被陆续发现并证实。
通过对顶复门寄生原虫的DNA结合域进行生物信息学搜索,发现一个与植物转录因子Apetala2同源的蛋白质家族,即Apicomplexan AP2样因子(ApiAP2)。APiAP2是顶复门原虫中一个保守的转录因子家族,该家族蛋白均包含一个或多个AP2 DNA结合域,在调控基因表达中具有重要作用。目前在弓形虫基因组中注释有68个潜在的AP2转录因子,而有24个ApiAP2转录因子会在速殖子-缓殖子转换过程中的不同时期呈现出不同的表达差异,提示它们可在虫体细胞周期的特定时间调控基因表达(Behnke等,2010)。
在高温(40℃)诱导缓殖子形成的过程中,核因子Cactin可发生突变,从而将增殖周期阻滞在G1期。针对该条件下诱导的虫体进行转录组分析,发现TgAP2Ⅹ-7、TgAP2Ⅶa-6、TgAP2Ⅻ-4和TgAP2Ⅷ-4在缓殖子期特异性上调,提示这4个ApiAP2转录因子可抑制细胞周期进入S期(Szatanek等,2012)。而TgAP2Ⅺ-5被证实可在速殖子整个细胞周期表达,并通过与靶基因的回文序列“GCTAGC”结合,在S/M期参与毒力基因(如棒状体和微线体)的表达调控。然而,有趣的是,TgAP2Ⅺ-5自身的转录本和蛋白表达谱在速殖子细胞周期中并没有明显变化,而是必须与另一个ApiAP2转录因子,亦即TgAP2Ⅹ-5结合,在后者辅助下,才能结合至其调控的靶基因启动子区域。TgAP2Ⅹ-5是S/M期最常见的一个转录因子,可调控多个在S/M期高表达的毒力基因(如棒状体和微线体)表达。敲除TgAP2X-5虽不会影响虫体增殖,但会在一定程度上影响虫株的入侵能力(Lesage等,2018)。然而,TgAP2Ⅹ-5是否可以直接与靶基因的启动子区结合,还是两个转录因子以异源二聚体形式结合至靶基因启动子区,目前尚不清楚。
与恶性疟原虫相似,TgApiAP2也可与染色质相关因子相互作用。例如,4个TgApiAP2转录因子(TgAP2Ⅸ-7、TgAP2Ⅹ-8、TgAP2Ⅺ-2和TgAP2Ⅻ-4)可以与组蛋白乙酰转移酶TgGCN5-B共沉淀(Wang等,2014),但目前尚不清楚这种相互作用具有何种生物学功能。
碱性诱导是调控速殖子向缓殖子转换的另一种常用策略,基于该策略,已鉴定出几种具有激活和抑制该转换过程的TgApiAP2转录因子。例如:TgAP2Ⅸ-9被诱导与靶基因的“CAGTGT”基序结合。敲除TgAP2Ⅸ-9会促进组织包囊的形成,而过表达TgAP2Ⅸ-9则可抑制包囊形成,表明TgAP2Ⅸ-9可抑制缓殖子基因的表达(Hong等,2017;Radke等,2013)。同时,TgAP2Ⅳ-4也被证实可参与抑制缓殖子基因表达,TgAP2Ⅳ-4在速殖子晚期表达,敲除该基因虽不会影响速殖子的增殖,却会导致速殖子虫体中缓殖子期特异性基因的表达(Radke等,2018)。与上述两个转录因子不同,转录因子TgAP2Ⅸ-4若被敲除,可减少组织包囊的形成,表明该转录因子具有促进缓殖子转换的作用。TgAP2Ⅸ-4主要在速殖子和早期缓殖子中动态表达,依据转录组学结果推测,TgAP2Ⅸ-4可能在缓殖子形成的早期通过抑制缓殖子期特异性基因发挥作用(Huang等,2017)。
当TgAP2Ⅸ-9表达达到高峰后,TgAP2Ⅳ-3的表达开始上调,这可能是对缓殖子基因表达调控的一种竞争机制,可诱导缓殖子相关基因表达(Hong等,2017;Radke等,2013)。而在缓殖子发育后期,则由TgAP2Ⅺ-4替代TgAP2IX-9的功能以诱导缓殖子的形成。在碱诱导条件下,TgAP2Ⅺ-4与缓殖子发育和包囊形成有关,因为该基因敲除不影响速殖子的生长,但可以抑制包囊的形成。“CACACAC”基序是TgAP2Ⅺ-4的一个可能的结合位点,而两个锌指蛋白(TGME49_048330和TGME49_062970)可能是TgAP2Ⅺ-4调控的靶基因(Walker等,2013)。
综上所述,目前研究已证实,在弓形虫不同生活时期,TgApiAP2转录因子都在调控基因表达中发挥着激活或抑制的重要作用。而它们与染色质结合蛋白的相互作用表明它们发挥调节功能的机制之一是将染色质修饰复合物招募至靶基因启动子。然而,即便如此,仍有许多问题亟待解决,例如:TgApiAP2转录因子如何指导转录?如何促进染色质重塑?如何通过相互作用来实现转录调控?翻译后修饰如何调节其功能?此外,由于TgApiAP2转录因子在弓形虫增殖及虫体分化中的重要性,加之在人类缺乏同源基因,使其成为非常有吸引力的药物靶点。例如:以TgAP2Ⅺ-3为靶点的磷二酸酯吗啉低聚物可特异性干扰其基因表达,并显著抑制体内外弓形虫的增殖(Lai等,2012)。因此,进一步深入阐明ApiAP2转录因子在弓形虫增殖、分化中的调控功能将为抗弓形虫病药物研发提供更多的理论依据。
烯醇化酶(enolase,ENO),又称2磷酸-D-甘油酸水解酶,是一种糖酵解的、金属激活的金属酶,属于烯醇化酶超家族。在糖酵解和糖异生过程中,该酶可逆性催化依赖于Mg 2+ 的2-磷酸-D-甘油酸酯脱水生成磷酸烯醇式丙酮酸。该酶十分保守,单体的分子量大小为45~48kD,但主要以二聚体的形式发挥生物学活性。
在酵母细胞中,ENO被证实与热休克蛋白HSP48一样,参与酵母的耐热性与生长调控。在弓形虫体内可差异表达两种植物样烯醇化酶:TgENO1和TgENO2。两者均由单拷贝基因编码,其氨基酸序列具有73.65%的同源性,但两者却具有不同的酶活性与抗原性。其中,TgENO1为缓殖子期特异性蛋白,而TgENO2则主要在速殖子期表达(Mouveaux等,2014)。
在哺乳动物细胞中,部分ENO蛋白已被证明具有转录因子的功能,可以抑制 c - myc 基因启动子的表达。而在没有 c - myc 同源物的拟南芥中,一个具有双重功能的ENO可通过与编码锌指蛋白STZ/ZAT10的基因启动子结合,调控冷反应基因的转录。对弓形虫TgENO的研究中,无论是速殖子期还是缓殖子期,虽然在成熟期虫体内定位于胞浆中,但在胞内增殖和发育早期,两个ENO蛋白均表现出很强的核定位倾向。进一步研究证实,这两个TgENO蛋白是弓形虫胞内增殖过程中调控基因表达的重要核因子,两者可通过结合至靶基因的启动子区来调控基因表达。ChIP-Seq结果进一步表明,两个TgENO蛋白可以与241个基因(占弓形虫总基因数的3%)中的潜在启动子区结合(Mouveaux等,2014)。
然而,值得注意的是,无论是在动物细胞还是植物细胞中,ENO蛋白必需与靶基因启动子区域的TATA基序结合才能转录调控。但通过对弓形虫的全基因组测序结果分析,并未在任何基因的启动子区域中发现有功能性的TATA和CCAAT盒。尽管有研究人员提出弓形虫基因启动子区的“TTTTCT”基序可能是ENO蛋白的结合区,但ENO蛋白在弓形虫基因转录调控中的详细机制仍有待进一步阐明,例如:①两个ENO蛋白序列中均没有核定位信号,也未发现有伴侣蛋白促进其入核,那么两个蛋白是如何入核发挥调控作用的?②调控ENO在胞浆与核内穿梭定位的机制是什么?
如前所述,一系列调节虫体分化的ApiAP2转录因子已经被发现和证实,但迄今为止尚无一个ApiAP2转录因子被证实能够完全独立地调控虫体分化。因此,人们普遍认为,虫体分化涉及多个转录因子的协同作用,而并非由某一个占绝对主导地位的转录因子所调控。然而,近期一项研究发现,在弓形虫体内存在一个主调控转录因子,即TGME49_200385,命名为缓殖子形成缺陷因子1(bradyzoiteformation deficient1,BFD1)(Waldman等,2020)。
研究者利用CRISPR/Cas9筛选与单细胞RNA测序结合对碱性诱导前、后的ME49虫株速殖子和缓殖子进行差异比较,发现只有BFD1基因的表达在缓殖子期完全消失。BFD1全长2 415个氨基酸残基,包含两个串联的、较保守的SANT/Myb样DNA结合结构域。BFD1基因特异性敲除后,ME49成囊株无论是在体外碱性诱导条件下,还是在慢性感染的小鼠体内,都完全丧失了分化成囊的能力。与之相反,组成性稳定表达BFD1蛋白的转基因虫株即便在非诱导条件下也表现出了高水平的自发成囊能力。进一步研究发现,在诱导分化期间,BFD1可与许多缓殖子期特异性基因的启动子区域以及AP2IX-9启动子结合。这表明BFD1是调控缓殖子分化成囊所必需的转录因子;单一的BFD1转录因子就足够发挥转录调控功能。
确定“BFD1是缓殖子分化的主调节因子”有几个重要的意义。例如,该研究颠覆了之前“调控弓形虫速殖子-缓殖子转换是多个转录因子协同作用”的观点,取而代之的是“在缓殖子分化过程中存在一个主转录调控程序”。基于这一观点,研究者认为那些并不受BFD1表达影响、却在碱诱导条件下上调的基因可能只是碱性诱导所致,而并非缓殖子期特异性基因。此外,BFD1的发现可能对弓形虫病防治具有重要意义。由于BFD1缺陷株无法成囊,这使得它有望成为一种具有潜在应用前景的减毒活疫苗候选者,因为理论上讲,它既可以诱导宿主产生免疫应答,又不能在宿主体内长期存活。当然,如何使BFD1缺陷株在体内不对宿主产生临床致病是研发减毒活疫苗必须解决的问题。
但有关BFD1调控成囊,仍有些问题尚待解决:
(1)BFD1敲除不影响速殖子的繁殖:虽然BFD1敲除株虫体内无法成囊,但目前尚不清楚这种缺失是由于虫体到达脑组织后未能成囊,还是这些虫体无法到达大脑。若是后者,则表明BFD1可能在体内虫体播散或速殖子繁殖中发挥作用。进一步研究发现,敲除BFD1后并不影响速殖子的分裂增殖。在急性感染小鼠体内,BFD1敲除株与野生株毒力并无区别。
(2)虫体感知宿主细胞的压力:已知BFD1在缓殖子转化中发挥主要作用,但仍不了解弓形虫如何感知宿主细胞压力,以及随后启动BFD1的表达。研究发现,BFD1的mRNA水平在虫体不同阶段保持不变,但BFD1蛋白水平却在碱性诱导条件下增加,表明翻译后调控可能在从虫体感受刺激到启动BFD1依赖的分化过程中发挥作用。
(3)虽然BFD1可能是主调控因子,但考虑到在诱导分化期间,BFD1可与许多ApiAP2的启动子区域结合,提示BFD1和ApiAP2之前可能存在一定程度的协同作用。但如何分工协作来精确调控虫体仍不清楚。
综上所述,涉及BFD1的未来工作应包括阐明速殖子-缓殖子转换的主转录调控程序;识别体内驱动转化的分子机制;以及研发安全、有效的人/畜用弓形虫疫苗。
RNA聚合酶Ⅱ(RNA polymerase Ⅱ,RNAPⅡ)是一个存在于真核生物细胞中的酶,可催化RNA转录,从而合成mRNA及大多数非编码RNA(如hnRNA和microRNA)的前体。涉及RNAPⅡ的基因表达调控可发生在特定mRNA转录的不同阶段,如启动前、启动、启动子清除、延伸、RNA加工和终止等。
RPB1是RNAPⅡ分子中的最大亚基,其羧基末端结构域(carboxy terminal domain,CTD)是这一过程中的一个关键调控元件。RPB1-CTD由典型的“YSPTSPS”七肽重复序列组成,由一系列细胞周期蛋白依赖性激酶(cyclin-dependent kinase,CDK)对该序列中的丝氨酸(Ser)残基依次磷酸化是转录调控的中心。随着转录的进行,RPB1-CTD的功能性七肽(主要是Ser5和Ser2残基)会在转录周期的特定阶段被特定的CDK磷酸化。其中,CDK7主要介导Ser5磷酸化,该磷酸化事件通常发生在转录周期的早期,可调控转录启动和启动子清除,并在磷酸化同时伴随mRNA加帽;而Ser2磷酸化则主要由CDK9介导,该磷酸化可促进RNAPⅡ介导的转录延伸,当CDK9对靶基因启动子近端的Ser2磷酸化时,可将RNAPⅡ从转录起始复合物中释放出来。此外,为了促进转录终止因子和RNA加工因子与mRNA的结合,越靠近3′端,Ser2磷酸化程度越高。
弓形虫RPB1(TgRPB1)-CTD(1631-1847aa)中包含9个假定的“YSPxSPx”七肽序列(其中x可以是任何氨基酸),虽然与经典的“YSPTSPS”序列不完全一致,但Ser2和Ser5残基却有明显的保守性(Deshmukh等,2016)。弓形虫基因组中包括多个CDK相关激酶(CDK-related kinase,CRK),均具有保守的激酶结构域和细胞周期蛋白结合序列。目前已初步证实,转录调控有关的弓形虫CRK(TgCRK)主要有2个:TgCRK7(Deshmukh等,2016)和TgCRK9(Deshmukh AS等,2018)。TgCRK7可通过对TgRPB1-CTD的Ser5磷酸化修饰参与调控转录起始和新生转录成熟过程。而TgCRK9被证实具有CTD激酶活性,其T-loop区的两个苏氨酸残基对激酶活性起关键作用。激活后的TgCRK9可对TgRPB1-CDT的Ser2进行磷酸化修饰,当利用特异性CTD激酶抑制剂(DRB与flavopiridol)抑制TgCRK9的酶活性后,多个基因(如 PCNA1 、 BiP 、 β - Tubulin 和 α - Tubulin )的3′端Ser2磷酸化程度减少,提示TgCRK9可能主要在转录延伸中起调控作用。
CDK属丝氨酸/苏氨酸蛋白激酶家族,其酶活性的激活需要与细胞周期蛋白(cyclin)结合并发生磷酸化。CDK的激活主要是由一个以CDK7为核心的主调控复合体完成的,被称为CDK活化激酶(CDK activating kinase,CAK)。哺乳动物的CAK除了催化亚基CDK7外,还包括一个调节亚单位CyclinH和一个环指蛋白组装因子(ménage a trios 1,MAT1),形成CDK7-CyclinH-Mat1复合物从而激活CDK7的激酶活性。而在介导转录延伸过程中,CDK9的CTD激酶活性需要通过与Cyclin T结合而被激活。弓形虫基因组中缺乏典型的Cyclin T同源物,但包含三个与潜在的与转录有关的TgCyclin:TgCycH、TgCycL和TgCycY。体外生化实验表明,TgCRK7的酶活性可在TgCycH的协同作用下被激活,从而参与调控转录启动。而TgCRK9的CTD激酶活性需要TgCycL存在的情况下被激活。然而有趣的是,TgCycL被证实还可与TgCRK1协同作用调控有丝分裂进程和胞质分裂,而TgCycH被证实还可以与TgCRK2相互作用,提示弓形虫中Cyclin-CDK配对的灵活性。
尽管目前已证实多个TgApiAP2转录因子对缓殖子的生存、包囊的形成具有十分重要的作用,但它们在弓形虫无性生殖阶段的作用仍不清楚。例如:在速殖子分裂的S/M期达到峰值的TgApiAP2因子中,近75%并非虫体增殖所必需的。相反,一些在细胞周期后期才出现高表达的TgApiAP2因子却又对虫体生长发育至关重要。解释这一矛盾的部分原因可能在转录起始的下游,比如mRNA的转录成熟修饰(mRNA剪接、加帽、polyA尾)与mRNA稳定(保护、降解)等。
近年来随着RNA深度测序技术的发展,已证实在弓形虫中存在大量的细胞周期mRNA级联,也确定了一些新的RNA,如:长链非编码RNA、反义RNA和大量的小RNA等。这为人们更全面理解虫体RNA调控提供了可能性,也有助于人们注释基因、确定替代的剪接位点、以及精确定位3′UTR和5′UTR末端。
通过对基因组重新组装分析,人们发现弓形虫中有75%的基因存在内含子(而隐孢子虫中仅5%的基因存在内含子)。弓形虫的内含子序列具有典型的5′GU-AG3′剪接接头,且在分支点有明显的核酸变异趋势(Fox等,2002)。同时,在弓形虫基因组中还发现了许多编码RNA结合蛋白的基因,例如:异质核糖核蛋白(hnRNP)和富含丝氨酸/精氨酸(SR)的蛋白家族。这些RNA结合蛋白在其他真核生物中已被证实可通过与增强子或沉默子序列结合来特异性调控剪接位点的识别,但在弓形虫体内的具体作用尚有待进一步证实。
在mRNA成熟过程中,需要由剪接体剔除pre-mRNA中的内含子序列。剪接体由五个主要的小核核糖核蛋白(snRNP)复合体组成:U1、U2、U4、U5和U6。通过生物信息学分析,在弓形虫中已发现这几个复合体蛋白的编码基因,并且还发现一个剪接体U2复合体的辅助蛋白U2AF65,但该蛋白仅在子孢子阶段表达(Suvorova等,2014)。
尽管如此,目前对这些剪接因子的功能以及调控机制仍然知之甚少。通过分析弓形虫细胞周期突变体,新确定了一种在速殖子G1期所必需的RNA结合蛋白RRM1(Suvorova等,2013)。当第169位酪氨酸残基突变为天门冬酰胺后,该蛋白在高温下变得不稳定,进而将细胞周期阻滞在G1期早期,并导致几乎所有包含内含子的基因出现错误剪接。有意思的是,这一现象在其他真核生物中没有观察到。研究证实弓形虫RRM1蛋白参与了U4/U6.U5复合体的形成,因此该蛋白的丢失可能是内含子剪接中断的原因。但目前仍然不清楚这是如何将速殖子阻滞在G1期的,因为虫体的整个细胞周期中,基因转录仍在活跃地发生。
在真核生物中,hnRNP和SR家族的RNA结合蛋白还积极参与了mRNA的可变剪接。其调控方式主要是这些蛋白通过与外显子和内含子调控序列的直接结合以增强或抑制剪接体组装来调控剪接。在弓形虫体内,目前认为主要是含RRM结构域家族(占总基因的1%)的蛋白来行使这种功能,因为含该结构域的蛋白多为保守的hnRNP和SR家族蛋白。当然,目前对这些蛋白的研究仍十分有限。
目前,人们对于弓形虫基因表达调控机制研究仍然处于早期阶段。已经确定的是稳态mRNA水平在调控蛋白表达的程度和时机方面的作用,但在虫体生长发育过程中mRNA水平变化的调控机制仍有许多问题亟待解决。之前的研究主要聚焦于启动子和发育基因的调控表达,而研究切入点都是从对ApiAP2转录因子和染色质重构体入手的。因此,目前仍有高达50%的基因表达并不清楚是如何维持组成性mRNA的,也不清楚在复制阶段虫体是怎样快速产生动态循环的mRNA。对弓形虫基因组进行生物信息学分析,发现存在大量的反义RNA和microRNAs,提示RNA转录后调控机制对虫体的基因表达有重要影响,但具体作用机制仍有待进一步阐明。同时,RNA的加工、降解和利用(翻译)对虫体蛋白表达的影响仍然知之甚少,未来对基因表达的研究也应更多地关注转录起始下游的机制。