2002年,英国科学家Cohen等首次运用二维电泳对弓形虫速殖子的蛋白质组进行了研究,他们首先运用高分辨率二维电泳在pH 4~7和6~11之间分离出1 000多条多肽,而后,又运用窄谱二维电泳在多个单pH单位凝胶中共分离出3 000多条多肽,许多在二维电泳胶上的蛋白质斑点都能够被质谱成功鉴定出。基质辅助激光解吸/电离质谱(MALDI-MS)获取的肽质量指纹图谱结果表明:运用基因序列信息鉴定蛋白质的方法可靠性高于运用表达序列标签鉴定蛋白质的方法。该研究中的数个蛋白质斑点被发现由同一个基因编码,这提示弓形虫功能基因的表达也存在可变剪接和翻译后修饰。2013年,我国学者首次报道了不同基因型弓形虫速殖子的比较蛋白质组学研究,运用二维荧光差异电泳结合质谱技术对Ⅰ型(GT1株)、Ⅱ型(PTG株)和Ⅲ型(CTG株)弓形虫速殖子的蛋白质组进行了比较研究,共计鉴定出2 321个蛋白质斑点。Ⅰ型(GT1株)和Ⅱ型(PTG株)弓形虫速殖子显示出高度相似的蛋白质图谱,而Ⅲ型(CTG株)弓形虫速殖子的蛋白质图谱则与Ⅰ型(GT1株)和Ⅱ型(PTG株)弓形虫速殖子的蛋白质图谱明显不同。84个蛋白质斑点差异表达1.5倍以上,其中7个蛋白被成功注释到当时的弓形虫数据库。2014年,Zhou等应用二维电泳结合基质辅助激光解吸电离飞行时间质谱技术(MALDI-TOF-MS),对Ⅰ型(RH株)、Ⅱ型(PRU株,Tg-QHO株)和中国Ⅰ型(TgC7株)四个虫株速殖子的蛋白质组进行了比较研究,共筛选出110个差异显著的蛋白质斑点。其中,98个蛋白质斑点对应于弓形虫数据库中的56个蛋白,例如表面抗原1(SAG1)、热休克蛋白70(HSP70)、二硫异构酶、冠蛋白、热休克蛋白60(HSP60)、丙酮酸激酶、活化C激酶受体1和过氧化物氧还酶等。基因本体(gene ontology,GO)富集分析表明,大多数差异蛋白参与生物调控、代谢过程、应激反应、结合、抗氧化活性和转运过程。通路富集分析结果提示,一些差异蛋白参与糖酵解/糖异生通路(Zhou等,2014)。
蛋白质翻译后修饰是蛋白质发挥功能的重要基础,丙二酰化修饰是近年来新发现的一种蛋白质翻译后修饰方式,它广泛存在于原核生物和真核生物中。2020年,Nie等报道了弓形虫速殖子丙二酰化修饰蛋白质组的研究成果,他们运用丙二酰化特异性抗体亲和富集结合液相色谱-质谱联用技术,对RH虫株速殖子丙二酰化修饰蛋白质组进行了定性研究。RH虫株速殖子丙二酰化修饰蛋白质组三个生物学重复中分别鉴定出294个、345个、352个丙二酰化修饰位点和203个、236个、230个丙二酰化修饰蛋白,其中138个丙二酰化修饰蛋白在三个生物学重复中同时存在。在该研究中,鉴定出的丙二酰化修饰位点总数为506个,丙二酰化修饰蛋白总数为326个。其中,73%的丙二酰化修饰蛋白只有一个丙二酰化修饰位点,14%的丙二酰化修饰蛋白含有两个丙二酰化修饰位点,而13%的丙二酰化修饰蛋白质含有的丙二酰化修饰位点数目大于两个。基序分析结果揭示:弓形虫RH虫株速殖子丙二酰化修饰蛋白质组中的保守基序为xxxxxxCxxxKxxxxxxxxxx。对RH虫株速殖子丙二酰化修饰蛋白质进行GO分析,结果显示丙二酰化修饰蛋白质定位于速殖子的各个区域;通路富集分析结果显示,丙二酰化修饰蛋白质显著富集于糖酵解/糖异生、固碳作用、氨基酰-tRNA合成和抗生素生物合成。丙二酰化修饰蛋白质相互作用网络结果显示,糖酵解/糖异生、核糖体、蛋白酶体、氨基酰-tRNA合成过程是丙二酰化修饰蛋白质相互作用最紧密的四个蛋白质亚网络,这与通路富集分析的结果基本一致(Nie等,2020)。
2019年,有学者报道了弓形虫包囊/缓殖子的定性蛋白质组学研究成果。他们对小鼠感染弓形虫ME49虫株后21天至150天脑组织包囊的缓殖子蛋白质组进行了定性研究,从感染后第21天脑组织包囊缓殖子蛋白质组中鉴定出462条肽段,从感染后28天脑组织包囊的缓殖子蛋白质组中鉴定出8 163条肽段,这些肽段被注释到1 683个弓形虫蛋白质,感染后第21天脑组织包囊中鉴定到的肽段数量少的原因可能是包囊未完全发育成熟所致。在此基础上,他们选择小鼠感染后第28天、第90天和第120天的脑组织包囊缓殖子,分别完成了两个生物学重复的蛋白质组定性研究,结果显示:从感染后第28天脑组织包囊缓殖子中鉴定出6 528条肽段,感染后第90天脑组织包囊缓殖子中鉴定出3 617条肽段,感染后第120天脑组织包囊缓殖子中鉴定出3 486条肽段,其中2 040条肽段在感染后第28天、90天和120天三个时间点被同时鉴定出。蛋白质鉴定结果为:感染后第28天为870个弓形虫蛋白,感染后第90天为504个弓形虫蛋白,感染后第120天为502个弓形虫蛋白,总共鉴定出893个弓形虫蛋白,其中366个蛋白在感染后第28天、90天和120天三个时间点被同时鉴定出(Garfoot等,2019)。有学者应用Percoll密度梯度离心法分离纯化弓形虫PRU虫株包囊,然后用CST1抗体进行免疫沉淀富集包囊壁,并应用液相色谱-串联质谱对包囊壁蛋白质组进行定性鉴定。结果不仅鉴定出一系列已知的包囊壁蛋白质,例如CST1、BPK1、MCP4、MAG1、GRA2、GRA3和GRA5,而且发现数个新的定位于包囊壁的蛋白质,它们都是功能未知的致密颗粒蛋白。他们还运用基因敲除技术研究了CST2和CST3两个包囊壁蛋白的功能,其中CST2敲除的PRU虫株毒力显著降低,且未能在小鼠体内形成包囊。该研究新发现的数个包囊壁蛋白可能在弓形虫与宿主相互作用时发挥作用。
弓形虫卵囊能抵御外界恶劣的理化环境,在弓形虫病流行中起到决定性的作用。卵囊是弓形虫在猫科动物小肠上皮细胞内经过有性生殖产生的。卵囊在刚生成后呈未孢子化状态且对宿主没有感染性。未孢子化卵囊随粪便排出体外后,会在适宜条件下进行需氧孢子化(aerobic sporulation)。卵囊在孢子化的过程中会经历未孢子化阶段(unsporulated),孢子母细胞阶段(sporoblast-stage)及完全孢子化阶段(fully sporulated)。未孢子化卵囊近似圆形,大小为10μm×12μm,囊壁分为两层,母孢子(sporont)充斥于整个卵囊。孢子化卵囊呈椭圆形,大小为11μm×13μm。成熟卵囊含有两个椭圆形的孢子囊(sporocyst),大小为6μm×8μm。每个孢子囊内含4个新月形的子孢子(sporozoite),大小为2μm×(6~8)μm,相互交错。相对于弓形虫的其他时期,对卵囊在蛋白水平的研究要少得多。直到20世纪80年代中期,Kasper等才通过血清学及生物化学的方法证实卵囊阶段特异性蛋白的存在。后来研究人员发现卵囊的子孢子与速殖子存在很多共有的表面蛋白,但也存在很多不同的蛋白。比如,子孢子表面抗原蛋白SRS28(sporoSAG)在速殖子表达后,虫体入侵能力得到显著提高。Possenti等通过分析弓形虫子孢子cDNA文库,发现七种富含半胱氨酸的囊壁蛋白(TgOWPs),其中TgOWP1~3三种蛋白只在卵囊中特异表达。后来Salman等通过检索EST数据库,又证实了TgOWP8~12的存在(Salman等,2017)。Hill等利用双向差异凝胶电泳技术发现了20多种子孢子特有蛋白,其中的TgERP蛋白能特异性区别卵囊源感染和其他途径引起的感染。随着高效液相分离技术和静电场轨道阱质谱技术的发展,以液相色谱串联质谱为代表的高通量蛋白质组学技术得到了广泛的应用。有人利用液相质谱的方法对弓形虫M4虫株的孢子化卵囊进行了蛋白质组学分析(Fritz等,2012),鉴定出1 031种蛋白,其中10种属于卵囊壁所特有。在鉴定到的孢子囊/子孢子蛋白中,包含10种表面抗原-1相关序列(surface antigen-1-related sequence,SRS)家族蛋白,分别是SRS28、SRS57、SRS51、SRS46、SRS29B、SRS27B、SRS52A、SRS34A、SRS42和SRS17B。该研究还鉴定到15种微线体蛋白,分别是MIC1、MIC2、M2AP(MIC2-associated protein)、MIC3、MIC4、MIC6、MIC7、MIC8、MIC10、MIC11、MIC12、MIC13、AMA1、AMA1-paralogue和一个新预测蛋白,其中MIC12和MIC13的丰度最高。此外,该研究还鉴定到19种棒状体蛋白及8种致密颗粒蛋白(GRA1、GRA2、GRA4、GRA5、GRA6、GRA7、GRA8和GRA14)。在卵囊壁中,含PAN结构域的蛋白(TGME49_035200)丰度最高。另外,同艾美耳球虫( Eimeria sp.)卵囊壁一样,弓形虫卵囊壁含有多种富含酪氨酸的蛋白(TGME49_116550、TGME49_081590、TGME49_087250、TGME49_037080、TGME49_120530和TGME49_119890),不过这些蛋白在孢子囊/子孢子中同样存在。有学者利用液相色谱技术对VEG虫株的卵囊(含60%成熟卵囊和40%未成熟卵囊)进行了蛋白质组学分析,经过三次生物学重复,共鉴定出1 615种蛋白,其中758种蛋白在三次重复中均可被鉴定出来(Possenti等,2013)。通过亚细胞定位分析,发现310种蛋白位于胞浆中,277种蛋白位于胞核中,180种蛋白位于线粒体中。很多鉴定到的蛋白还参与了蛋白分泌的过程,比如鉴定到的蛋白中包含184种胞外蛋白、131种质膜蛋白和47种顶复体蛋白。通过功能注释,该研究发现164种蛋白参与调控蛋白命运,140种蛋白参与代谢活动,101种蛋白参与蛋白合成,99种蛋白参与细胞拯救、防御及毒力,还有97种蛋白参与细胞转运。与之前Fritz等的研究比较后,有794种蛋白在这两次研究中都被鉴定出来。另外,与VEG速殖子蛋白质组相比较,有1 150种蛋白在这两个时期都存在,而154种蛋白是卵囊特有的蛋白。通过功能分析发现,在卵囊特有的蛋白中,28种参与代谢活动、17种参与细胞拯救、防御及毒力、12种参与能量产生、11种参与蛋白命运的调控。
随着定量蛋白质组学技术的不断发展,标记定量技术在弓形虫生活史不同发育期蛋白质组学和不同虫株速殖子蛋白质组学研究中显示出较大的优势。Wang等首次运用标记定量蛋白质组学技术研究了Ⅱ型弓形虫(PRU虫株)速殖子、未裂解包囊壁的包囊缓殖子、未裂解卵囊壁的孢子化卵囊子孢子三个不同发育期的比较蛋白质组。速殖子与未裂解卵囊壁的孢子化卵囊子孢子相比较,74个蛋白显著上调表达,801个蛋白显著下调表达;速殖子与包囊相比较,146个蛋白显著上调表达,510个蛋白显著下调表达;未裂解包囊壁的包囊缓殖子与未裂解卵囊壁的孢子化卵囊子孢子相比较,180个蛋白显著上调表达,358个蛋白显著下调表达。毒力因子表达量分析结果显示:速殖子与未裂解卵囊壁的孢子化卵囊子孢子相比较,3个毒力因子上调表达,20个毒力因子下调表达,未裂解包囊壁的包囊缓殖子与速殖子相比较,10个毒力因子显著上调表达,5个毒力因子显著下调表达;未裂解包囊壁的包囊缓殖子与未裂解卵囊壁的孢子化卵囊子孢子相比较,无毒力因子上调表达,11个毒力因子下调表达。核糖体蛋白表达量分析结果显示:速殖子与未裂解卵囊壁的孢子化卵囊子孢子相比较,无核糖体蛋白显著上调表达,33个核糖体蛋白质显著下调表达;未裂解包囊壁的包囊缓殖子与速殖子相比较,46个核糖体蛋白显著上调表达,没有核糖体蛋白质显著下调表达;未裂解包囊壁的包囊缓殖子与未裂解卵囊壁的孢子化卵囊子孢子相比较,6个核糖体蛋白显著上调表达,没有核糖体蛋白质显著下调表达。速殖子毒力因子和核糖体蛋白的表达量均显著低于未裂解包囊壁的包囊缓殖子和未裂解卵囊壁的孢子化卵囊子孢子(Wang等,2017)。
磷酸化修饰是蛋白质最常见和最广泛的翻译后修饰方式。2019年,有学者运用二氧化钛(TiO 2 )亲和层析富集结合iTRAQ定量蛋白质组学技术,报道了弓形虫不同基因型速殖子(Ⅰ型RH虫株、Ⅱ型PRU虫株、ToxoDB#9 PYS虫株)的比较定量磷酸化修饰蛋白质组学研究成果,共鉴定出1 441个磷酸化修饰肽段、1 250个磷酸化修饰位点和759个磷酸化修饰蛋白(Wang等,2019a)。RH虫株与PRU虫株相比,324个磷酸化修饰蛋白显著上调表达,68个磷酸化修饰蛋白显著下调表达,差异磷酸化修饰蛋白质包含三个保守基序(RxxS、SxxE和SxxxE);PRU虫株与PYS虫株相比,112个磷酸化修饰蛋白显著上调表达,186个磷酸化修饰蛋白显著下调表达,差异磷酸化修饰蛋白质也包含三个保守基序(RxxS,SxxE和SP);PYS虫株与RH虫株相比,174个磷酸化修饰蛋白显著上调表达,262个磷酸化修饰蛋白显著下调表达,差异磷酸化修饰蛋白质包含五个保守基序(SxxE、SP、SxE、LxRxxS和RxxS)。对这些差异磷酸化修饰蛋白的保守基序分析提示,一些激酶在这三个弓形虫虫株速殖子之间可能存在差异表达,例如蛋白激酶A(PKA)、蛋白激酶G(PKG)、酪蛋白激酶Ⅱ(CKⅡ)、NF-κB抑制蛋白激酶(IKK)和促分裂素原活化蛋白激酶(MAPK)等。激酶相关网络分析表明,棒状体蛋白5(ROP5)、棒状体蛋白16(ROP16)、细胞周期相关蛋白激酶(CDK)是弓形虫速殖子激酶互作网络中相关性最高的磷酸化修饰蛋白质。运用乙酰化抗体富集结合非标记定量蛋白质组学技术,对弓形虫不同基因型速殖子(Ⅰ型RH虫株、Ⅱ型PRU虫株、ToxoDB#9型PYS虫株)的乙酰化修饰蛋白质组学进行研究(Wang等,2019b),结果发现,RH虫株速殖子蛋白质组的乙酰化修饰程度最高(458个乙酰化修饰蛋白),其次是PYS虫株速殖子蛋白质组(188个乙酰化蛋白),而PRU虫株速殖子蛋白质组的乙酰化修饰程度最低(115个乙酰化蛋白)。基序分析揭示了三个虫株弓形虫速殖子乙酰化蛋白质的保守基序数量,RH虫株速殖子和PYS虫株速殖子均包含四个保守基序,而PRU虫株速殖子包含三个保守基序。两个模序(xxxxx KAcH xxxx和xxxxx KAcF xxxx)在这三个虫株中显著富集,而包含天冬酰胺的基序(xxxxx KAcN xxxx)只在RH虫株速殖子和PYS虫株速殖子中显著富集,在PRU虫株速殖子中不显著富集。对三个虫株速殖子共表达的乙酰化修饰蛋白质进行非标记定量比较,结果显示,RH虫株与PYS虫株相比,2个乙酰化蛋白显著上调表达,24个乙酰化修饰蛋白显著下调表达;PYS虫株与PRU虫株相比,2个乙酰化修饰蛋白显著上调表达,仅1个乙酰化修饰蛋白显著下调表达;PRU虫株与RH虫株相比,5个乙酰化修饰蛋白显著上调表达,10个乙酰化修饰蛋白显著下调表达。组蛋白乙酰转移酶和糖基-tRNA合成酶在RH虫株速殖子的表达水平高于PRU虫株速殖子和PYS虫株速殖子;这两种酶都在弓形虫的毒力、增殖和外界应激中发挥作用(Wang等,2019)。
2019年,Yin等绘制了弓形虫Ⅰ型(RH虫株)和Ⅱ型(ME49虫株)速殖子赖氨酸巴豆酰化和2-羟基异丁酰化两种修饰蛋白质组图谱,从定性和定量角度全面阐述了两种不同基因型弓形虫速殖子蛋白质的赖氨酸巴豆酰化和2-羟基异丁酰化修饰的特征。在两个虫株速殖子中,共鉴定到7 131个赖氨酸巴豆酰化修饰位点和17 594个赖氨酸2-羟基异丁酰化修饰位点,分别对应2 045个和3 670个弓形虫蛋白。亚细胞定位分析显示差异蛋白质大部分位于除质膜以外的亚细胞结构上,同源蛋白簇(KOG)分析显示两个虫株的赖氨酸巴豆酰化和2-羟基异丁酰化修饰差异蛋白质主要集中于核糖体结构、蛋白质合成、蛋白质翻译后修饰以及分子伴侣等类别。通路富集分析结果显示,差异修饰蛋白质主要富集于细胞质和核糖体通路,可能参与调节tRNA氨酰化、化合物代谢和生物合成过程。他们对比了两个虫株速殖子中特异的2-羟基异丁酰化修饰蛋白质,发现RH虫株速殖子特异的2-羟基异丁酰化修饰蛋白质参与脂肪酸降解和过氧化物酶体的形成,而ME49虫株速殖子特异的2-羟基异丁酰化修饰蛋白质更多地参与碳固定通路。他们还分析了参与糖酵解/糖异生和三羧酸循环的巴豆酰化修饰和2-羟基异丁酰化修饰的调控酶,结果发现17种参与糖酵解/糖异生的酶和7种参与三羧酸循环的酶差异修饰,其中包括多种三羧酸循环的限速酶,如己糖激酶、6-磷酸果糖激酶、丙酮酸激酶和柠檬酸合酶Ⅰ等,这些限速酶参与了一系列的能量代谢过程。这些蛋白质在RH虫株速殖子中的2-羟基异丁酰化修饰程度比较高,提示两个虫株糖代谢的差异可能与2-羟基异丁酰化修饰有关,从而影响了虫株速殖子的增殖速度。组蛋白翻译后修饰是表观遗传学研究主要方向之一,在调控基因转录和沉默中发挥关键作用。Yin等发现弓形虫速殖子组蛋白上17个氨基酸位点发生巴豆酰化修饰,37个氨基酸位点发生2-羟基异丁酰化修饰,相对于组蛋白上的其他蛋白质翻译后修饰,2-羟基异丁酰化修饰的丰度较高,而且其中5个位点(H3K57、H3K80、H3K123、H4K32、H4K80)在人、小鼠、水稻中也高度保守,提示2-羟基异丁酰化修饰在弓形虫表观遗传调控中发挥着重要的作用。同时,H3K24、H4K32、H3K57、H2AzK10、H2AzK18、H2BaK100和H2BaK112上可同时发生多种修饰类型,提示这些位点上的修饰之间存在交互作用。另外,许多组蛋白修饰酶也发生巴豆酰化修饰和2-羟基异丁酰化修饰,包括精氨酸甲基转移酶家族(PRMT)、组蛋白去乙酰化酶(HDAC2)和组蛋白赖氨酸乙酰转移酶(MYST-A)。在与弓形虫入侵相关的蛋白质中,在RH虫株和ME49虫株中共鉴定到70个巴豆酰化修饰位点和2-羟基异丁酰化修饰位点,这些修饰位点主要位于棒状体、微线体、致密颗粒等结构,在RH虫株速殖子中鉴定到61个(87.14%)特异性修饰位点,其中有52个位点(85.25%)发生了2-羟基异丁酰化修饰,表明2-羟基异丁酰化修饰可能参与弓形虫对宿主细胞的快速侵袭(Yin等,2019)。
此外,有学者利用iTRAQ技术对弓形虫PRU虫株的孢子化卵囊和未孢子化卵囊的蛋白组进行比较分析,结果共鉴定出2 095种蛋白,其中1 823种蛋白变异系数小于50%(Zhou等,2016)。通过对这1 823种蛋白进行直系同源(cluster of orthologous group)蛋白数据库检索,发现69%的蛋白可以归为25类,其中“翻译、核糖体结构及生物起源”“一般功能预测”及“翻译后修饰、蛋白转换和分子伴侣”三类包含的蛋白的数量最多,分别包括212种、208种、185种蛋白。通过定量分析,该研究发现587种差异表达蛋白。值得注意的是,25种毒力因子(SPATR、POR18、ROP16、ROP5、ROP2、MIC1、MIC6、MIC3、MIC8、AMA1、GRA7、GRA4、GRA1、GRA25、GRA6、RON2、RON5、RON4,PP2C、ROM4、SIP、PhIL1和VP1等)在孢子化卵囊中都出现了上调表达,这很可能与孢子化卵囊的感染性有关。通过检索KEGG数据库,发现51种差异蛋白具有KEGG ID,并且大多与代谢活动相关。
弓形虫膜蛋白质组的研究对阐明弓形虫入侵宿主细胞的机制、发掘治疗弓形虫病的药物靶标及新的防治策略具有重要意义。现已有三种不同类型的蛋白质组学研究方法应用于弓形虫膜蛋白质组的研究,分别是一维凝胶液相色谱-串联质谱分析技术,生物素标记结合一维凝胶液相色谱-串联质谱分析技术和三层凝胶电泳结合多维蛋白质鉴定技术(Che等,2011)。
一维凝胶液相色谱-串联质谱分析技术运用聚丙烯酰胺凝胶电泳将弓形虫RH虫株速殖子膜蛋白质进行分离,从每个电泳泳道中切下40~45个胶条带,经过还原、烃化和酶解消化之后,应用液相色谱-串联质谱联用技术进行鉴定。在第一次实验中,膜蛋白质沉淀处理时未用高盐溶液和高碱性溶液进行冲洗,该方法在弓形虫RH虫株速殖子膜中共鉴定出1 606个蛋白,其中734个蛋白包含单个或多个跨膜结构域,这些膜蛋白被进一步聚类至266个蛋白质种类。该实验所用膜蛋白聚类方法的设计充分考虑了同一基因组区域基因的可变剪接和蛋白质翻译后修饰,如蛋白酶切割和共价修饰等,即使氨基酸序列的一致性高于90%,长度近似的不同膜蛋白质也能够被成功进行聚类分析,所以734个膜蛋白功能分类结果的可靠性很高。由于高盐溶液和高碱性溶液能够成功破坏蛋白质之间的非共价相互作用,所以在第二次实验的膜蛋白质沉淀处理步骤中,研究者应用高盐溶液和高碱性溶液对膜蛋白质沉淀物进行处理,以去除大部分与弓形虫速殖子膜蛋白质非共价结合的胞质蛋白质,而其余实验步骤则与第一次实验一致。第二次实验总共鉴定出2 938个蛋白,其中981个蛋白包含单个或多个跨膜结构域,这表明用高盐溶液和高碱性溶液处理弓形虫速殖子的膜蛋白质沉淀物显著增加了膜蛋白质的鉴定数目。在这两次实验中,521个膜蛋白被同时鉴定出来,它们被聚类至178个蛋白质种类。两次实验结果证实,不少与膜蛋白质非共价结合的胞质蛋白被高盐溶液和高碱性溶液从弓形虫速殖子膜蛋白沉淀处理物中洗脱移除,例如2C-甲基-D-赤藓糖醇、2,4-环二磷酸合成酶、细胞色素C氧化酶、糖基转移酶。众多与膜蛋白质非共价结合的胞质蛋白质的移除导致膜蛋白质沉淀物中蛋白质动态范围的下降和膜蛋白质鉴定数目的升高,许多在首次实验中未被鉴定出的膜蛋白质在第二次实验中被成功鉴定出来,例如氢离子转运无机焦磷酸酶TVP1蛋白、P型ATP转移酶、七种跨膜受体域蛋白质和一个被推测有钠-氢交换功能的膜蛋白质。
生物素标记结合一维凝胶液相色谱-串联质谱分析技术是运用生物素对弓形虫速殖子表面的质膜蛋白质进行富集,然后利用液相色谱-串联质谱鉴定弓形虫速殖子质膜整体蛋白质组。该技术成功鉴定出1 029个蛋白,这些蛋白质被聚类至304个蛋白质种类,其中329个蛋白包含跨膜区域,这些膜蛋白被聚类至118个膜蛋白质种类。这些膜蛋白中虽然包括许多功能未知的蛋白质,但是许多发挥重要功能的蛋白质也在其中,如ROP4、ROP5、ROP13、ROP14、ROP18、RON1、RON2、RON3、GRA3、GRA6、GRA7、ADP /ATP转运蛋白、钙ATP激酶SERCA样蛋白、Rab11、钙离子ATP激酶、葡萄糖转运体GT1、二氢硫辛酰胺-乙酰转移酶、ATP结合域蛋白质B亚家族成员3、氢离子转运无机焦磷酸酶TVP1蛋白、苹果酸转运蛋白、纳虫泡ATP转移酶亚基A、空泡ATP合成酶催化亚基A、草酸甲酸逆向转运体蛋白和NMDA受体谷氨酸结合链。
三层凝胶电泳结合多维蛋白质鉴定技术在膜蛋白质的鉴定中具有许多优势,该技术被应用于弓形虫RH虫株细胞膜蛋白质组研究时,研究者采用了与一维凝胶液相色谱-串联质谱分析技术鉴定弓形虫RH虫株细胞膜蛋白质组同样的两种膜蛋白质沉淀物处理步骤。当未用高盐溶液和高碱性溶液处理膜蛋白质沉淀物时,该方法共鉴定出2 938个蛋白质,它们被聚类至923个蛋白质种类,其中1 461个蛋白包含单个或数个跨膜结构域,这些包含跨膜结构域的膜蛋白质被归类至525个膜蛋白质种类。当用高盐溶液和高碱性溶液处理膜蛋白质沉淀物时,共鉴定出3 116个蛋白,其中1 428个蛋白是膜蛋白质,这些膜蛋白质被归类至546个膜蛋白质种类。这两种不同膜蛋白质沉淀物处理方法同时鉴定出的蛋白质数目为1 825个,其中893个蛋白包含单个或数个跨膜结构域,这些膜蛋白质被归类至312个膜蛋白质种类。这两种不同膜蛋白质沉淀物处理方法总共鉴定出的蛋白质数目为4 229个,这些蛋白质被归类至1 403个蛋白质种类,其中1 996个蛋白包含单个或数个跨膜结构域,这些膜蛋白质被归类至759个膜蛋白质种类。与一维凝胶液相色谱-串联质谱分析技术相比,三层凝胶电泳结合多维蛋白质鉴定技术多鉴定出376个膜蛋白质种类。
对上述三种技术研究弓形虫RH虫株速殖子膜蛋白质组的结果进行比较,研究者发现鉴定出的膜蛋白质总数为2 241个,它们被归类至841个蛋白质种类。其中,大约66%的膜蛋白质被两条及两条以上Mascot分值高于49的肽段所匹配,15.4%的膜蛋白质被一条Mascot分值高于60的肽段所匹配,18.8%的膜蛋白质被一条Mascot分值介于49至60的肽段所匹配。三组实验中96%的肽段Mascot分值高于60,而且这些肽段在三组实验中被同时成功鉴定出。近62%的膜蛋白质包含两个或两个以上的跨膜结构域,20.8%的膜蛋白质包含的跨膜结构域数目等于或大于7,其中一个腺苷酸和鸟苷环化酶催化的蛋白质包含的跨膜结构域数量高达22个。一维凝胶液相色谱-串联质谱分析技术和三层凝胶电泳结合多维蛋白质鉴定技术同时鉴定出的膜蛋白质数目为959个,它们被归类至358个蛋白质种类,分别占到两种技术鉴定出膜蛋白质总数的48%和80.3%。一维凝胶液相色谱-串联质谱分析技术、生物素标记结合一维凝胶液相色谱-串联质谱分析技术和三层凝胶电泳结合多维蛋白质鉴定技术三种技术同时鉴定出的膜蛋白质数目为285个,它们被归类至98个蛋白质种类,分别占到三种技术鉴定出膜蛋白质总数的23.9%,86.6%和14.3%。质膜蛋白质鉴定方面,一维凝胶液相色谱-串联质谱分析技术和三层凝胶电泳结合多维蛋白质鉴定技术共同鉴定出97%的质膜蛋白质,而生物素标记结合一维凝胶液相色谱-串联质谱分析技术仅鉴定出归类于4个蛋白质种类的10个膜蛋白质,其余均为质膜蛋白质,由于该方法专门用于质膜整体蛋白质组的研究,所以在疾病药物靶标发掘方面具有很大优势。
运用基因本体论对三种技术鉴定到的全部膜蛋白质进行生物信息学分析,在细胞组成基因本体分析结果中,占膜蛋白质总数23%、21%、3%和3%的膜蛋白质分别被注释至膜蛋白质、细胞膜整体、质膜蛋白质、内质网蛋白质;在生物过程基因本体分析中,占膜蛋白质总数15%、4%、7%和4%的膜蛋白质分别被注释至转运、ATP生物合成、代谢过程、蛋白质酶解及磷酸化过程;在分子功能基因本体分析中,占膜蛋白质总数47.89%的膜蛋白质或者具有与ATP、核酸、蛋白质、离子结合功能,或者具有细胞膜相关酶活性,而剩余的52.11%的膜蛋白质功能则是未知的。膜蛋白质锚定蛋白修饰位点预测显示,29个膜蛋白质很可能是糖基磷脂酰肌醇样锚定蛋白质,如表面抗原43和糖基磷脂酰肌醇样锚定表面BSR4相关抗原。此外,许多蛋白质可能被糖基磷脂酰肌醇锚定,例如SAG2E、信号识别颗粒54kD蛋白、子孢子特异表面抗原蛋白质等,不过它们大多数都是预测的蛋白质。值得注意的是,三种技术研究弓形虫速殖子膜蛋白质组的实验中,超过42%的膜蛋白是预测的蛋白质,而且超过一半的预测蛋白是弓形虫特有的蛋白质。
弓形虫的内膜复合体(inner membrane complex,IMC)是一种位于弓形虫外周膜下的扁平囊泡状结构,附着于弓形虫的膜下细胞骨架。弓形虫内膜复合物的合成组装依赖于TgRab11A和TgRab11B介导的囊泡运输以及GAPM家族蛋白(Harding等,2016)。GAPM家族蛋白是一种多重跨膜蛋白,可能作为一个桥梁与弓形虫外周膜相连,为弓形虫内膜复合物的合成及组装提供支撑和稳定作用。弓形虫的内膜复合物主要沿着22条膜下高密度的微管骨架分布,在弓形虫复制、移动以及入侵宿主细胞过程中发挥重要作用。首先,弓形虫内膜复合物可以作为分子马达的支点,为弓形虫的移动、入侵提供着力点,传递弓形虫入侵所需要的动力和能量。其次,弓形虫内膜复合物与弓形虫微管等细胞骨架结构相互作用,形成弓形虫分裂所需要的框架并提供能量。
在空间蛋白组学和生物素邻近标记技术没有开发以前,弓形虫内膜复合物组分的鉴定主要通过亚细胞定位、免疫共沉淀等低通量的技术来获得。Anderson-White等通过基因表达规律、同源比对、亚细胞定位等技术,鉴定到了15个内膜复合物蛋白(TgIMC1-15)。内膜复合物蛋白的表达具有一定的时间特性,这15个内膜复合物蛋白的表达峰值大部分集中在有丝分裂G1早期,但TgIMC14表达峰值出现在出芽增殖后1小时,TgIMC7和TgIMC12表达峰值出现在有丝分裂G1晚期和S期之间。不同内膜复合物蛋白的亚细胞定位也具有一定的特点。例如,TgIMC11主要定位在弓形虫的顶部和底部的内膜复合物,而TgIMC5、TgIMC8、TgIMC9和TgIMC13的定位则会随着弓形虫细胞周期的改变而有所变化(Anderson-White等,2011)。由于某些内膜复合物蛋白组分表达和定位具有一定的时空特异性,故内膜复合物蛋白组分的鉴定具有一定的难度。
随着空间蛋白组学技术和生物素邻近标记技术的开发及在弓形虫研究领域的应用,弓形虫内膜复合物的研究进入了高通量鉴定的阶段。TgISP3和TgISP4是定位于弓形虫内膜复合物的蛋白并参与弓形虫的胞内增殖调控。Chen等于2015年、2017年分别对TgISP3、TgISP4蛋白的C端进行BirA*蛋白融合标记。通过TgISP3标记BirA*蛋白,他们鉴定到9个已知的IMC相关蛋白(IMC1、IMC10,IMC14,MLC1,GAP45,GAP50,HSP20、Rab11b以及ISP1)和19个新的IMC相关蛋白(AC1、AC2、AC3、AC4、AC5、AC6、AC7、ISC1、ISC2、ISC3、ISC4、IMC17、IMC18、IMC19、IMC20、IMC21、IMC22、IMC23和IMC24)。其中,AC1-7主要定位于弓形虫顶部的内膜复合物并与弓形虫的细胞骨架互作,IMC17-24定位于弓形虫中部和底部的内膜复合物,ISC1-4主要定位于弓形虫膜上的缝合结构(suture structure)的内膜复合物(Chen等,2015)。通过TgISP4标记BirA*蛋白,2017年有学者鉴定到11个新的内膜复合物蛋白(IMC26、MIC27、IMC28、IMC29、ISC5、ISC6、TSC2、TSC3、TSC4、TSC5和TSC6);通过亚细胞定位分析发现,TSC2、TSC3、TSC4、TSC5和TSC6均定位于缝合结构的内膜复合物(Chen等,2017)。2020年,Barylyuk等则通过空间蛋白组学技术对弓形虫速殖子细胞器的蛋白组分进行分析,结果发现约100个蛋白与内膜复合物存在密切关系,这些蛋白中包括了一些与内膜复合物互作的蛋白,例如肌球蛋白A、肌球蛋白C和COPI衣被蛋白。在这近100个蛋白中,约有50%的蛋白为全新的未知蛋白,它们的结构域、功能以及所属蛋白家族均未在其他物种被鉴定和研究(Barylyuk等,2020)。这表明弓形虫的内膜复合物是一个非常复杂、精密的细胞结构。深入研究这些未知蛋白将有利于我们更好的解析弓形虫的生物学特性。
此外,某些内膜复合物蛋白的正确定位依赖于蛋白的翻译后修饰。棕榈酰化是一种常见的蛋白翻译后修饰,其在调控蛋白的转运、亚细胞定位、功能及稳定性上具有重要的调控作用。Frénal等通过棕榈酰化蛋白组学技术,对弓形虫的棕榈酰化蛋白进行了鉴定,结果发现内膜复合物蛋白ISP1、ISP2、ISP3、ISP4、HSP20、IMC1、IMC4、IMC6、IMC9、IMC10、IMC11、IMC12、IMC13、IMC14和IMC15为棕榈酰化蛋白。弓形虫蛋白的棕榈酰化通过DHHC棕榈酰化酰基转移酶的催化进行。生物信息学分析显示弓形虫共编码了约18个DHHC棕榈酰化酰基转移酶,其中TgDHHC2和TgDHHC14定位于弓形虫内膜复合物,且均为弓形虫的必需基因(Frenal等,2014)。因此,通过蛋白组学技术进一步研究弓形虫的翻译后修饰将会加深对弓形虫蛋白的生物学功能的了解。
顶复门原虫存在一套特有的细胞骨架,该骨架由虫体前端极性微管组织中心(microtubule organizing center,MTOC)向虫体外周发散,该微管组织中心即为顶复体(apical complex),该结构也是顶复门原虫分类的关键依据。然而,由于顶复门不同亚纲原虫中顶复体的保守性不同,导致其存在不同的形态。球虫亚纲和隐孢子虫亚纲包含完整的顶复体结构,即包括极环、类锥体、类锥体前环、类锥体下微管,而血孢子虫亚纲包含高度保守的极环,但类锥体已高度退化。因此,其类锥体有其特殊的存在方式,微管结构由9根原纤维以逗号状分布形成一根微管纤维,整体上由14根微管纤维以一定角度弯曲螺旋形成致密的结构,这与由13根闭环原微管纤维构成的传统微管结构存在巨大差别(Hu等,2002)。因此,这种结构特征必然要求多种蛋白质参与,以保持其原纤维的开环状态以及14根微管纤维螺旋弯曲,最终形成类锥体,作为虫体微管组织中心的重要部分。
在深度解析顶复体特别是类锥体的亚细胞结构特征后,Hu等采用生化离心分离法初步分离顶复体,获得了其粗蛋白质组,发现至少285个候选蛋白质,进一步采用外源表达法鉴定了少数几个顶复体蛋白质(Hu等,2006)。随后的多项研究相继发现了多个构成蛋白,包括ICMAP1、RNG2、APR1、Kinesin A和DXC等。由于顶复体结构的复杂性,这些蛋白质的定位并不都呈现一致性。TgICMAP1是一个含有SMC结构域的蛋白,特异地定位于类锥体下微管;同样的,TgTrxL1、TgTrxL2和TgTLAP3也发现定位于类锥体下微管(图5-1)。而SAS-6是多种真核生物中心体生物合成的重要蛋白,在弓形虫中定位于中心体,而其SAS6样蛋白即SAS6L则定位于类锥体前环。
图5-1 顶复体结构的蛋白质构成及其分布
目前已鉴定出构成顶体极环的蛋白质有TgRNG1、TgRNG2、TgAPR1和TgKinesin A(图5-1)。功能研究表明这些蛋白对22根虫体外周微管的稳定性以及类锥体与极环的关联具有重要意义。研究发现,极环的稳定性取决于Kinesin A和顶体极环蛋白APR1,而Kinesin A可以标记正在分裂的子代虫体,并与APR1在顶体极环共定位;缺乏Kinesin A可导致虫体生长缓慢,Kinesin A和APR1同时缺失会引发极环断裂,进而导致虫体外周微管从极环脱落,在微管阵列中出现不规则的间隙,这些结构缺陷最终导致弓形虫的运动能力、分泌和入侵能力受损,影响虫体复制增殖。RNG1是一种定位于弓形虫顶体极环的必需蛋白,在核分裂完成后,RNG1开始出现在虫体内,而后,顶体极环开始形成;然而核和骨架分裂相关过程在被药物抑制后导致虫体异常生长时,RNG1也能稳定的表达,因此其可作为一个良好的虫体分裂标记蛋白。RNG2的氨基酸残基数大于2 400个,其C-端定位于顶体极环,而其N-端定位于类锥体中部。然而,尚不清楚其蛋白质缺失是否会影响类锥体结构的改变,但是其蛋白质缺失会影响微线体蛋白的分泌,这或许为弓形虫微线体分泌位点的探索提供一个重要的暗示。
类椎体由致密的微管纤维构成。然而,由于其组成单元微管原纤维与传统的构成单元排列并不一样,每根微管纤维由9根原纤维形成如“逗号”状的开环结构构成。完整类椎体是由14根微管纤维从其基部开始围绕类椎体螺旋,呈现半周螺旋,其微管纤维与顶体极环交错,形成35°~50°角度。因而可以预料,这种螺旋形态和结构特征必将产生刚性张力。然而,其微管蛋白α和β与哺乳动物微管蛋白具有90%的同源性,推测类锥体包含大量其他结构和功能性的蛋白质(Hu等,2002)。有研究表明,微管调节蛋白质DCX可能对调节其微管刚性张力有意义,DCX包含双连接蛋白质DCX结构域和P25-alpha结构域,是常见的微管蛋白聚合物结构的调节蛋白(Nagayasu等,2017)。DCX缺失会破坏类锥体的自然结构,影响虫体的入侵和复制能力。最近的一项研究发现一个含锚蛋白重复结构域(ankyrin repeat domain)的蛋白质CPH1,其在类锥体中可作为蛋白质互作网络的中心,介导一系列蛋白质的互作,包括DCX、MyoH以及多个包含紊态结构域(disordered regions)的蛋白质,如CIP1、CIP2和CIP3等(Long等,2017a)。这些研究结果说明,微管纤维-DCX还需要众多的其他蛋白质辅助形成其结构,并执行功能。
同样的,CPH1蛋白的缺失也导致类锥体结构性的破损,包括类锥体的萎缩和微管纤维的崩塌。因此,CPH1与DCX都是微管纤维的结构性构成成分。然而,令人惊讶的是,上述研究采用生物素标记法鉴定互作网络时发现,CPH1与MyoH的蛋白质互作网络关系几乎完全重叠。基于此,有理由认为CPH1与MyoH在类椎体中存在直接互作关系,并介导该肌球蛋白MyoH锚定在微管纤维。对于弓形虫虫体的滑移运动的机制在虫体主体部分普遍认为是由滑动体(glideosome)执行。然而,虫体滑移运动机制在虫体最前端-顶复体部分一直没法进行解释。上述研究成果对理解弓形虫虫体滑移运动在虫体的最前端-顶复体结构部分的运动机制有直接意义(图5-2)。
此外,MyoH还受钙调蛋白TgCaM1、TgCaM2和TgCaM3的调节。TgCaM1和TgCaM3分布于虫体类锥体,而TgCaM2主要分布在类锥体,少量分布于胞质内。TgCaM1和TgCaM2都是弓形虫的非必需蛋白,但是两者的共同敲除会导致虫体滑移运动和入侵活性的大幅度降低。缺失蛋白的表型分析发现,上述三个钙调蛋白具有类似的功能,这与MyoH的功能作用非常类似。因此,推测它们与MyoH在类锥体中有直接的相互关系,而MyoH蛋白包含有结合钙调蛋白的IQ结构域,并且它们在类锥体存在大幅度的共定位关系,这为上述推测提供了关键证据(Long等,2017b)。
类椎体中也发现了其他的一些蛋白质,包括动力蛋白轻链1型(TgDLC1,也称为TgDLC8a)、类固醇相关蛋白1(TgCAP1)、MyoL和MyoE等,然而,这些蛋白质的功能目前还不清楚,有待进一步解析。
顶质体基因组只编码少量管家基因,但作为弓形虫脂肪酸、类异戊二烯和血红素的合成场所,顶质体是虫体必不可缺的重要细胞器。绝大多数顶质体蛋白由虫体核基因编码,经转录和翻译后进入内质网,然后经过蛋白质分选途径转运至顶质体最外层膜,并通过顶质体四层膜内的各个区室到达最终的位置。
顶质体与线粒体和叶绿体一样,作为内共生细胞器,都已演化出特异机制以导入核编码蛋白质(图5-3)。对弓形虫酰基载体蛋白ACP的序列分析表明,顶质体蛋白与其他类型质体蛋白的序列特征不同,顶质体蛋白的N末端具有一段特殊的双引导序列(bipartite targeting sequence,BTS)(Waller等,1998)。BTS含有一段信号肽(signal peptide,SP)及一段转运肽(transit peptide,TP),分别引导蛋白通过顶质体的外两层膜和内两层膜。顶质体蛋白先经SP介导进入内质网,在内质网切除SP之后通过两种不同的蛋白质运输途径(高尔基体依赖途径、非高尔基体依赖途径)到达顶质体,随后进入顶质体的外两层膜。切除SP后的蛋白转换为转运肽型(t-protein),在TP介导下进入顶质体内两层膜,通过TOC和TIC复合物转运,而最终蛋白切除TP后成为成熟型(m-protein)。该蛋白的分选途径不受布雷菲德菌素(brefeldin)的干扰,而布雷菲德菌素可特异抑制蛋白质从内质网向高尔基体运输,这表明ACP以非高尔基体依赖的分选途径进行转运。Aparna等对仅定位于顶质体的ATrx1、ATrx2、Tic22、PPP1和Der1,及双定位蛋白质(线粒体和顶质体)进行蛋白质分选途径研究,证明了仅定位于顶质体的蛋白质不用通过高尔基体途径进行运输,而双定位的TgACN/IRP与TgPxr1/2需要经过高尔基体依赖性途径进行运输(Krishnan等,2020)。此外,双定位的TgSOD2含HDEL信号标签时,既不定位于顶质体,也不在ER中滞留。关于顶质体蛋白质的转运和定位机制目前仍不清楚,需要做进一步的研究。
图5-2 类椎体和质膜中动力蛋白Myosin互作的模式
注:CPH1在类锥体作为蛋白质互作的中心,连接关键马达分子MyoH和类锥体结构蛋白,这对解释MyoH在虫体中的滑移运动机制有直接意义。而滑移运动在虫体主要结构部分的机制已经解析非常清楚。
弓形虫顶质体参与了血红素、脂肪酸及类异戊二烯的合成代谢。其中,弓形虫从头合成血红素的途径中的8种血红素生物合成蛋白分别定位于线粒体、胞质和顶质体。血红素合成的起始和终末过程均发生在线粒体,而中间阶段在顶质体和胞质中进行,其中顶质体是血红素合成中间步骤的重要场所(图5-4)。氨基乙酰丙酸从线粒体经胞质被转运到顶质体,在胆色素原合酶(TgPBGS/TgALAD)催化脱水缩合成卟胆原,其中琥珀酰丙酮可以通过靶向抑制TgPBGS的活性或ALA,从而造成亚铁血红素累积进而抑制新血红素的产生。卟胆原在胆色素原脱氨酶(PBGD)和尿卟啉原Ⅲ合酶(UROS)的作用下,脱氨缩合生成尿卟啉原Ⅲ。其中,TgUroD基因敲除会抑制弓形虫增殖,降低虫体内的游离血红素水平和线粒体中含有血红素的c型细胞色素蛋白的丰度(Tjhin等,2020),这也暗示着顶质体在弓形虫血红素生物合成中发挥着重要作用。
图5-3 顶质体蛋白质的分布、定位及运输机制
注:顶质体由四层膜及其间隙构成,绝大多数蛋白质由核基因组编码,然后靶向不同的位点。其蛋白靶向定位机制较为复杂,目前认识尚不完全。但基本了解核编码蛋白质可以通过两种不同的途径进行转运。
异戊烯基焦磷酯(IPP)及其异构体二甲基烯丙基二磷酸酯(DMAPP)是顶质体非甲羟戊酸途径(MEP/DOXP)途径的最终产物。其中IPP的合成以丙酮酸和三磷酸甘油醛为底物,合成1-脱氧-D-木酮糖-5-磷酸盐(DOXP),再将DOXP转化为2-C-甲基-赤藓糖醇-4-磷酸盐(MEP),中间包含7步催化反应,用于IPP的生物合成,其合成基本步骤可参见图5-4。其中,DOXP途径中的LytB是一种[Fe-S]蛋白,顶质体代谢途径其他几种酶也含[Fe-S]中心。Fe-S簇[2Fe-2S]、[3Fe-4S]和[4Fe-4S]是生物体内最常见的结构,是铁离子与半胱氨酸(Cys)配位并通过硫桥相互连接,从而发挥电子传递或催化等作用,在生命活动中是最为古老的蛋白质活性调节因子。已有数据表明顶质体[Fe-S]中心合成采用的硫动员机制(sulfur mobilization machinery,SUF)途径,这与人类和动物细胞中仅以铁硫族组装机制(Iron sulfur cluster assembly machinery,ISC)途径完全不同。其参与蛋白质及其CRISPR生长适应性数值可参见图5-2。已知和推测的参与质体[Fe-S]生物发生的蛋白(图5-4)和目前已知的顶质体中的[Fe-S]蛋白如下:LipA([4Fe-4S])、LytB([4Fe-4S])、GcpE([4Fe-4S])、ptFd([2Fe-2S])、MiaB([4Fe-4S])。由此可见,[Fe-S]中心合成途径在顶质体代谢途径中具有非常重要的意义。
顶质体FASII途径产生的脂肪酸和磷脂对弓形虫生命周期中的增殖和分裂至关重要。顶质体内的脂肪酸从头合成途径(FASII)由多种不同的酶协同合成脂肪酸(图5-2)。其中,Krishnan A等报道了β-羟基酰-ACP脱水酶的敲除导致弓形虫出现明显的生长缺陷,但受到影响的FASII途径可以通过外源性添加脂肪酸而挽救(Krishnan等,2020);顶质体中的磷脂酸(Prasad等,2020)是所有磷脂类从头合成的中心前体,其中甘油-3-磷酸酰基转移酶(GPAT)和顶质体酰基转移酶1(TgATS1)先后两步酯化甘油-3-磷酸后分别合成溶血磷脂酸(LPA)和PA,进而用于PL的大量合成。TgATS2具有产生PA达到调节LPA/PA平衡的作用,而TgATS2的敲除会破坏PA在顶质体的合成,从而导致从宿主来源摄取PA,以及影响动力蛋白TgDrpC在顶质体分离中的作用及膜曲率的异常(Amiar等,2020)。FASⅡ途径与硫辛酸的合成密切相关,硫辛酸在顶质体的合成途径需要两个酶的催化:酰基载体蛋白ACP-N-辛酰转移酶(LipB)和硫辛酸合成酶(LipA)(图5-2)。其中,丙酮酸脱氢酶复合体(PDH)是催化丙酮酸(Pyr)生成乙酰辅酶A(AC-CoA)进行TCA循环的关键酶,而硫辛酸可激活PDH的E2亚基,为脂肪酸的合成提供底物。
图5-4 弓形虫顶质体代谢途径及其相关蛋白质
注:参与代谢的酶注明CRISPR生长适应性数值。数据来自ToxoDB或参考文献(Krishnan等,2020)。
解析弓形虫顶质体蛋白组有助挖掘有价值的抗弓形虫药物靶标。基于顶质体内代谢途径对弓形虫生长发育的重要性,而类异戊二烯和铁硫[Fe-S]中心合成途径在人类和动物细胞中是完全不同的,这使得顶质体代谢的相关蛋白具有开发抗弓形虫病药物的潜在发展前景。
棒状体是顶复门原虫特有的细胞器,在虫体侵入宿主时其成分(蛋白等)释放到新生的纳虫泡腔和纳虫泡膜中,这些蛋白往往是虫体与宿主相互作用的前沿。因此,棒状体与虫体的侵入、纳虫泡的形成、逃逸宿主攻击以及虫体营养获取等功能密切相关。早在2005年和2010年,就有学者分别以生化分离方法和生物信息分析法获得了大量有关棒状体蛋白构成的数据。近10年来,随着分析技术的迅速发展和改良,对弓形虫棒状体所包含或分泌的蛋白质有了更深入的认识,目前鉴定出约57个棒状体蛋白:①在速殖子中鉴定的40个棒状体或者棒状体分泌的蛋白质(Clough和Frickel,2017);②在缓殖子或包囊形成阶段鉴定的10个棒状体蛋白(Jones等,2017;Fox等,2016);③由棒状体分泌对IVN具有重要意义的3个WNG蛋白(Beraki等,2019);④棒状体膜外周细胞质侧的RASP1-3和ARO蛋白(Suarez等,2019;Mueller等,2013)。分泌型棒状体蛋白成熟过程发生在转运过程或者棒状体内,通常含有信号肽,且至少含有一个跨膜结构域或GPI锚,棒状体与质膜的结合和锚定,也可以通过肉豆蔻酰化和棕榈酰化进行(Mueller等,2013)。根据这些蛋白的分子和功能特征及其定位,可以大致分为激酶(ROP)、蛋白酶(protease)、磷酸酶(phosphatase)、钠离子氢离子交换蛋白(Na + /H + exchangers,NHEs)、棒状体颈部(RON)蛋白以及棒状体外周蛋白等。下面以此分类进行描述。
ROP蛋白源自棒状体球结构部分,这些蛋白质数量很多,通常都包含激酶结构域,有些具有活性,有些由于缺乏催化氨基酸残基而不具有激酶活性。很多ROPs被分泌到PV或PVM中,甚至被注入到宿主细胞质中操控宿主基因表达(如ROP16)。因此,ROPs通过对PV或PVM进行修饰以防御宿主免疫攻击,同时可协助从宿主摄取营养。
ROP1是弓形虫第一个被鉴定的ROP蛋白,该蛋白是一个可溶性蛋白质。ROP2家族是一个较大的蛋白激酶家族,包括ROP2、ROP4、ROP5、ROP7、ROP8、ROP16、ROP18等18个成员。该家族蛋白的前体蛋白富含脯氨酸,N端富含精氨酸,C端则含有跨膜结构域,主要定位于PVM。该家族的成员都拥有激酶活性的结构域,但仅有部分蛋白能够真正发挥激酶催化特性。ROP2家族存在高度的差异性,其N端的激酶结构是最保守的结构,包括活化环和底物结合位点。ROP5、ROP16和ROP18为弓形虫重要的毒力决定因子,在弓形虫的致病性及对宿主细胞的调节中起着关键作用。部分ROP蛋白在顶复门原虫中保守,例如ROP9,在疟原虫中也发现了其同源蛋白。此外,ROP14也保守。
有两个实验室分别对缓殖子阶段的ROP进行了研究,发现了缓殖子阶段大量表达的ROP蛋白以及对缓殖子形成有重要意义的ROP(Jones等,2017;Fox等,2016)。此外,也发现了缓殖子阶段特异的棒状体蛋白1(bradyzoite specific rhoptry protein 1,BRP1),该基因在缓殖子分化阶段高度表达。
棒状体蛋白中包含有几种蛋白酶,包括枯草杆菌样丝氨酸蛋白酶(subtilisin-like serine protease,SUB2)、TgTLN1和Toxopain-1等。TgSUB2含有保守催化结构域的Ⅰ型跨膜蛋白,N端暴露于膜内且能够进行自催化作用。TgSUB2的催化位点与ROP蛋白的切割位点相似,有研究提出TgSUB2为催化ROP蛋白成熟的蛋白酶。TgTLN1是棒状体另外一个蛋白酶,其活性通常依赖于二价阳离子。此外,Toxopain-1也参与了棒状体蛋白质的成熟过程。
弓形虫PP2C蛋白磷酸酶家族能催化蛋白发生去磷酸化修饰。现已鉴定到一个PP2C蛋白定位于弓形虫棒状体,该蛋白包含一个核定位信号(nuclear localization signal,NLS)序列,可被分泌到宿主细胞中。棒状体中磷酸酶的出现,表明磷酸化和去磷酸化在棒状体细胞器以及虫体在宿主细胞的寄生中都发挥重要作用。
钠离子/氢离子交换蛋白参与弓形虫胞内胞外的钠离子和氢离子交换,从而调节虫体内的pH。TgNHE2是定位于棒状体的钠离子/氢离子交换蛋白,可调节棒状体生成过程中pH变化,但其蛋白缺失对速殖子没有表现出生长缺陷。
棒状体颈部最接近于分泌位点,其蛋白质往往在虫体侵入早期开始分泌,对虫体入侵宿主细胞具有重要意义,而且这类蛋白通常在顶复门原虫中较为保守。RON1是含有Sushi结构域的蛋白,是跨膜蛋白,其缺失能影响虫体入侵细胞。TgRON2、TgRON4、TgRON5、TgRON8蛋白已被证明可在虫体入侵宿主时与微线体蛋白相互作用,在虫体和宿主细胞质膜之间形成移动连接(moving junction,MJ)复合体,以牵引虫体完成入侵。其中 Tg RON4与宿主细胞表面的磷脂酰肌醇聚糖1(glypican 1)相互作用,并与细胞骨架蛋白β-微管蛋白结合,而TgRON5对TgRON2的稳定性和TgRON4的正确靶向必不可少。RON9和RON10形成一种高度稳定的异配体复合物,RON9包含Sushi结构域、锚蛋白重复基序,是典型的PEST序列。
犰狳重复序列(armadillo repeats-only,ARO)蛋白是一种顶复门原虫保守性蛋白,其定位于疟原虫或弓形虫的棒状体胞质侧。ARO的C端有两个armadillo重复,而N端的前20个氨基酸含有酰化基序,通过N端的肉豆蔻酰化和棕榈酰化与长链脂肪酸共价连接(Mueller等,2013)。TgARO介导棒状体蛋白在弓形虫顶部的定位,与肌球蛋白F(myosin F)相互作用,能够抑制肌动蛋白(actin)的聚合和肌球蛋白的功能,造成棒状体的弥散分布。TgARO进行条件性敲除能够观察到弓形虫的棒状体蛋白随机分布在胞质中,并导致弓形虫的入侵能力显著减弱。
RASP1、RASP2和RASP3蛋白定位于棒状体极性前段膜外,即细胞质侧,尤其是RASP2,免疫电镜清晰显示其在细胞器外侧定位(Suarez等,2019)。该蛋白质是棒状体分泌所必需,但是其缺失并不会导致棒状体结构失去极性定位,这与ARO锚定棒状体极性定位不一样。RASP2通过C2结构域和PH结构域与磷脂酰肌醇4,5-二磷酸(PIP2)和磷脂酸(PA)结合,同时缺失C2结构域的碱性氨基酸残基和PH结构域导致RASP2失去活性。
Toxofilin是弓形虫分泌的肌动蛋白结合蛋白,其在弓形虫入侵宿主细胞时释放,与侵入点的宿主细胞肌动蛋白相结合导致宿主细胞肌动蛋白网络的解聚。作用于宿主细胞的toxofilin上调宿主肌动蛋白的细胞骨架动力学,促进了弓形虫对宿主细胞的入侵。
弓形虫的致密颗粒(dense granule)是一种具有高电子密度的球形细胞器,直径约0.3μm,分布于弓形虫各个部位,但主要分布于虫体的后部。弓形虫速殖子和子孢子通常含有5~12个致密颗粒,每个缓殖子有8~10个致密颗粒,而弓形虫裂殖子的致密颗粒仅约2~3个。弓形虫致密颗粒的形成机制至今尚未被研究清楚,未成熟的致密颗粒至今也未曾被发现和鉴定到。因此,揭开致密颗粒的形成机制对研究弓形虫的生物学特性具有重要意义。致密颗粒是弓形虫的重要分泌细胞器之一。弓形虫在入侵宿主细胞、形成纳虫泡后,致密颗粒与弓形虫外周膜融合,释放致密颗粒蛋白并参与多种生物学功能。致密颗粒蛋白通常在蛋白质的N端会有一个疏水的信号肽,介导致密颗粒蛋白的转运以及定位到致密颗粒。致密颗粒蛋白虽然在分泌之前都定位于致密颗粒,但不同的致密颗粒蛋白在其分泌之后有着不同的亚细胞定位和功能。例如,致密颗粒蛋白可以分泌到弓形虫纳虫泡或纳虫泡膜,构建纳虫泡内部的膜纳米管道网络,修饰纳虫泡膜和包囊壁,参与纳虫泡膜和包囊壁的成熟;也可分泌到宿主细胞中调控宿主细胞的代谢、免疫以及基因表达。
大部分的致密颗粒蛋白均能分泌到纳虫泡中,参与纳虫泡、纳虫泡膜及包囊壁的成熟和修饰,例如GRA1、GRA2、GRA6和GRA17。此外,弓形虫还有为数不多、但能参与宿主细胞生命活动调控的致密颗粒蛋白,例如GRA15、GRA16和GRA24。研究表明,GRA15能分泌到宿主细胞质并定位于宿主细胞的内质网,激活宿主STING蛋白并诱导宿主产生免疫反应。此外,GRA15还能与宿主肿瘤坏死因子受体相关蛋白(TRAF6、TRAF2和TRAF3)互作,介导宿主NF-κB信号通路的激活。弓形虫敲除GRA15后,其对小鼠的毒力会被增强。GRA16和GRA24则能分泌并定位于宿主细胞核中。GRA16定位于宿主细胞核后能与宿主的去泛素化酶HAUSP互作,以HAUSP依赖的方式调节宿主P53的蛋白含量;GRA16还能与宿主的PP2A蛋白磷酸酶互作,诱导PP2A进入宿主细胞核。由于PP2A对细胞分裂M期具有负调控作用,故GRA16可能参与对宿主细胞周期的调控。GRA24则能与宿主的p38αMAPK形成稳定二聚体,延长p38αMAPK磷酸化状态并诱导p38αMAPK进入宿主细胞核,进而上调EGR1、c-Fos、IL-12和CCL2的表达,调节宿主免疫反应。虽然弓形虫速殖子的GRA16和GRA24能分泌到宿主细胞中,但弓形虫转化为缓殖子并形成包囊后,GRA16和GRA24则不能继续分泌到宿主细胞中。
致密颗粒蛋白自从1989年被Cesbron-Delauw等首次研究和报道以来,至今已鉴定到约数十个致密颗粒蛋白,其中包括多个非典型的致密颗粒蛋白,例如TgNTPase-Ⅰ、TgNTPase-Ⅱ、TgPI-1、TgPI-2、TgCPC1、TgCPC2、TgMYR1-4、TgLCAT、TgDGK2、TgHCE1和TgTEEGR等。这些研究成果提示我们,弓形虫致密颗粒是一个成分复杂的细胞器,低通量的检测手段已无法满足对致密颗粒蛋白的研究。2016年,Nadipuram等通过生物素标记技术对GRA13、GRA17和GRA25进行BirA*标记,通过BirA*的生物素标记功能以及蛋白组学检测技术共鉴定到了42个蛋白与GRA13、GRA17和GRA25密切相关(Nadipuram等,2016)。GRA1是弓形虫表达量较高的致密颗粒蛋白。2019年,Pan等通过对GRA1的C端分别标记BirA*和APEX过氧化物酶,通过亲和纯化生物素标记蛋白共鉴定到了26个新的致密颗粒蛋白,其中5个新致密颗粒蛋白定位于致密颗粒(Pan等,2019)。2020年,Barylyuk等通过空间蛋白组学技术,共鉴定到了156个蛋白与致密颗粒相关(定位于致密颗粒或者与致密颗粒蛋白互作)(Barylyuk等,2020)。
虽然有研究显示弓形虫的致密颗粒参与弓形虫包囊壁的形成,但有关致密颗粒在包囊壁的定位研究尚少。2020年,Tu等通过将BirA*标记到CST1、BPK1、MCP4、MAG1和GRA6等包囊壁蛋白上,利用生物素邻近标记蛋白组学技术对包囊壁的组分进行鉴定,显示GRA1、GRA2、GRA7、GRA9、GRA12、GRA34、GRA50、GRA51、GRA52、GRA53均能定位于包囊壁(Tu等,2020)。
线粒体(mitochondrion)是真核细胞重要的细胞器,参与重要的代谢途径。线粒体除了为细胞提供能量,还参与了糖类代谢、脂类代谢、氨基酸代谢、钙离子平衡、应激反应、细胞凋亡和死亡等多种生命活动的调控,在真核生物的生命活动中起着重要作用。线粒体是一种具有独立遗传信息并由两层膜包被而成的细胞器,是真核生物能源物质ATP的重要来源。线粒体的起源一直存在争议,有共生起源和非共生起源假说两大阵营。非共生起源假说认为,线粒体起源于自身并由具有氧化磷酸化功能的膜内陷而成。在内陷的过程中,具有氧化磷酸化功能的膜包裹了部分遗传物质,最终进化形成现在的线粒体。共生起源假说认为,线粒体起源于数十亿年前的细菌的共生现象。原始真核宿主细胞吞噬了共生菌之后,随着两者之间的共生方式不断演化,共生菌从宿主细胞中获得越来越多的生存资源,同时为宿主细胞提供能量物质。根据用进废退的进化论观点,共生细菌逐渐丧失了部分基因,或将部分基因转移到宿主基因组中;宿主细胞则逐渐丢失氧化磷酸化以及呼吸链相关的基因。最终,共生细菌演化为现在的线粒体,并与宿主形成协同分裂、相互调控的共存关系。
在顶复门原虫中,线粒体被认为是一种有前景的药物(例如阿托伐醌)的靶点。在真核生物弓形虫中,每个弓形虫内只有一个线粒体,宽约0.5μm,呈长管形状。其长度和大小可以根据亚细胞定位、细胞周期以及弓形虫的生活史而不同。目前的研究显示弓形虫线粒体基因组相对较小,碱基数约为6kb。弓形虫线粒体基因组在进化过程中丢失了较多的基因,只编码3个线粒体蛋白(包括cob、cox1和cox3)。虽然弓形虫线粒体基因组相对较小,但是由于弓形虫线粒体的cob和cox1基因在核基因组中散布着较多的假基因,完整的弓形虫线粒体基因组测序和鉴定需借助新的测序技术(Berná等,2021)。虽然弓形虫线粒体基因组编码的蛋白非常少,但研究表明顶复门原虫的线粒体组分与其宿主线粒体组分存在明显不同,许多顶复门原虫线粒体蛋白在其寄生宿主中没有同源蛋白。此外,某些弓形虫线粒体蛋白具有多重亚细胞定位的特性。例如弓形虫的铁超氧化物歧化酶(FeSOD2)既能定位于线粒体,也能定位于顶质体(Pino等,2007)。
由于弓形虫线粒体编码蛋白数量少,某些弓形虫线粒体蛋白与宿主线粒体蛋白无同源性且弓形虫线粒体蛋白具有多重定位特点,这些特性使得弓形虫线粒体蛋白的鉴定具有一定的挑战性。蛋白组学技术为解决这一难题提供了良好的研究手段。Seidi等于2018年对弓形虫线粒体蛋白HSP60分别进行了APEX和BirA*标记,通过生物素邻近标记蛋白组学技术对弓形虫线粒体蛋白进行了研究(Seidi等,2018)。该研究共鉴定到421个被APEX和BirA*共同标记的弓形虫蛋白,提示这421个弓形虫蛋白定位于线粒体基质的可能性比较高。在这421个弓形虫蛋白中,有175个蛋白为未知蛋白。通过代谢通路分析发现,鉴定到的蛋白显著富集于TCA循环、氧化磷酸化、丙酮酸盐代谢等属于线粒体的信号通路。鉴定到的线粒体基质蛋白中约有40%的蛋白其N端含有与细胞器定位相关的双亲水性α螺旋,而约60%的蛋白无明显的亚细胞定位信号;这表明某些线粒体蛋白可能会通过一些未知的通路被转运进了弓形虫线粒体。为了验证鉴定到的蛋白是否为弓形虫线粒体蛋白,研究者对27个蛋白进行了亚细胞定位分析。结果发现有22个蛋白定位到了弓形虫线粒体、3个蛋白定位于弓形虫细胞质、1个蛋白定位于弓形虫内质网、1个蛋白定位于弓形虫细胞核;成功定位于线粒体的蛋白约占80%。Seidi等选择了一个与其他物种没有同源性、功能未被研究过的弓形虫线粒体蛋白(TgApiCox25)进行深入研究。虽然TgApiCox25的功能未知,但全基因组基因表型研究结果显示,TgApiCox25是弓形虫的一个必需基因,是细胞色素C氧化酶的组分之一,参与了弓形虫线粒体氧化磷酸化过程(Seidi等,2018)。2020年,Barylyuk等通过空间蛋白质组学技术,也鉴定到了约443个与线粒体密切相关的弓形虫蛋白(Barylyuk等,2020)。通过比较分析线粒体细胞器蛋白质组学的结果,发现约有244个蛋白在两次蛋白组学鉴定中均被鉴定为线粒体蛋白,故这244个蛋白定位于弓形虫线粒体的可信度相对较高。综合使用多种蛋白质组学技术为解析弓形虫线粒体蛋白提供了通量高、成本低的解决方案。
细胞骨架指的是细胞内的蛋白纤维网络结构,主要由微管、微丝以及中间纤维构成。微管是由α及β微管蛋白(tubulin)二聚体以头尾相连组成的中空管道。微丝则是由肌动蛋白(actin)构成,呈一个实心的纤维状结构。中间纤维的直径界于微管和微丝之间,其成分相对比较复杂,由多种蛋白构成,例如波形蛋白和角蛋白等。根据细胞骨架的定位,细胞骨架还可以分为细胞核骨架、细胞质骨架和细胞膜下骨架等。细胞骨架是细胞必不可少的细胞器,细胞多种生命活动、功能均依赖于细胞骨架的支持。首先,它可以维持细胞的形态、抵御外部压力,是维持细胞内部结构稳定的重要细胞器;其次,细胞骨架为细胞内物质、囊泡的高速定向运输提供支点或路径,线粒体等细胞器的运动也依赖于细胞骨架的支持;最后,细胞骨架为细胞的运动、迁移、分裂、细胞间连接等提供动力支架。
弓形虫细胞骨架参与构成了弓形虫顶部的顶环、基底部复合物、雄配子鞭毛等亚细胞结构,是弓形虫移动、入侵、逸出、复制等生命活动必不可少的细胞组分。顶环位于弓形虫的顶部,由两个环形结构的细胞骨架组成。前顶环的直径约160nm,后顶环的直径约220nm。沿着顶环纵向分布着22条约5μm长的膜下微管,这22条膜下微管覆盖了弓形虫虫体长度的三分之二。膜下微管上分布着内膜复合物,这些内膜复合物由微管相关蛋白介导内膜复合物和微管之间的连接和互作。已鉴定10多个微管相关蛋白,其中包括TgMORN1、TgICMAP1、TgSPM1、TgSPM2、TgCEN2、TgCEN3和TgDLC1。基底部复合物位于弓形虫的后端,是内膜复合物分布的终点。虽然弓形虫细胞骨架结构已被研究得比较清楚,但是其成分复杂、蛋白种类繁多(例如:微管蛋白、微管相关蛋白、肌动蛋白、驱动蛋白、动力蛋白和动力蛋白激活蛋白等)。此外,弓形虫细胞骨架处于一个动态变化的过程,免疫共沉淀等常规研究手段已无法满足现代研究的需求。
2014年,Gomez de León等通过Triton X-100对弓形虫速殖子的细胞骨架进行了提取,并利用蛋白质组学技术对提取的弓形虫细胞骨架进行蛋白鉴定,共鉴定到95个细胞骨架相关蛋白,包括18个保守的细胞骨架蛋白(例如肌球蛋白、肌动蛋白、微管蛋白等)、10个内膜复合物相关蛋白、5个含有alveolin样重复的蛋白、25个功能未知蛋白以及37个依赖于细胞骨架的其他细胞器蛋白(例如囊泡、棒状体等)(Gomez de León等,2014)。2020年,Barylyuk等通过空间蛋白质组学技术对弓形虫的微管蛋白进行了分析,鉴定到9个已知的微管蛋白和3个功能未知、未被研究和报道过的蛋白(Barylyuk等,2020)。
弓形虫致病机制十分复杂,为了适应不同种类的宿主和不同类型的细胞并完成其寄生生活,弓形虫通过分泌蛋白与宿主建立相互作用关系,借此调控宿主的免疫反应,维护虫体的生长发育,最终达到宿主防御与虫体生长这一复杂的平衡(Clough和Frickel,2017)。鉴定新的分泌蛋白仍然是弓形虫感染与致病机制研究的热点和难点之一。但由于传统的提取方法无法完全提取弓形虫的膜蛋白,因此尚不能全面地鉴定弓形虫的分泌蛋白。生物素标记和亲和素层析分离技术具有灵敏度高、特异性好、稳定性强和适用性广泛等优点,近年来被广泛地用于蛋白的标记和分离研究。
应用LC-ESI-HDMS质谱分析法,对弓形虫排泄分泌物、微泡、外泌体以及上清液中的蛋白质种类及含量进行鉴定和定量,其中在排泄分泌物中共鉴定到512个蛋白(Ramírez-Flores等,2019)。通过对蛋白的功能分析发现,有49个蛋白与分泌细胞器相关,包括10种MIC蛋白、14种GRA蛋白以及25种ROP蛋白;还有一些与细胞骨架相关的蛋白,例如肌动蛋白、肌球蛋白和丙氨酸,以及与泡囊运输相关的蛋白,例如Rab蛋白。此外,也鉴定到了蛋白酶、SAG相关蛋白和磷酸酶。
通过对测序结果数据分析发现,MIC蛋白、GRA蛋白和ROP蛋白均存在于微泡、外泌体和上清液中,但是含量不是特别的丰富。MIC在上清液中含量最高,部分与囊泡有关(微泡和外泌体)。在微泡、外泌体和上清液这三种组分中,功能未知蛋白的含量是最高的。尽管一些蛋白质的含量很低,例如激酶、磷酸酶和新陈代谢有关酶,但仍然被检测到。在排泄分泌物中共检测到49种MIC蛋白、ROP蛋白和GRA蛋白,在微泡中共检测到29种蛋白,在外泌体中共检测到30种蛋白。16种蛋白仅存在于排泄分泌物中,而MIC3只存在于微泡中,RON5只存在于外泌体中(Ramírez-Flores等,2019)。
上清液中所检测的蛋白质与可溶性蛋白对应。功能未知蛋白如HSP、ROP、GRA和MIC蛋白在上清液中的含量要比囊泡中多。与新陈代谢相关的酶在上清液中的含量也是最高的。MIC蛋白可能是以可溶性蛋白质的形式释放,因为它在上清液中的含量最高;相反,GRA和ROP蛋白在囊泡中的含量最高。Rab蛋白是介导真核细胞细胞膜流动过程中,囊泡与目标质膜之间融合的分子,大量存在于囊泡中。由于弓形虫所释放的小泡有自组装形成管状结构的特性,在微泡和外泌体中发现了大量的Rab蛋白;然而在排泄分泌物中Rab蛋白含量较少。此外,在上清液中仅发现了GTPase Rab7(Ramírez-Flores等,2019)。
利用传统的二维电泳、差异凝胶电泳和质谱技术,Nelson等对弓形虫RH株感染后6、12、16和24小时的成纤维细胞进行蛋白质组学分析,共发现157个差异表达的蛋白,差异表达蛋白的数量随着感染时间的延长而增加。对检测到的差异表达蛋白进行功能研究发现,代谢和结构蛋白占非常大的比例,然而超过三分之一的差异表达蛋白与线粒体功能有关,表明线粒体蛋白在感染过程中被过度调节,显示了宿主细胞器在弓形虫感染反应中的重要性(Nelson等,2008)。宿主细胞的线粒体和内质网与弓形虫感染有着密切的关系,可能为纳虫泡内的弓形虫提供脂类及代谢中间产物等营养物质。另外,与新陈代谢功能相关的差异表达蛋白有30个,提示宿主代谢的调节是细胞对感染反应的内在机制(Coppens等,2000)。新陈代谢不仅与细胞内的合成代谢和分解代谢过程有关,还与能量、细胞周期和细胞死亡密切相关。弓形虫先天性缺失从头合成嘌呤的能力,它依赖于捕获、转运和补救机制从宿主细胞窃取嘌呤,以满足自身的需求。弓形虫感染所致宿主细胞腺苷酸激酶2的上调可能是弓形虫腺嘌呤修复对宿主细胞的需求所致。
弓形虫可以从头合成脂质,并能从细胞外环境、脂质体和线粒体中清除特定的脂质和固醇。在受弓形虫感染的细胞中,直接参与脂质和固醇代谢的羰基还原酶1(carbonyl reductase 1)、警醒素(vigilin)、货物选择蛋白TIP47(cargo selection protein TIP47)和脂蛋白受体相关蛋白(lipoprotein receptor-related protein)均下调表达(Nelson等,2008)。参与糖酵解、氨基酸代谢和脂质合成中心等中间代谢的其他方面的一些蛋白质也显示出显著的变化,表明增加脂质合成和修饰所需的原料供应似乎能够维持弓形虫的生长。
在感染过程中,宿主细胞糖酵解水平表现出相当大的改变,有7种酶表现出差异表达的迹象,其中6种表现为上调表达,分别是醛缩酶A和B(aldolase A and B)、烯醇化酶(enolase)、甘油醛3磷酸脱氢酶(glyceraldehyde 3 phosphate dehydrogenase)、磷酸甘油酸激酶(phosphoglycerate kinase)和丙酮酸激酶(pyruvate kinase,PYK),而只有磷酸丙糖异构酶(triose phosphate isomerase)表达下降。这些数据提供了弓形虫入侵导致宿主细胞糖酵解上调的证据。
弓形虫感染可以抵抗宿主细胞通过内源性线粒体依赖途径和外源性死亡受体途径上发生凋亡。热休克蛋白27(HSP27)和70(HSP70)均在受感染的宿主细胞中差异表达。这些蛋白可以抑制凋亡通路的关键效应分子,并在蛋白酶体介导的凋亡调节蛋白降解中发挥作用(Garrido等,2003)。HSP27可以阻止凋亡小体的形成和随后半胱天冬酶的激活(Bruey等,2000),而HSP70可以保护细胞免受应激诱导的半胱天冬酶依赖性凋亡,包括凋亡相关线粒体行为的上游和下游(Garrido等,2003)。
在受感染细胞中,6种转录蛋白和2种翻译蛋白延伸因子1 α(elongation factor 1 alpha)和泛素(ubiquitin)A-52呈现出上调表达(Nelson等,2008)。除此之外,在感染细胞中,HSPs发生差异表达的现象可能是由于转录和翻译的增加引起的,表明HSPs在蛋白质加工中占据非常重要的地位。
微管蛋白α(TUBA1)在受感染细胞中呈现差异表达的现象。微管在提供细胞结构功能的同时,对细胞内各种细胞器的运输和分布起着至关重要的作用。弓形虫感染后,宿主细胞的线粒体、内质网、溶酶体和胞内外途径成分在纳虫泡周围和胞质中重新分布。特定分子在脂膜上的转运是所有细胞的基本特征,参与此转运过程的最主要的基因家族是ATP结合盒转运子超家族。在受感染细胞中,ATP结合盒转运蛋白(ATP binding cassette transporter)A13呈现上调表达,这种阴离子转运蛋白主要负责细胞内胆固醇的转运,在感染期间上调,可能是弓形虫清除宿主细胞脂质的机制之一。
在弓形虫感染过程中,宿主细胞中一些参与氧化应激的蛋白质也呈现差异表达,包括超氧化物歧化酶、HSP27、蛋白质二硫异构酶(PDI)相关蛋白和抗氧化酶过氧化物酶(PRDX)的六个亚型等,表明其与细胞对感染的反应密切相关(Nelson等,2008)。
巨噬细胞是机体重要的免疫细胞,构成了机体抗病原体免疫防御的第一线。弓形虫感染机体后,巨噬细胞产生的NO在抗弓形虫免疫中起到关键作用。Zhou等于2011年应用双向电泳(2-DE)技术结合MALDI-TOF MS/MS串联质谱技术,对感染弓形虫RH株速殖子24小时后的小鼠巨噬细胞蛋白质组进行了研究。与未感染组相比,感染组的巨噬细胞其显著差异表达蛋白点有108个。对其中60个显著上调或下调的差异表达蛋白点进一步进行质谱鉴定,最后成功鉴定出52个蛋白点,它们属于38种特定蛋白,包括肌动蛋白、膜联蛋白、波形蛋白、烯醇化酶、精氨酸酶、组织蛋白酶S、氨基酰化酶1和β-葡糖醛酸苷酶等。利用Uniprot数据库(Swiss-Prot/TrEMBL)和GO数据库对鉴定的蛋白质从生物学过程、细胞组分和分子功能三方面进行了细胞定位和功能分析,这些结果为深入了解弓形虫和宿主巨噬细胞之间的相互关系提供了有价值的信息(Zhou等,2011)。
蜕膜组织浸润大量免疫细胞,其中70%为NK细胞,20%为巨噬细胞,10%左右的NKT细胞、T细胞、树突状细胞及少量B细胞。蜕膜免疫微环境在诱导母胎免疫耐受中起关键作用。Zhang等采用TMT标记定量蛋白质组学技术,自人蜕膜免疫细胞中筛选出181种弓形虫感染所致显著差异表达的蛋白。其中,IL-1β、微小染色体维持缺陷蛋白结合蛋白、环氧化物水解酶2、核帽结合蛋白2(NCBP2-A)、HMGN2、细胞间黏附分子-1(又称CD54)、转录因子CCAAT增强子结合蛋白β(C/EBPβ)、人颗粒酶A和人纤溶酶原激活物抑制因子2等111种蛋白的表达水平显著下调;70kD热休克蛋白6、酰基辅酶A硫酯酶13、线粒体ATP合酶抑制因子、核糖体蛋白L23、肌动蛋白相关蛋白3和MP68等70种蛋白的表达水平显著上调。这些差异表达蛋白参与了生物调节、代谢、应激反应、信号传导和免疫应答等生物学过程;并发现某些蛋白质与妊娠的生理过程密切相关,包括滋养细胞侵袭、子宫螺旋动脉重塑、蜕膜化、胚胎植入和胎儿宫内发育等(Zhang等,2018)。这些蛋白质的鉴定和功能分析将有助于更好地了解弓形虫感染导致的异常妊娠结局发生的相关机制。
弓形虫感染能引起感染宿主血液里的丙氨酸转移酶和天冬氨酸转移酶的含量发生改变,这表明弓形虫感染能影响宿主的肝功能指标。多种肝脏病变(例如肝大、肝炎、肝硬化、肝坏死、肝星状细胞增多以及肝脏代谢能力的改变)与弓形虫感染也存在一定的相关性,但具体的机制有待阐明。通过蛋白组学检测,我们可以获得弓形虫感染后肝脏的蛋白表达数据,深入分析弓形虫感染引起的肝脏差异表达蛋白将为解析弓形虫的致病机制奠定基础。
He等通过研究弓形虫感染后小鼠肝脏的蛋白组学发现,弓形虫感染小鼠肝脏后约有300个蛋白的表达水平发生显著改变,其中有73个蛋白显著下调,228个蛋白显著上调。表达上调的蛋白显著富集于囊泡、细胞核核仁、高尔基体、溶酶体、内质网、肌动蛋白细胞骨架等细胞组分以及免疫、蛋白折叠等生命活动进程。免疫相关GTP酶和GBP蛋白在小鼠抗弓形虫感染中具有重要的免疫调节作用,通过蛋白组学研究发现,小鼠肝脏感染弓形虫后共有5个免疫相关GTP酶和5个免疫相关GBP发生差异表达,且均在弓形虫感染中显著上调。而下调的蛋白显著富集于线粒体、微体等细胞器以及代谢相关的生命进程(例如呼吸链信号通路、脂肪酸代谢、药物代谢等)。通过对上调和下调蛋白使用的转录因子进行分析发现,上调蛋白使用最多的转录因子有Stat2、Stat1、Irf2、Irf1、Sp2、Egr1、Stat3、Klf4、Elf1和Gabpa,这些转录因子调控的蛋白主要参与了免疫反应;而下调蛋白使用最多的转录因子为Hnf4A、Ewsr1、Fli1、Hnf4g、Nr2f1、Pparg、Rxra、Hnf1A、Foxa1和Foxo1,这些转录因子大部分参与了对代谢相关基因的调控。这些结果提示,弓形虫感染可能通过调节这些转录因子参与的信号通路来影响感染宿主的肝功能(He等,2016)。
弓形虫感染大多数为包囊隐性感染,包囊长期甚至终身存在于脑等组织。Zhou等曾对弓形虫PRU株包囊感染昆明鼠后第7天、14天和21天的脑蛋白组进行研究。运用双向电泳技术对蛋白样品进行蛋白质组分离,扫描凝胶图像,利用ImageMasterTM 2D Platinum 5.0软件进行分析,选择表达水平相差在1.5倍以上的蛋白点为显著差异表达蛋白点,共选择60个显著上调或下调的差异蛋白点用MALDI-TOF MS/MS串联质谱进行鉴定和分析。这60个差异表达蛋白点中有56个蛋白点被成功鉴定,属于46种蛋白,包括核纤层蛋白B1、丝氨酸蛋白酶抑制剂、细胞色素b5、抑制素蛋白、内质蛋白、钙网蛋白、载脂蛋白E、α-微管蛋白和β-微管蛋白等,并利用Uniprot Knowledgebase和Gene Ontology database对鉴定成功的蛋白质进行了功能预测(Zhou等,2013),这些结果有助于了解弓形虫包囊感染的不同时间对宿主脑组织的影响。
有学者应用iTRAQ技术分析比较了感染弓形虫和未感染的蒙古沙鼠脑组织蛋白质组,共检测到4 935种蛋白,其中110种蛋白的表达具有显著差异;蛋白酪氨酸激酶、蛋白谷氨酰胺γ谷氨酰转移酶、Rho因子鸟苷酸解离抑制蛋白、氨基肽酶、色氨酸-tRNA连接酶和膜突蛋白等48种蛋白显著上调表达,而电压依赖性阴离子选择通道蛋白2、囊泡抑制性氨基酸转运体、V型质子ATP酶亚基C1、丝氨酸/苏氨酸蛋白磷酸酶5、电压依赖性阴离子选择通道蛋白1和非特异性丝氨酸/苏氨酸蛋白激酶等62种蛋白显著下调表达。通路分析和GO注释表明这些差异表达蛋白与免疫应答、代谢和神经系统过程(例如神经元生长和神经递质运输)等通路的失控有关。这些结果有助于鉴定参与弓形虫脑炎发病机制的关键蛋白,更好地研究弓形虫慢性感染中宿主与弓形虫互作的关系(Lv等,2017)。
对确诊有HIV-1感染的5例弓形虫病患者的脑组织,和5例未感染弓形虫的患者脑组织,应用iTRAQ技术分析比较他们蛋白质组的差异。结果共检测到3 496种蛋白质,其中表达差异显著的蛋白有607种;主要组织相容性复合体I类、髓过氧化物酶、α-1-抗胰蛋白酶、C-反应蛋白、胞间黏附分子1、谷氨酸受体3亚型1、电压依赖性钙通道γ-2亚单位、突触结合蛋白-1、突触融合蛋白结合蛋白和突触前膜蛋白1等293种蛋白显著上调表达,而天冬氨酸酰基转移酶、髓鞘脂蛋白、Rho相关GTP结合蛋白G、羰基还原酶1、3-磷酸甘油脱氢酶、突触囊泡膜蛋白VAT-1、Ras相关蛋白Rap-1A和热休克相关70蛋白2等314种蛋白则显著下调表达。通路分析表明,差异表达蛋白主要涉及抗原加工、免疫应答、神经元生长、神经递质转运和能量代谢等通路(Sahu等,2014)。
猪既是一种重要的经济动物,也是弓形虫传播过程中的重要中间宿主。家猪对弓形虫卵囊非常敏感,1个孢子化卵囊即可使猪感染弓形虫。我国流行的弓形虫基因型主要为Chinese 1(即Toxo DB#9),家猪的弓形虫感染率在10%~45%之间,给养猪业造成巨大的经济损失。对猪感染弓形虫后不同组织的蛋白组研究发现,在感染后的第6天,脑、肝、肺、肠系膜淋巴结以及脾分别有156个、391个、170个、292个、200个蛋白的表达发生显著差异;在感染后第18天,脑、肝、肺、肠系膜淋巴结以及脾分别有339个、351个、483个、388个、303个蛋白的表达发生显著差异(He等,2020)。通过对差异表达蛋白的功能、通路进行富集分析发现,表达上调的蛋白显著富集于免疫相关的通路(其中包括抗原递呈通路以及补体相关的通路)。这表明猪各组织在感染弓形虫后,免疫反应均受到上调。此外,通过蛋白组学分析还发现,虽然猪肝脏的免疫相关通路在弓形虫感染中上调,但是肝脏代谢相关的通路在弓形虫急性感染期(感染后第6天)却被显著下调。这与小鼠弓形虫急性感染期的肝脏蛋白组学检测数据一致,提示弓形虫急性感染期引起的肝代谢能力下调可能是一个普遍的现象。在猪感染弓形虫后的多器官蛋白组学检测中,虽然在不同组织器官、不同感染时期共鉴定到数百个差异表达蛋白,但是却没有发现共同的差异表达蛋白。影响这一结局的因素很多,其中不同组织器官在不同感染阶段对弓形虫感染的反应及反应强度可能有密切的关系。采用其他分析方法例如软阈值的方法来分析宿主应对弓形虫感染的共同反应可能会获得更理想的结果。
加权基因共表达网络分析(weighted gene co-expression network analysis,WGCNA)是一种软阈值共表达算法,其与一般的聚类算法不同。首先,WGCNA会将基因表达的相关系数进行处理,使得相关系数分布符合无尺度网络分析要求、让数据更符合生物学规则。然后通过软阈值和权重网络计算基因与样品表型之间的联系,并对与样品表型相关的关键基因进行鉴定。通过将均一化后的蛋白表达量进行WGCNA分析,发现猪在感染弓形虫后共有25个基因共表达模块。其中一个模块(共有301个蛋白)与弓形虫的感染呈显著相关性。根据蛋白表达量的变化,这301个蛋白又分为上调(含163个蛋白)和下调(含138个蛋白)两大类。通常情况下,宿主会在感染病原后通过上调抗感染相关的基因表达来控制病原感染。为了验证这一假设,通过对上调和下调的蛋白分别进行功能、通路富集分析发现,上调的蛋白显著富集于免疫、感染相关的通路,故这163个鉴定到的蛋白可能是家猪抗弓形虫感染的相关基因。根据感染相关系数的显著性,前30个与弓形虫感染显著相关的蛋白分别是:HSP90AA1、PLCH1、SERPINA3-3、HSPA4、GBP1、HSPCB、STIP1、TRIM21、HYOU1、HSPA5、ITGAL、PZP、GVIN1、PDIA3、ERAP1、C3、SLA-DRA、LOC100513619、C4、GP91-PHOX、HSPH1、PLG、GBP7、STAT3、CASP1、HSP90B1、HSPA8、PPIB、TAP1和HSP70.2。通过受试者工作曲线(receiver operator characteristic curve,ROC)分析发现,这30个蛋白在响应弓形虫感染方面均具有很高的敏感性和特异性,可能是家猪抗弓形虫感染的关键基因。通过在猪肺泡巨噬细胞(3D4/21细胞系)中过表达HSP70.2和PDIA3蛋白,结果发现猪巨噬细胞在过表达HSP70.2和PDIA3蛋白后其细胞内的弓形虫含量相对较低,表明通过WGCNA鉴定到的基因确实属于猪抗弓形虫感染的关键基因(He等,2020)。
生物信息学是一种利用生物学知识、计算机科学和信息技术对生物学数据进行存储、检索和分析的技术,是高通量组学数据分析的重要手段。生物信息学分析往往离不开对各种数据库的使用,随着高通量组学技术的发展,生物信息学数据库如雨后春笋般的快速发展。目前,收录弓形虫蛋白质组学数据的数据库主要有ToxoDB(https://toxodb.org/toxo/)和Experimental ProteomICs DataBase for Toxoplasma gondii and Cryptosporidium parvum (http://toro.fiserlab.org/cgi-bin/biodefense/main.cgi,EPICDB)。
ToxoDB数据库是弓形虫研究领域使用频率最高的数据库,该数据库收录了关于弓形虫各个方面的信息,是一个专门的弓形虫分子生物学数据库。在蛋白分析方面,ToxoDB数据库整合了基因的蛋白序列、文献数据、结构域、信号肽、亚细胞定位、基因表达量、基因敲除表型、免疫多肽、互作蛋白、蛋白功能与通路预测、代谢分析以及质谱数据分析等多方面的分析结果。ToxoDB数据库目前收录了多种弓形虫蛋白组学检测数据,涵括了弓形虫卵囊、速殖子、缓殖子、分泌蛋白组、乙酰化蛋白组、泛素化蛋白组、磷酸化蛋白组、甲基化蛋白组、细胞器等蛋白组学数据。这些数据为进一步解析、探索弓形虫的生物学特性以及药物开发提供了数据支持(详见第十七章)。
EPICDB是一个收录弓形虫和隐孢子虫蛋白组学数据的数据库。目前,EPICDB数据库收录的弓形虫蛋白组学数据有膜蛋白组学数据、胞质蛋白组学数据以及糖蛋白组学数据。该数据库不仅支持对弓形虫蛋白信息进行查询,还能通过关联外部数据库对弓形虫蛋白的功能进行预测。目前支持分析功能包括蛋白的Pfam结构域预测、基因本体论注释、跨膜结构域预测、信号肽预测以及GPI锚定蛋白预测。与ToxoDB数据库不同,在比较基因组学分析选项里,EPICDB数据库除了支持顶复门原虫的比较,还支持与其他已知物种的比较,能分析该蛋白是否为物种特有蛋白。为了便于分析,EPICDB还对弓形虫的转录因子进行了预测和分类。目前,EPICDB数据库将弓形虫的转录因子分为5组,根据弓形虫蛋白表达数据,EPICDB数据库对弓形虫转录因子的特有靶基因和共同靶基因进行了预测和分析。此外,还有一些网站可为弓形虫蛋白质组学研究提供研究思路和参考。例如,Barylyuk等于2020年通过空间蛋白组学技术对弓形虫微线体、致密颗粒、棒状体、线粒体等亚细胞结构的蛋白进行了分析、鉴定,并将数据公布于网站https://proteome.shinyapps.io/toxolopittzex/,相关的亚细胞定位数据也被整合进了ToxoDB数据库。
虽然目前针对弓形虫的蛋白组数据库比较少,但其他非弓形虫蛋白数据库的利用也为弓形虫与宿主互作的蛋白组学研究提供了有力的支持。例如,与信号通路、蛋白功能有关的KEGG、GO、COG和Pfam等数据库;与转录调控有关的DP-Bind、ENCODE、TRRUST、JASPAR、DBTSS、The Interactome和cisRED等数据库;与蛋白互作相关的STRING、BioGRID、Reactome、BIND、HPRD和PIPs等数据库;与代谢相关的LAMP、ToxoNet1、ENZYME和BRENDA等数据库;与免疫相关的InnateDB、immuneXpresso、IEDB和ImmuneDB等数据库。在研究弓形虫与宿主互作蛋白组时如能综合使用这些数据库进行数据分析,将有利于我们深度挖掘弓形虫与宿主互作的蛋白组学数据,为研究宿主抵抗弓形虫感染、弓形虫逃避宿主免疫清除等互作机制提供有力的支持。有关弓形虫相关的数据库使用,详见第十七章。
(朱兴全 龙少军 贺君君 王泽祥 周春雪 丛 伟 周东辉)