1998年,英国Sanger中心和法国Pasteur研究所合作完成了结核分枝杆菌H 37 Rv的全基因组测序工作。2002年,Camus等根据新的实验数据和序列信息,又发现了82个能够编码多肽的新基因。基于和已有基因组序列的比较以及来自文献中的数据,确定了2058个蛋白质的功能,预测其中376个蛋白质是分枝杆菌所独有的。
1999年,Behr等利用DNA微阵列杂交法比较H 37 Rv、 M.bovis 以及多个BCG菌株的差异,结果发现与H 37 Rv相比, M.bovis 有11个缺失区(包含91个ORF),BCG菌株在这11个缺失区的基础上还有5个缺失区(包含38个ORF)。和BCG菌株DNA序列相比,把MTB中存在的DNA序列差异区域(regions of difference,RD)称为缺失区。目前,对于MTB RD区编码的蛋白有较多研究,并取得了可喜的研究进展。
RD1区全长9.5kb,包含9个阅读框即 Rv3871 ~ Rv3879c ,在MTB H 37 Rv和 M.bovis 基因组中存在,在BCG菌株中缺失。RD1区所编码的蛋白是MTB的主要毒力因子之一,被认为在MTB的致病过程中起关键作用。 Rv3871 编码的EccCb1蛋白是ESX-1分泌系统的重要组成部分,可与 Rv3870 编码的蛋白结合共同形成分子转运通道;又能与ESAT-6/CFP-10二聚体结合参与其分泌转位;也有研究揭示, Rv3871 编码的蛋白可能在ESAT-6/CFP-10蛋白的折叠、分泌过程中起关键作用。卡介苗基因组中这段序列的缺失可能与其保护力减弱有直接关系。 Rv3872 编码的PE35蛋白和 Rv3873 编码的PPE68蛋白可能在结核病的发病过程中起重要作用,有助于MTB感染状态的建立和维持,此外PE35和PPE68蛋白在结核病的感染发病过程中起重要的免疫调节作用。 Rv3874 和 Rv3875 分别编码CFP-10和ESAT-6两个低分子质量蛋白。这两个基因的表达受同一个启动子调控,其产物CFP-10和ESAT-6形成紧密的1∶1蛋白质复合物发挥生物学功能,预测其可能在病原体-宿主细胞信号转导中发挥关键作用;CFP-10的C-末端形成的氨基酸臂,对蛋白质的分泌起重要作用。Zhang等使用遗传学方法证实 Rv3876 编码的EspI蛋白是MTB ESX-1分泌系统的组成部分之一,在细胞ATP水平消耗的条件下,EspI在负向调节ESX-1介导的分泌过程中起重要作用。 Rv3877 编码的跨膜蛋白EccD1是组成蛋白质分泌通道的主要成分。 Rv3878 编码ESX-1分泌相关蛋白EspJ,且EspJ与STPKs介导的磷酸化联合作用是促进分枝杆菌生长的主要机制之一。 Rv3879 编码的分泌蛋白EspK能够和 Rv3871 编码的蛋白EccCb1相互作用,促进蛋白Rv3881c/Mh3881c(EspB)的分泌。
RD2区全长5.6kb,包含11个阅读框,即 Rv1978 ~ Rv1988c ,在牛分枝杆菌基因组和部分BCG菌株中存在,在BCG-Danish、BCG-Prague、BCG-Glaxo、BCGConnaught、BCG-Phipps、BCG-Tice和BCG-Pasteur菌株中缺失。RD2区对MTB毒力方面起重要作用,某些基因编码的蛋白与BCG的安全性和宿主的免疫应答有关,如Rv1979c可能是一种氨基酸转运蛋白,并且该基因的缺失可能抑制巨噬细胞生长。 Rv1980c 编码的MPT64和 Rv1984c 编码的CFP21,可诱导机体产生强烈的免疫应答。 Rv1982c 可以编码毒素-抗毒素家族蛋白(toxin-antitoxin,TA)VapC36,VapC36可以通过RNA酶活性抑制翻译。Rv1987蛋白是RD2区基因编码的一种具有免疫效力的分泌蛋白,有研究表明该蛋白可以调节宿主免疫反应向Th2型细胞应答转化,可能有助于细菌逃逸宿主免疫识别。 Rv1988 编码的蛋白是重要的分枝杆菌毒力因子,可作为治疗分枝杆菌感染的潜在靶标。 Rv1978 编码的蛋白为假定蛋白。
RD3区全长9.3kb,包含14个阅读框,即 Rv1573 ~ Rv1586c ,在牛分枝杆菌基因组中存在,在全部BCG菌株中缺失。研究表明,噬菌体衣壳蛋白Rv1576c、Rv1578c和噬菌体整合酶Rv1586c可能与MTB适应环境及发病机制有关。Rv1580c可能是鉴定血清样品中牛分枝杆菌感染的理想选择。 Rv1573 ~ Rv1585c 编码的蛋白为噬菌体蛋白。
RD4区全长1.9kb,包含3个阅读框,即 Rv0221 、 Rv0222 和 Rv0223c ,在MTB H 37 Rv和非洲分枝杆菌基因组中存在,在BCG菌株和牛分枝杆菌基因组中缺失。Rosenkrands等对MTB差异区RD2-7、RD9-13和RD15的47个基因进行基因克隆表达,并纯化重组蛋白,采用血清学检测发现 Rv0222 编码的蛋白EchA1具有很高的血清学诊断价值,并在人类免疫缺陷病毒(human immunodeficiencyvirus,HIV)感染者中呈现较高的灵敏度,其识别HIV阳性结核患者的灵敏度为43%,识别HIV阴性肺结核患者的灵敏度为30%。 Rv0221 和 Rv0223c 编码的蛋白分别为甘油三酯酶和乙醛脱氢酶。
RD5区全长2.8kb,包含5个阅读框,即 Rv3117 、 Rv3118 、 Rv3119 、 Rv3120 和 Rv3121 ,在MTB H 37 Rv和非洲分枝杆菌基因组中存在,在BCG菌株和牛分枝杆菌基因组中缺失。RD5区的完整性可能与生物毒力作用增加有关。 Rv3121 编码细胞色素蛋白Cyp141,可能参与调节宿主的免疫反应,可以作为新型疫苗的候选成分,在结核病的诊断方面具有潜在的价值。 Rv3118 编码的蛋白为假定蛋白, Rv3119 编码的蛋白为MoaE1。
RD6区全长12.8kb,包含11个阅读框,即 Rv1506c ~ Rv1516c ,其中包含编码3个糖代谢途径中的相关蛋白,如GDP-D-甘露糖脱水酶GmdA(Rv1511)、核苷酸异构酶EpiA(Rv1512)、糖基转移酶Rv1516c以及2个膜蛋白Rv1508c和Rv1510。在MTB H 37 Rv和非洲分枝杆菌基因组中存在,在牛分枝杆菌和BCG菌株基因组中缺失。通过对重组蛋白Rv1515c在分枝杆菌和宿主相互作用中的功能研究发现,Rv1515c能通过影响脂肪酸合成而引起一系列菌落表型变化,包括滑动能力、单菌落形态和生物膜的形成,从而增强耻垢分枝杆菌在体外的存活能力,并能使鼠源巨噬细胞RAW264.7和人源巨噬细胞THP-1中细胞因子IL-6和IL-10 mRNA表达水平显著下调,表明Rv1515c蛋白是与MTB致病性相关的一种调控蛋白,可作为新型的抗结核药物靶点。 Rv1506c 、 Rv1507c 、 Rv1509 、 Rv1513 和 Rv1514c 编码的蛋白为假定蛋白。
RD7区全长9.0kb,包含8个阅读框,即 Rv2346c ~ Rv2353c ,在MTB H 37 Rv和非洲分枝杆菌基因组中存在,在牛分枝杆菌和BCG菌株基因组中缺失。曹廷明等对Rv2352c蛋白进行基因克隆表达、纯化后免疫新西兰兔,发现能够刺激产生高滴度的抗体反应;之后对Rv2352c重组蛋白进行免疫印迹分析,结果显示该重组蛋白能与结核病患者血清发生良好免疫反应,证明Rv2352c蛋白具有很好的免疫原性和抗原性。 Rv2346c 基因编码的蛋白能够诱导MTB在巨噬细胞内的氧化应激来提高MTB的生存能力。 Rv2347c 基因编码的蛋白可能与MTB毒力有关。 Rv2348c 编码的蛋白为假定蛋白, Rv2349c 、 Rv2350c 和 Rv2351c 编码的蛋白分别为磷酸酯酶C(PlcC)、膜磷酸酯酶B(PlcB)和膜磷酸酯酶A(PlcA)。
RD8区全长3.4kb,包含4个阅读框,即 Rv0309 ~ Rv0312 ,在非洲分枝杆菌和BCG菌株基因组中存在,在牛分枝杆菌基因组中缺失。蒋天舒等构建了高效表达的Rv0309重组质粒并获得了高纯度Rv0309重组蛋白,表明Rv0309具有诱导宿主产生保护性免疫应答作用,为进一步利用该抗原制备结核病新疫苗提供依据。 Rv0310c 、 Rv0311 和 Rv0312 编码的蛋白为假定蛋白。
RD9区全长18.3kb,包含7个阅读框,即 Rv3617 ~ Rv3623 ,在MTB H 37 Rv基因组中存在,在非洲分枝杆菌、牛分枝杆菌和BCG菌株基因组中缺失。有研究用重组Rv3618蛋白作为抗原,采用ELISA检测71例肺结核患者血清中特异性Rv3618蛋白和38KD蛋白的IgG抗体,发现Rv3618与38KD蛋白联合可用于肺结核病患者的血清学检测且呈现较高的敏感性,认为Rv3618蛋白可作为结核病血清学诊断的抗原之一。也有研究揭示 IS6110 和 Rv3618 基因可以作为检测MTB的分子靶标;使用免疫色谱法(PCR-ICT),同时检测1500个临床痰标本中的MTBC和MTB,将结果与传统培养和生化鉴定结果进行比较,并与患者的临床结果进行比较,整体敏感性为93.0%,特异性为99.8%,其中检测MTBC的灵敏度为95.5%、特异性为97.9%,检测MTB的灵敏度为93.0%、特异性为99.8%,证明 Rv3618 在结核病诊断上具有较好的潜在应用价值。Rv3620c也是MTB的重要免疫显性抗原。以Ag85B-ESAT6-Rv3620c融合基因重组卡介苗构建了一种新型重组卡介苗(recombinant BCG,rBCG),动物实验结果显示与BCG相比,rBCG可以显著增加Th1型细胞免疫应答和特异性体液应答。 Rv3617 编码的蛋白为环氧化物水解酶EphA, Rv3619c 编码的蛋白为EsxV(ESAT-6), Rv3621c 的预测功能为编码蛋白PPE65, Rv3622c 编码蛋白PE32。
RD10区全长3.0kb,包含3个阅读框,即 Rv1255c ~ Rv1257c ,在MTB H 37 Rv和非洲分枝杆菌基因组中存在,在牛分枝杆菌和BCG菌株基因组中缺失。RD10区对MTB有保护作用,与毒力无关,因此可用于新疫苗研发。 Rv1255c 的编码蛋白为转录调控因子, Rv1256c 编码的蛋白为细胞色素P450 Cyp130, Rv1257 编码的蛋白为氧化还原酶。
RD11区全长28.8kb,包含5个阅读框,即 Rv3425 ~ Rv3429 ,在MTB H 37 Rv基因组中存在,在BCG菌株基因组中缺失。研究表明Rv3425蛋白在结核病诊断方面具有很高的应用价值。 Rv3426 的预测功能为编码蛋白PPE58, Rv3427c 和 Rv3428c 编码的蛋白为转座酶, Rv3429 编码蛋白PPE59。
RD12区全长2.0kb,包含4个阅读框,即 Rv2072c 、 Rv2073c 、 Rv2074 和 Rv2075c ,在MTB H 37 Rv基因组中存在,在BCG菌株基因组中缺失。Tan在研究Rv2073c和Rv2074两种蛋白时发现,与健康对照组相比,Rv2073c蛋白只在结核病组诱导分泌高水平的IFN-γ且呈正相关关系,表明Rv2073c可作为MTB特异性诊断试剂和疫苗的备选成分之一。 Rv2072c 和 Rv2075c 编码的蛋白分别为甲基转移酶CobL和假定蛋白。
RD13区全长11.0kb,包含16个阅读框,即 Rv2645 ~ Rv2660c ,在MTB H 37 Rv和牛分枝杆菌基因组中存在,在BCG菌株基因组中缺失。研究发现,结核病患者外周血用Rv2645特异性刺激产生IFN-γ水平比健康人高;Rv2645能诱导接种了热灭活H 37 Rv的小鼠发生结核菌素特异性皮肤试验反应,可作为一种新型的细胞介导的结核病免疫诊断试剂。有研究表明,纯化的重组Rv2659c蛋白可在潜伏结核感染患者中引起T细胞应答的选择性免疫原性,提示该蛋白具有潜在的诊断价值且可能是对潜伏结核感染患者使用的候选疫苗之一。 Rv2646 编码的蛋白为整合酶, Rv2648 编码的蛋白为转座酶IS6110(片段), Rv2649 编码的蛋白为转座酶IS6110, Rv2650c 、 Rv2652c 、 Rv2653c 、 Rv2655c 、 Rv2656c 和 Rv2658c 编码的蛋白为噬菌体蛋白, Rv2651c 编码的蛋白为噬菌体蛋白酶, Rv2647 和 Rv2660c 编码的蛋白为假定蛋白。
RD14区全长9.1kb,包含8个阅读框,即 Rv1766 ~ Rv1773c ,在大部分BCG菌株基因组中存在,在牛分枝杆菌基因组和BCG-Pasteur菌株中缺失。研究表明,Rv1769和Rv1772均可作为T细胞抗原诱发较强的T细胞免疫反应,提示其可作为潜在的细胞免疫检测抗原或亚单位疫苗成分。 Rv1771 编码一种脱氢酶,具有合成维生素C的能力。 Rv1766 、 Rv1767 和 Rv1770 编码的蛋白为假定蛋白, Rv1768 编码的蛋白为PEPGRS家族蛋白PE-PGRS31, Rv1773c 编码的蛋白为转录调控蛋白。
RD15区全长12.7kb,包含15个阅读框,即 Rv1963c ~ Rv1977 ,在MTB H 37 Rv基因组中存在,在牛分枝杆菌和BCG菌株基因组中缺失。 Rv1966 ~ Rv1971 分别编码蛋白质Mce3A、Mce3B、Mce3C、Mce3D、Mce3E和Mce3F,研究表明这6种蛋白在MTB体外生长过程中均检测到mRNA的高表达,提示其可能与MTB的发病机制有关。 Rv1973 编码的蛋白为外膜蛋白。Jiang等发现 Rv1977 编码的蛋白可能是一种特异性抗原,可能参与宿主免疫逃避。 Rv1963c 编码的蛋白为转录抑制因子Mce3R, Rv1964 、 Rv1965 、 Rv1972 和 Rv1974 编码的蛋白均为膜蛋白, Rv1975 和 Rv1976c 编码的蛋白为假定蛋白。
RD16区全长7.6kb,包含6个阅读框,即 Rv3400 、 Rv3401 、 Rv3402c 、 Rv3403c 、 Rv3404c 和 Rv3405c ,在大部分BCG菌株基因组中存在,在牛分枝杆菌基因组、BCG-Moreau菌株和BCG-Russia菌株的基因组中缺失。 Rv3400 编码一种水解酶,参与分枝菌酸合成。朱琳等发现抗原Rv3400能够诱导高水平IL-6和TNF-a的分泌,增加巨噬细胞表面分子CD80、CD86、CD40、MHCⅡ的表达,提高巨噬细胞吞噬能力;亚单位疫苗Rv3400-IFA在C57BL/6小鼠体内可产生较好的细胞免疫和体液免疫效应,提示Rv3400有望成为新型结核病疫苗及诊断标志物的候选成分。Rv3402c通过干扰宿主的信号途径来扰乱宿主的免疫应答,最终导致巨噬细胞的快速裂解及提高细菌在胞内的存活率。 Rv3401 、 Rv3403c 和 Rv3404c 编码的蛋白为假定蛋白, Rv3405c 编码的蛋白为转录调控蛋白。
结核病的感染、发生、发展及转归均依赖于机体细胞免疫反应的不同作用机制,一般认为机体对MTB的免疫,首先是细胞免疫,其次是体液免疫。其中CD4 + 和CD8 + T淋巴细胞在机体对MTB的细胞免疫应答中起重要作用;B细胞主导体液免疫,越来越多的研究表明体液免疫在抗原呈递、刺激机体产生保护性抗体、调节宿主免疫应答等方面起重要作用。淋巴细胞识别外来抗原依赖于短肽片段(即表位)。MTB中存在编码T细胞和B细胞抗原表位的氨基酸序列。抗原表位又称抗原决定簇(antigenic determinant,AD),指抗原分子中决定抗原特异性的特殊化学基团。抗原通过抗原表位与相应淋巴细胞表面的抗原受体结合,从而激活淋巴细胞,引起免疫应答;抗原也借表位与相应抗体或致敏淋巴细胞发生特异性结合而发挥免疫效应。抗原表位的性质、数目和空间构型决定抗原的特异性。抗原表位在抗原诱发免疫应答时起决定性作用。B细胞抗原表位是抗原表面与B细胞相互识别、刺激B细胞产生抗体或分泌细胞因子、调节免疫应答的特殊结构。
2008年,Enrst等建立了一个免疫表位数据库(immune epitopes database,IEDB),在此数据库中共有491个预测的MTB人T细胞抗原表位。其中在H 37 Rv中仅包含了480个人T细胞抗原表位。Jiang等对180株MTB临床分离株的480个人T细胞抗原表位基因进行PCR扩增,比较其在基因及氨基酸水平的差异,筛选出可能发生免疫逃逸的抗原表位及蛋白,结果显示:480个抗原表位中,有415个表位序列高度保守,65个表位在基因水平发生了变异,占13.54%;在氨基酸水平上,共有60个表位发生了氨基酸的改变,占12.5%;有18个蛋白在基因水平发生了变化,变化较大的几个表位位于 pstS1 、 esxL 、 mpt64 、 esxO 、 lppX 和 MT0322 基因中,都发生了两个及以上氨基酸的改变;在这次研究的480个表位中,dN/dS的值为1.38,有12个基因的dN/dS值大于1,说明这些基因在遗传学上受压力选择的作用而可能发生免疫逃逸;此外,还发现北京基因型菌株比非北京基因型菌株人T细胞抗原表位基因更为保守,从而使人淋巴更容易识别北京基因型菌株,而淋巴细胞是造成MTB人间传播的关键要素,因此提示北京基因型菌株比非北京基因型菌株更容易传播。
目前已知的MTB人B细胞抗原表位为399个,分别由81个基因编码;无论在卡介苗菌株中,还是在MTB临床分离菌株中,绝大多数B细胞抗原表位均高度保守。李马超等报道,在13株卡介苗菌株的基因组中321个B细胞抗原表位的编码序列未发生任何变化;全部表位根据变化情况可分为5个Group,Group 1 包含321个B细胞抗原表位,在全部卡介苗菌株中均高度保守;Group 2包含15个B细胞抗原表位,在全部卡介苗菌株中存在相同的点突变;Group 3包含26 个B细胞抗原表位,在全部卡介苗菌株中缺失;Group 4包含13个B细胞抗原表位,在部分卡介苗菌株中缺失;Group 5包含23个B细胞抗原表位,在不同的卡介苗菌株中发生特异性变化。BCG-Tokyo 172和BCG-China 菌株中拥有357个完整的MTB人B细胞抗原表位,为13株卡介苗菌株中拥有B细胞抗原表位数量最多的疫苗株。李马超等研究显示,在180株MTB临床分离菌株中,293个MTB人B细胞抗原表位未发生任何碱基序列变化,104个MTB人B细胞抗原表位的编码序列发生了不同程度变化,78个表位的多肽序列发生了变异;在150株拥有完整测序结果的菌株中,1株菌发生了12个B细胞抗原表位编码序列的变化,为发生B细胞抗原表位编码序列变化最多的菌株,10株菌株397个B细胞抗原表位编码序列未发生任何变化;99.33%临床分离菌株(149/150)MTB人B细胞抗原表位的变化数量不超过10个;MTB临床菌株中B细胞抗原表位的分布高度保守。B细胞抗原表位及编码基因的高度保守使得MTB更容易被宿主识别、在人群中广泛传播;在全部编码序列中,无论B细胞抗原表位的编码基因、B细胞抗原表位的编码区还是非表位的编码区,大多数情况下其dN/dS值均小于1,倾向于受纯化选择压力的作用,这也提示在疫苗设计时应充分考虑采用添加可变抗原成分来提高疫苗的保护力。
蛋白质是MTB实现入侵、潜伏、增殖、耐药等功能的主要执行者。研究MTB蛋白质,对明确致病机制、潜伏机制、耐药机制等有重要意义。20世纪90年代以前,结核分枝杆菌蛋白功能都是通过传统的生化方法和单克隆抗体筛选来鉴定和诠释。一些重要的蛋白质,如Ag85复合物、MPB64、MPB70以及一些细胞质蛋白,如DnaK、GroEl和SodA,都是使用传统方法鉴定。
蛋白质组学这一概念在1994年被首次提出,其含义为“一个基因组或一个细胞、组织在特定时间及空间上表达的全部蛋白质”。传统的蛋白质研究只注重单一蛋白质,而蛋白质组学研究注重一组参与特定生理或病理状态的所有蛋白质种类及其与周围环境的关系。因此,蛋白质组学研究能提供更多有关MTB生命和活动的信息。截至目前,蛋白质组学的核心研究技术主要包括双向电泳(2-DE)、生物质谱和生物信息学。随着技术的不断发展,目前各类生物质谱技术和生物信息学成为研究MTB蛋白质组的主要技术。近年来,关于结核分枝杆菌蛋白质组,从全蛋白组的解析研究到靶向蛋白的功能调控蛋白组研究,都有许多进展。
1998年MTB基因组测序的完成为蛋白组学的研究提供了可能,标志着结核病研究已经进入后基因组研究时代。但根据基因组信息预测的4000多个开放读码框,经过实验证实其蛋白结构的只有300余个,更多开放读码框的蛋白功能未能诠释。2011年,Anand等通过生物信息学方法注释了结核分枝杆菌H 37 Rv的蛋白组(图1-3-1),共注释了2877个蛋白功能,主要是通过基因序列预测蛋白折叠结构和新的结合位点,从而预测蛋白功能。用于预测的序列长度百分比主要在50%以上,其中,序列预测长度大于90%的有1423个蛋白。通过预测获得的蛋白折叠形式主要包括铁蛋白样、DNA/RNA结合3-螺旋束、含有核苷三磷酸的P-环水解酶等。根据预测获得的蛋白功能,主要包括脂代谢蛋白、信号通路蛋白、PE/PPE家族蛋白、其他代谢相关蛋白、调控类蛋白、插入序列和噬菌体相关的蛋白等。H 37 Rv蛋白质组的解析,对研究结核病致病机制和筛选抗结核治疗靶点有积极作用。
图1-3-1 结核分枝杆菌H 37 Rv蛋白质组解析
Gunawardena等应用2D结合LC-MS技术解析了MTB和BCG菌株的所有膜蛋白。研究鉴定到2203个膜蛋白,其中结核分枝杆菌2003个,BCG菌株2009个,1809个膜蛋白是MTB和BCG菌株共有的,194个膜蛋白是MTB特有的,200个膜蛋白是BCG菌株特有的。2203个膜蛋白中,只有26%的蛋白(580个)具有跨膜结构域或胞质输出信号肽序列,这些数据为揭示结核分枝杆菌的内在毒力因子提供了蛋白组学基础。Bell等通过分离亚细胞组分、富集细胞膜组分,利用液相色谱-质谱鉴定了MTB细胞壁、细胞膜、细胞浆、裂解物和分泌产物,得到1051个蛋白质,包括183个跨膜蛋白。
纯蛋白衍化物(PPD)的蛋白质组组成也得以阐明。Prasad等分析了FDA标准株PPD-S2的蛋白质组成分,显示其由至少240种蛋白质组成,包含许多已知的MTB T细胞抗原(GroES、GroEL2、HspX和DnaK等)。对PPD-S2、RT23和PPD-KIT之间的比较蛋白质组学分析表明,Esx蛋白家族成员的相对丰度差异可能是导致RT23和PPD-KIT试剂引发炎症反应增加的原因。PPD试剂的异质性可能是人群中迟发型超敏反应差异的原因之一。对PPD-CT68(Tubersol)的蛋白质分析显示,约142个蛋白质是PPD-CT68和PPD-S2的共有蛋白,其中123个蛋白是PPD-CT68特有的,89个蛋白是PPD-S2特有的。MTB、牛分枝杆菌和鸟分枝杆菌来源的纯蛋白衍化物中仅有18个蛋白质是共有的,充分说明了不同菌株间的蛋白质组差异,这或许是引起不同毒力和致病力的重要原因。
MTB中存在,但牛分枝杆菌和BCG菌株中不存在的蛋白质是用于新型结核病诊断、治疗和疫苗研发的有价值抗原。因此,比较蛋白质组学分析侧重于区分强毒和减毒分枝杆菌菌株之间的蛋白质组成。
Jungblut等使用2-DE和MALDI/MS技术分析比较了两种毒力MTB菌株(H 37 Rv和Erdman菌株)和两种BCG菌株(芝加哥和哥本哈根型)中的蛋白质。这些菌株的蛋白质组成非常相似,但在蛋白胶上呈现的斑点位置和强度存在一些差异。与BCG菌株相比,H 37 Rv菌株包含13个特异斑点,但是缺少8个斑点。其中6个斑点在H 37 Rv中独有,包括L-丙氨酸脱氢酶(Rv2780)、苹果酸异丙酯合酶(Rv3710)、烟酸-核苷酸焦磷酸酶(Rv1596)、MPT64(Rv1980c)等。另外,H 37 Rv菌株有9个斑点的强度较低,1个斑点的强度较高。这些差异斑点正是毒力株和减毒株所特有的差异。Malen等使用2-DE和MS技术对MTB强毒株H 37 Rv和减毒株H 37 Ra进行了比较蛋白质组分析。两类菌株共鉴定到1700余个蛋白,其中29个膜蛋白在两类菌株中的表达量差异达到5倍以上,19个膜蛋白和脂质相关蛋白在H 37 Rv菌株中高表达,另外10个蛋白在H 37 Ra菌株中高表达。这些差异蛋白可能与MTB毒力变化有关。有研究进一步使用高分辨率傅立叶变换质谱法探讨了强毒株H 37 Rv和减毒株H 37 Ra的蛋白质组和磷酸化蛋白质组图谱。在两类菌株中共鉴定到2709种蛋白质并成功定量,同时鉴定获得来自257种蛋白质的512个磷酸化位点。除了证实先前描述的MTB磷酸化蛋白的存在外,其中265个磷酸化位点是首次鉴定获得的磷酸化位点。定量蛋白质组学分析显示,与H 37 Ra相比,H 37 Rv中属于毒力相关的Ⅶ型细菌分泌系统的蛋白质上调超过5倍,共计84种蛋白质表现出毒力和减毒菌株之间磷酸化水平的变化。对H 37 Rv和H 37 Ra蛋白表达水平或磷酸化水平改变的蛋白质生物信息学分析揭示了脂肪酸生物合成和双组分调节系统中涉及的途径的富集。这一数据为进一步探索H 37 Rv和H 37 Ra分子水平的功能差异提供了资源。
蛋白质组学也被用于研究不同BCG菌株亚型的保护差异。Gunawardena等通过蛋白质组学发现BCG菌株不同亚型的LpqH、Icl1和GlcB蛋白表达发生变化。除此之外,与MTB相比,BCG菌株中的ESX-3水平降低。由于ESX-3在MTB中是必不可少的,参与铁、锌离子的体内平衡,因此通过提高ESX-3水平也许能够提高BCG的保护效率。
对具有毒力或耐药差异的MTB菌株进行蛋白质组学分析可能提供与致病性相关的线索,并有助于鉴定毒力因子。根据流行病学和群体特征以及小鼠感染模型中的毒力所定义的两种临床北京菌株,使用非标记定量蛋白质组学方法评估两种菌株蛋白质丰度的差异,发现48种蛋白质在低毒分离株中过量表达,53种蛋白质在强毒分离株中过量表达。这些差异蛋白可能是毒力相关因子,对这些蛋白质的深入研究可能发现治疗靶点。为了确定异烟肼耐药和敏感的MTB菌株之间的蛋白质差异,Jiang等比较了9种异烟肼单耐药和7种异烟肼敏感的MTB菌株中的蛋白质,发现大多数差异表达的蛋白质是膜蛋白。在异烟肼耐药菌株中上调的5种蛋白质经过质谱鉴定为Rv1446c、Rv3028c、Rv0491、Rv2145c和Rv2971,其中 Rv0491 编码的RegX3蛋白属于SenX3/RegX3双组分调节系统,与MTB的毒力相关,能够调节MTB应对不断变化的环境条件。
对不同毒力、耐药性菌株的比较蛋白质组学研究,能够发现MTB毒力相关蛋白和各种药物耐药相关蛋白,对研发新型抗结核药物具有重要意义。
与描述性和比较性蛋白质组分析不同,功能蛋白质组学更侧重于对不同的环境和宿主交互作用中MTB蛋白质活性、功能和信号转导等表征的研究。近年来,对MTB的功能蛋白组学研究主要集中在MTB致病性、代谢途径、潜伏机制和耐药机制研究等。
对不同毒力菌株进行蛋白质组学分析,其差异蛋白点有可能是不同致病性相关毒力因子。通过2-DE和MS对H 37 Rv(强毒株)和H 37 Ra(弱毒株)的蛋白质进行分析,发现H 37 Ra中有3种蛋白斑点缺失,均为EAST-6样蛋白,提示ESAT-6样蛋白可能与毒力相关。由于MTB的致病性与其免疫逃逸机制有重要的关系,通过阻断MTB中的甘露糖基转移酶基因,并通过糖蛋白组学质谱分析明确突变株的O-甘露糖蛋白质损失,结果表明无论在体外还是免疫抑制的小鼠体内,MTB突变体的生长已严重受到影响,说明分枝杆菌O-甘露糖蛋白的翻译后修饰可能对MTB逃避宿主防御机制有重要贡献。通过蛋白质组学研究MTB的逃逸机制,有助于探索其发病机制及治疗途径。Feltcher等应用非标记定量蛋白质组学研究了MTB特异性SecA2依赖型蛋白质输出系统在实现细菌毒力作用中的具体功能。通过比较野生型MTB和SecA2突变体MTB的细胞壁、细胞质蛋白质组,揭示了依赖SecA2途径从细菌细胞质输出到细胞壁的蛋白列表,发现LipO和PknG蛋白是依赖SecA2途径输出至细胞壁,在宿主细胞内阻止形成成熟吞噬体的重要蛋白;同时发现MTB溶质结合蛋白家族(SBPs)和脂质转运蛋白家族(MCEs)可依赖SecA2途径进行蛋白输出和胞壁定位,在感染宿主时发挥毒力作用。通过蛋白质组学研究发现MmpL4、Rv1269c、Rv3137和SseA蛋白在北京菌株中差异表达,表明这些蛋白质的表达增加可能与北京菌株的毒力和发病机制有关。
通过化学蛋白质组学方法研究H 37 Rv株的ATP结合蛋白,通过脱硫生物素共轭ATP作为分子探针标记ATP结合蛋白,并使用MS识别分析,发现 desA1 和 desA2 基因是MTB生存的必需基因,并发现在缺氧条件下高度表达,表明ATP结合蛋白是MTB在缺氧条件下生长所必需的。通过2-DE和MS对处于正常对数生长期和营养饥饿6周的MTB进行蛋白质组学分析,观察MTB的代谢情况,鉴定出在饥饿状态下有230种蛋白质的表达水平升高,其中包括大量的毒素、抗毒素相关蛋白和脂蛋白,并推测脂蛋白的增加与膜囊泡的释放增加有关,这些因素的增加更有利于MTB进入休眠状态。研究发现在饥饿状态下铁硫簇结合蛋白的表达降低,这些降低的蛋白可参与有氧呼吸、氨基酸的生物合成等。而铁元素是各种生命活动重要酶的辅因子,其在MTB的生长繁殖中起重要作用,推测这些蛋白表达的降低与MTB的代谢休眠也有关。采用LC-MS研究了MTB在低氧环境中菌体和胞外蛋白表达的变化,发现其菌体Rv0569、Rv2031c(HspX)、Rv2623、Rv2626C和Rv3841(BfrB)5种蛋白高表达,培养滤液中还可见Rv0363c(Fba)和Rv2780(Ald)表达量增加。这些蛋白与MTB的潜伏相关,但是了解其在结核潜伏感染中的作用机制还需进一步研究。
采用蛋白质组学方法在整体水平进行全局、动态研究,有助于全面阐明MTB耐药机制,寻找新药靶标,对研制和筛选新的抗结核药物具有重要意义。
分析耐药菌株与非耐药菌株之间的蛋白差异,能进一步了解MTB的耐药基础。以敏感株和H 37 Rv为对照,鉴定MTB对异烟肼与链霉素耐药的临床分离株02166的菌体蛋白,发现02166菌株与对照组相比,Rv0234c、Rv2466c、Rv3118、Rv2626c 和Rv2986c 蛋白存在差异,可能与MTB异烟肼、链霉素耐药有关。应用2-DE和MALDI-TOF-MS技术比较异烟肼耐药株和敏感株的全菌蛋白表达图谱,鉴定出耐药菌株显著高表达的6个细胞壁蛋白,分别是海藻糖磷酸酶、铁钼蛋白A、莽草酸5-脱氢酶、葡萄糖胺果糖-6-磷酸氨基转移酶、吲哚-3-3甘油磷酸合成酶和TetR家族转录调控因子,上述蛋白可能在MTB细胞壁合成及细胞壁新陈代谢中发挥重要作用。针对其他一线或二线抗结核药物,也有许多研究应用蛋白质组学方法筛选和鉴定抗结核药物相关的MTB耐药蛋白,发现了诸如脂质体代谢通路、胞质蛋白转运和转位、蛋白输出系统、外排泵等通路或细胞功能中参与MTB耐药的关键蛋白。
综上,将蛋白质组学技术应用于MTB的研究领域,通过寻找差异蛋白点的表达探索MTB的代谢、致病等方面有重要意义。此外,根据既往研究获得的MTB蛋白质组学数据,目前已经建立了分枝杆菌蛋白质组数据库(www.mpiibberlin.mpg.de/2 DPAGE),该数据库将为进一步深入研究MTB致病、耐药、潜伏等活动相关的蛋白功能提供基础性研究数据。
(李桂莲 万康林 潘丽萍 张宗德)