购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

第二节
结核分枝杆菌基因组的结构与功能

一、结核分枝杆菌基因组结构及特点

(一)结核分枝杆菌基因组

结核分枝杆菌全基因组序列约4.41Mb(4411529bp),富含GC碱基,G+C含量高达65.6%。H 37 Rv基因组中基因分布密度为平均1.1kb长度有一个基因,这一数值与大多数原核生物的基因密度接近。H 37 Rv基因方向没有明显的偏向性,59%的基因转录方向与复制叉移动方向相同。以ATG为起始密码子的基因约占61%,以GTG为起始密码子的基因约占35%。结核分枝杆菌H 37 Rv共有3924个开放读码框(open reading frame,ORF)编码相应的蛋白质,占基因组编码能力的91%。通过各种数据库比较,在预测的结核分枝杆菌基因表达产物中,40%为有明确功能的蛋白质,44%找到了一些相关和与其他细菌中相似的信息,剩下的16%完全未知,并且仅存在于分枝杆菌属中。结核分枝杆菌基因组中大约有10%的ORF编码PE和PPE蛋白质家族,富含甘氨酸,分别得名于蛋白质N-端的序列均含有脯氨酸-谷氨酸(Pro-Glu)和脯氨酸-脯氨酸-谷氨酸(Pro-Pro-Glu)基序。此类蛋白序列和结构独特,目前为止该基因家族只在分枝杆菌基因组中发现,特别是在结核分枝杆菌这样的致病分枝杆菌中含量丰富。PE/PPE家族共编码168个蛋白,被认为对分枝杆菌在不同环境中生存和繁殖起重要作用。

结核分枝杆菌基因组中存在较多的重复序列,包括插入序列(insertion sequence,IS)、分枝杆菌分散重复序列(mycobacterial interspersed repetitive unit,MIRU)、重复基因或基因家族等。H 37 Rv具有16个IS6110拷贝和6个更稳定的IS1081拷贝,IS6110属于插入序列IS3家族,由于其具有拷贝数的差异和位置多态性,已成为分子流行病学研究中广泛使用的标记物。JesuÂs等最新发现,全球分布的菌株中IS6110的谱系特异性较高,通过研究IS6110转座的分子调控发现了两种转录后调节机制的协同作用:核糖体移码和干扰翻译的RNA假结,提示IS6110转座可以使细菌不断适应宿主和不利的生长环境。MIRU序列是一类位于基因间的特殊的分散重复序列,其长度一般为46~101bp,根据其序列、组成和长度等可分为3种。在结核分枝杆菌H 37 Rv基因组中有65个拷贝的MIRU,分布于41个位点,主要存在于操纵子的基因之间。MIRU以连续重复的形式在不同种细菌中存在不同的拷贝数,因此常被用来进行菌型鉴定。结核分枝杆菌基因组约10%的编码基因与PE和PPE两个家族蛋白相关。在PE/PPE家族中,一些编码基因的序列几乎完全相同,而且编码基因序列中包含多个拷贝的富含G+C的多拷贝多态重复序列(polymorphic GC rich repetitive sequence,PGRS)和多态性串联重复序列(major polymorphic tandem repeat,MPTR),基因由多个简单的重复序列如CGGCGGCAA和GCCGGTGTTG组成。这种基因序列可能有延长或缩短的趋势,是复制过程中链滑动的结果,也是分枝杆菌基因组多态性的重要来源。PGRS序列中含有大量的甘氨酸-甘氨酸-丙氨酸或甘氨酸-甘氨酸-天冬氨酸的连续重复序列,MPTR序列中有大量的天冬酰胺-X-甘氨酸-X-甘氨酸-天冬酰胺-X-甘氨酸的连续重复序列。结核分枝杆菌基因组中还存在一个特殊的REP13E12家族,主要由7个拷贝分散重复序列组成,可能是通过开放阅读框的移动合成不同的蛋白,该序列可以发生转座,可能作为活动性遗传物质在结核分枝杆菌基因功能中发挥作用。

在基因组序列中已经检测到至少两种前噬菌体( phiRv1 phiRv2 ),它们的存在可以解释结核分枝杆菌在培养中表现出持续的低水平裂解。两个前噬菌体基因长度均为10kb,并且排列方式类似,其基因产物与链霉菌和腐生分枝杆菌中的某些噬菌体基因编码产物有明显的相似性。 phiRv1 的插入位点对应13E12家族一个重复序列的一部分,其本身似乎已经整合到生物素操纵子中。已证实一些结核分枝杆菌需要生物素作为生长补充剂, phiRv1 可能对生物素基因的表达具有极性影响,或者造成基因异常切割导致突变。另一前噬菌体 phiRv2 在菌株间较少变异,更加稳定。谢建平等研究发现 phiRv1 phiRv2 基因可以感受宿主体内的氧状态,提高结核分枝杆菌的适应性。

结核分枝杆菌H 37 Rv最早通过Sanger方法测序,随着二代、三代测序技术的发展,要求每10万个碱基中少于1个碱基的错误,因此在最早测序的结核分枝杆菌4.4Mb中包含超过44个碱基的错误并不令人惊讶。通过不同方法、对不同H 37 Rv菌株测序补充和纠正了参考基因组中的单碱基错误,并对基因组进行了重新分析和注释。Camus等发现了82个能够编码多肽的新基因,确定了2058个蛋白质的功能,预测出376个蛋白质与已知蛋白质无同源性,是结核分枝杆菌所独有的。而McEvoy和de Souza等的不同研究都发现PPE38(Rv2352c)区域有出现大规模差异的可能性。结核分枝杆菌基因组的最新认识及研究进展将大大促进全球结核病的研究。

(二)结核分枝杆菌非编码RNA

微阵列分析技术和RNA测序技术(RNA-Seq)的应用揭示了结核分枝杆菌中广泛存在非编码RNA(non-coding RNA,ncRNA),包括5′末端和3′末端非翻译区(untranslated region,UTR)、反义RNA(antisense-RNA)和基因间小RNA(sRNA)等。

结核分枝杆菌H 37 Rv在对数生长期,去除核糖体RNA(rRNAs)信号后,识别出17%基因间小RNA,12%反义RNA;在稳定生长期,非编码RNA增加到总RNA(非rRNA)的58%,这主要是由于单个高丰度sRNA转录物(MTS823)的积累。

1.反义RNA

反义RNA通过多种机制调节转录本的转录和翻译。结核分枝杆菌在对数生长期有65%的基因具有对应≥10%编码转录本的反义成分,在稳定生长期这一比例可以提高到90%。通过低分子量RNA片段的克隆测序或RNA-seq鉴定了几种结核分枝杆菌反义转录本,它们的大小以及相对同源开放阅读框(ORF)的位置显著不同:一些在ORF的5′端编码;一些位于中间;一些位于3′末端;少数覆盖整个ORF或更大。大多数结核分枝杆菌反义RNA可能是独立的转录本,但少数来自长而重叠的3′末端非编码区。

Ino1 基因( Rv0046c )在结核分枝杆菌中编码催化肌醇合成第一步的酶,并与细菌毒力密切相关。该基因受同源ORF中段转录出的反义RNA调节,表达量从对数生长期到稳定生长期显著下调。因此这种转录本的差异表达可影响其同源mRNA的表达,从而在结核分枝杆菌的发病机制中发挥作用。研究发现的另外2个与脂类代谢相关的反义RNA(ASdes、ASpks)具有潜在的与多个mRNA碱基配对的特征,可以作用于多个由重复基因表达的同源mRNA。如ASdes不仅可以作用于mRNA( DesA1 Rv0842c ),还可以作用于另一种mRNA( DesA2 Rv1094 ),这两个基因都编码酰基转运蛋白去饱和酶。因此,反义RNA可能代表结核分枝杆菌基因调控的一个共同组成部分,在某些情况下可能顺式调节其同源mRNA的表达,并协同反式调节相关基因的表达。

2.5′末端UTR与3′末端UTR

5′末端UTR的典型结构是核糖开关。核糖开关可以通过与小分子效应物的结合改变构象以调节mRNA的转录。通过序列同源性分析,结核分枝杆菌中已经鉴定出许多核糖开关,其中之一是钴胺核糖开关。这种类型的核糖开关在钴胺(维生素B 12 )存在时抑制下游基因和与钴胺的合成和/或运输有关的上游基因的表达。另外一个核糖体开关(Mbox)在结核分枝杆菌基因组中两个位置出现,通常与镁的转运蛋白有关。镁饥饿状态可诱导两个Mbox下游基因的表达,因此该核糖体开关是功能性的镁相关的RNA调节因素,当巨噬细胞中镁浓度降低时被激活。3′末端UTR的序列结构与5′末端UTR不同,结核分枝杆菌3′末端UTR调控功能至今没有被明确鉴定。

3.基因间sRNA

大约有20种结核分枝杆菌基因间sRNA已经通过Northern印迹鉴定和验证,显示出不同程度的保守性:一些局限于结核分枝杆菌复合体的紧密相关成员,另一些则存在于如麻风分枝杆菌等病原分枝杆菌中,还有一些在全部分枝杆菌甚至其他放线菌中是保守的。结核分枝杆菌sRNAs的长度在50个核苷酸到多于300个核苷酸范围内,常常随着环境的变化而差异性表达。命名为MTS194、MTS479和MTS2822的基因间sRNA在应对H 2 O 2 时表达增加,H 2 O 2 模拟细菌在宿主巨噬细胞内遇到的氧化应激反应,因此这些sRNA可能与感染早期的细胞内存活有关。另外三个基因间sRNA,MTS997、MTS1338和MTS2823在结核分枝杆菌对数生长期和稳定期表达量较高,而在细菌感染期间表达量更高,提示这些sRNA可能在结核分枝杆菌发病中发挥重要作用。一旦确定了结核分枝杆菌sRNA的不同调控因子和靶点,监测sRNA缺失或过表达时靶mRNA的命运将有助于区分不同的机制模型。

二、基因复制

基因复制(gene replication)和维持对于任何生物体生存和繁殖都是至关重要的。而结核分枝杆菌等病原体,必须完成传播、感染和发病的连续循环才能在人群中立足,这就要求细菌必须在可变的宿主环境中,如代谢、免疫和抗生素等压力应激下完成基因复制和维持。

尽管不同细菌之间存在显著的遗传差异,但在染色体复制机制中可能存在很强的功能保守性。在考虑结核分枝杆菌DNA复制的整个过程时,可参考大肠杆菌模型,一些研究表明结核分枝杆菌系统在一些关键方面可能存在差异。结核分枝杆菌复制模块包括复制启动子蛋白、DnaA、DnaB螺旋酶、DnaG引物、Pol IIIα、β 2 滑动钳、ε校对亚单位、τ、δ和δ′、SSB、DNA连接酶与PolI。结核分枝杆菌基因组中有两个DNA聚合酶(PolⅢ)α亚基基因( dnaE1 dnaE2 )。 dnaE1 基因( Rv1547 )缺失是致死性的,因此,这个基因被认为是主要的DNA复制聚合酶。

DnaA-ATP相互作用对复制起始至关重要,其导致DNA双链的解螺旋,从而允许DnaB的加载,并且 dnaA 启动子在复制过程中保持活跃以确保整个细胞周期的连续。结核分枝杆菌 oriC 位于 dnaA dnaN 之间的527bp基因区间,包含多个预测和证实的DnaA结合位点。有趣的是,该区域也作为插入IS6110转座元件的共同位点。然而,到目前为止,没有证据表明插入对复制过程有任何影响,包括复制开始的时间。相反,这些位点已被用作临床结核分枝杆菌限制性片段长度多态性(restriction fragment length polymorphism,RFLP)指纹图谱的有用标记。最新研究证实了结核分枝杆菌DnaA和DnaB的物理相互作用,并且进一步表明DnaB在控制DnaA复合物的形成和与 oriC 的相互作用方面起作用。相比之下,结核分枝杆菌不具有DnaC解螺旋酶装载机的同源性,这是将DnaB解螺旋酶装载到大肠杆菌DNA上所必需的,因此DnaC的功能必须由另一种蛋白质来完成,或DnaA本身可能足以装载DnaB。

经测定,结核分枝杆菌的体外突变率为每复制一轮有2.9×10 -10 碱基对发生突变,与大肠杆菌的测定值相当。但与所有放线菌一样,结核分枝杆菌不具有可确认的复制后错配修复系统(mismatch repair,MMR)系统。缺失MMR系统将严重影响细菌的突变率,但结核分枝杆菌并非一个突变体,这提示固有聚合酶的保真度和/或校对能力能够维持分枝杆菌复制错误率。因此可能存在一种替代性的、与其他细菌非同源的系统催化分枝杆菌的MMR。最新发现的一种古细菌体内的错配特异性内切核酸酶在结核分枝杆菌中起作用,但这还有待于验证。Rock及其同事研究发现分枝杆菌的DNA修复校对功能主要由核酸外切酶亚单位完成,此功能域定位在PolⅢα亚基DnaE1的PHP(polymerase and histidinol phosphatase)结构域。携带替换了PHP外切酶功能所必需氨基酸的耻垢分枝杆菌突变株显示出严重的生长缺陷,突变率比野生型高2300倍以上。结核分枝杆菌聚合酶核心中ε(DnaQ)被认为具有校对功能,然而在Rock等对分枝杆菌复制保真度的研究中发现,虽然结核分枝杆菌DnaQ在体外生化测试中具有外切核酸酶活性,但DnaQ中假定的校正亚基与DnaE1编码的α亚基没有稳定的相互作用。随后,毕利军教授及其同事的另一项重要研究证实了这一结果,他们在体外重组了功能性结核分枝杆菌DNAPolⅢ全酶(holoenzyme,HE),该HE包括重组α(DnaE1)、ε(DnaQ)、β(DnaN)、τ(DnaZX)、δ(HolA)、δ′(HolB)和SSB(Ssb)亚基。通过一系列生化分析得出结论,分枝杆菌核心复制酶由αβ 2 ε组成,β 2 作为桥蛋白,增加α和ε蛋白之间的相互作用。这表明,可能还有其他因素决定了PHP和DnaQ在结核分枝杆菌DNA修复校对中所起的作用。

在体外最佳生长条件下,结核分枝杆菌每隔18~24小时分裂一次,而大肠杆菌每隔18~20分钟分裂一次。然而,体外研究发现结核分枝杆菌的重组DnaE1聚合酶在生化测定中达到的复制速率至少与(如果不快于)大肠杆菌PolⅢα一样快,这与任何认为内在复制能力必然限制分枝杆菌生长速率的概念相矛盾。而这与体内研究形成对比,通过荧光显微镜对分枝杆菌生长和分裂的单细胞分析发现,耻垢分枝杆菌的染色体复制约占细菌细胞周期的70%,正如Trojanowski及其同事指出的,这相当于每秒400个碱基的DNA合成速率,大约比结核分枝杆菌的速度快8倍,但比进行多叉复制的快速生长的大肠杆菌慢1.5~2.5倍(每秒600~1000个碱基的DNA合成速率)。因此,从体外重组复制酶蛋白的活性估计DNA合成速率与从整个细菌细胞推断DNA合成速率之间的不一致性可推测,有其他因素影响结核分枝杆菌的体内复制速率,比如DNA复制过程中dNTPs的供应。

由于DNA复制在生存和发病机制中的重要作用,分枝杆菌复制和修复机制成为抗结核新药开发的靶点。例如,6-苯胺尿嘧啶及其衍生物已被证明可抑制DNA PolⅢ酶活性,并且对低GC含量革兰氏阳性菌具有抗菌活性。此外,最新一项研究确定了一组新的咪唑啉化合物,其对复制的和非复制的结核分枝杆菌及革兰氏阳性球菌都具有杀菌作用。最新的研究表明,DNA复制和修复途径可能显著提高细菌耐药性,进一步说明DNA复制和修复途径作为新的抗菌疗法的靶标具有很大潜力。

三、基因转录和转录后加工

基因转录(gene transcription)是原核生物基因表达的主要调控点。通过RNA聚合酶、转录因子和启动子的相互作用可以实现转录调控,并由此导致转录调控的多样性,使细胞能迅速应答内部和外部信号,通过相应的基因调控变化及时改变细胞的表型,适应细胞生理状态和环境变化。结核病是一种复杂的疾病,要求细菌在吞噬细胞内繁殖,在缺氧和坏死性肉芽肿中存活,并忍受强大的免疫应答以在宿主体内持续存在。在感染期间,宿主免疫应答通过一系列防御措施抑制结核分枝杆菌的增殖,包括活性氧和氮应激、缺氧、酸应激、遗传毒性应激、细胞表面应激和饥饿等。因此,结核分枝杆菌需要执行一个复杂的、相互连接的、依赖于基因表达变化的应激反应网络来抵抗宿主的免疫攻击并维持其特殊的生存方式。

在所有细菌中,转录是通过单一核心RNA聚合酶(RNAP)实现的,该酶包括必需亚基β、β′和2个α亚基以及非必需ω亚基,组成α 2 ββ′ω。为了识别和结合基因上游的启动子序列,核心RNAP与亚基σ结合形成RNAP全酶(Eσ)。σ亚基识别特定的启动子DNA序列,参与转录起始复合物的异构化。因此,在不同条件下基因表达的第一决定因素是σ因子库的活性。每个σ因子结合特定的启动子序列,从而确定RNAP全酶转录靶向哪些启动子。初始的Eσ/启动子DNA识别触发一系列事件,例如酶解12~14bp的DNA序列以形成具有转录能力的开放启动子复合体(RPo)。与其他专一的人类病原体相比,结核分枝杆菌编码σ亚基的基因占基因组的比例最高,σ因子活性随不同压力和条件的变化能够改变细菌的表达谱。结核分枝杆菌σ因子网络包括:①1个σ A :在各种生理代谢中都起作用,协助大多数基因的转录,与管家基因的转录有关,是正常生理环境下细菌生长所必需的。②1个σ B :正常生理环境下非细菌生长所必需,当结核分枝杆菌暴露在应激条件下,σ A 失活或表达下降时,σ B 可辅助σ A 维持管家基因表达。③11个替代性σ因子(σ C 至σ M ):不同的胞外环境信号可诱导相应的替代性σ因子活化,表达1套特异基因以适应胞外环境。σ H 是结核分枝杆菌对热和氧化应激反应的中枢调节因子,其可调节σ B 、σ E 、热休克蛋白、硫氧还蛋白还原酶/硫氧还蛋白和霉硫醇前体的合成。除了σ B 、σ E 和σ H ,氧化应激过程中的存活也依赖于σ C 和σ J 。低温诱导σ B 、σ E 和σ I 的表达,同时抑制σ C 、σ E 、σ G 和σ M 的转录。σ I 是冷休克期间高浓度诱导的σ因子,并且在宿主之间进行气溶胶颗粒传播时对细菌的存活很重要。缺氧条件下,σ B 的表达也上调,σ B 是影响结核分枝杆菌对缺氧敏感性的唯一因素。σ B 、σ D 、σ E 和σ F 都显示在长时间的饥饿过程中被上调表达。这组广泛的因素使结核分枝杆菌能够调节其转录反应,以适应多样的条件。结核分枝杆菌中的所有σ因子都属于70家族(σ 70 ),其在大肠杆菌成员识别启动子DNA中的两个序列,即-10区和-35区。

原核生物的转录是不连续、分区段进行的,每一个转录区段可视为一个转录单位,称为操纵子。操纵子是数个相关的结构基因及其调控区的结合,是一个基因表达的协同单位。其中,调控区序列中的启动子是RNA聚合酶结合并启动转录的特异性DNA序列,主要由RNA聚合酶中的σ因子识别。原核生物的启动子通常在转录起始点上游-10区及-35区存在共有序列。结核分枝杆菌启动子包含一个保守的-10区序列,这对于转录是必需的,有时甚至是足够的。而-35区序列的保守性较低,有的分枝杆菌中并未鉴定到-35区序列。与大肠杆菌启动子相比,结核分枝杆菌中-10区和-35区序列的间隔区也有显著差异。这些启动子元件的差异可能反映结核分枝杆菌的σ多样性。

转录分为转录起始、转录延长、转录终止。原核生物由RNA聚合酶σ因子辨认位于转录起始点上游的启动子序列,与模板DNA结合后,催化两个与模板配对的相邻核苷酸生成磷酸二酯键而连接起来。第一个磷酸二酯键生成后,σ因子脱落,核心酶沿着DNA链前移,进入延长阶段。因为原核生物在同一DNA模板上有多个转录同时进行,而且转录同时伴随着翻译,因此电镜下可看到转录成羽毛状图形。转录终止分为依赖因子与非依赖因子两大类。Rho因子是转录终止的重要依赖因子,可与RNA转录产物结合后发生构象变化,停止转录。DNA模板上靠近终止处还有一些特殊的碱基序列,使得转录产物形成特殊茎环或发夹结构来终止转录。应用终止子基因组扫描(genome scanner for terminators,GeSTer)方法鉴定细菌基因组中可能存在的非依赖因子的终止子,按结构分为5种:L型、I型、V型、U型、X型。结核分枝杆菌H 37 Rv鉴定出最佳终止子947个,L型和I型分别占9%和91%,而X型、U型、V型终止子很少。

原核生物没有核膜,转录与翻译连续进行,因此最初认为原核生物的mRNA没有转录后修饰过程。但研究发现,大肠杆菌和其他细菌中也存在含有poly(A)尾的RNA,但比真核的poly(A)尾要短一些,为14~60个核苷酸。一般认为poly(A)尾是由poly(A)聚合酶催化形成,结核分枝杆菌中的 pcnA 基因有可能编码poly(A)聚合酶。但目前对于结核分枝杆菌mRNA poly(A)尾的功能尚不清楚。

四、基因翻译及翻译后修饰

蛋白质合成是所有细胞生存和复制的基本要求。迄今为止,已经进行了大量的遗传和生化研究来探讨大肠杆菌的翻译及其调控机制,但对分枝杆菌等生长缓慢的细菌相关研究较少。遗传信息由mRNA传递给新合成的蛋白质,即mRNA分子中的遗传密码被翻译为蛋白质的氨基酸序列,因此,蛋白质的合成过程也被称为翻译。翻译过程主要发生在核糖体上,核糖体由一个小的和一个大的亚基组成,小的30S亚基读取mRNA,大的50S亚基催化进入的氨基酸和新生链之间的肽键形成。参与该过程的物质还有氨基酸、mRNA、tRNA、氨基酰tRNA合成酶和蛋白因子、ATP或GTP等供能物质以及无机离子。结核分枝杆菌作为一种常见致病菌,在入侵人体细胞后,还可以利用宿主细胞提供的氨基酸原料在自身的核糖体中合成蛋白质。

原核生物蛋白质合成分为肽链合成的起始、肽链延长、肽链合成的终止和核糖体循环4个阶段。起始阶段参与的因子包括起始因子(initiation factor,IF)1~3、mRNA、转运tRNA、GTP等。在原核生物中,30S核糖体小亚基通过16S rRNA与mRNA起始密码子AUG上游的SD序列的互补,从而与mRNA结合。此外,30S核糖体小亚基与mRNA的结合还需要起始因子的帮助,原核生物有三种起始因子,其中有两种(IF1、IF3)通过与30S核糖体亚基结合促进30S亚基与mRNA的识别与结合。当mRNA与核糖体小亚基结合后,携带甲酰甲硫氨酸的tRNA通过反密码子与mRNA中AUG识别从而进入核糖体,同GTP、IF2结合,形成GTP-IF2-tRNA fMet 复合物。起始tRNA复合物与mRNA的AUG密码子结合后,释放IF3,核糖体70S大亚基加入到复合物中形成完整的核糖体-mRNA起始复合物。该过程伴随GTP的水解、IF1和IF2的释放。肽链延长阶段,新的氨基酸不断被特异性tRNA运至核糖体形成增加了一个氨基酸的新肽链。同时,核糖体从mRNA 5′端向3′端不断移位推进翻译过程。该过程需要两种延长因子(elongation factors,EF)EF-T和EF-G、GTP、Mg 2+ 及K + 的参与。肽链合成终止阶段,当终止密码子移入核糖体时,肽链合成终止并被水解释放。这一阶段需要GTP和释放因子(release factor,RF)的参与。原核生物的RF有3种,RF1、RF2识别不同的终止密码子,RF3与GTP结合,水解GTP为RF1、RF2提供能量。核糖体循环阶段,肽链水解后留下肽链合成终止后核糖体复合物(PoTC)。在核糖体循环因子(ribosome recycling factor,RRF)、EF-G、GTP及IF3的共同作用下,核糖体解离成大、小亚基,tRNA脱落,mRNA与核糖体分离并进入新一轮的蛋白质合成。此过程中的每一步受调控机制的严格控制,以确保翻译的保真度。

结核分枝杆菌的核糖体蛋白比大肠杆菌更大,有一些(uS2、uS3、uS5、uS9、bS16、uS17、bS18、uL4、uL10、bL17、uL22、bL25和uL29)比大肠杆菌同源物长13个或更多个残基。此外,结核分枝杆菌的核糖体蛋白相比大肠杆菌更趋向于带正电(具有更高的等电点),尤其是bS6、bL9和uL22。核糖体蛋白bS1在大肠杆菌和结核分枝杆菌的核糖体之间有所不同。在大肠杆菌中,bS1包括6个结构域:结构域1和2将蛋白质与核糖体结合,结构域3~6与mRNA相互作用,介导mRNA的展开和与第6结构域的对接,这对于翻译起始是不可缺少的。在结核分枝杆菌中,bS1的第6结构域被约100个残基的未知功能域取代,这可能是放线菌特有的,使bS1在功能上不同于来自大肠杆菌的bS1。除了组装细菌核糖体所需的一组核糖体蛋白,结核分枝杆菌还具有至少四个重复的或可替代的核糖体蛋白,这些蛋白与其原始蛋白不一样,缺乏富含Cys的锌结合基序。有趣的是,结核分枝杆菌中原代核糖体蛋白bS18与替代核糖体蛋白bS18的比例在缺锌条件下有所变化,替代蛋白的产量增加以组装成替代的核糖体。这种机制可以确保细菌在从巨噬细胞释放出来后,在缺锌的细胞外环境中产生蛋白质。

2017年Hentschel和Yang等先后发现了耻垢分枝杆菌和结核分枝杆菌核糖体的近原子分辨结构,为病原体翻译机制的解读提供了重要的线索。与其他细菌核糖体相比,结核分枝杆菌核糖体的整体结构是保守的,然而,一些额外的电子密度区域是分枝杆菌核糖体所特有的。最值得注意的是,在解码中心和肽基转移酶中心(peptidyl transferase center,PTC)附近发现了两个新的蛋白质密度区。第一种蛋白质命名为BL37,靠近PTC,可能是分枝杆菌特有的。它由20个残基组成,为α螺旋环结构,位于由23S rRNA的螺旋H39和H89形成的口袋中。第二种蛋白质命名为BS22,在折叠和位置方面与真核蛋白EL41非常相似,据推测其在稳定组装的70S复合物中起重要作用。另外发现约80%的结核分枝杆菌核糖体中存在亚单位之间的B9桥,由23SrRNA的100个核苷酸扩增形成,当30S和50S亚基结合时,发生显著的构象变化,这种结构可能通过阻止70S核糖体的过早形成来协调结核分枝杆菌的翻译起始。研究还发现,结核分枝杆菌核糖体表现出显著的结构异质性,增加了核糖体亚群可能不同于典型核糖体的可能性。也许这些特殊的核糖体负责翻译结核分枝杆菌无前导序列基因,例如20%的核糖体中没有B9桥可以使这些核糖体更容易与70S结合,翻译无前导序列mRNA。

核糖体异质性也可以在稳定核糖体的水平上实现。核糖体稳定定义为核糖体亚单位或核糖体的结合,使核糖体翻译不活跃。在大肠杆菌中,当细胞停止生长时,一部分核糖体发生二聚化,产生100S核糖体二聚体,这些二聚体在翻译上不活跃,被认为处于冬眠状态。当细胞条件再次变得有利时,冬眠的核糖体可以被分解和再循环用于新一轮翻译。与大肠杆菌相反,在低氧应激条件下,结核分枝杆菌核糖体不形成100S二聚体,而是稳定在相关的70S形式,并且不容易解离成30S和50S亚基。这种稳定是由DosR调节子的成员RAFH蛋白介导的,DosR调节子包含超过50个基因,参与诱导结核分枝杆菌的休眠。核糖体沉默因子也在不利的生长条件下与核糖体结合,从而关闭翻译。在营养限制期间,结核分枝杆菌的核糖体沉默因子RsfS与50S结合,抑制30S亚基与阻断蛋白的结合。

结核分枝杆菌核糖体的结构分析将有助于理解细菌在不同水平的翻译调控机制和许多靶向核糖体的抗生素作用模式,阐明结核分枝杆菌对抗生素产生耐药性的机制,并为设计新的化合物抑制翻译提供理论基础。

结核分枝杆菌具有富含GC的基因组(65%),每个氨基酸的优选密码子的第三个碱基位置具有G/C的强烈偏向。优选密码子是被最丰富的tRNA识别并倾向于出现在高表达基因中的密码子,而在较低水平表达的基因中,密码子的使用更加均匀。密码子的使用对mRNA的稳定性也有影响,富含最佳密码子的mRNA比富含稀有密码子的mRNA更稳定。

与核糖体一样,tRNA在翻译中不是被动的参与者,而是作为mRNA和蛋白质之间的适配分子在这一过程中起核心作用。tRNA具有高度保守的二级和三级结构,对其与蛋白质和其他RNA分子的相互作用至关重要,但也必须具有一定的灵活性。然而,翻译过程中可能出现误读。链霉素处理可增加几个密码子的误读,而氧化应激对翻译保真度没有影响。尽管生物需要维持翻译的保真度,但其调节控制可能随生长条件的变化而变化,这可能是因为误译对细胞有利,增加蛋白质多样性,促进适应性蛋白质进化。

另外,在蛋白质的合成过程中,并不是所有的翻译过程都能顺利进行,mRNA受损、缺少终止密码子或低效的终止密码子等因素可能导致核糖体在mRNA上停滞,停滞的核糖体的积累导致活性核糖体的数量短缺,导致蛋白质翻译停滞并最终导致细胞死亡。生物体内则进化出了多种核糖体拯救机制,细菌体内主要有三种:tmRNA-SmpB介导的核糖体拯救机制,又称为反式翻译过程;ArfA(YhdL)介导的核糖体拯救机制以及ArfB(YaeJ)介导的核糖体拯救机制。2014年,Personne等发现结核分枝杆菌与大肠杆菌等其他细菌不同,不存在ArfA和ArfB的同系物,而且即使在正常条件下tmRNA也是结核分枝杆菌生长所必需的,tmRNA-SmpB介导的反式翻译过程是结核分枝杆菌唯一的核糖体拯救机制。

蛋白质的翻译后修饰(post-translational modifications,PTMs)在调节蛋白结构和功能中发挥重要作用,大部分蛋白质都会经历翻译后修饰。随着蛋白质组分析技术的进步,发现细菌中大量的蛋白质存在PTMs,如在结核分枝杆菌中已发现如下PTMs:β-糖基化、磷酸化、甲基化、乙酰化、脂类化、去酰胺化、N-甲酰化和泛素化等。截至目前,共有602个泛素化分枝杆菌蛋白质被描述,实验鉴定出其中的55个。另外,516种丝氨酸/苏氨酸激酶的磷酸化位点在301种结核分枝杆菌蛋白质中被发现。在3种结核分枝杆菌临床分离菌株中鉴定了953个蛋白质中存在2490个class-Ⅰ乙酰化位点、2349个氧乙酰化位点和141个N ε 乙酰化位点。虽然结核分枝杆菌蛋白存在广泛的PTMs,但PTMs的作用仍知之甚少。张雪莲等最新的研究发现,结核分枝杆菌可以通过异柠檬酸裂合酶的乙酰化修饰上调酶活性及蛋白稳定性进而调控细菌利用脂肪酸作为碳源,乙酰化修饰调控结核分枝杆菌潜伏感染调控因子DosR与DNA的结合,进而调控与潜伏感染相关的蛋白活性。

总之,结核分枝杆菌通过改变有利于其生长和生存的关键基因的表达来应对环境变化,这些变化不仅发生在转录水平,而且在翻译和翻译后水平都有发生。因此,深入了解结核分枝杆菌的翻译过程可以更好地理解细菌的适应性反应,并为治疗靶点的选择提供线索。

五、基因表达的调控

结核分枝杆菌的基因表达受很多因子的调控,以下内容主要概述了σ因子、双组分调节系统、丝氨酸/苏氨酸蛋白激酶系统的调控作用。

(一)σ因子

结核分枝杆菌中的基因表达主要在转录起始的水平上进行调节,该过程由RNAP介导,而RNAP是由核心聚合酶(α 2 ββ′ω亚单位组成的复合物)和相关的σ因子组成。σ因子通过与-35至-10基因区域的上游结合来识别启动子元件,导致核心RNA聚合酶募集至启动子以启动基因转录。因此,σ因子是基因表达的关键调节因子。近期,原核生物中的σ因子,特别是胞外功能因子(extracytoplasmic function factors,ECF)σ因子,已被越来越多的研究证实是一种新的信号转导系统。

从结核分枝杆菌的基因组序列中共预测了13种σ因子基因,迄今为止研究的大多数σ因子已经被证实对结核分枝杆菌的毒力很重要。

1.结构及分类

根据σ因子的同源性,可将其大致分为两类,即σ 70 家族和σ 54 家族,前者主要参与细菌生长期间大多数基因的转录,后者负责应对各种环境变化而直接转录。两类家族的结构和开放式复合物形成的机制都不相同。

并不是所有的原核生物都表达σ 54 ,如所有GC含量丰富的革兰氏阳性菌和蓝藻就不表达σ 54 ;而σ 70 相关的σ因子被编码在所有细菌的基因组中。结核分枝杆菌的13种σ因子都属于σ 70 家族。

σ 70 家族的σ因子包含多达4个保守区域(区域1、2、3和4),并可进一步划分为子区域。区域1位于氨基末端并包含子区域1.1和1.2,子区域1.1通常带负电荷并可抑制游离σ因子与DNA结合。在一些σ因子中,非保守区域(nonconserved region,NCR)将区域1连接到区域2,区域2由4个子区域组成,子区域2.4在识别-10启动子框中是必需的,子区域2.3参与转录泡的融合。区域3包括子区域3.0、3.1和3.2,子区域3.0涉及识别扩展-10启动子元件。区域4由子区域4.1和4.2组成,子区域4.2负责识别-35启动子元件,并与多种转录激活因子产生相互作用。尽管程度不同,所有区域都对σ因子与RNA聚合酶的结合有贡献。

基于结构和生理功能,σ 70 家族的σ因子可被分为4个亚组。第1组由基本σ因子组成,是包含所有4个保守区域的必需基因;第2组是类基本σ因子,与第1组σ因子关系最密切,但不是必需基因,缺少子区域1.1,仅在少数细菌(变形细菌、蓝藻和GC含量丰富的革兰氏阳性菌)中发现,一般参与应激反应和稳定期存活基因的转录;第3组σ因子包含保守区域2~4,与第1组σ因子关系比较疏远,属于包含具有相似功能的进化相关蛋白质的簇,例如热休克、孢子形成或鞭毛生物合成;第4组是σ因子最大和最异构的集合,又被称为ECF σ因子,仅包含保守区域2和区域4,主要对来自胞质外环境的信号作出反应,此外,该组几个σ因子对原核生物的毒力很重要。

结核分枝杆菌的13种σ因子中,σ A 和σ B 分别属于基本σ因子和类基本σ因子,在所有分枝杆菌的基因组中都很保守,主要控制基因的基础表达;σ F 属于第3组σ因子,其余的10种σ因子属于胞外功能σ因子。σ C 存在于所有致病性分枝杆菌属中,σ E 是所有分枝杆菌属中唯一保守的ECF σ因子,这两组结核分枝杆菌σ因子都主要调节基因表达以适应不同的环境条件。

2.结核分枝杆菌σ因子的翻译后调控

在σ因子水平上对基因转录谱的调节机制比较简单,如蛋白酶水解和蛋白磷酸化等,但一些σ因子的活性可以通过拮抗蛋白进一步调节,前者主要是基本σ因子和类基本σ因子,后者主要是ECF σ因子。抗σ因子直接与特定的σ因子发生可逆性结合,由此产生的σ因子螯合物阻碍其与RNA聚合酶的结合,从而抑制σ因子对基因表达谱的潜在影响,直到细菌受到适当的刺激解除这种螯合物。迄今为止,已在结核分枝杆菌的基因组中鉴定出三类抗σ因子,即自我调节的抗σ因子、外部调节的抗σ因子、联合抗σ因子。

自我调节的抗σ因子有RseA、RshA、RslA和UsfX四种。结核分枝杆菌RslA(Rv0376)是跨膜蛋白,在细胞内结构域中具有典型的氧化还原敏感基序HX 3 CX 2 C,在不同的氧化状态下可逆地结合锌离子(Zn 2+ )。在还原条件下,RslA结合Zn 2+ 并结合σ L ,从而抑制σ L 的功能。然而,在氧化条件下,在HX 3 CX 2 C基序内形成二硫键并且释放Zn 2+ ,导致基序结构被修饰从而对σ L 的亲和力下降8倍,最终释放σ L ,恢复其功能。RseA和RshA分别是σ E 和σ H 的抗σ因子,含有相同的HX 3 CX 2 C基序,通过类似的机制调节σ因子。UsfX是σ F 的抗σ因子,含有一种新型金属离子结合基序XGSFS,类似于既往在人整合素CR3蛋白超家族中报道的DXSXS基序,并且与A3的离子结合将需要改变其结构,这表明UsfX可能通过感知一种特殊的金属离子来调节σ F ,但确切的机制仍不清楚。

外部调节的抗σ因子包括RskA、RsdA和RsmA三种,分别对应σ K 、σ D 和σ M 。这些抗σ因子缺乏所有感应结构域或保守基序,只能接收来自其他传感器蛋白的信号,通常属于跨膜蛋白,含有一个胞外域。调节这些抗σ因子的基质包括抗-抗σ因子的调节、蛋白酶水解和蛋白磷酸化。

联合抗σ因子为RseA,其与σ E 的亲和力受多种机制调节。一方面,RseA含有保守基序HX 3 CX 2 C,使其与σ E 的结合或释放依赖于氧化还原状态;另一方面,RseA还可以通过磷酸化依赖性ClpC1-ClpP2蛋白水解而失活并释放σ E

总的来说,σ因子的翻译后调控主要通过抗σ因子、蛋白磷酸化和相关转录调控因子介导,抗σ因子进一步受到抗-抗σ因子、蛋白磷酸化和蛋白酶水解的调控。多元交错调控表明,σ因子平衡对结核分枝杆菌至关重要,需要在多元环境下进行详细调控。

(二)双组分调节系统

结核分枝杆菌在巨噬细胞中的长期生存取决于细菌在其宿主内感知和适应微环境(例如低氧、低pH、氧化应激等)的能力。双组分调节系统(two-component vegulatory system,TCS)是结核分枝杆菌感应体内外环境,适应宿主微环境,从而做出相应反应并得以生存的关键调控系统。TCS是一类高度保守的调控系统,在细菌中普遍存在,也存在于一些植物、低等真核生物和古细菌。

1.双组分调节系统组成

TCS由感受器组氨酸激酶(histidine kinase,HK)和反应调节因子(response regulator,RR)两部分组成。HK是一种跨膜蛋白,能发生自身磷酸化,其氨基末端为信号接受域,羧基末端结构域通常二聚化,由磷酸转移结构域和催化ATP结合结构域组成。RR包含具有保守天冬氨酸残基的结合结构域和DNA结合基序的效应结构域。根据DNA结合结构域的结构,RR可以分为亚家族,如OmpR家族包含翼状螺旋-转角-螺旋基序,LuxR家族具有螺旋-螺旋-转角-螺旋结构域。HK羧基端的结构域作为与RR相互作用的界面,赋予HK和RR相互作用的特异性。

2.双组分调节系统作用机制

外部环境中的特定应激信号导致HK的组氨酸残基自磷酸化,然后其将一个磷酰基转移至RR保守的天冬氨酸残基,导致RR的构象变化,激活其DNA结合能力,最终调节一组有益于细菌在应激下生存的基因。少数HK也具有磷酸酶活性,可以介导RR的磷酸化和去磷酸化。一般RR由其成对HK催化磷酸化,但一些RR也可以催化乙酰磷酸的磷酸转移。尽管大多数HK和RR成对发挥作用,但非成对的双组分调节系统之间也可能发生协同作用,HK可以磷酸化非成对的RR。

3.双组分调节系统功能

研究发现,结核分枝杆菌全基因组编码12个配对的TCS(表1-3-1),4个非配对的RR。TCS参与结核分枝杆菌的毒力、持留性、休眠等致病因素,在结核分枝杆菌生理学中发挥重要作用。PhoPR、SenX3/RegX3、PrrAB和MprAB都与结核分枝杆菌毒力有关。PhoP调节细胞壁组成。SenX3/RegX3控制磷酸盐的获取。MprAB与应激反应和维持细胞包膜完整性有关,是控制DNA复制和细胞分裂的必需系统。KdpDE可以控制钾的摄取。NarL可能在低氧和饥饿环境中诱导。DosRST系统包含两个与单个HK交互的RR。TrcRS的功能仍不清楚。

表1-3-1 结核分枝杆菌的双组分系统

(1)MtrAB:

MtrAB、PhoPR、SenX3/RegX3、PrrAB和MprAB的RR属于OmpR家族,具有特征性翼状螺旋-转角-螺旋DNA结合基序。MtrAB是结核分枝杆菌内鉴别的第一个TCS,是结核分枝杆菌所必需的。结核分枝杆菌受到应激后,MtrB的组氨酸残基(MtrB-His305)自磷酸化,继而磷酸化MtrA的天冬氨酸(Asp56)激活下游级联信号转导。非活性MtrA蛋白质的两个结构域广泛相互作用,通过磷酸化和二聚化激活MtrA将显著破坏这种相互作用,这表明激活可能比该家族的其他成员更困难并且磷酸化可能相对缓慢。

MtrAB在阻断吞噬体和溶酶体融合方面具有重要作用。BCG MtrA在巨噬细胞诱导表达上调,而结核分枝杆菌(H 37 Rv)的MtrA在小鼠和人巨噬细胞感染时表达保持不变。MtrA缺失突变的结核分枝杆菌是致死的,但MtrA的过表达降低了小鼠肺组织、人和小鼠巨噬细胞中吞噬体和溶酶体之间的融合。MtrAB也受其他分枝杆菌蛋白质的调节。膜结合脂蛋白LpqB与MtrB的细胞外结构域结合以调节其活性,从而影响分枝杆菌对抗结核药物敏感性、细胞动力学控制和细胞壁稳态。

(2)MprAB:

在MprAB TCS中,MprB是HK,MprA是RR。据报道,MprB对结核分枝杆菌在液体培养基的生长至关重要,MprA则不是必需的。磷酸化发生在MprB的组氨酸(His249)和MprA的天冬氨酸(Asp48)上。除了其激酶和磷酸转移酶活性外,MprB还具有磷酸酶活性。

MprA识别由3个核苷酸分隔的松散保守的8bp直接重复序列。磷酸化的MprA增强其DNA亲和力。MprA调节 pepD acr2 sigB sigE 等200多种基因的功能。它与MprB-PepD基因座的基因间区域结合。此外,它调节与DosR相关的 Rv0081 (转录因子)、β-螺旋基因 Rv1057 (与抗生素抗性相关)和 espA 操纵子(编码EspA、EspC和EspD,调控ESX-1功能)的表达。与野生型分枝杆菌感染的巨噬细胞相比,缺失 mprA 启动子和 mprB 的C末端的MprAB突变体结核分枝杆菌对巨噬细胞感染降低IL-1β、TNF-α和IL-10的分泌。

(3)SenX3/RegX3:

SenX3/RegX TCS由HK SenX3和RR RegX3组成。响应刺激后,SenX3的组氨酸(His167)被磷酸化,并继而将信号传递给RegX3的天冬氨酸(Asp52)。在结核分枝杆菌中,senX3和regX3处于相同的操纵子。 senX3-regX3 的基因间区域含有分枝杆菌分散重复序列(mycobacterial interspersed repetitive unit,MIRU)序列。尽管MIRU在结核分枝杆菌中的确切功能尚不清楚,但可被用作临床诊断的标记物。

SenX3/RegX3对结核分枝杆菌感染有重要作用。感染结核分枝杆菌的巨噬细胞会发生磷酸盐缺乏,表明这些表型与无法获得足够的外源性无机磷酸盐有关。SenX3和RegX3的部分缺失突变导致其在小鼠骨髓来源的巨噬细胞和人巨噬细胞(THP-1细胞系)的生存减弱,在感染的免疫缺陷SCID小鼠和有免疫功能的DBA小鼠也观察到生存衰减的现象。此外,RegX3或SenX3的缺失导致其在BALB/c或裸鼠的复制减少。缺失RegX3转座子的CDC1551菌株在感染豚鼠和小鼠的持留性降低。

(4)PhoPR:

PhoPR是结核分枝杆菌重要的双组分调节系统,PhoP是HK,PhoR是RR。结核分枝杆菌受到应激后,PhoP的组氨酸残基(PhoP-His259)被磷酸化,继而磷酸化PhoR的天冬氨酸(Asp71)。PhoP作为应答调节子调节基因的表达,参与细胞壁脂质合成,并对结核分枝杆菌毒力有重要调控作用。结核分枝杆菌的 phoP 缺失突变体在THP-1巨噬细胞以及鼠骨髓来源的巨噬细胞中的生长减弱。PhoPR调控espB和espR的表达,这对于ESX-1介导的ESAT-6分泌至关重要。据报道,PhoP和EspR彼此直接相互作用并被募集到espACD启动子中。PhoP突变体对巨噬细胞的黏附增加,在细胞内的复制减少,这可能是由于丧失了防止吞噬溶酶体融合的能力。

(5)DosR/DosS:

DosR/DosS是结核分枝杆菌特征性的TCS之一。该TCS有3个成员,DosR、DosS和DosT。DosS和DosT是HK,DosR是RR。感受应激后,DosS和DosT均可使自身相应的保守组氨酸残基(DosS-His395,DosT-His392)磷酸化,传递磷酰基至效应器DosR的天冬氨酸(Asp-54),导致其构象改变,增加了DosR与同源DNA序列的亲和力,最终活化特定基因的转录。DosR识别保守的18个碱基大小的回文序列,结合位点位于一些低氧或NO诱导基因上游的启动子区域。DosR与同源DNA作用位点在Lys179、Lys182和Asn183。DosR/DosS被认为对结核分枝杆菌潜伏起重要作用。在低氧、一氧化氮、一氧化碳或抗坏血酸的微环境下,DosR/DosS被激活,诱导结核分枝杆菌处于休眠状态。低氧可诱导依赖DosR的48个休眠调节基因表达,其上调有利于结核分枝杆菌在体外培养条件下和小鼠体内长期休眠存活。DosR/DosS TCS以及休眠调节因子在感染小鼠骨髓来源的巨噬细胞以及小鼠和豚鼠肺部感染后期的结核分枝杆菌中上调,表明其在致病机制中有重要作用。在低氧诱导下DosR缺失突变的卡介苗(BCG)生存减弱。另外,Converse等研究表明,DosR/DosS可能是结核分枝杆菌的毒力因子之一,经气溶胶途径感染的DosR/DosS缺失突变株在BALB/c小鼠、C57BL/6小鼠和豚鼠体内的毒力均有不同程度的减弱,提示DosR/DosS能增强结核分枝杆菌的致病力。

(6)PrrAB:

PrrAB TCS由RR PrrA和HK PrrB组成。PrrA是OmpR家族的成员。 prrA prrB 构成操纵子并在对数生长期共转录,转录水平在稳定期和缺氧期降低。在氮限制条件下,诱导PrrAB转录,同时在酸性pH或碳饥饿下保持不变。PrrAB起着早期适应细胞内感染的作用。通过转座子诱变破坏操纵子导致结核分枝杆菌在鼠骨髓来源巨噬细胞中复制率降低。敲除结核分枝杆菌中的 prrAB 操纵子仅在存在 prrAB 的附加型拷贝时发生,表明该TCS对结核分枝杆菌生存是必需的。

(7)KdpDE:

KdpDE TCS在细菌中高度保守,对多种刺激有反应,包括钾离子、渗透压、ATP浓度、生长温度和密度。HK KdpD与RR KdpE相互作用。 kdpD kdpE 是单个操纵子的一部分。在结核分枝杆菌中,KdpDE控制相邻和反向转录的 kdpFABC 操纵子的表达。结核分枝杆菌的 kdpDE 失活导致SCID小鼠中的超毒力表型。

(8)NarLS:

NarLS是结核分枝杆菌的功能性TCS,存在硝酸盐时,其是结核分枝杆菌存活所必需的。NarL调节30个基因的表达,这些基因与DosR依赖性基因一致,表明DosR与NarL有协同作用。据报道,NarL和DosR可以结合到同一个基因的启动子区域,如 narK2 ACG Rv3130c

(9)其他双组分调节系统:

目前有几个功能不太确认的TCS。HK TrcS和RR TrcR构成了TrcRS TCS,TrcR鉴定为 Rv1057 ,一种功能未知的β螺旋蛋白。PdtaRS TCS尚未阐明。 Rv0600c Rv0601 c和 Rv0602c 是未知功能的TCS。

(三)丝氨酸/苏氨酸蛋白激酶系统

结核分枝杆菌基因组除编码11个丝氨酸/苏氨酸蛋白激酶(serine/threonine protein kinases,STPKs)外,还存在相似数量的双组分系统,表明这两种信号转导机制在细菌适应环境方面都很重要。双组分系统是几乎所有细菌门的主要信号转导机制,与双组分系统不同的是,STPKs在不同细菌群体中分布较少。结核分枝杆菌磷酸化蛋白质包括数百个丝氨酸和苏氨酸磷酸化蛋白,参与结核分枝杆菌生物学的各个方面,表明STPKs在调节结核分枝杆菌生理学方面起着关键作用。其中9种STPKs是受体型激酶,具有胞质外传感器域和胞内激酶域,表明这些激酶能转导外部信号。另外2种STPKs是细胞质的,具有检测细胞内变化的调节结构域。对一些STPKs的结构分析使研究者对这些激酶的激活和调节机制有了进一步理解,功能分析为磷酸化对几种蛋白质活性的影响提供了新的见解,但是对大多数磷酸化蛋白来说,磷酸化在调节功能中的作用尚不清楚。未来研究者的主要挑战包括表明磷酸化对大量磷蛋白的功能影响,鉴定这些磷蛋白的同源STPKs,并确定STPKs感知的信号,最后将这些STPKs调控的过程整合到更大的集成监管网络中,这将为导致结核病发病机制的结核分枝杆菌适应性机制提供更深入的了解。STPKs为抑制剂开发提供了有吸引力的靶点,可能会为药物敏感和耐药结核病带来新的疗法。

结核分枝杆菌基因组编码的11个丝氨酸/苏氨酸蛋白激酶包括PknA、PknB、PknD到PknL。PknA和PknB由操纵子中的相邻基因编码,包括细胞壁合成酶PBPA和细胞形状决定蛋白RodA的基因以及蛋白磷酸酶PspA,可调节细胞形状和细胞壁的合成。除此之外,PknA和PknB还直接或间接与其他细胞过程的调节相关联,包括脂质合成、细胞分裂和转录调节等。

PknD由编码参与磷酸盐转运的多个基因的染色体位点上的非必需基因编码。尽管PknD的配体及其功能尚不清楚,但2010年Vanzembergh F等的研究表明,pknD在磷酸盐摄取中有作用,并且证明在缺乏磷酸盐的生长培养基中 pknD 缺失的结核分枝杆菌突变体的存活受到损害。2012年Be NA等通过对结核分枝杆菌感染中枢神经系统所需基因的筛选,发现 pknD 缺失株对中枢神经系统侵袭有缺陷,表明 pknD 与中枢神经系统结核病有关。PknD被证明是体外结核分枝杆菌侵入脑内皮细胞所必需的,且该分子的胞质外结构域足以刺激这些细胞的侵袭。PknD可能导致中枢神经系统侵袭的机制和可能有助于该表型的PknD蛋白质底物尚不清楚。

关于PknE的底物或功能知之甚少。它可能是一种受体型激酶,具有细胞外结构域、跨膜结构域和细胞内激酶结构域(Kinase domain,KD)。2011年Kumar D等研究表明,PknE可以调节结核分枝杆菌感染巨噬细胞的凋亡。在使用 pknF 过表达和反义表达菌株的研究中,观察到其对生长、形态和间隔位置有显著影响,表明 pknF 在调节生长和细胞形状中具有作用。此外,迄今PknF的细胞外结构域尚未阐明。

PknG是缺乏跨膜区的两种结核分枝杆菌的STPKs之一,PknK是另一种。因此,PknG不具有在跨膜信号转导中起作用的典型受体型激酶的结构。除了其KD,其不与基于氨基酸序列的任何其他结核分枝杆菌STPKs聚类。PknG具有对其功能重要的氨基和羧基末端序列。氨基末端区域含有红素氧化还原敏感区域,羧基末端含有四肽重复结构域,可能在蛋白质与蛋白质的相互作用和激酶活性的调节中发挥作用。2004年使用牛分枝杆菌BCG株和耻垢分枝杆菌的研究表明,PknG是一种毒力因子,分泌到巨噬细胞吞噬体中并通过调节宿主信号转导起作用,以防止吞噬体和溶酶体融合。PknK是一种大蛋白质(119 kDa),其氨基末端区域的KD和长羧基末端区域显示出与ATP依赖性转录调节因子MalT家族的相似性。研究表明PknK在调节与生长和环境条件相关的翻译中发挥作用。

PknH编码转录调节因子EmbR的基因3′端。序列分析表明PknH是典型的受体型激酶,具有细胞内KD和细胞外受体结构域。在结核分枝杆菌细胞包膜糖脂和脂质调节中起作用。PknH磷酸化可调节结核分枝杆菌休眠反应的机制。关于PknI和PknJ的底物或功能,已知的相对较少。PknL由与转座酶相邻的基因和公认的DNA结合蛋白编码。该区域的其他基因编码几种用于芳香族氨基酸、甘露聚糖和脂质生物合成的保守的假设蛋白和生物合成酶。在分枝杆菌中对PknL的研究相对较少,其可能对分枝杆菌细胞壁的合成有调节作用。

六、比较基因组学研究

比较基因组学(comparative genomics)是在基因组图谱和测序的基础上,利用某个基因组研究获得的信息推测原核生物、真核生物类群中的基因数目、位置、功能、表达机制和物种进化的学科。比较基因组学是功能基因组学研究的核心内容。1998年完成结核分枝杆菌H 37 Rv的全基因组测序,标志着对MTB的研究进入了后基因组时代,为分枝杆菌比较基因组学的应用及了解MTB的结构和功能提供了良好的契机。将MTB和其他分枝杆菌全基因组信息及各种生物信息学技术综合应用于比较基因组学,有助于获得有关MTB菌种进化与分类、毒力相关因子、耐药相关基因及药物靶标的信息,从而为结核病的预防、早期诊断和治疗提供科学依据。

H 37 Rv基因组包含了4411529个碱基对,包含4000余个基因,基因组中鸟嘌呤和胞嘧啶含量高达65%。Cole等通过使用不同的数据库进行比较分析,总结了40%基因的预测蛋白质功能和44%基因的类似信息,其余16%基因的蛋白质功能不明;其中有约占MTB基因组编码基因10%的富含脯氨酸-谷氨酸(PE)和脯氨酸-脯氨酸-谷氨酸(PPE)两个多功能基因家族。PE的形成基于多拷贝的多态重复序列PGRS,PPE的形成基于多态性串联重复序列MPTR。通过基因序列的比对分析可以获得PE和PPE家族的遗传变异性。MTB不同于其他细菌,很大程度上取决于其能编码参与脂肪合成的脂肪酸合成酶(FASⅠ和FASⅡ)及参与脂肪分解的酶。

2002年,Fleischmann 等完成了MTB CDC1551 菌株的基因组测序,并将其与实验菌株H 37 Rv进行了全基因组比对,以确定潜在的与发病机制、免疫和进化相关的多态序列。他们发现,CDC1551和H 37 Rv菌株的基因组存在大量基因序列以及单核苷酸的差异,尤其是细胞膜脂蛋白磷脂酶C和与细菌毒力和宿主细胞免疫有关的PE/PPE家族成员编码基因。和CDC1551相比,H 37 Rv共发现37个插入序列(大于10bp),其中26个位于开放阅读框内,11个位于间隔区中。CDC1551共发现49个插入序列,其中35个位于开放阅读框内,14个位于间隔区中。同年,Cockle 等应用比较基因组方法找出牛分枝杆菌相比BCG菌株缺失的基因,从中选出RD1、RD2和RD14的13个开放阅读框,根据这些基因序列设计出436条多肽抗原用于鉴别牛分枝杆菌感染和牛分枝杆菌BCG免疫的牛模型,得到了具有诊断价值和亚单位疫苗潜质的8个基因( Rv1983 Rv1986 Rv3872 Rv3873 Rv3878 Rv3879c Rv1979c Rv1769 )。

2008年,Zheng等完成实验室无毒力菌株H37Ra(ATCC25177)的基因测序,并用比较基因组学方法将其基因序列和与其同源的毒力菌株H37Rv以及临床分离株CDC1551的基因序列进行比较。发现和H 37 Rv相比,H37Ra的基因成分和顺序高度相似,具有53个插入序列和21个缺失序列,总长度比H37Rv的基因长度长8445bp;H 37 Ra和H 37 Rv之间有198个单核苷酸变异,其中119个变异在H37Ra和CDC151之间相同,3个是H 37 Rv自身存在的变异,其余76个H 37 Ra特异的变异分散在32个基因内。Zheng等进一步用生物信息学以及定量PCR检测数个重要基因的潜在启动子区域后发现,转录因子以及代谢调控因子的突变与细菌应对老化压力相关;影响细胞膜结构、基础代谢、体内生长的基因突变以及PE/PPE/PE-PGRS家族基因的变异可能与H 37 Ra毒力减弱有关。

2011年,Zhang等完成了两株北京基因型菌株的基因组测序,发现这两株菌株和H 37 Ra及H 37 Rv相比,在PE/PPE家族中具有很大差异。

2012年,McGuire等对8株结核分枝杆菌复合群菌株[MTB H 37 Rv、MTB H 37 Ra、MTB F11(ExPEC)、 M.bovis BCG Pasteur 1173P2、 M.bovis AF2122/97、MTB Haarlem、MTBC、MTB CDC1551]、11株非结核分枝杆菌菌株、4株棒状杆菌、2株链霉素、 Rhodococcus jostii RHA1 、法氏诺卡氏菌( Nocardia farcinia )、纤维放线菌( Acidothermus cellulolyticus )、 Rhodobacter sphaeroides Propionibacteriumacnes 以及 Bifidobacterium longum 共31份基因组进行比对分析,结果发现MTB中脂质代谢和调节具有重要的功能、饱和与不饱和脂肪酸代谢相关基因之间的进化差异、DNA修复和蝶呤型钼辅因子在MTB的致病过程中起重要的作用;同时通过分析高度保守的非编码区以及相关的基因表达数据,鉴别出400个保守的非编码区,包括37个保守的预测启动子调控元件(其中4种与以前验证的元件相对应)及50个潜在的非编码RNAs。

2013年,Zhang等对1株牛结核分枝杆菌( M.bovis )菌株(AF2122/97)、13株 M.bovis BCG菌株(BCG-Frappier、BCG-Glaxo、BCG-Moreau、BCG-Phipps、BCG-Pragure、BCG-Sweden、BCG-China、BCG-Tice、BCG-Russia、BCG-Danish、BCG-Mexico、BCGTokyo 和 BCG-Pasteur)以及5株MTB(F11、H 37 Ra、H 37 Rv、KZN1435 和CDC1511)的基因序列进行分析后发现,BCG菌株与MTB相比,RD区缺失比例更高,而且共有188人T细胞表位存在不同程度的缺失,推测BCG菌株间保护力的差异可能是由于不同BCG菌株T细胞的表位差异所致。

近年来比较基因组学被广泛用于MTB系统发育进化的研究,Luo等通过对358株北京基因型菌株的全基因组进行分析,发现北京基因型菌株大约三万年前在东南亚地区出现,东亚地区北京基因型菌株存在多样性,而在全球范围内引起结核病暴发的北京基因型菌株主要是现代型北京基因型菌株。Luo等还结合了中国不同地区的1793株菌株的全基因组和基因型数据进行分析,发现中国的现代型北京基因型菌株于新石器时代已经在中国北方不断传播,后来随着汉族人的不断迁徙而传播到中国各地。现代型北京基因型菌株的成功传播显示其具有强毒力以及对现代密集型社会的高度适应力,必须对这类菌株引起高度重视。此外,MIRU-VNTR方法及SNP分型方法已在分枝杆菌系统进化及分类研究中广泛应用,这两种方法均是在比较基因组学的基础上发展起来。

比较基因组学在耐药基因的研究及筛选抗结核药物靶标方面具有重要作用。染色体介导的耐药是MTB产生获得性耐药的主要分子基础。近年来,MTB耐药的分子机制在世界范围内已被广泛研究,并确认MTB的9种基因或间隔区(intergenic regions,IGRs)(如 KatG inhA aphC-oxyR IGR kasA rpoB rrs rpsL embB pncA )与一线抗结核药的耐药密切相关。但还有一部分耐药菌株不存在上述耐药相关基因突变以及对一线药物以外的药物耐药机制不清楚。Zhang等利用比较基因组学的方法比较了161株临床分离的MTB菌株,新发现了与MTB耐药性高度相关的72个基因和28个IGRs,同时认为MTB的耐药机制比预想的还复杂,他们的研究为阐明MTB新的耐药机制提供了强有力的基础。

比较基因组学方法还可用于结核分枝杆菌和类人猿代谢途径的差异分析,研究表明有些MTB蛋白与宿主蛋白无相似性。Kushwaha等认为研究结核病这种人兽共患疾病时,非同源性蛋白质(酶)应作为首选研究目标。MTB H 37 Rv与主体宿主之间代谢途径无相似性的酶,将成为极具潜力的研究靶标。

(徐 颖 周向梅 李桂莲 万康林) S+CctwFvw4vYec79zGeAOMgRRpm8vjWnUHaGXDKFIvD5Nil08D4ajUfj3zcl67SN

点击中间区域
呼出菜单
上一章
目录
下一章
×