丙型肝炎病毒(hepatitis C virus,HCV)是有包膜的单股正链RNA病毒,鉴于其带有脂质包膜以及病毒蛋白的亲、疏水性与黄病毒和瘟疫病毒相似,目前将HCV归于黄病毒科肝炎病毒属( Hepacivirus ),但其确切的分类地位尚有待确定。
既往在浓缩的感染者血清、感染HCV的黑猩猩肝细胞以及体外组织细胞培养中均观察到了基本相似的 HCV 病毒样颗粒(virus-like particles,VLPs)。新近,Piver E 等利用特殊的免疫包被方法在电镜下观察到来源患者外周血的HCV颗粒。HCV VLPs分布在胞质小泡内膜附近,颗粒大致呈球形,直径约50nm,有包膜和表面突起。在感染HCV的患者血清中发现了两种不同浮力系数的毒粒,在高感染滴度的患者血清中HCV毒粒的浮力系数约为1.06g/cm 3 ,而在低感染滴度的患者血清中则同时出现浮力系数为1.06g/cm 3 和1.17g/cm 3 的两种HCV毒粒。血清中的HCV样颗粒经去污剂(如吐温80)处理后,HCV RNA只出现在浮力系数为1.17g/cm 3 的位置,因此推测低密度的颗粒是有包膜的完整病毒,而高密度的颗粒是HCV的核心颗粒。HCV核心颗粒也呈球形,直径约为33nm,HCV的核心颗粒没有感染性。
HCV对各种理化因素的抵抗力较弱,对酸、热均不稳定,对氯仿、乙醚等有机溶剂敏感。紫外线照射、用1:1000的甲醛37℃作用4天、沸水煮5min或加热60℃ 30min、20%次氯酸处理,均可使HCV失活。血液或血液制品经60℃处理30h后可完全灭活HCV。
HCV属黄病毒属,因此对HCV各种裂解蛋白的推测是以黄病毒的编码区为依据的。HCV基因组是一单股正链RNA,全长约9600nt。推测基因组的排列为:5'-NCR-C-E1-E2-p7-NS2-NS3-NS4A-NS4B-NS5A-NS5B-3'-NCR,编码区占基因组全长的95%。仅含有单一的ORF,从第4个ATG起始合成蛋白,编码一个3010~3033aa的多聚蛋白前体,然后在宿主信号肽酶及HCV NS3丝氨酸蛋白水解酶的作用下,裂解成各种病毒蛋白,其中C蛋白、E蛋白为结构蛋白,NS2~NS5为非结构蛋白,P7蛋白的功能尚不清楚。
HCV基因组的5'端有一段NCR,长342bp。5'-NCR形成广泛的二级结构。对不同分离株及基因型的HCV基因组序列的分析结果表明,5'端非编码区(5'-noncoding region,5'-NCR)是整个基因组中最为保守的区段,因此可作为HCV的PCR诊断标志。5'-NCR为翻译的起始所必需,在大多数的基因型HCV,5'-NCR内都有5个起始密码子(AUG)。翻译的启动机制是内部核糖体进入:核糖体与基因组的内侧结合,从特定位点的AUG起始密码子启动翻译。有多种细胞因子参与这一过程。HCV的内部核糖体进入位点(internal ribosome entry sites,IRES)的3'边界不在5'-NCR内,而在病毒编码衣壳蛋白的序列内,它至少包括了衣壳蛋白的29个核苷酸。5'-NCR延伸入编码区的区段可能形成一个稳定的二级结构。如果将AUG突变为AUU或CUG,对翻译的抑制作用很小。在342bp处起始密码子前后再分别插入一个AUG,对于核糖体的正确识别并无影响,说明核糖体的识别是很特异的。缺失突变结果表明,5'-NCR中nt46所形成的茎环对IRES至关重要。
核心基因位于HCV基因组N端,紧接5'-NCR,全长573nt,编码191aa。该区段较为保守,对7种不同基因型的序列分析发现,核心区基因的核苷酸同源性和由此推导出的氨基酸序列同源性分别为79.4%~99.0%和85.3%~100%,其保守性在HCV基因组中仅次于5'-NCR。
核心蛋白具有典型的黄病毒科核心蛋白的特性,如富含碱性氨基酸、亲水性高、抗原性强、不含糖基化位点。核心蛋白中脯氨酸(Pro)的含量约占11.0%,高含量的Pro可能与维持蛋白质的结构有关。而精氨酸(Arg)、赖氨酸(Lys)含量高达15%,主要分布在aa6~23、aa39~74和aa101~121这3个保守的亲水区段内。这3个区段同时也是蛋白的免疫优势区,其中aa39~62的10个Arg、Lys残基完全不变,可能是一个重要的RNA结合域。核心蛋白的C末端则带有两个疏水区段,分别位于aa121~151和aa170~191,后者被认为是HCV E1蛋白的跨膜信号序列,对核心蛋白本身的亚细胞定位也有重要作用。序列分析发现核心蛋白aa99~102可能是一个DNA结合基序SPRG。缺失突变证实aa38~43的PRRGPR是核定位信号。此外,蛋白激酶A、C的识别位点也已确定,分别是Ser53、Ser116和Ser53、Ser99。
核心蛋白是HCV的核壳蛋白,它具有自身多聚化和结合病毒RNA的能力。此外,近年来研究发现HCV核心蛋白是一种多功能蛋白质。除作为结构蛋白具有病毒颗粒组装功能外,它还具有调控细胞及病毒基因表达、调控细胞正常生长等功能。它能调控很多基因的转录,如p53等肿瘤相关基因、一些细胞周期相关基因以及细胞凋亡相关基因。HCV核心蛋白对 I-κB 降解的调控、对 c-Jun激酶(c-Jun N-terminal kinase,JNK)活性的调控则间接地抑制了很多重要基因的转录。研究还发现HCV核心蛋白和转录调节因子异质性胞核核糖核蛋白 K(heterogeneous nuclear ribonucleoprotein K,hnRNP K)之间有蛋白 -蛋白相互作用,结合hnRNP K的位点定位于第25~91氨基酸。核心蛋白对转录的调控可能与HCV致病机制有关(如肝癌)。此外,通过对一些重要细胞基因进行转录调控,HCV核心蛋白能抑制Fas和TNF-α介导的细胞凋亡,有利于病毒在细胞中建立持久感染,因而可能是丙型肝炎慢性化的机制之一。
HCV包膜蛋白包括E1及E2(也称为E1/NS1),是完整的膜蛋白。E1基因位于HCV基因组中的 nt915~1490,长576nt,编码蛋白长192aa(aa192~383),表达产物为 gp35;E2基因位于 nt1491~2768,长1278bp,编码蛋白长426aa(aa384~809),表达产物为 gp70。E 区为HCV基因组中变异最大的部位,在不同的分离株中核苷酸差异可达30%左右。如美国HCV-1株与日本分离株HCV-J、HCV-BK及HC-J6的异源性分别为24.5%、25.2%及37.5%,其中E2区的差异分别为27.5%、28.9%及33.1%。E2 aa215~255区段中有一个中度变异区。在E2蛋白中,还有2个高度变异区(hypervariable region,HVR),分别为位于aa390~410的 HVR1及 aa474~480的 HVR2。HVR1包括 E2 N 末端的32aa(aa383~414),极具多变性。在免疫系统的选择压力的作用下,HVR可发生快速突变,而在长达两年半的无丙种球蛋白的患者中并未见到变异。血清中针对HVR1的抗体,尽管在某一个体中具有较好的保护性,但因为它在各病毒株之间极具变异性,因此能否用于疫苗研究尚不明确。
P7是含有63aa的多肽(aa747~809),位于结构蛋白与非结构蛋白的连接处。P7是否被包装进入HCV颗粒尚未知晓。它由两个跨膜区域构成,形成六聚体离子通道。目前认为P7对于病毒组装是重要的,因为相关的牛病毒性腹泻病毒(BVDV)的相对应蛋白对产生有感染性的子代病毒是必需的,但对RNA复制却不是必需的。
非结构蛋白由 NS2~NS5组成,编码 NS2、NS3、NS4A、NS4B、NS5A 和 NS5B 6种蛋白,其中NS3及NS5的功能较为明确。
NS2区位于 nt2769~3359,长591bp,编码蛋白长197aa(aa810~1006),表达的蛋白质相对分子质量为23kD(p23)。NS2是一种穿膜蛋白,其C末端插入内质网腔,N末端位于胞质内。NS2的C末端和NS3的N末端紧密相连形成一个具有Zn 2+ 依赖性金属蛋白酶的活性结构的复合体,负责NS2/NS3位点的剪切,在Zn 2+ 的作用下,通过顺式作用快速自动裂解NS2/NS3位点。NS2/NS3剪切以后释放出游离的HCV NS3丝氨酸蛋白酶的N末端,对于病毒的复制是至关重要的。NS2/NS3蛋白酶的主要作用方式为自身催化,但在细胞培养系统中发现也存在反式剪切。
NS2/NS3裂解位点的上游130aa及下游180aa区段对NS2/NS3的转录是必需的,His952、Cys993、Glu972的突变将阻断或抑制NS2/NS3的裂解,提示该位点受病毒NS2/NS3区域编码的蛋白激酶所催化。
NS3区位于 nt3360~5312,长1953bp,编码蛋白长651aa(aa1007~1657),表达多功能蛋白p72(72kD)。蛋白的前1/3编码丝氨酸蛋白激酶,包含酶活性中心及底物结合部位,但其发挥作用需要NS4A及NS2作为协同因子、在二价金属离子的参与下完成,非结构蛋白的产生都与之相关。后2/3为NTPase/解螺旋酶编码序列,在RNA或DNA同源多聚体、poly(U)的作用下,该酶活性明显升高。通过poly(U)易与NTPase/解螺旋酶结合,推测NS3可与HCV 3'-NCR的poly(U)结合,但其具体意义还不清楚。
NS4区位于 nt5313~6257,长945bp,编码蛋白长315aa(aa1658~1972),被 NS3的蛋白酶裂解成 NS4A 及 NS4B 两部分,分别长为54aa(aa1658~1711)及261aa(aa1712~1972),分子量分别为8kD及27kD。NS4A有多种功能,如作为复制复合体的锚定物以及NS3丝氨酸蛋白酶的辅助因子。NS4A作为辅助因子既可以进行顺式剪切(NS3/NS4),也可进行反式剪切(NS4A/4B/5A/5B)。NS4A能显著提高NS3在胞质中的稳定性,并将之定位于内质网。NS4A辅助功能的活性区为aa1678~1691的14aa。用人工合成的该14氨基酸寡肽存在体外活性。NS4B是一个非常疏水的蛋白。它和NS3以及NS4A一起,为非结构蛋白NS5A的高度磷酸化所必需;NS5A要从p56形式转变为高度磷酸化的p58形式,要求NS3、NS4A、NS4B和NS5A被编码在一个多蛋白上。朝鲜学者证实,HCV NS4B蛋白与Ha-ras基因一起在HCV所致的细胞恶性转化中起重要作用。
NS5区位于 nt6258~9374,长3117bp,编码蛋白长1039aa,由 NS3蛋白酶裂解成 NS5A(448aa,aa1973~2420)及 NS5B(591aa,aa2421~3011)两部分,主要表达 RNA 依赖的 RNA 聚合酶(RNA dependent RNA polymerase,RdRp),参与 HCV 的复制。NS5A 被发现和一个膜结合蛋白 hVAP-33(human vesicle-associated membrane protein-associated protein of 33 kD)有特异的结合,同时hVAP-33还和HCV的RdRp(NS5B)相结合。NS5A和NS5B分别和hVAP-33的羧端和氨端结合。此结合进一步提示NS5A是复制酶的组成部分并提示了复制酶在膜上定位的机制。
NS5A的两种形式p56和p58均为磷酸化蛋白,尤其后者为高度磷酸化蛋白。磷酸化暗示了此蛋白具有重要功能,比如在信号传导、转录调控、细胞凋亡等行为中起作用。NS5A具有多个脯氨酸富集区域,能和细胞信号分子的SH-3结构花式相结合,干扰细胞信号传导[(如对细胞外信号调节蛋白激酶(ERK)1/2磷酸化的抑制],这可能是HCV的致病机制之一。
根据和其他病毒的RNA依赖的RNA聚合酶(RdRp)顺序的同源性比较,HCV NS5B被指定为HCV的RdRp,即复制酶复合物最重要的成分,在真核体外表达系统表达产物大小为68kD,即p68。缺失突变分析表明NS5B的N末端负责结合RNA。单链RNA的复制过程要求RdRp具有引物酶活性或者在复制起始时它能利用某个特异的引物。体外试验表明NS5B能使用模板的3'末端羟基作为引物;而如果模板3'末端被封闭或者模板是一个单调的多聚核苷酸,NS5B起始复制时需要特定的寡聚核苷酸引物。这表明NS5B没有内在的引物酶活性。
3'端非编码区(3'-noncoding region,3'-NCR)对HCV RNA结构稳定性的维持及病毒蛋白的翻译有重要功能,它包括以下4种元件:①一个短的约40nt的可变序列,其后有终止密码子;②一个多聚poly(U)序列,呈现高度异质性,即使是同一感染个体不同的HCV之间也存在这种异质性;③一个主要由U、少数C组成的多聚嘧啶序列;④一个新发现的98bp的多聚序列,称为3'-X尾,呈高度保守,即使是在遗传学差别最远的1B和2A之间也是保守的。其3'末端有一个46bp的新序列可形成稳定的茎环结构,可能对HCV负链RNA复制的起始很重要,无该序列的HCV基因组则无感染性。3'-NCR对HCV RNA结构稳定性的维持及病毒蛋白的翻译有重要功能。
近年来,特别是日本的一些研究,对IFN-α疗效不同患者的HCV的核苷酸序列进行比较,发现在IFN-α敏感和抗性HCV毒株之间在NS5A区存在着明显的差别。随而提出了 HCV NS5A 区具有 IFN-α敏感决定区(interferon sensitivity determining region,ISDR)的概念。HCV基因型、血清HCV RNA水平以及肝组织病理改变程度等也是影响IFN-α疗效的主要因素。进一步研究表明,HCV NS5A aa2209~2248之间的序列性质和变异,对于HCV,特别是HCV 1b型的IFN-α治疗敏感性具有决定性的意义。ISDR氨基酸突变≥4aa的HCV称为突变型;≤3aa称为中间型;与标准株完全相同的称为野生型。对58例日本HCV感染者(包括15例肝硬化患者)的NS5A aa2209~2248序列的性质、血清丙氨酸转氨酶(谷丙转氨酶,alanine aminotransferase,ALT)和 HCV RNA 水平、年龄,以及组织病理学特征与IFN-α疗效之间的相互关系进行了研究。结果表明,NS5A的基因突变与IFN-α疗效敏感性之间具有显著的相关性,而且与血清HCV RNA水平以及组织病理学变化性质之间也有显著的相关性。在15例肝硬化患者中,6例NS5A突变的患者中3例有确切的病毒学指标表明对干扰素治疗有应答,但5例中间型和4例野生型HCV感染者,对于IFN-α的治疗没有应答。从这项研究中可以看出,ISDR突变型HCV对IFN治疗敏感性高,而中间型和野生型的敏感性低。
与其他黄病毒相似,HCV的复制周期由以下若干步骤组成:①HCV穿入宿主细胞并将其基因组RNA释放入细胞质;②以侵入细胞质的HCV正链RNA为模板,经翻译及蛋白裂解后,形成一个与细胞内膜状结构相结合的病毒复制酶复合物;③以侵入的HCV正链RNA为模板合成负链RNA作为复制中间体;④以负链RNA为模板合成正链RNA,正链RNA可以重新用于合成新的负链RNA、表达多聚蛋白以及作为基因组被包装入子代病毒粒子;⑤病毒粒子从感染细胞释放。
HCV RNA的突变率是原核和真核DNA复制突变率的10 6 倍,达10 -3 ~10 -4 nt/(碱基位点·a),因此很难见到序列完全相同的2个无关的HCV分离株。HCV在黑猩猩中的变异率为(0.9~1.92)×10 -3 nt/(碱基位点·a)。HCV感染黑猩猩8.2年后,HCV 的核苷酸变异率为1.18%。对美国1例慢性丙型肝炎患者的一个4923nt HCV片段进行序列分析,发现经过13年之后,核苷酸及氨基酸的突变率分别为2.5%及2.6%,突变率为1.92×10 -3 nt/(碱基位点·a),E2区的基因变异最高,达4.6%,其中一个39nt片段有11nt突变,9aa编码发生改变。5'-NCR及C基因变异率只有0.7%~1.4%。对HCV-H株感染的慢性丙型肝炎患者及HC-J4株感染的黑猩猩分别进行为期13年及8年的动态追踪,发现HCV各基因都出现不同程度的变异,且HCV在人与黑猩猩中的变异率有所不同。HCV基因的变异并非随机,E基因变异最大,而5'-NCR最小。
HCV变异以点突变为主,多为转换,少数颠换。不同HCV分离株的转换和颠换率有所差异,如HCV-JT株与HCV-J株间碱基转换率高达83.7%;而HCV-JT株与HCV-1株转换与颠换率大致相同。病毒突变可分为同义突变和非同义突变。所谓同义突变,即碱基突变并不改变所编码的氨基酸,对表型无影响。非同义突变指改变其编码的氨基酸,并导致表型的改变,从而影响病毒的毒力及其对抗病毒药物的抵抗力等。HCV E1和E2区点突变所引起的氨基酸突变率最高,但NS2区突变常不引起氨基酸的改变。
HCV偶可出现插入突变及缺失突变,如HCV-J株和HCV-BK株分别在NS5区有3nt缺失,HC-J6株 E2区有3处分别插入3nt、3nt、6nt,NS5区有2处分别插入12nt、60nt,同时有2处12nt、3nt的缺失。如果HCV基因组中出现插入或缺失,特别是非3倍数的插入或缺失,可引起移码突变,影响多肽的氨基酸序列,甚至影响HCV的转录与翻译。
RNA依赖的RNA聚合酶无校正功能,HCV基因组是直接在RNA依赖的RNA聚合酶指导下进行复制的,而RNA依赖的RNA聚合酶缺乏5'→3'校正功能,病毒复制可发生随机突变,复制中的错误掺入无法校正,最终导致HCV的高度变异。
在HCV复制过程中存在易误性RNA依赖的 RNA 聚合酶(error-prone RNA dependent RNA polymerase,EPRDRP),也是导致高度变异的重要原因。
由于宿主免疫选择压力的作用,使能有效激活宿主免疫应答的HCV基因的变异高于其他基因。与抗-HCV抗体结合的HCV分离株同体内游离的HCV准种株间的HVR不同,推测抗-HCV抗体一方面具有阻止HCV与肝细胞的黏附作用,另一方面又使体内产生不同的准种株以逃逸机体的免疫应答,使本来处于劣势的或不能诱导机体产生特异性抗体的HCV准种株被正选择成优势种群。在无γ球蛋白血症的丙型肝炎患者中从未发现HVR的变异,也支持正选择作用。
HCV基因组中各种基因的结构及功能不同,有些区域高度保守,如5'-NCR,否则就会产生缺陷型病毒,影响病毒的复制及活性。
1971年Eigen等首先提出RNA分子的复制机制,进而引出了准种的概念。所谓准种(quasispecies),是指物种基因组的核酸序列在统计学上高度一致,但个体之间又存在差异的一组群体。与基因型或亚型不同,准种的同源性高于前两者。基因型是病毒在长期与生存环境的相互作用过程中突变不断累积,以至于造成核酸序列的显著差别;准种是对于感染单一病原体的具体患者,在相对较短的时间内,突变造成体内同时存有基因序列微小差别的种群,这种差别程度一般不超过核苷酸总长度的2%~5%。
准种的演变是从一个原始的特定病毒序列开始的,该病毒的每一轮复制均导致变异株的出现。因此,在任何时点,某病毒群(viral population)总是由常见的代表性序列即主序列(master sequence)和同一组不同的但又密切相关的序列(变异株)所组成。所有这些相关的序列(变异株),不管其所占比例如何,均被认为是一群复制体(replicon),表现为动态的基因相互作用(dynamic genetic interaction)。当环境发生改变时,在原病毒群中已存在的各种变异株,以及在复制过程中新生代的变异株中,将被选择出最适应于新环境的变异株。之后,被选择出的变异株又面临新环境的变化。为了其子代能继续复制,将再次被选择出适应新环境的变异株。如此周而复始,不断形成新的病毒群,即准种。
指初次感染时的病毒主要序列。
指与主序列不同但又密切相关的序列。综合基因组每一个位点上最常见的核苷构成的序列,由PCR产物的直接测序或至少3个克隆的序列分析获得。
包括不同变异株的百分比(即各变异株的频率)和变异株的多态性(polymorphism)或变异株谱(mutant spectrum)。前者是指各变异株在该病毒群中所占比例;后者表示多态性位点数,即变异位点数除以片段长度乘以所分析的克隆数。
准种的复杂性对区别两个准种群的特点具有重要意义,特别是当两个准种群的优势序列相同时尤为重要。准种的复杂性与准种存在的时间、初次感染时的病毒群数量、所分析的基因区突变率及不同变异株的复制率有关。准种的复杂性低提示该病毒群系近期感染。如在初次感染或再次感染时病毒群数量很大(如输血或持续应用血制品),则准种的复杂性高;如患者只感染一个或少数几个复制病毒,则准种的复杂性低。病毒各基因区的突变率高或变异株的复制率高,则准种的复杂性也高。
指基因组复制时发生变异的频率,它取决于基因复制的保真度、参与病毒复制的酶及环境条件(如细胞质的核苷酸浓度以及存在致突变因子等)。RNA病毒的平均突变率为10 -3 ~10 -5 /每个基因组/每一复制循环。由于RNA病毒的复制率高,因此只需若干个复制循环即可形成由多种变异株组成的准种群。
由于HCV缺乏合适的细胞培养系统,因此难以确定每一个复制循环的突变率。但是,通过对HCV感染者的随访研究,可了解HCV的平均突变率。例如:通过比较8~13年间从人和黑猩猩分离的HCV优势序列,估计HCV基因组的平均突变率为(1.44~1.92)×10 -3 /(碱基位点·a)。此突变率与引起持续性感染的其他病毒相似。
上述突变率是通过对间隔多年后所获得的HCV克隆核苷酸全序列计算出来的。但是,在基因组内各区域的突变率是不同的。如果是比较于短期内获得的克隆序列,而且是某一特定的基因区,则其突变率可能不同。这在HCV E2区的HVR1尤为明显,因该区突变率最高。此外,E1、E2和NS2区的突变率也较高,较C区和NS3区高5倍。
最早分析准种的方法是用RNA指纹图法(RNA finger-printing),但是,由于HCV RNA在血清中的浓度很低,因此,不能直接用RNA“指纹图法”检测,需用逆转录聚合酶链反应(reverse transcription-polymerase chain reaction,RT-PCR)扩增后才能分析。
目前分析HCV准种的方法有以下几种:
将 HCV RNA RT-PCR产物克隆至大肠埃希菌,然后从10~20个独立克隆(每个克隆代表一个病毒基因组)分离DNA,并测定其序列。
应用非对称PCR获得单股DNA,然后分析单股DNA在非变性凝胶中的电泳速度。在特定条件下,DNA片段的电泳速度由其结构所决定。病毒基因组的每一个变异均导致结构的改变。因此,在电泳时,各变异株的电泳方式不同。SSCP法是目前最常用的方法,但它只能分析较少数量和较短片段的变异而不适用于分析基因群和较长片段的变异。
HCV RNA经RT-PCR扩增后,获得DNA链,其间形成杂交子(hybrids),此种杂交子也称异种复制子(heteroduplexes),它是由一个野毒株序列和一个或两变异株序列所组成,这些杂交子含有错配子(位于DNA链的错配位点)。由于错配导致杂交子的稳定性下降,因此,在温度梯度凝胶电泳时,杂交子在特定的位点融化。不同变异株在RT-PCR过程中形成不同的杂交子,而不同杂交子的稳定性各不相同,从而导致各变异株不同的电泳特点。
异源双链泳动分析法(heteroduplex mobility analysis,HMA/heteroduplex gel shift analysis,GSA),亦称异源双链示踪检测法(heteroduplex tracking assay,HTA)。此法早期主要用于艾滋病病毒异质性研究,主要原理是基于DNA分子的变性和复性过程。在DNA经过变性后复性时,如反应系统中存在两种或两种以上具有一定同源性的核酸分子链,不同来源的两链同源区可配对形成双链,此即异源双链;异源双链内出于存在碱基错配或不配区域,分子构象发生改变。不同于同源双链,通过非变性的聚丙烯酰胺凝胶电泳(PAGE),同源性越高,泳动就越快。反之则慢。
HCV在某一个相同的区段由于个别碱基的变异导致了某些酶切位点的改变,PCR产物经多种不同限制性内切酶酶切和电泳后,即可得到特异性的酶切图谱。此法对于限制性酶切点发生突变的检测十分有效,但对某些靶序列并不适合。
在丙型肝炎患者的每毫升血清中,存在成千上万个不同序列的HCV变异株,现有的准种分析方法只能提供较为常见的变异株分布资料,但不能提供少见准种的资料。因此,准种分析方法尚需进一步提高。
在HCV感染过程中,由于病毒高突变率使其进化很快,在短时间内即可改变病毒群的表型。而且感染时间长、血清HCV RNA水平高的慢性丙型肝炎患者准种数量较多,认为HCV感染的慢性化过程实际是HCV准种产生速度大于宿主免疫清除能力的过程,随着感染时间及病程的延长,HCV准种数量不断增加。其生物学影响包括:可形成众多代次的各种变异株,如逃避免疫应答的变异株、逃避疫苗的变异株、耐抗病毒治疗的变异株,细胞嗜性的改变,以及毒力和宿主范围的变化等。对抗病毒药物的耐药的出现仅需要特定蛋白的一个或数个氨基酸的改变。有些耐药病毒株在抗病毒治疗前即以少量群体存在,因此在治疗期间可迅速得以选择成为优势病毒群。
HCV不整合于宿主的基因组,但常引起持续性感染。HCV持续性感染并不局限于HLA-DR单型患者,提示存在其他的致病机制。关于HCV持续性感染的致病机制目前有如下几种解释:
(1)使HCV致细胞病变的能力下降:
①HCV在复制过程中不断产生有缺陷的变异株,这些有缺陷的变异株在细胞内复制可影响野毒株的复制,因此,总的病毒产量减少,从而降低了病毒的致细胞病变能力,有利于病毒的持续感染;②产生致细胞病变力低的变异株;③产生复制率低的突变株;④细胞与病毒共同进化(cell and virus co-evolution)使肝细胞产生对HCV致细胞病变的耐受力,从而导致HCV的持续性感染。
(2)产生逃避宿主免疫应答的变异株:
宿主对HCV的免疫应答是主动的,可限制病毒的产生。用HCV合成肽反复刺激HCV慢性感染患者的外周血单个核细胞(PBMC),发现50%患者的PBMC对多种HCV多肽有特异性细胞毒性T淋巴细胞(CTL)应答。在感染的肝组织中存在介导的、能有效清除感染HCV的肝细胞所必需的组分。肝脏HCV特异性CD8 + CTL活性阳性的患者,其ALT水平明显升高,淋巴结内CD8 + 细胞数增加,病毒滴度较低,组织学上肝炎活动度较高,提示HCV特异性CTL通过调节病毒复制,在宿主防御中起重要作用。HCV基因组的中和抗体或CTL表位突变可逃避宿主免疫应答,并导致持续感染。从一只HCV持续性感染的黑猩猩中发现,在NS3解旋酶区保守的CTL表位发生单aa突变后,即不能被野毒株的CTL所识别。研究表明,针对NS3区内的保守表位的CTL,能够选择出有利于在宿主内持续存在的变异株。在急性感染期,清除HCV患者的CTL活性明显高于后来发展成慢性感染的患者,这一表位的突变仅见于发展成慢性感染的患者。然而,细胞免疫应答可针对多个表位,因此单个表位的突变不一定意味着病毒能够成功逃避免疫系统。
此外,逃避体液免疫应答的变异株也有报道,它可能是HCV持续感染的另一个重要原因。免疫抑制的患者如肝移植第一阶段的患者、合并感染人类免疫缺陷病毒(human immunodeficiency virus,HIV)的患者、CD4数量减少的患者以及免疫球蛋白缺乏症患者,其HCV准种的复杂性低,也支持宿主免疫应答与HCV持续性感染的关系。在HCV感染者体内能够发现不被所存在的抗体所识别的病毒变异株,支持抗体介导的免疫选择。输血后丙型肝炎患者的研究表明,在发展成慢性感染的急性期,HCV HVR1准种的异质性增加,而在急性自限性感染患者,这种异质性降低。这些结果提示,在发展成慢性感染的患者,免疫系统不能完全控制感染,因为出现多重逃避突变株。
(3)病毒的适应性(viral fitness):
病毒具有适应性,为了适应环境改变而不断变异、不断选择,产生适应新环境的变异株并继续复制,从而导致持续性感染。
每当HCV基因组突变产生时,都有可能不是中性的。当正在复制的病毒已经很好地适应环境时,新的突变有衰退的倾向,复制能力降低。当复制的病毒对环境不是很好地适应时,某些突变可能有利,导致选择出新的变异株。已经明确,低复制能力的病毒群的有利突变的概率,比更适应的病毒群高。
一些研究提示,HCV可能有直接致细胞病变作用:①急性和慢性丙型肝炎患者的肝组织学提示HCV有直接致肝细胞损伤作用;②用原位杂交法检测感染HCV的黑猩猩肝组织,可测到负链HCV RNA,并与血清丙氨酸转氨酶(ALT)升高相一致;③一些体外细胞系研究也证明,HCV复制可引起细胞裂解;④合并感染HIV及免疫球蛋白缺乏症患者的HCV感染较为严重;⑤HCV核心区和包膜区准种群的异源性与肝组织学严重程度有关;⑥HCV准种的异源性与ALT水平高低有关。但是,也不能排除宿主免疫应答在肝损伤及控制病毒复制中的作用。
同一患者处于不同的感染状态时,体内的准种株数量也有差异,并随病情的加重而增多,如肝癌>肝硬化>慢性丙型肝炎。随着病程的延续,体内先前存在的某些准种株逐渐消失,而出现一些新的优势准种株。分析肝癌细胞及其癌周细胞HVR的变异情况,发现两者序列差异很大,说明在这两种组织中存在不同的准种株,而不同准种株对肝细胞的亲和力及致癌作用也有所差异。
Okada等首先报道HCV HVR1区的变异程度与对干扰素的应答有关。之后,一些研究证实,准种的复杂性与对干扰素的应答有关,含HCV准种复杂性高的患者常对干扰素治疗应答差或无应答。Poliak等认为,对干扰素治疗有无应答取决于变异株间的差异程度,而不是变异株的数量。但另一些学者报道,对干扰素有应答和无应答的两组患者,在治疗前其准种的复杂性并无差异。
HCV具有高度的变异性,不同HCV分离株的核苷酸及氨基酸同源性有较大的差异,因此对HCV进行分型有助于了解各地区HCV的流行及进化情况,为HCV的诊断、治疗、预防等提供理论基础。
HCV基因分型主要以核苷酸序列为基础。HCV分型最准确的方法是比较HCV全基因的同源性,核苷酸的同源性小于80%则分属不同的基因型,但HCV全基因组的克隆实际上很难做到。目前最常用的方法是PCR分型法,扩增有代表性的HCV基因片段如NS5、C、5'-NCR、E1等,并进行遗传进化分析而分型。该方法可直接得到HCV的有关靶基因序列,是HCV基因分型最经典、最可靠的分型方法。已报道的HCV分型约一半是基于该方法的。但该技术要求较高,耗时多,因此实验条件稍差的单位难以开展,更难以在临床上推广应用。另外,扩增DNA序列测定通常无法鉴定不同基因型的混合感染。
根据不同HCV型在某一区段序列的差异,设计一系列型特异性引物,不同型可扩增出不同的片段,并以此进行分型。具体做法是先设计一对非型特异性引物,对HCV进行扩增,再用型特异性引物进行第二轮PCR。由于常选用C区进行PCR分型,故该方法又称为CPCR。如 Okamoto 等设计的一对 C 区引物,可扩增出57nt、144nt、174nt、123nt 4种不同的条带,并据此把HCV分成Ⅰ~Ⅳ型。显然型特异性引物PCR分型法较DNA序列分析分型更为简便、快速、价廉,而且还可检测出不同HCV型的混合感染,但对PCR引物的设计要求较高,要保证各型之间有较大的差异,且每份样品需同时进行多次检测才能最终确定型别。
通过将生物素或荧光素标记的型特异性寡核苷酸探针固相化在膜或芯片上,与RT-PCR扩增的病毒产物进行杂交后,经过扫描,在相应的型特异性探针位置上出现荧光点,根据点位置确定HCV的基因型和基因亚型。用于该分型方法的探针常来自5'-NCR和C区。
限制性片段长度多态性(restriction fragment length polymorphism,RFLP)根据不同型别的HCV在某一个相同的区段由于个别碱基的变异直接导致了某些酶切位点的改变,PCR扩增靶基因得到的产物经多种不同限制性内切酶酶切,不同型或亚型得到不同长度大小的片段,然后根据酶切后电泳所表现的片段大小及多态性进行HCV基因分型。5'-NCR、NS5保守性较高,常成为RFLP分型的首选靶基因。该方法常用酶为HaeⅢ、RsaⅠ、MvaⅠ、HinfⅠ、ScrfⅠ,利用这些酶可将6个基因型分开。RFLP分型法具有准确、快速、灵敏、经济等优点,适于对HCV感染者作大规模的筛查。但若只用少数内切酶则所能检测到的型别有限,且无法发现新的基因型。
1993年Simmonds等提出亲缘关系分析法或遗传树(phylogenetic tree)分析法,得到大多数人的赞同。他们通过扩增来自欧洲、南美洲、北美洲、远东地区等的一系列丙型肝炎患者血清HCV NS5B的一个222nt片段(第7975~8196nt),进行亲缘关系聚类分析,发现不同型基因同源性在56%~72%,亚型为78%~88%,不同株间为88%~100%。按照分离株发现的先后顺序,每一型还可分2~3个亚型,分别用a、b、c表示。作者将HCV分成6型和11亚型,而且该方法还可与其他分型方法相对应。另外,以C、NS4、E1等作为靶序列,也可将HCV确定为6型。该方法不仅协调了各种分型方法,还可进行新基因型及亚型的命名。此分析方法可把5'-NTR区、C区、NS5B区、E1区作为靶序列分型,对一定区域内的样本测序结束后可将序列相互比较,分析样本间序列的进化距离,画出该区域内HCV流行的系统关系进化树,观察HCV在区域内的分子流行情况及特点,也可将样本序列与世界各地已发表的该区段序列比较,分析样本序列与其他序列的差异。
DNA-酶免疫测定(DNA enzyme immunoassay,DEIA)是 PCR 结合酶免疫测定的一种新技术,其主要技术路线是设计C区引物,经RT-PCR扩增一段250nt的cDNA片段,再与生物素-亲和素上的特异性探针杂交,加入鼠抗dsDNA McAb及免抗鼠酶标二抗,反应结束后,测定并判断结果。90%以上的HCV分离株可通过DEIA分型,一般无假阳性结果。DEIA无同位素污染问题,操作简单、省时,适于HCV的分型。
上述方法均能正确鉴定主要基因型,但亚型的区分有赖于直接测序法。所有基于PCR的方法都具有PCR的优点和缺点。HCV基因分型方法的选择,应基于实验室的条件和经验以及分型的目的。若要鉴定所有亚型和新的型别,PCR结合测序是首选的方法。如果是以指导治疗为目的,仅需将1型感染和其他型别感染区别开来,上述的任何一种方法均适用。
由于不同的学者曾采用不同的分型靶基因以及不同的基因型命名方法,建立了各自的HCV基因分型系统,因此基因型命名一度甚为混乱,无法对比各实验室的研究结果,也缺乏统一的鉴定标准。这一状况在1995年以前特别严重。Simmonds等根据病毒基因组核苷酸序列的同源性提出了一套HCV基因型分类命名系统,与以往的命名系统有大致的对应关系(表1-3-1)。1994年在第2届国际HCV及其相关病毒学术会议上,一致推荐Simmonds HCV基因型分类命名系统,现已广为接受,HCV基因分型与命名的混乱局面已得以改观。该系统按照核酸序列的同源性分型,核酸特异性小于75%则分属于不同的基因型,同型内非常相似的变异株称为亚型,不同基因型之间核酸同源性介于75%~90%,同一亚型内的不同分离株间的同源性大于90%。依据发现顺序,用阿拉伯数字命名HCV基因型,用小写英文字母命名亚型。
表1-3-1 HCV基因分型系统的比较
HCV基因型分布存在明显的地理差异,6种主要基因型分布广泛,其中1a和1b型是美国最常见的基因型,也是欧洲的优势型别。在日本,1b型占HCV感染中的73%。2a和2b型在北美、欧洲和日本相当常见,2c型常见于意大利北部。3a型在美国和欧洲的静脉药瘾者特别常见。4a型在北美和中东占优势。5a型局限于南非,6a型主要见于我国香港地区、麦加和越南,7、8、9型仅见于越南患者。10、11型见于印度尼西亚患者。关于HCV分离株应当归入的基因型数目存在不一致的意见,有学者认为7~11型是相同组别的变异株,应将其归入单个基因型,即6型。多数资料表明,中国内地(大陆)仅有1b和2a两型,且以1b型为主,南方城市(南京、南宁、成都),1b型占90%以上,北方城市(哈尔滨、沈阳、兰州),2a型占46%~70%,基因型多样性不如我国香港和台湾地区,也低于日本,但混合感染率明显高于其他国家和地区。国内报道采用Enomoto分型法在10余省、市的122例血清标本中发现5个基因型(RT、K1、K2a、K2b、K3),其中 K1和 K2型占75.4%。这一结果可能与样本来源、检测方法等因素有关,有待进一步研究证实。目前我国在HCV基因分型中所用方法难以检出6a或其他新基因型,因此不能除外有其他基因型感染的可能。此外,多数研究以慢性肝病患者为调查对象,影响结果的可比性,不像无症状HCV阳性献血者更能反映HCV基因型在人群中的分布。
HCV基因分布存在着地理差异,因此当HCV在人群中暴发时,基因分型可作为追查其根源的有效工具。HCV主要传播途径是直接与患者血液接触,通过对不同人群HCV分子学研究,使包括垂直传播与性传播在内的HCV其他传播途径受到广泛关注,并证实HCV可在结肠镜检查时于患者-患者间传播。Zein等人发现HCV基因分型与所选择的研究对象没有关联,但不少研究者证实了这种关联,他们指出,3a型和1a型在静脉药瘾者中多见,1b型多见于HCV血制品传播中。从而证明基因分型对追踪HCV流行来源有重要意义。
通过对献血员检测血清中抗-HCV抗体进行筛选,是目前阻止HCV传播的主要方法,但这种筛选的成败关键依赖于不同分离株间序列变异的程度。第一代HCV检测抗原由HCV基因1型NS4区编码的5-1-1、C 100-3 组成,不与其交叉反应的基因型可被漏检。第二代HCV检测抗原,增加了比较保守的C区抗原。第三代试验在二代的基础上增加了NS5区的抗原,从而,大大提高敏感性和特异性,降低基因分型的影响。HCV RNA逆转录PCR扩增已经渐渐成为HCV感染诊断和患者个体化治疗所必需的试验,其主要优点包括对急性感染和病毒血症的早期诊断,但其敏感性受到引物选择及标本处理的影响。
感染了HCV后,绝大多数(80%)患者不能自行清除,而发展为慢性肝炎。Amoroso等人研究了基因分型在急性感染转变成慢性HCV中的作用,发现92%1b型急性感染患者会进展为慢性化,而其他类型仅35%~50%。而这一现象已成为研究的焦点。有人认为,细胞免疫和体液免疫是自行清除的关键,但尚未被论证。也有人认为,可能是病毒基因高度变异发生免疫逃避或者是病毒滴度低引发机体CTL反应太弱。
多项临床研究表明,对干扰素α抗病毒治疗应答性有影响的常见因素包括年龄、病程、肝硬化、基因型和HCV RNA血清水平。多元分析表明,1b型、高水平的HCV RNA是唯一对干扰素α治疗无应答的独立性预测因子。普通干扰素α治疗24周,2型的患者对干扰素的完全应答占60%~70%,而1型患者仅占10%~15%。Peignoux等对法国141例慢性丙型肝炎经干扰素α治疗的研究中表明,1b型的持续有效率最低仅为4%,非1b型达32%;特别是3a型的持续有效率高达38%。长效干扰素(即聚乙二醇干扰素,pegasys)对丙型肝炎患者的疗效明显优于普通干扰素α,但在各基因型中也存在差异。Perry等报道,HCV基因型1型对聚乙二醇干扰素治疗的持久病毒学应答率为28%,而基因型2/3型患者中持久病毒学应答率为56%。
有关HCV体外感染的细胞模型及体内动物模型详见第一篇第七章第二节相关内容。
(林旭)