在细胞中,核酸的相对分子量非常大,其分子内或分子间有较强的相互作用,也可与蛋白质结合,形成结构复杂的核蛋白复合物,其结构可分为四级结构:一级结构(primary structure)、二级结构(secondary structure)、三级结构(tertiary structure)和染色体结构(Chromosome structure)。
核酸的一级结构是指核酸链中核苷酸的排列顺序,由于核苷酸之间磷酸、戊糖相同,仅有碱基不同,故核酸的一级结构也指碱基的排列顺序(base sequence)。虽然组成DNA的碱基只有4种,配对方式仅2种,然而DNA长链中的碱基序列则千变万化,形成了DNA分子的多样性。对于某一特定生物的DNA,确定的碱基序列构成了DNA分子的特异性。因此,DNA分子作为生物体的遗传物质,其多样性和特异性奠定了地球上物种多样性和特异性的基础。
核酸中的核苷酸以3',5'-磷酸二酯键相连,即上一核苷酸中戊糖的3'羟基(-OH)与下一核苷酸中戊糖C-5'的磷酸基(-P)之间酯化脱水形成3',5'-磷酸二酯键,最终构成线性或环形的核酸分子。由于核苷酸上戊糖的C-5'连接磷酸基(-P),而C-3'连接羟基(-OH),所以由核苷酸聚合而成的核酸链有5'和3'两个不同的末端。为与核酸合成的方向(5'→3')一致,把含有游离磷酸基的5'端作为核酸的起始端,把含有游离羟基的3'端作为结束端(图3-1)。
单链核酸的大小通常用碱基数目(base,kilobase)表示,而双链核酸则用碱基对数目(base pair,bp或kilobase pair,kb)表示。通常把小于50bp的核酸称为寡聚核苷酸。
核酸一级结构通常用图3-1所示的几种方法表示。
核酸的空间结构是指其所有原子在三维空间的相对位置,包括核酸的二级结构、三级结构和染色体结构。DNA和RNA分布在细胞中的不同区域,其存在状态不同,结构差异明显,在生命活动中的功能也各不相同。
DNA二级结构除了典型的右手双螺旋结构外,还可在不同条件下发生多态性变化,形成多链螺旋结构等。
1.Chargaff法则 20世纪40年代,美国科学家Chargaff等人利用紫外分光光度法和纸层析等技术研究多种生物DNA的化学组成,提出了关于DNA碱基组成的Chargaff法则:
(1)DNA碱基组成具有物种特异性,不同物种的DNA具有其独特的碱基组成(表3-4)。
图3-1 核酸一级结构的表示方法
(2)同一个体的不同器官、不同组织的DNA具有相同的碱基组成。
(3)同一个体的DNA碱基组成终生不变,不受年龄、营养状况和环境等因素的影响。
(4)几乎所有物种的DNA碱基组成都有下列关系:A=T,G=C,A+G=T+C。
表3-4 不同生物来源的DNA组分的相对比例
2.DNA的二级结构 1953年,J.Watson和F.Crick提出了DNA的二级结构——双螺旋结构模型,不仅解释了DNA理化性质的物理基础,还揭示了DNA分子的遗传机制,首次把生物性状遗传与DNA分子结构联系起来,为分子生物学的发展奠定了基础。
(1)B-DNA双螺旋模型结构的要点
①DNA分子是反向平行的右手双螺旋结构。DNA分子是双链结构,由磷酸基团和脱氧核糖构成亲水性的两条多核苷酸主链(backbone)位于螺旋外侧,疏水性的碱基位于内侧。两条链反向平行(anti-parallel),围绕同一长轴盘绕,构成右手双螺旋(right-handed double helix)结构(图3-2)。双螺旋上有一条大沟(major groove)和一条小沟(minor groove)。
②两条链之间的碱基互补配对。碱基平面与长轴(戊糖平面)垂直,碱基之间A与T形成两个氢键,G与C形成三个氢键,这样的碱基配对关系称为碱基互补配对(complementary base pair),因此,DNA的两条链称为互补链(complementary strand)。
③双螺旋的直径为2nm,每旋转一周包含10.5bp,两个相邻碱基平面之间的垂直距离为0.34nm(图3-2)。
图3-2 B-DNA双螺旋结构模型
④碱基堆积力和氢键维持螺旋结构的稳定性。相邻的两个碱基对平面在旋进中相互重叠,因此产生具有疏水性的碱基堆积力,维持螺旋的纵向稳定,是保持DNA双螺旋稳定的主要作用力。互补链之间碱基对的氢键维持DNA双螺旋的横向稳定。磷酸基团的负电荷与组蛋白、介质中阳离子的正电荷之间相互作用,减少了DNA分子间的静电斥力,对DNA双螺旋结构的稳定有一定作用。
(2)DNA二级结构的多态性
①A型DNA和Z型DNA。Watson和Crick提出的双螺旋结构称为B型DNA或B-DNA(图3-3),是在水环境或生理条件下DNA最稳定的构象。但在不同的离子强度和相对湿度下,DNA双螺旋结构的沟槽、螺距和旋转角等都会发生变化(表3-5)。在脱水或DNA-RNA杂交时,DNA右手双螺旋结构称为A型DNA或A-DNA(图3-3)。富含GC重复序列的DNA分子会出现左手双螺旋结构,称为Z型DNA或Z-DNA(图3-3)。因此,在生物体内,DNA的双螺旋结构所处环境不同,其功能也发生相应的变化,与基因的表达调控相适应。
图3-3 DNA分子多态性
表3-5 不同类型DNA的比较
②DNA的多链螺旋结构。1963年,K.Hoogsteen提出在酸性条件下,胞嘧啶N-3原子与鸟嘌呤N-7原子形成氢键,胞嘧啶C-4的氮原子所连的氢原子与鸟嘌呤的C-6连接的氧原子形成氢键,称为Hoogsteen氢键。DNA分子通过Hoogsteen氢键形成C + GC的三螺旋DNA结构(triplex DNA),如图3-4A所示。此外,在真核生物DNA分子3'末端常存在富含GT的重复序列,通过Hoogsteen键形成四链结构,如图3-4B所示。
图3-4 DNA多链结构及其碱基之间的氢键
A.三键结构 B.四键结构
(3)DNA双螺旋结构的生物学意义 DNA双螺旋结构模型阐明了生物遗传信息的构成和传递方式,开启了分子生物学时代,为人类从分子水平研究生命的发生、发育、遗传、衰老和死亡等现象,以及疾病的发病机制、预防、诊断和治疗等奠定了坚实的基础。
DNA的三级结构是指DNA在二级结构基础上进一步盘绕和折叠所形成的超螺旋结构(supercoil),如图3-5所示。
图3-5 DNA超螺旋结构
1.超螺旋结构 细菌、某些病毒和噬菌体等原核生物以及真核生物的线粒体和叶绿体的DNA都是闭环结构,可进一步扭转、盘绕成超螺旋结构。超螺旋有2种:正超螺旋(positive supercoil)和负超螺旋(negative supercoil)。形成超螺旋一方面可以降低DNA分子的张力,使DNA分子更加稳定,另一方面可以压缩DNA分子,使其结构更加紧凑,可将很长的DNA分子局限在细胞内一个很小的区域中。与DNA双螺旋的旋转方向一致的扭转,称为正超螺旋;与DNA双螺旋的旋转方向相反的扭转,称为负超螺旋。在细胞间期,DNA处于负超螺旋状态,此时DNA双链易于解链,有利于基因表达。细菌的DNA可形成多个相互独立的超螺旋区,且各区之间的螺旋程度不同。
该病初步诊断:脆性X染色体综合征。该患者具有下颌大、突耳和大睾丸等典型的脆性X染色体综合征表型;遗传分析发现,患者的男性亲属具有典型智力障碍家族史,表现为伴性遗传,综合上述可做初步诊断。进一步确诊需进行X染色体脆点确认(即X染色体长臂末端的随体),或RFLP连锁分析、DNA杂交分析、PCR扩增等方法来检出致病基因。
脆性X染色体是由脆性X染色体智力低下基因1(fragile X mental retardation 1 gene,FM R-1)5'端CGG重复序列突变,导致该基因失去功能引起的。临床表现为面容瘦长,前额突出;面中部发育不全,下颌大而前突;约80%的男性患者睾丸增大,性腺发育不良,且伴有中度或重度智障等。
2.染色体结构 真核细胞的DNA以极其有序的方式组装在细胞核内,在细胞分裂间期形成染色质结构,而在细胞分裂期则形成高度致密的染色体结构。两者主要区别在于染色体的压缩程度比染色质高。
染色体由DNA、组蛋白、少量RNA和非组蛋白构成,其中DNA和组蛋白的比例接近于1∶1。
(1)组蛋白(histone) 属碱性蛋白质,是真核生物染色体的基本组分,包括H1、H2A、H2B、H3和H4等五种蛋白质。它们富含精氨酸和赖氨酸等碱性氨基酸,在生理条件下带正电荷。在一级结构上,H1与其余四种组蛋白的差异较大,有明显种属差异性,而H2A、H2B、H3和H4则高度保守,无明显种属差异性。组蛋白参与维持染色体的结构并调节染色体功能。
(2)核小体(nucleosome) 是染色体的基本结构单位,由DNA和组蛋白构成。组蛋白H2A、H2B、H3和H4各两分子组成八聚体的组蛋白核心,长约150bp的DNA以左手螺旋盘绕组蛋白核心1.75圈,形成核小体的核心颗粒。核小体的核心颗粒之间再由组蛋白H1与大约50bp的连接DNA连接起来形成串珠状的染色质细丝,这是DNA在核内形成致密结构的第一层次折叠,使DNA长度压缩了约7倍;每6个核小体进一步卷曲形成直径约30nm的中空状纤维螺线管,使DNA长度压缩了约100倍(图3-6);30nm纤维螺线管进一步盘绕折叠为直径300nm的超螺旋管,即染色质纤维,后者再进一步压缩成染色单体,最终在核内组装成染色体。在细胞分裂期,DNA被压缩了约8400倍。真核细胞染色体DNA的折叠和组装的整个过程都受到精确调控(图3-7),染色体结构变异则导致严重疾病。
图3-6 核小体的结构及染色质30nm纤维螺线管截面示意图
图3-7 染色体的结构示意图
3.DNA三级及以上结构的意义
(1)DNA超螺旋状态有利于基因调控 生物体DNA结构处于动态稳定中,在细胞间期,超螺旋结构的变化可以协调DNA的局部解链,影响复制、转录。
(2)DNA被高度压缩有利于稳定传递遗传信息 真核生物基因组比原核生物大很多,如大肠杆菌的DNA约为4.7×10 6 bp,而人的基因组DNA约为3×10 9 bp。真核生物DNA作为遗传信息载体,在细胞分裂期被高度压缩成染色体并组装于核内,有利于遗传信息的稳定传递。
染色体是基因的载体。真核生物的基因分布在细胞核内一组形态不同的染色体上。染色体结构变异,致使其携带基因的数量和排列顺序异常,导致性状的变异,多数染色体变异对生物体是不利的,甚至是致命的。
FMR-1基因定位于Xq27,包含17个外显子,大小38kb,对应mRNA 4.4kb,编码序列长19kb。在FMR-1的5'端非翻译区,即距离第1外显子启始转录点69bp处有一段三核苷酸重复序列(CGG) n ,当CGG重复超过200时,FMR-1基因启动子(Cp G岛)常发生甲基化,导致FMR-1转录受抑制或减弱,FMR蛋白表达受阻,最终导致脆性X染色体综合征。
多数生物遗传信息的载体是DNA,少数病毒的遗传物质是RNA。遗传信息通过指导合成蛋白质而发挥作用,但DNA并不直接指导蛋白质合成,而是先转录合成RNA。RNA在核糖体上作为蛋白质合成的模板,决定肽链的氨基酸排列顺序。因此,RNA是细胞内蛋白质合成的中间物质。下面主要介绍RNA的结构特点,其加工修饰详见第十三章。
RNA通常是线性单链结构,有时可自身回折形成局部双链、茎环或发夹等二级结构,再进一步折叠形成三级结构;与DNA相比,RNA种类较多,分子量较小,结构比较复杂,功能也相对多样。现今已知的RNA大多参与蛋白质的相互作用、遗传信息的表达及其调控。参与蛋白质合成的RNA主要有三类:信使RNA(messenger RNA,mRNA)、转运RNA(transfer RNA,tRNA)和核糖体RNA(ribosomal RNA,rRNA)。
1.信使RNA(mRNA) 指在蛋白质合成过程中直接作为模板指导蛋白质合成的RNA。mRNA的特点有:①差异大。不同的mRNA长短不一,分子量差别非常大。②含量少。占细胞RNA总量的2%~5%。③代谢快。在所有RNA中,mRNA寿命最短。不同的mRNA的半衰期各不同,一般约为几分钟或几个小时,指导合成不同的蛋白质后即被降解。
(1)原核生物mRNA结构特点 原核生物mRNA一般5'端有一段非编码区(NCR),称前导序列,3'端有一段非编码区,中间是蛋白质的编码区,一般编码多个多肽链。
(2)真核生物mRNA结构特点 ①mRNA 5'末端帽子结构。多数真核生物mRNA的5'端以7-甲基鸟嘌呤-三磷酸核苷(m7GpppN)为帽子结构(cap sequence)(图3-8)。原核生物没有这种特殊结构。5'末端的帽子结构可以保护mRNA免遭核酸酶的降解,也是翻译起始因子识别、结合的一种标志。②mRNA 3'末端多聚A(poly A)结构。真核生物mRNA前体hnRNA转录合成后,由poly A转移酶催化形成poly A结构,称为多聚A尾,长100~200个腺苷酸。Poly A尾可引导mRNA由细胞核向细胞质转运,增加mRNA稳定性及参与翻译起始的调控(图3-9)。
图3-8 真核生物mRNA帽子结构
图3-9 真核生物mRNA加工过程
2.转运RNA(tRNA) 为在蛋白质合成过程中负责搬运氨基酸并解读mRNA密码子的RNA。tRNA占细胞中总RNA的15%,tRNA至少有60多种,虽然各有其独特的碱基组成和空间结构,但均具有如下结构特征:
(1)tRNA一级结构特点 ①为小分子单链RNA,由73~95个核苷酸构成。②稀有碱基多。tRNA所含的稀有碱基占其碱基总数的10%~20%,如二氢尿嘧啶核苷酸(D)假尿嘧啶核苷酸( φ )等。tRNA中的稀有碱基都是转录后修饰加工而成。③5'端核苷酸多是鸟苷酸。④3'端为CCA-OH序列,是氨基酸结合位点。该序列多是转录后在核苷酸转移酶作用下连接到tRNA 3'末端的。
(2)tRNA二级结构 tRNA二级结构呈三叶草形(图3-10),包含四臂四环结构:氨基酸臂(amino acid arm)、反密码子臂(anticodon arm)及反密码子环、TΨC臂(TΨC arm)及TΨC环、DHU臂(DHU arm)及DHU环、额外环(extra loop)。反密码子环的第3、4、5位核苷酸组成反密码子。反密码子可通过碱基互补的关系识别mRNA上的密码子。
图3-10 tRNA二级结构
(3)tRNA三级结构 tRNA三级结构均为倒“L”形(图3-11),氨基酸臂和反密码子臂分别位于倒“L”的两端,TΨC臂和DHU环虽在三叶草结构中位于两侧,但在三级结构中相邻(图3-10)。在翻译过程中,tRNA这样的结构有利于将特定活化的氨基酸带入核糖体,并通过mRNA的密码子与tRNA的反密码子相互识别,将mRNA的碱基序列解读成蛋白质中氨基酸的排列顺序。
3.核糖体RNA(rRNA) rRNA常与核糖体蛋白结合构成核糖体(ribosome),为蛋白质合成提供场所。核糖体在所有细胞中均由大小2个亚基构成。核糖体及其组分的大小常用沉降系数表示。
核糖体RNA特点:①含量多。rRNA是细胞内含量最丰富的RNA,占RNA总量的80%~85%。②寿命相对长。③种类少。原核生物核糖体由3种rRNA构成,分别是5S、16S和23S;真核生物核糖体由4种rRNA构成,分别是5S、5.8S、18S和28S。原核生物和真核生物的核糖体大、小亚基组成成分如表3-6所示。
图3-11 tRNA三级结构
各种rRNA的碱基序列已经确定,据此可预测它们的二级结构和其他空间结构,了解其作用机制。
表3-6 核糖体的组成
4.非编码RNA 除上述3种RNA外,近年在细胞内发现一些大小不超过300个核苷酸的小分子RNA,它们被称为非编码RNA(non-coding RNA,ncRNA)或非信使小RNA(small nonmessenger RNA,snmRNA)。这是近年来发现的一类能转录但不编码蛋白质,且具有特定功能的RNA小分子。ncRNA可以根据分子大小、结构特征、亚细胞定位及功能等进行分类与命名,包括催化性小RNA(small catalytic RNA)、核内小RNA(small nuclear RNA,snRNA)、核仁小RNA(small nucleolar RNA,snoRNA)、细胞质小RNA(small cytoplasmic RNA,scRNA)及小干扰RNA(small interfering RNA,siRNA)、微小RNA(microRNA,miRNA)等,其中催化性小RNA亦被称为核酶(ribozyme,参见第五章),是一类细胞内具有催化作用的小分子RNA,可催化特定RNA降解,其在RNA的剪接修饰中起重要作用。ncRNA主要功能见表3-7。目前发现ncRNA的功能愈来愈多,几乎涉及细胞的各种生理过程,且不同的ncRNA在这些生理过程中发挥的作用也不尽相同,如参与对生长发育、染色质结构、转录、mRNA的稳定性、翻译等调控,参与RNA加工和修饰,以及应对环境刺激等。
表3-7 动物细胞内主要的RNA种类及功能
续表