购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

第一章
基因和基因组

自然界中从简单的病毒到复杂的高等生物,都有决定其基本特征和控制其生命活动的遗传信息,这些遗传信息的载体就是核酸。 核酸 包括 脱氧核糖核酸 (DNA)和 核糖核酸 (RNA)。 DNA 包括染色体DNA、线粒体DNA、叶绿体DNA及质粒等,统称 常居DNA (resident DNA),是遗传物质。 RNA 存在于细胞质、细胞核和其他细胞器中,参与遗传信息的复制和表达。此外,RNA还是RNA病毒的遗传物质。

1869年,瑞士科学家F. Miescher从脓细胞中分离到含DNA的 核蛋白 (nucleoprotein),并命名为“nuclein(核素)”。1889年,德国科学家R. Altmann从核素中分离到无蛋白成分,将其命名为“nucleic acid(核酸)”。1909年,丹麦植物学家W. Johannsen创造了“gene(基因)”一词(源于希腊语 genos ,意为“出生”),用以命名孟德尔遗传单位。对基因化学本质和功能的阐明是在20世纪40年代之后, 基因 (gene)是DNA表达遗传信息的功能单位,以一段或一组特定的核苷酸序列为载体,通过表达功能产物RNA或蛋白质控制各种生命活动,从而控制生物个体的性状。

1920年,德国植物学家H. Winkler创造了“genome(基因组)”一词(是由基因gene与染色体chromosome构成的混成词)。遗传学上把一个配子的全套染色体称为一个 染色体组 ,一个染色体组所含的全部DNA称为一个基因组。现代分子生物学把一种生物所含的一套遗传物质称为 基因组 (genome)。基因组以 染色体组DNA 核基因组 )为主体,真核生物的基因组还包括线粒体DNA( 线粒体基因组 )、叶绿体DNA( 叶绿体基因组 )。RNA病毒的基因组则为一套RNA。总之,从简单的病毒到复杂的高等生物,都有决定其基本特征的基因组。

当代生物学及医药领域的许多新发现、新技术均以基因、基因组为核心。 at74OQVJPSz64O29GIIj0lKyWDQuZ02GnB5lx92202Y6zHb9Wp9CoDJOsmoZtXlE



第一节
DNA的结构和功能

DNA的基本结构单位是一磷酸脱氧核苷(dNMP),包括一磷酸脱氧腺苷(dAMP)、一磷酸脱氧鸟苷(dGMP)、一磷酸脱氧胞苷(dCMP)和一磷酸脱氧胸苷(dTMP),分别由腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)和胸腺嘧啶(T)等碱基与磷酸、脱氧核糖构成。一磷酸脱氧核苷按一定序列连接构成线性DNA单链,这是 DNA的一级结构 。两股DNA链反向互补结合并形成右手双螺旋结构,这是 DNA的二级结构 。原核生物及部分病毒的共价闭合环状DNA(第十一章,289页)进一步盘曲形成超螺旋结构;真核生物线性DNA与蛋白质及少量RNA结合,经过层层压缩,最终形成染色体结构,这些是 DNA的三级结构

一、DNA的一级结构

1885年,A. Kossel团队(1910年诺贝尔生理学或医学奖获得者)从酵母核素中分离出腺嘌呤,1891年鉴定核酸成分之磷酸、腺嘌呤、鸟嘌呤,1893年鉴定胞嘧啶、胸腺嘧啶,1901年其学生A. Ascoli从酵母细胞核成分中鉴定尿嘧啶(A. Kossel还于1884年鉴定组蛋白,1896年鉴定组氨酸)。

四种一磷酸脱氧核苷通过3',5'-磷酸二酯键连接,构成DNA单链。

在DNA单链中,每个核苷酸的3'-羟基与相邻核苷酸的5'-磷酸基缩合,形成3',5'-磷酸二酯键(受2'-羟基影响,RNA的3',5'-磷酸二酯键不如DNA的稳定)。DNA 主链 又称骨架,由磷酸基与脱氧核糖交替连接构成,具有亲水性;碱基相当于侧链,具有疏水性。

DNA单链有方向性,即有两个不同的末端,分别称为5'端和3'端, 5'端 有游离磷酸基(或羟基),是头; 3'端 有游离羟基,是尾。DNA链有几种书写方式,均为从头到尾,即5'→3'端书写,与核酸的合成方向一致。

不同DNA分子的长度不同,其一磷酸脱氧核苷的排列顺序不同。核苷酸广义上包括一磷酸脱氧核苷,所以 DNA的一级结构 通常被定义为DNA的核苷酸序列(图1-1)。不同核苷酸只是碱基不同,所以核苷酸序列也称为碱基序列。

图1-1 核酸一级结构及其书写方式

二、DNA的二级结构

DNA典型的二级结构为右手双螺旋结构。此外,DNA分子还存在局部左手双螺旋结构、十字形结构和三股螺旋结构等。

(一)右手双螺旋结构

1953年,J. Watson和F. Crick结合Chargaff规则及R. Franklin和M. Wilkins对DNA纤维X射线衍射图的研究,提出了经典的DNA二级结构模型—— 双螺旋结构模型 (double helix model,图1-2)。

图1-2 B-DNA双螺旋结构示意图

1.两股DNA链反向互补形成双链结构 在该结构中,DNA主链位于外面,碱基侧链位于内部(暴露于大沟和小沟内)。双链碱基形成 Watson- Crick碱基配对 (图1-3),即腺嘌呤(A)以两个氢键与胸腺嘧啶(T)结合,鸟嘌呤(G)以三个氢键与胞嘧啶(C)结合,这种配对称为 碱基配对原则 。由此,一股DNA链的核苷酸序列决定着另一股DNA链的核苷酸序列,两股DNA链称为 互补链

图1-3 Watson-Crick碱基配对

2. DNA双链进一步形成右手双螺旋结构 在双螺旋结构中,碱基平面与 螺旋轴 (helical axis)垂直,脱氧核糖为C-2'内构象,糖苷键为反式构象,糖基平面与碱基平面接近垂直,与螺旋轴平行;双螺旋直径为2nm,每个螺旋含10bp(bp,base pair,用作双链核酸长度单位,1bp为1个碱基对),螺距为3.4nm,相邻碱基对之间的轴向距离为0.34nm;双螺旋表面有两道沟槽,相对较深、较宽的为 大沟 (轴向沟宽2.2nm),相对较浅、较窄的为 小沟 (轴向沟宽1.2nm)。

3.离子键、氢键和碱基堆积力维持DNA双螺旋结构的稳定性 金属离子与磷酸基形成的离子键和碱基对氢键维持双链结构横向稳定,碱基对平面之间的 碱基堆积力 (base stacking,包括范德华力和疏水作用)维持双螺旋结构纵向稳定。

上述双螺旋结构模型是在92%相对湿度下制备的DNA钠盐纤维的二级结构,称为 B- DNA 。在溶液状态下,每个B-DNA螺旋含10.5bp,螺距为3.6nm,且形成碱基对的两个碱基并非共面,而是形成螺旋桨结构。细胞内DNA几乎都以B-DNA结构存在。

(二)其他二级结构

相对湿度、离子强度等条件均能引起DNA二级结构的改变,除B-DNA外,通常还有A-DNA、Z-DNA(图1-4)、十字形结构、三股螺旋结构、四链体DNA等。

1. A-DNA 也是右手螺旋DNA,但脱氧核糖为C-3'内构象,糖苷键为反式构象,因而与B-DNA相比大沟变窄、变深,小沟变宽、变浅。A-DNA双螺旋直径为2.6nm,每个螺旋含11bp,螺距为2.8nm。A-DNA是不高于75%相对湿度下制备的DNA钠盐纤维的二级结构。在细胞内,某些DNA-蛋白质复合物中含A-DNA,RNA双链区及某些DNA-RNA杂交双链的二级结构与A-DNA一致。

2. Z-DNA 是左手螺旋DNA,嘧啶核苷酸脱氧核糖为C-2'内构象,糖苷键为反式构象,嘌呤核苷酸脱氧核糖为C-3'内构象,糖苷键为顺式构象。Z-DNA主链呈锯齿状,其表面只有一道沟槽,对应B-DNA的小沟,窄而深。Z-DNA双螺旋直径为1.8nm,每个螺旋含12bp,螺距为4.5nm。Z-DNA形成于嘧啶嘌呤交替排列序列,特别是CpG序列,在B-DNA大沟暴露的胞嘧啶发生甲基化修饰时,可变构为Z-DNA。DNA的这类变构效应与基因表达调控或DNA重组有关。

图1-4 几种DNA双螺旋结构

3.十字形结构 双链DNA中存在一类 反向重复序列 (IR),特别是调控序列附近及复制起点处,这种序列可以形成十字形结构。这种结构可能有助于DNA与 DNA结合蛋白 (DBP)结合,故可能参与复制和转录调控。大肠杆菌DNA复制起点也存在十字形结构(cruciform,图1-5)。

图1-5 DNA反向重复序列与十字形结构

4. G- 四链体 DNA分子中,4个共平面的鸟嘌呤可通过Hoogsteen氢键结合形成 G- 四分体 (G-quartet),富含鸟嘌呤序列(如G 3+ N 1~7 G 3+ N 1~7 G 3+ N 1~7 G 3+ )可形成 G- 四链体 (G-quadruplex)。G-四链体中多核苷酸链的骨架可平行或反平行排布(图1-6)。研究表明,G-四链体序列普遍存在于端粒、复制起点、启动子等处,故可能参与复制和转录调控。人类基因组中约300种基因转录产物mRNA的5'非翻译区也含有G-四链体序列。某些癌基因序列中的G-四链体有望成为药物靶点。

图1-6 G-四分体和G-四链体结构和类型

三、DNA的超螺旋结构

B-DNA的双螺旋结构称 松弛结构 (relaxed state,每个螺旋碱基对数=10.5bp),其螺旋轴呈没有扭转(加捻,twisting)的线性或环形状态。松弛结构在不破坏双螺旋结构的前提下扭转,则螺旋轴会形成螺旋,称 超螺旋结构 (supercoil),扭转过程称为 超螺旋化 (supercoiling)。螺旋轴顺双螺旋方向扭转形成 正超螺旋 (positive supercoil,单螺旋碱基对数<10.5bp),表现为单位长度所含右手螺旋数多于松弛DNA,被称为 扭转过度 (overwound)。螺旋轴逆双螺旋方向扭转形成 负超螺旋 (negative supercoil,单螺旋碱基对数>10.5bp),表现为单位长度所含右手螺旋数少于松弛DNA,被称为 扭转不足 (underwound)。DNA在细胞内通常处于负超螺旋状态,这有利于其复制或转录时解链。

●DNA扭转应力(DNA torsional stress) 是指施加大小相等、方向相反的旋转力于B-DNA的两股链,使其相对于螺旋轴产生某种旋转而产生的作用力。根据施加旋转力的方向,产生的 DNA扭转应力有正和负两种。负应力促使形成负超螺旋结构,正应力促使形成正超螺旋结构。

超螺旋结构分为 螺线管型 (solenoidal)和 相缠型 (plectonemic)。螺线管型正超螺旋的螺旋轴形成右手螺旋,负超螺旋的螺旋轴形成左手螺旋(图3-6,第三章,80页)。相缠型正超螺旋的螺旋轴形成左手双螺旋,负超螺旋的螺旋轴形成右手双螺旋(图1-7)。

图1-7 相缠型超螺旋

四、染色体的结构

真核生物染色体DNA与组蛋白、非组蛋白及少量RNA在细胞分裂间期形成染色质结构,在细胞分裂期形成染色体结构,两者的主要区别是压缩程度(称为压缩比、包装比)不同。

(一)染色体组成

染色体的主要成分是DNA和组蛋白,它们含量稳定,含量比接近1∶1。此外,染色体还含有少量RNA和非组蛋白,其含量随着生理状态的变化而变化。

1.组蛋白(histone) 是真核生物染色体的基本结构蛋白、含量最多的染色体蛋白。C端2/3序列富含疏水性氨基酸残基,N端1/3序列富含碱性氨基酸残基Arg和Lys(约占氨基酸残基数的1/4)。组蛋白属于碱性蛋白质,等电点pI>10。

组蛋白主要有H1、H2A、H2B、H3和H4五类,其中H2A、H2B、H3和H4称为 核心组蛋白 (core histone),H1称为 连接DNA组蛋白 (linker histone)。核心组蛋白一级结构高度保守,特别是H3和H4,没有明显的种属特异性和组织特异性,含量也很稳定,提示其功能高度保守。例如豆类(Ile60、Arg77)与牛(Val60、Lys77)的组蛋白H4仅有两个氨基酸残基不同,人与酵母的组蛋白H4仅有八个氨基酸残基不同。相比之下,连接DNA组蛋白H1在不同生物体、不同组织细胞中的差异较大,在个体发育过程中也有变化。组蛋白在维持染色体的结构和功能方面起关键作用。

2.非组蛋白(nonhistone) 大多数非组蛋白比组蛋白大,且富含酸性氨基酸,属于酸性蛋白质。非组蛋白种类广泛,具有种属特异性和组织特异性,并且在整个细胞周期中都有合成,而不像组蛋白仅在S期与DNA同步合成。非组蛋白既有支架蛋白(scaffold protein),又有酶和转录因子等,其主要功能是参与DNA折叠、复制、修复、重组,RNA合成与加工,基因表达调控。非组蛋白有以下特性:

(1)种类多样性:有几千种,包括染色质重塑蛋白、DNA复制酶系、转录酶系等,其中含量最多的依次为DNA拓扑异构酶、染色体结构维持蛋白,种类最多的为转录因子。

(2)结合特异性:以离子键、氢键结合于特定DNA序列的大沟。这些序列进化上具有保守性。相应的非组蛋白多可二聚化。

非组蛋白的结合特异性源于其含各种DNA结合基序,如螺旋-转角-螺旋、锌指、亮氨酸拉链、螺旋-环-螺旋(第六章,168页)。

(3)功能多样性:包括染色质组装、染色体重塑、基因表达调控等。

3.非编码RNA(noncoding RNA) 占染色体质量的1%~3%,含量最低,变化较大。功能是通过与组蛋白、非组蛋白相互作用而调控基因表达。

(二)染色体结构

真核生物DNA在双螺旋的基础上与组蛋白等组装,经过多级压缩形成染色质、染色体结构。

1.串珠纤维 核小体是串珠纤维的基本结构单位,由组蛋白核心和核小体DNA(=核心DNA +连接DNA)构成。不同生物核小体DNA长度不同,人核小体DNA长185~200bp。

(1)一个(H3-H4) 2 四聚体与两个H2A-H2B二聚体构成 组蛋白八聚体 (histone octamer),又称核小体核心(nucleosome core)、组蛋白核心(histone core)。

(2)组蛋白八聚体被 核心DNA (core DNA,145~147bp)以左手螺线管(solenoid,负超螺旋)方式缠绕1.67圈,形成圆盘形 核小体核心颗粒 (nucleosome core particle),厚约6nm,直径10~11nm。

(3)核小体核心颗粒与 连接DNA (linker DNA,15~60bp)构成 核小体 (nucleosome,人单倍体DNA与核心组蛋白形成1.7×10 7 个核小体)。

(4)若干核小体形成直径约为10nm的 串珠纤维 (beads-on-a-string,又称核小体纤维、10nm纤维,图1-8)。从DNA双螺旋到串珠纤维, 包装比 (packing ratio,又称压缩比)为6~7。

图1-8 串珠纤维

串珠纤维进一步包装成高度凝集的染色质、染色体结构,包装机制尚未阐明,以下为早期假说之一。

2.染色质纤维 串珠纤维经过螺旋化形成直径约为30nm、螺距约为12nm的螺线管,称为 30nm纤维 ,其每个螺旋含6~7个核小体,且每个核小体需结合一分子H1(结合于连接DNA与核心DNA的连接部,覆盖约20bp DNA;结合力较弱,可在盐溶液中分离)形成 染色质小体 (chromatosome,表1-1)。核心组蛋白N端、组蛋白H1、高离子强度对螺线管的形成和稳定起重要作用。从串珠纤维到30nm纤维,压缩比为6。

表1-1 染色质结构单位组成

30nm纤维进一步结合非组蛋白、少量RNA及与复制转录有关的酶类,形成 染色质纤维 (chromatin fiber)。

3.染色线 在细胞分裂前期,染色质纤维进一步螺旋化形成直径约为300nm的 超螺线管 (supersolenoid)结构,称为 染色线 300nm纤维 。从30nm纤维到300nm纤维,压缩比为40。

4.染色单体 300nm纤维凝缩成直径约为700nm的 染色单体 ,压缩比为5。因此,细胞分裂中期染色单体的压缩比高达8000~10000;相比之下,在细胞分裂间期,染色质结构的压缩比仅为100~1000。

近期研究表明:①串珠纤维进一步包装形成染色质过程不存在染色质纤维形成环节。②染色质、染色体中存在化学本质为蛋白质的染色体支架(chromosomal scaffold),DNA通过一些特异序列与支架结合。

串珠纤维在细胞分裂间期形成松散的染色质结构。它们并非如几十根面条在碗中相互纠缠,而是像聚拢的钢丝球一样各自独占一定空间( 染色体域 ,chromosome territory)。每一条染色质均含两类区段,一类凝集程度低,所含基因处于活跃状态,位于常染色质区;另一类凝集程度高,所含基因处于沉默状态,或不含基因序列,位于异染色质区。两类染色质都含有一类绝缘子序列(第六章,161页),可募集一类转录抑制因子。相邻绝缘子序列平均间距800kb,与转录抑制因子结合形成DNA环,凝集为 拓扑结构域 (topologically associating domain,图1-9)。

图1-9 染色质拓扑结构域

实际上,由于细胞内不断进行新陈代谢及基因表达,DNA的扭转盘绕是一个动态过程,所以在不同周期时相、不同代谢状态、不同DNA区段,其盘绕方式和盘绕程度都不相同。

(三)染色体结构生理意义

DNA形成染色体结构具有重要的生理意义。

1.便于细胞核容纳 DNA分子在长度上高度压缩,有利于组装。例如人体细胞核内有23对染色体,其DNA总长度1.7~2m,在细胞分裂期被压缩到长度约200μm(细胞核直径10~15μm),压缩了8000~10000倍。

成年人体约有10 14 个细胞,所含DNA总长度2×10 11 km。与地球周长(4×10 4 km)及地球和太阳之间的距离(1.5×10 8 km)对比或更易理解其压缩意义。

2. DNA保护 相比之下,裸DNA(naked DNA)容易受到损伤。

3.便于细胞分裂时正确分配 避免形成非整倍体、异倍体。

4.便于基因表达调控 使基因表达以正调控为主。

5.超螺旋结构影响复制和转录 细胞核内DNA结构处于动态变化之中。超螺旋的转换可以协调DNA局部解链,从而影响复制和转录等的启动及进程。

五、染色体外DNA

真核生物还存在线粒体DNA、叶绿体DNA(植物)等,许多原核生物及个别真核生物(酵母等真菌)还携带质粒,它们统称 染色体外DNA 。染色体外DNA与原核生物染色体DNA均为裸露结构,统称 基因带 (genonema)。

(一)线粒体DNA

1894年,R. Altmann发现线粒体。1963年,M. Nass和S. Nass从鸡胚肝细胞线粒体内鉴定 线粒体DNA (mtDNA),它所携带的遗传信息可以指导合成部分线粒体蛋白,因而属于细胞核外遗传系统。

一个细胞可以含成百上千个线粒体,一个线粒体含多个mtDNA拷贝,因此一个细胞含大量mtDNA,可达细胞总DNA的1%。mtDNA属于重复序列(26页)。

绝大多数mtDNA为共价闭合环状结构,一股链含较多的嘌呤碱基,浮力密度较高,称为 H链 (heavy chain,重链);另一股链含较多的嘧啶碱基,浮力密度较低,称为 L链 (light chain,轻链)。草履虫mtDNA虽为线性结构,但末端为发夹结构,故没有游离单链末端。

人的线粒体多数含2~10个mtDNA拷贝,位于线粒体基质的不同区域。每个拷贝含16569bp,几乎均为编码序列(基因间区累计仅87bp),编码2种rRNA(12S rRNA和16S rRNA)、22种tRNA(负载Leu和Ser的tRNA各有2种)和13种蛋白质多肽链(呼吸链复合物Ⅰ、Ⅲ、Ⅳ和ATP合成酶的7、1、3和2种肽链,每种约50aa。aa:氨基酸,这里作为肽链长度单位)。人mtDNA于1981年完成序列分析。

(二)质粒

质粒 (plasmid)是游离于某些细菌及个别低等真核生物(酵母等真菌)染色体DNA之外、能自主复制的遗传物质,大多数是一种共价闭合环状DNA,大小为2~400kb。质粒含复制起点,能够利用 宿主细胞 (host cell,是指病毒、质粒或其他外源DNA转化并赖以复制或扩增的细胞)的DNA复制系统进行复制,并在宿主细胞分裂时分配给子细胞。质粒在三个方面不同于染色体DNA:①许多质粒不是宿主细胞生长所必需的,许多细菌没有质粒。②一个细胞通常含多个质粒拷贝。③在宿主细胞分裂形成子细胞时,它们向子细胞的分配是随机的。

一个宿主细胞所含质粒的数目称为 质粒拷贝数 。质粒拷贝数由其复制类型决定,并据此将质粒分为两类:① 严紧型质粒 (stringent plasmid):其复制与宿主染色体复制同步,拷贝数较低,一个细胞内仅有1~3个,例如pSC101。② 松弛型质粒 (relaxed plasmid):其复制与宿主染色体复制不同步,可以自主复制,拷贝数较高,一个细胞内可有10~500个,例如ColE1。一种质粒是属于严紧型还是松弛型,常和宿主细胞的代谢状况有关。例如,R质粒在大肠杆菌中属于严紧型,而在奇异变形杆菌中属于松弛型。因此,质粒复制不仅由自身控制,还受宿主细胞制约。

质粒在重组DNA技术中用于构建载体。

质粒可根据所携带基因功能的不同分为R质粒(又称抗性质粒)、F质粒(又称性因子、F因子、致育因子)、Col质粒(又称Col因子、大肠杆菌素生成因子)等。

此外,真核生物细胞核内存在 染色体外环状DNA (eccDNA),其意义有待系统阐明。目前发现50%以上肿瘤细胞细胞核内存在eccDNA,携带肿瘤生长所需基因。正常心肌细胞eccDNA携带肌连蛋白(titin)基因。 1K/RmvU3q/ddqFjCegoQdo6Gh1CortX/Odni60rzR++tDXaE0EI7d8RghzMkgRny



第二节
RNA的结构和功能

DNA是遗传物质,其直接作用是指导合成RNA。结构上RNA与DNA明显不同之处是其几乎都呈单链状态。单链结构赋予RNA结构复杂性和功能多样性。RNA是唯一既可储存和传递遗传信息,又有催化活性的大分子,因而被推测为地球上最早出现的生命物质。核酶的发现也改变了酶的传统定义,即不限于蛋白质。

生物体内核酸都与蛋白质形成 核蛋白 (nucleoprotein),其中RNA形成的核蛋白称为 核糖[核酸]核蛋白 (ribonucleoprotein,RNP),有些RNP结构极其复杂,其RNA成分有的起结构作用,有的起催化作用。

一、RNA组成

RNA由四种核苷酸通过3',5'-磷酸二酯键连接形成,与DNA有以下不同。

1.组成RNA的核苷酸含核糖而不含脱氧核糖,含尿嘧啶(U)而几乎不含胸腺嘧啶(T)。因此,组成RNA的四种常规核苷酸是一磷酸腺苷(AMP)、一磷酸鸟苷(GMP)、一磷酸胞苷(CMP)和一磷酸尿苷(UMP)。

2. RNA含较多的 稀有碱基 (unusual base,minor base),各种稀有碱基几乎都有其特殊功能。

3. RNA有较多2'- O -甲基核糖。

二、RNA结构

绝大多数RNA为线性单链结构,其构象少有DNA那样典型的双螺旋结构,但有以下特征。

1.线性单链RNA形成右手螺旋结构。

2. RNA分子中某些片段具有序列互补性,因而可通过自身回折形成茎环结构(即发夹结构)。 茎环结构 由一段短的互补双链区(茎,又称臂)和一个有特定构象和功能的单链环构成(图1-10),互补双链区碱基配对原则是A对U、G对C,但可含 非Watson- Crick碱基配对 ,特别是G-U碱基对,例如rRNA富含G-U、G-A碱基对。互补双链区可形成右手双螺旋结构。

图1-10 RNA的茎环结构

3.各种RNA三级结构复杂,直接决定其生理功能。

三、RNA分类

人体一个细胞约含10pg RNA(约含7pg DNA)。与DNA相比,RNA种类繁多,分子量较小,含量变化大。RNA可根据结构和功能的不同分为 信使RNA 非编码RNA 。非编码RNA可根据组织特异性和水平稳定性及编码基因不同分为 管家RNA (housekeeping RNA,组成[性]非编码RNA)和 调控RNA (调节RNA,regulatory RNA,调控[性]非编码RNA);也可根据大小分为 非编码大RNA (large noncoding RNA)和 非编码小RNA (small noncoding RNA,sncRNA,<200nt;nt,nucleotide,用作单链核酸长度单位,较短的也用mer)(表1-2);还可根据分子长度、结构特征、分子伴侣、亚细胞定位等综合分类(表1-3)。

表1-2 非编码RNA分类

续表

表1-3 人非编码RNA一览

人体内已有23000种功能RNA被鉴定。

(一)信使RNA

信使RNA (mRNA)最早发现于1960年,在蛋白质合成过程中负责传递遗传信息、直接编码一条或几条肽链,具有以下特点(结构特点见第四章,99页)。

1.含量低 占细胞总RNA的1%~5%。不同RNA含量不一,可相差10 4 倍。

2.种类多 可达10 5 种。不同基因编码不同的mRNA。

3.寿命短 mRNA指导合成蛋白质,合成完毕即被降解。细菌mRNA的平均 半衰期 (又称半寿期)约为1.5分钟。脊椎动物mRNA半衰期长短不一,平均约为3小时。

4.长度差异大 细菌mRNA平均长度1.2×10 3 nt,不同真核生物mRNA平均长度1×10 3 ~ 3×10 3 nt,哺乳动物mRNA长度5×10 2 ~1×10 5 nt。

原核生物和真核生物的mRNA虽然有结构差异,但功能一样,均为指导蛋白质合成的模板(第四章,99页)。

(二)转运RNA

转运RNA (转移RNA,tRNA)在蛋白质合成过程中的作用是负载氨基酸、解读mRNA遗传密码。tRNA占细胞总RNA的10%~15%,绝大多数位于细胞质中。tRNA由F. Crick于1955年提出其存在,P. Zamecnik和M. Hoagland于1957年鉴定,R. Holley于1965年完成了酵母丙氨酸tRNA(tRNA Ala )测序(第一种被测序的核酸分子)。以下介绍细胞质tRNA。线粒体、叶绿体有自己的tRNA,它们都比细胞质tRNA小。

1. tRNA一级结构 ①是一类单链小分子RNA,长73~95nt(共有序列76nt),沉降系数4S。②是含稀有碱基最多的RNA,含7~15个稀有碱基(占全部碱基的15%~20%),位于非碱基对区。③5'末端多为5'-GMP。④3'端均为CCA序列,其中的AMP常称为A76,其3'-羟基是氨基酸结合位点。

tRNA稀有碱基中有些是A、U、C、G的甲基化、二甲基化修饰物。甲基化有些是为了避免配对错误,有些赋予tRNA局部疏水性,以便与氨酰tRNA合成酶或核糖体结合。

2. tRNA二级结构 约50%碱基配对,形成四段双螺旋臂(arm,stem,类似于A-DNA),与五段非配对序列形成三叶草形结构(图1-11①):① 氨基酸臂 (amino acid arm)长7bp。② 二氢尿嘧啶臂 (D arm,D[HU]臂)长4bp(个别3bp),末端有 二氢尿嘧啶环 (D[HU]环),特征是含2或3个二氢尿嘧啶(D[HU])。③ 反密码子臂 (anticodon arm)长5bp,末端有7nt 反密码子环 ,中间3nt组成 反密码子 (第四章,102页)。反密码子5'端与尿苷酸连接,3'端与嘌呤核苷酸连接。④ TΨC臂 (TΨC arm,T臂)长5bp,末端有 TΨC环 (Ψ环),特征是TΨC环含胸腺嘧啶核糖核苷T54-假尿苷Ψ55-胞苷C56。⑤ 额外臂 (extra arm,可变臂,variable arm)长3~21nt,仅较大的tRNA含有。

图1-11 tRNA结构

3. tRNA三级结构 呈扭曲的L形,氨基酸结合位点位于其一端,反密码子环位于其另一端,DHU环和TΨC环虽然在二级结构中位于两侧,但在三级结构中却相邻(图1-11②)。

尽管各种tRNA的长度和序列不尽相同,但其三级结构相似,提示三级结构与其功能密切相关。

(三)核糖体RNA

核糖体RNA (rRNA)与 核糖体蛋白 (r-protein)构成 核糖体 (ribosome),一个大肠杆菌约有15000个核糖体。

1.核糖体组成和结构 原核生物和真核生物的核糖体均由一个大亚基和一个小亚基构成,两个亚基均由rRNA和核糖体蛋白构成。它们的大小一般用沉降系数(S)表示(表1-4)。

表1-4 核糖体组成

(1)初期研究认为大肠杆菌核糖体大亚基(又称50S亚基)有36条肽链,编号L1~L36。进一步研究表明:①L7是L12的Ser2乙酰化产物。②L26是小亚基(又称30S亚基)蛋白质S20,并不是大亚基蛋白质。③L8是两个L7/L12二聚体与L10形成的五聚体。因此,目前认为大肠杆菌核糖体大亚基含有33种基因编码的36条肽链。

(2)真核生物18S、28S、5S rRNA分别与原核生物16S、23S、5S rRNA同源,5.8S rRNA与23S rRNA 5'端同源。

(3)核糖体与核糖体亚基形成解离平衡,Mg 2+ 抑制解离。

2.核糖体RNA特点 ①含量高:rRNA是细胞内含量最高的RNA,占细胞总RNA的80%~85%。②寿命长:rRNA更新慢,寿命长。③种类少:原核生物有5S、16S、23S三种rRNA,约占核糖体质量的66%(其中5S、23S rRNA占核糖体大亚基质量的70%,16S rRNA占核糖体小亚基质量的60%);真核生物主要有5S、5.8S、18S、28S四种rRNA,另有少量线粒体rRNA、叶绿体rRNA。

大肠杆菌16S rRNA的3'端有一段保守序列ACCUCCU,可与mRNA中的SD序列互补结合(共有序列AGGAGGU,第四章,107页)。5S rRNA有两段保守序列:①CGAAC,可以与tRNA的TΨC环的GTΨCG互补结合。②GCGCCGAAUGGUAGU,可以与23S rRNA中的一段序列互补结合。

3.核糖体种类 原核生物只有一类核糖体,真核生物则有位于细胞不同部位的以下几类核糖体:游离核糖体、内质网核糖体(又称附着核糖体)、线粒体核糖体和叶绿体核糖体(植物)。游离核糖体和内质网核糖体实际上是同一类核糖体,它们比原核生物核糖体大,所含的rRNA和蛋白质也多。线粒体核糖体和叶绿体核糖体比原核生物核糖体小。这些核糖体的基本结构和功能一致。

(四)核酶

科学家在研究RNA的转录后加工时发现某些RNA有催化活性,可以催化RNA的剪接,这些由活细胞合成、起催化作用的RNA称为 核酶 (ribozyme,RNA酶,RNA enzyme)。许多核酶的底物也是RNA,甚至就是其自身,其催化反应具有专一性。

已阐明的天然核酶有锤头状核酶(斧头状核酶)、发夹状核酶、Ⅰ型内含子、Ⅱ型内含子、丁型肝炎病毒核酶、核糖核酸酶P(RNase P)、肽酰转移酶(23S rRNA)等。

如何评价核酶的理论意义与实际意义,如何看待核酶与传统意义上的蛋白质酶在代谢中的地位,都有待进一步研究。

1.核酶发现 核酶最早由T. Cech和S. Altman(1989年诺贝尔化学奖获得者)发现。1967年,C. Woese、F. Crick与L. Orgel等基于RNA二级结构的复杂程度提出其可能有催化活性;1982年,T. Cech团队在研究单细胞真核生物四膜虫rRNA前体剪接时(从6.4kb中剪除413nt,得到26S rRNA)发现其内含子有自我剪接活性;1983年,S. Altman在研究细菌tRNA前体时发现RNase P中的M1 RNA参与tRNA前体转录后加工;1982年,K. Kruger等建议将有催化活性的RNA命名为“ribozyme(核酶)”。迄今已发现超过1500种这类内含子,广泛存在于真核生物甚至细菌中(但脊椎动物无),统称Ⅰ型内含子(大多数需要自我剪接)。

2.Ⅰ型内含子自我剪接机制 Ⅰ型内含子含一段 内部指导序列 (internal guide sequence)与上游外显子3'末端序列形成双链结构,并使其定向靠近下游外显子5'末端。①鸟苷(或GMP、GDP、GTP)作为辅助因子先结合于RNA的G结合位点。②鸟苷3'-羟基亲核攻击内含子5'剪接位点磷酸基,使上游外显子3'-羟基游离。③上游外显子3'-羟基亲核攻击内含子3'剪接位点,释放Ⅰ型内含子(413nt)(图1-12)。

图1-12 Ⅰ型内含子自我剪接机制

3.核酶特点 到目前为止鉴定的各种核酶有以下特点。

(1)化学本质为RNA或RNA片段。有些核糖核蛋白也有催化作用,但活性中心位于其蛋白质成分上,并不属于核酶,例如端粒酶。然而,如果核糖核蛋白的RNA含活性中心,则该RNA组分是核酶,例如RNase P所含的M1 RNA(第三章,82页)。

(2)底物种类比较少,大多数是自身RNA或其他RNA分子,并因此将核酶分为自体催化、异体催化两类。此外还有其他底物,例如核糖体肽酰转移酶的底物是氨酰tRNA和肽酰tRNA(第四章,104页)。

(3)催化效率比蛋白质酶低得多。

(4)具有专一性。例如,M1 RNA只切割tRNA前体5'端的额外核苷酸(extranucleotides,第三章,91页),不切割其3'端的额外核苷酸及其他序列。

(5)均催化不可逆反应。

(6)催化反应时需要Mg 2+ ,Mg 2+ 既维持其活性构象,又参与催化反应。

(7)多数核酶在细胞内含量极低。

4.核酶意义 ①使我们对RNA的生理功能有了进一步的认识,即它既是遗传信息载体,又是生物催化剂,兼有DNA和蛋白质两类生物大分子的功能。②纠正了所有生物催化剂均为蛋白质的传统认知。③对于了解分子进化具有重要意义,RNA或许是先于DNA和蛋白质出现的生物大分子。

5.核酶应用 ①基因治疗(第十五章,369页);②特定RNA降解;③生物传感器;④功能基因组学;⑤基因发现。 1K/RmvU3q/ddqFjCegoQdo6Gh1CortX/Odni60rzR++tDXaE0EI7d8RghzMkgRny

点击中间区域
呼出菜单
上一章
目录
下一章
×