分子生物学最新章节_王继峰著

第一节
蛋白质合成系统

蛋白质的合成过程非常复杂，合成系统由近300种大分子组成，包括mRNA、tRNA、rRNA、酶和一组蛋白因子，合成反应可表示如下：

这里先介绍蛋白质合成系统的核心成分mRNA、tRNA和含rRNA的核糖体，其他因子将结合在蛋白质合成过程中介绍（表4-1）。

表4-1　蛋白质合成系统

一、mRNA

mRNA传递从DNA转录的遗传信息，其一级结构中编码区的密码子序列直接编码蛋白质多肽链的氨基酸序列。

1. mRNA的一级结构 由编码区（coding region）和非翻译区（UTR）构成（图4-1）。

图4-1　mRNA的一级结构示意图

（1） 5'非翻译区 ：又称 前导序列 （leader，leader sequence），是从mRNA的5'端到起始密码子之前的一段序列，原核生物mRNA的5' UTR几乎都大于25nt，不编码蛋白质，但具有翻译调控功能。真核生物mRNA的5' UTR较长，但多数不超过100nt。

（2） 编码区 ：又称 编码序列 ，是从mRNA的5'端起始密码子到3'端终止密码子的一段连续的、无重叠的密码子序列，是mRNA的主要序列。一个编码区编码（平均长度约1050nt）一种肽链（平均长度约350aa）。细菌和古细菌有许多mRNA有两个或多个不同的编码区（因而编码两种或多种肽链），相邻编码区被一个 顺反子间区 （intercistronic region，-1～40nt）隔开，这种mRNA称为 多顺反子mRNA （polycistronic mRNA），大肠杆菌有50%mRNA是多顺反子mRNA。真核生物几乎所有mRNA都只有一个编码区，只能编码一种肽链，这种mRNA称为 单顺反子mRNA （monocistronic mRNA）。

（3） 3'非翻译区 ：又称 尾随序列 （trailer，trailer sequence），是从mRNA的终止密码子之后到3'端的一段序列。少数mRNA的非翻译区长度可达编码区的2～3倍，通常3'非翻译区更长。非翻译区影响加工、转运、储存、降解、翻译，从而成为调控基因表达的环节之一，其中部分事件发生在P小体上（P body）。

除编码区和非翻译区外，真核生物mRNA 5'端还有5'帽子结构，3'端有poly（A）尾（组蛋白mRNA例外）。

2.密码子 mRNA开放阅读框内从5'端向3'端每三个相邻核苷酸为一组组成一种遗传密码，称为 密码子 （codon，三联体密码，triplet code）（表4-2）。密码子共有64个，其中61个编码氨基酸，称为 有义密码子 （sense codon）。

（1） 起始密码子 ：位于编码区5'端的第一个密码子是起始信号，同时编码蛋氨酸（又称甲硫氨酸），即蛋白质合成都从蛋氨酸开始。原核基因的起始密码子（start codon）绝大多数是AUG（蛋氨酸密码子），少数是GUG（缬氨酸密码子）、UUG（亮氨酸密码子）。大肠杆菌三种起始密码子使用率依次为91%、7%、2%，但翻译起始因子3 mRNA的起始密码子是AUU。结核分枝杆菌H37Rv三种起始密码子使用率依次为61%、35%、4%。真核基因的起始密码子几乎都是AUG，极少数是CUG（亮氨酸密码子）。人睾丸5-磷酸核糖焦磷酸合成酶3 mRNA的起始密码子为ACG（苏氨酸密码子）。

（2）终止密码子：位于编码区3'端的最后一个密码子是终止信号，不编码任何氨基酸，称为 终止密码子 （stop codon，无义密码子，nonsense codon）。终止密码子有UAA（赭石密码子）、UAG（琥珀密码子）和UGA（乳白密码子）三种，在细菌基因组中的使用频率UAA＞UGA＞UAG。

表4-2　遗传密码表

● 遗传密码的破解完成于1966年，是20世纪最重要的科学发现之一，R. Holley、H. Khorana和M. Nirenberg因此于1968年获得诺贝尔生理学或医学奖。

3.密码子特点 包括方向性、连续性、简并性、通用性等。

（1）方向性（directionality）：核糖体阅读mRNA编码区的方向是5'→3'，因此：①所有密码子都以5'→3'方向阅读。②起始密码子位于编码区的5'端，终止密码子位于编码区的3'端。

（2）连续性（continuity）：①mRNA编码区的密码子之间没有间隔（gap），即每个核苷酸都参与构成密码子。②密码子没有重叠（nonoverlapping），即每个核苷酸只参与构成一个密码子。因此，如果发生插入缺失突变，并且插入缺失的不是3 n 个碱基，插入缺失点下游就会发生移码突变，导致蛋白质的氨基酸组成和序列改变。

（3）简并性（degeneracy）：一个有义密码子编码一种编码氨基酸，但编码氨基酸只有20种，有义密码子有61个，所以一种氨基酸可能有不止一个密码子。实际上只有蛋氨酸和色氨酸有单一密码子，其余18种氨基酸各有2～6个密码子（表4-2）。编码同一种氨基酸的不同密码子称为 同义密码子 （synonymous codon，简并密码子，degenerate codon）。同义密码子具有 简并性 （degeneracy），又称密码简并，即不同密码子可以编码同一种氨基酸，并且只编码一种氨基酸。密码子的特异性主要是由第一、二碱基决定的：大多数同义密码子的第一、二碱基一样，第三碱基不同，称为 第三碱基简并性 （third-base degeneracy）。例如GAU和GAC是同义密码子，都编码天冬氨酸，其第一、二碱基都是GA，第三碱基分别是U和C。简并性可最大程度降低突变效应，如同义突变（第二章，53页）。

密码子偏好性 （密码子偏爱性，密码子偏倚，codon bias）是指编码同一种氨基酸的几个同义密码子在一个基因组中的使用率不同，使用率高的称为 偏爱密码子 （preferred codon），使用率低的称为 稀有密码子 （rare codon）。密码子偏好性与同工tRNA丰度一致： 高丰度tRNA （common tRNA）识别偏爱密码子，翻译效率高； 低丰度tRNA （稀有tRNA，rare tRNA）识别稀有密码子，翻译效率低。密码子偏好性广泛存在于各种生物体内，包括细菌、植物和动物等。一个同义密码子在不同生物的基因组中翻译效率可能不同，在一种生物的基因组中可能是偏爱密码子，而在另一种生物的基因组中却可能是稀有密码子。

（4）通用性（universality）：地球生物基本采用同一套遗传密码，说明它们拥有共同的进化祖先。线粒体和某些细菌、某些单细胞真核生物染色体DNA的个别密码子例外，但主要涉及终止密码子，①山羊支原体用UGA编码色氨酸。②有纤毛原生生物四膜虫和草履虫用UAA/UAG编码谷氨酰胺。③假丝酵母用CUG（亮氨酸密码子）编码丝氨酸。④UGA编码硒代半胱氨酸。⑤线粒体DNA遗传密码的例外较多。

（5）抗突变性（mutation-resistant）：密码子不是随机分配给氨基酸的，而是执行了某种优化分配原则，该原则赋予其三个碱基抗突变性，可以尽最大可能降低有害突变特别是错义突变发生率。①密码子第三碱基的置换有75%是沉默突变。②第一碱基突变通常引起氨基酸取代，但这种取代多发生在具有相似化学性质的氨基酸之间，这在第二碱基为U的密码子尤为突出，它们编码的都是疏水性氨基酸，如缬氨酸密码子GUU转换为AUU而被异亮氨酸取代，转换为CUU则被亮氨酸取代，这些取代对蛋白质结构或功能的影响常常很小。

4.阅读框［架］ 是指mRNA及对应DNA碱基序列的3种解读方式，即可解读出3种密码子序列，末端不一定含起始密码子或终止密码子（图4-2）。其中从起始密码子开始到终止密码子结束的阅读框称为 开放阅读框 （可读框，open reading frame，ORF；另有定义开放阅读框不包括终止密码子）。ORF中编码产物或其功能尚未鉴定的称为 功能未定读框 （unassigned reading frame，URF），位于5'非翻译区内参与翻译调控的一种小ORF称为 上游开放阅读框 （upstream ORF，uORF）。mRNA的一个编码区就是一个开放阅读框。各种生物mRNA编码区所编码肽链的平均长度是350aa，人类是440aa。

图4-2　阅读框

mRNA翻译过程中有时会发生 核糖体移码 （ribosome frameshifting，翻译移码，translation frameshift），即核糖体复合物将一个四核苷酸序列读成密码子（ +1移码 ，如大肠杆菌RF-2的翻译合成，第五章，177页），或者将一个碱基重读（ -1 移码），接下来虽然继续按照三联体阅读，但阅读框已经改变。核糖体移码极少见，主要发生在某些病毒RNA（特别是逆转录病毒RNA）翻译过程中，是在翻译水平调控基因表达的一种机制。

● 大肠杆菌DNA聚合酶Ⅲ的τ亚基mRNA的密码子Lys430、Glu431、Pro432，正常阅读时合成τ亚基（Met1～Ile643），如果读至密码子Ser431时后退一个碱基（-1移码），则读为Glu431、终止密码子432，合成γ亚基（Met1～Glu431）（第二章，35页）。

二、tRNA

F. Crick于1955年提出可能存在一种小的核酸分子 连接物 （adaptor，linker），其结构的一个特定部位可以结合一种氨基酸，另一个特定部位可以识别一种mRNA分子中编码该氨基酸的碱基序列。这种连接物即为M. Hoagland和P. Zamecnik于1958年发现的tRNA。细胞质蛋白质合成体系至少需要32种tRNA，线粒体蛋白质合成体系只需22种tRNA。

1. tRNA是氨基酸转运工具 每一种氨基酸都有自己的tRNA，它通过3'CCA序列的腺苷酸3'-羟基结合、转运氨基酸并在核糖体上将其连接到肽链的C端。

2. tRNA是译码器 每一种tRNA都含有一个 反密码子 （anticodon），它是tRNA反密码子环（YY- N34- N35- N36 -R*N，Y为嘧啶碱基，R*为修饰嘌呤碱基）上的一个三核苷酸序列（ N34- N35- N36 ），可识别mRNA编码区的密码子，并与之结合（图4-3）。因此，mRNA通过碱基配对选择氨酰tRNA，并允许其将携带的氨基酸连接到肽链上。

图4-3　tRNA译码

3. tRNA译码存在摆动性 反密码子与密码子是反向结合的，即tRNA反密码子的第一、第二、第三碱基分别与mRNA密码子的第三、第二、第一碱基结合。如果这种结合严格按照碱基配对原则，即1种反密码子只识别1个密码子，那么识别61个密码子就需要61种反密码子，从而需要61种tRNA。

实际上，各种细胞所含tRNA的种类的确多于编码氨基酸的种类，因此一种编码氨基酸可能有几种tRNA，它们称为 同工tRNA （isoaccepting tRNA，因为被同一种氨酰tRNA合成酶催化负载，又称关联tRNA，cognate tRNA）。然而，绝大多数细胞所含的tRNA种类少于密码子个数。大多数细胞有40～50种tRNA，因此一种反密码子可能识别几个不同的密码子（当然它们一定是同义密码子）。这就意味着，有些反密码子与密码子的结合并不严格按照碱基配对原则配对，这种现象称为 摆动性 （wobble）。

研究发现，mRNA密码子的第三碱基（又称3'碱基）和tRNA反密码子的第一碱基（又称5'碱基）为 摆动位置 （wobble position），该位置存在非Watson-Crick碱基配对。1966年，F. Crick总结对摆动位置的研究，提出了 摆动假说 （wobble hypothesis，摆动法则，wobble rule）。

（1）mRNA密码子第一、第二碱基与反密码子第三、第二碱基只能形成Watson-Crick碱基对，对密码子的特异性起决定性作用。因此，两个同义密码子的第一、第二碱基即使有一个不同，也将由不同的tRNA识别。

（2）tRNA反密码子第一碱基被称为 摆动碱基 （wobble base），决定其可识别密码子的个数：①第一碱基为A或C的反密码子专一性最强，只能识别一个密码子。②第一碱基为U或G的反密码子专一性较弱，可以识别第三碱基为A、G或U、A的两个同义密码子。③第一碱基为次黄嘌呤的反密码子专一性最弱，可以识别第三碱基为A、C、U的三个同义密码子。因此，一种tRNA最多可识别三个同义密码子（表4-3）。

因此，摆动位置可以形成五种 非Watson- Crick碱基配对 （摆动配对）：G-U、U-G、I-A、I-C、I-U，其中特别值得注意的是G-U和U-G，它们与Watson-Crick碱基配对G-C、C-G几乎同样稳定。例如，苯丙氨酸的密码子UUU、UUC都被tRNA ^Phe 的反密码子GAA识别。实际上，如果两个密码子的第一、二碱基分别一样，第三碱基是U或C，那么它们一定编码同一种氨基酸，并且由同一种tRNA识别，该tRNA反密码子的第一碱基一定是G。

表4-3　摆动配对

*线粒体tRNA反密码子第一碱基C可以与第三碱基为A、G的两种同义密码子配对；**线粒体tRNA反密码子第一碱基U可以与第三碱基为A、C、G、U的四种同义密码子配对

（3）如果一种氨基酸有几种同义密码子，第一或第二碱基不同的同义密码子由不同tRNA识别。

（4）识别全部61种密码子至少需要32种tRNA的31种反密码子（识别AUG需要两种tRNA，其中1种tRNA识别起始AUG）。

线粒体DNA遗传密码有差异，其密码子识别需要22种tRNA。

摆动性意义：一方面使一种tRNA可以识别几个同义密码子，降低有害突变的发生率；另一方面可以平衡蛋白质合成的准确度和速度。

虽然32种tRNA可以支持翻译，但细胞内却有更多的tRNA，大肠杆菌基因组中有86个tRNA基因拷贝，编码47种tRNA。

● 16S rRNA的三个保守碱基G530、A1492、A1493监控密码子第一、第二碱基是否与反密码子第三、第二碱基形成Watson-Crick碱基配对：它们会与形成Watson-Crick碱基配对的碱基形成氢键。

三、核糖体

20世纪50年代，P. Zamecnik和E. Keller通过同位素实验证明蛋白质是在核糖体上合成的。V. Ramakrishnan、T. Steitz和A. Yonath因阐明核糖体结构和功能而获得2009年诺贝尔化学奖。

核糖体是复杂的超分子机器。核糖体及其两个亚基的构象已经解析（图4-4）。关键位点包括tRNA结合位点、肽酰转移酶中心、mRNA结合位点，这些位点的化学构成都是rRNA，基本没有肽链，肽链多点缀于核糖体表面，所以rRNA是核酶，是核糖体结构和功能的关键成分。

图4-4　原核生物核糖体结构

1. tRNA结合位点 有三个：① 氨酰位 （aminoacyl site）：简称 A位，又称受位（acceptor site），是 氨酰tRNA 结合位点，跨在小亚基和大亚基上。② 肽酰位 （peptidyl site）：简称 P位，又称给位（donor site），是 肽酰tRNA 结合位点，跨在小亚基和大亚基上。③ 出口位 （exit site）：简称 E位，是 脱酰tRNA 结合位点，主要位于大亚基上，但与小亚基也有接触（图4-7）。三个位点的小亚基部分可以结合tRNA的反密码子环，大亚基部分可以结合CCA。

2.肽酰转移酶中心 又称肽基转移酶（peptidyl transferase center）中心，位于原核生物和真核生物核糖体大亚基的A位和P位之间，可催化P位肽酰-tRNA与A位氨酰tRNA氨基缩合形成肽键。A位和P位之间有一个肽链通道（exit channel）入口，该通道直径1～2nm，长约10nm，可容纳约50aa肽段，主要由rRNA形成，出口位于50S表面，用于释放新生肽。

3. mRNA结合位点 位于30S小亚基上，两个连续的密码子位于A位、P位。

不同真核生物核糖体亚基大小差异较大。线粒体、叶绿体核糖体比细菌核糖体还小且简单。虽然如此，其核糖体结构、功能和蛋白质合成所涉及的许多基本成分及合成机制都非常保守，例如真核生物与原核生物rRNA中，18S rRNA与16S rRNA、28S rRNA与23S rRNA、5S rRNA与5S rRNA、5.8S rRNA与23S rRNA 5'端同源，提示它们在所有物种的 共同祖先 （last universal common ancestor，LUCA）时代就已存在。

第一节 蛋白质合成系统

一、mRNA

二、tRNA

三、核糖体

第一节
蛋白质合成系统