如果可以把 复制子 看作细胞的前夜的话,那么复制子的材料就是暗夜中的繁星,它们的出现要早得多。人们无法明确知道生命到来之前地球上有哪些生命的材料,可能性最大的有水(这几乎是必然的)、二氧化碳、甲烷和氨。基于这种推测,科学家尝试模拟早期地球的化学环境。他们把上述简单物质放入反应器中,并提供早期地球上可能的能量来源如紫外线、电火花等。几周过去了,科学家发现了有趣的现象:在反应器中,更复杂的分子出现了,例如 氨基酸 、 嘌呤 、 嘧啶 (见 道金斯 的《自私的基因》)。另一种说法则认为在复制子诞生的前夜,地球上就存在着氨基酸、 羟基酸 、糖、嘌呤、嘧啶和 脂肪酸 [22] 。无论哪种说法,氨基酸、碱基和脂肪酸似乎早已具备了。氨基酸是 蛋白质 的材料,嘌呤、嘧啶碱基则是 核苷酸 的组成部分,后者进一步组成 核糖核酸(RNA) 和 脱氧核糖核酸(DNA) ,脂肪酸则是 膜 的组成材料。总之,在细胞诞生很久以前,地球环境已经做好了材料准备。
随着时间的流逝,这些材料可能形成稍微复杂一点的结构,比如 多聚体 。有些多聚体具有一些特殊的性质,包括可以黏附在某些矿物的表面,不会轻易降解,以及可以以之为基础形成更大的聚集物。但无论如何,这些结构最后总会土崩瓦解,风流云散。
直到某一刻,复制子出现了,地球上终于出现了一种物质,它们不再简单地遵循 热力学第二定律 ,刹那生灭,而是长久存在,直到今天,并将在未来继续。但构成复制子的,却不是我们最熟悉的蛋白质。
蛋白质具有多姿多彩的功能,这源于其结构。蛋白质一般由20种氨基酸组成,所以由 n 个氨基酸组成的蛋白质,仅就其序列而言,就有20 n 种可能的排列组合,以此为基础,有可能执行各种功能。有的蛋白质如 抗体 形成Y字形,便于和 抗原 结合;有些蛋白质如合成细胞内能量货币的一种酶即 ATP合酶 ,形成一个复杂的类似水坝的结构,同真实水坝的区别在于,积累形成势能的不是水而是 质子 ;有些蛋白质如 马达蛋白 有一个大脑袋和两条细腿,腿部负责运送货物,脑袋则沿着细胞内的通道移动。相比之下,核酸由4种核苷酸组成,所以由 n 个核苷酸组成的核酸,仅就其序列而言,就只有4 n 种可能的排列,缺乏足够的结构多样性以承载功能。因此,蛋白质是功能的良好载体。
但是,蛋白质的复制能力不占优势。蛋白质可以很稳定,然而蛋白质缺乏互补配对的类型。尽管常见的氨基酸多达20种,但是没有哪两种会形成很好的互补配对结合。有些蛋白质确实能形成螺旋结构,但只是单螺旋,所以蛋白螺旋并不会形成类似DNA的互补结构。另外,同只有4种核苷酸的DNA相比,蛋白质也缺少简洁性,这其实不利于复制。从大自然中存在的极少数的具有复制能力的蛋白质上,我们能看到蛋白质复制的劣势。
朊病毒 病可能就是由有复制能力的蛋白质造成的。朊病毒病指的是一种由朊病毒引起的疾病,其特征是可以传染。当含有朊病毒的组织被另一个个体吃掉后,这个新的健康个体体内也会积累朊病毒并发病。 羊瘙痒病 ,人类的 克–雅病 、 库鲁病 , 牛海绵状脑病 都属于朊病毒病。朊病毒病是由朊病毒蛋白的错误折叠和聚集造成的。朊病毒蛋白一般存在于 细胞膜 ,尤其是神经细胞的细胞膜表面。错误折叠的朊病毒蛋白能将正确折叠的同类带偏,并呈现多米诺骨牌样的效应。当人类吃了有错误折叠朊病毒蛋白的牛(如海绵状脑病病牛)的肉后,也常常发病,就是所谓的 疯牛病 。朊病毒蛋白具有罕见的蛋白质复制能力。蛋白质的这种能力没有在进化上进一步发展,可能的原因很多,如缺少互补结构,没有由简单组合形成复杂的能力,等等。
功能要求的是结构的复杂,复制要求的则是结构的简单,所以,两者似乎很难同时拥有。也就是说,对于一个固定的分子,很难在提高功能多样性的同时也让复制变得容易。就像图书馆中的书:被越多的人看就会摆放得越乱,其功能也实现了最大化,但同时,这些满足读者需求实现功能最大化的书,整理起来准备搬家也很困难。
人们一度认为DNA是最初的复制子,连那些最聪慧的大脑也不例外。 薛定谔 在《生命是什么》中提到最初的生命材料,并给出了一个专门词汇—— 非周期性晶体 ,以便和那些呈周期性排布的晶体如食盐相区别;诺贝尔奖得主、法国化学家 雅克·莫诺 认为生命起源于第一个DNA分子;沃森和克里克甚至认为最初的DNA可能不用酶就可以实现复制,或者单链螺旋可能充当酶 [23] 。
然而,越来越多的证据表明RNA才是最初的复制子,而DNA则可能起源于RNA。RNA具有还算稳定的结构,事实上,如果不是环境中充满了 RNA酶 ——一种降解RNA的蛋白酶的话,RNA可能会遍布于环境之中。RNA是单链分子,虽然无法在整体上形成互补的结构,但在局部,它们则会按照互补配对的原则进行匹配,类似于DNA,可以作为复制子载体。因为是单链和局部互补,RNA以组成的简单性形成复杂性的可能性大大降低了。进一步,这种整体单链、局部互补的结构又会让RNA具有复杂的、不同于DNA而更接近于蛋白质的复杂结构,从而让RNA甚至可以具有酶的活性,这是一种额外的福利。另外,尽管单个的DNA分子比RNA更加稳定,但在没有膜结构的情况下,DNA双链维持的成本可能更高。最初的复制子,只能是RNA。
RNA作为最初的复制子,需要解决三个问题:第一是要有稳定的、互补的以及一定复杂性的结构,以便携带一定量的信息并方便复制;第二是要有自己复制自己的能力,即具有复制酶活性,这个在今天是由蛋白质完成的,但在远古,只能由RNA自己实现;第三是除了可复制、能复制,RNA还必须具备一些基本的代谢能力,这同样需要酶活性。这就像一本书,携带了信息并有被复制的可能,但若要传播还需要复印机,而复印的过程还需要能量等。RNA是可复制的,这个上面已经提到过。RNA还要有复制自己的能力,这个值得详细说一说。
RNA可以具有催化RNA聚合的能力。需要强调的是,让人信服RNA具有催化自身的能力是很难的,有两个原因:第一是今天的世界从来没有出现直接从RNA到新的RNA这样的情形,RNA病毒自我复制是通过 逆转录 为DNA,再由DNA 转录 为新的RNA来实现的;第二是历史上可能存在直接从RNA到新的RNA的情形,但我们无法找到任何踪迹,因为那段历史可能距今数十亿年,足以让任何痕迹消失。那么如何让人接受可能存在由RNA组成的复制RNA的酶呢?答案只能是人工进化。1993年的时候,科学家在实验室中得到了催化RNA复制的酶,起名叫作 I类连接酶 。I类连接酶本身是RNA,长120个核苷酸左右,自身一部分可以作为模板结合互补的RNA,催化效率是每分钟100个核苷酸,这比非催化反应速度提高了700万倍 [24] 。I类连接酶的例子表明RNA确实可以有复制自己的能力。
除了复制自己的能力,RNA还要能完成更多的催化功能。在RNA世界之中,这些催化功能更多的是针对RNA本身,如RNA的剪切加工等。一种负责RNA的加工的酶叫作 核糖核酸酶P ,能针对RNA进行切割。核糖核酸酶P是第一个被确定的具有催化能力的RNA,也叫 核酶 。
在复制上强于蛋白质,在功能上优于DNA,这让RNA成为地球上最初的复制子、苍茫大地上生命的最初星火。
对于RNA,尽管在复制上强于蛋白质,在功能上优于DNA,同时也暗示了在复制上弱于DNA,在功能上不及蛋白质。在进化的压力下,RNA也需要改变。
前面我们提到过,对于一件事物,同时提高效率和安全是不可能的,因为这是跷跷板上的两极,要想二者兼顾,需要做出大的改变。RNA也是如此,一方面,充分折叠的RNA复制起来很难,就像面容精致的头像很难复制一样;另一方面,未能充分折叠的RNA又不是酶的好载体,RNA想兼顾复制与功能,亟待突破。
RNA的突破,从内部开始。在某个时间点,RNA的两条链发生了劳动分工,其中一条主要负责复制,而另一条则专攻酶活性,这样,RNA就在复制和酶活性两方面都得到了提高 [21 , 25] 。
RNA既能复制,又能执行功能如发挥酶的作用,因而统治了早期的地球。人们认为,RNA世界可能存在了大概5亿年。一个广为接受的假设是宇宙起源于138亿年前,太阳系和地球形成于45亿年前,RNA世界则存在于35亿~40亿年前,在35亿年前左右,第一个拥有DNA作为遗传材料的细胞才诞生。
既然也要执行酶的作用,RNA就必须演化出各种精巧的结构。RNA的存在形式虽然没有蛋白质那样多样,但还是要比DNA丰富得多。甚至不需要过多的证据,我们也能没有太大偏差地推断出各种RNA登场的顺序。
最初的RNA是什么呢?作为RNA家族的负责氨基酸运输的 转运RNA 很可能是最早的RNA类型。这些RNA很小,只有70个核苷酸左右,即使在自然条件下形成的可能性也最大。转运RNA具有典型的单链、局部配对的结构。转运RNA也还能和其他的分子如氨基酸结合,可能实现了最早的对氨基酸的驾驭。
核糖体RNA 则可能是接下来登场的RNA类型。它们比转运RNA大了很多,可以长达1500个核苷酸左右,能以如此长度存在,这很可能是核糖体RNA结合了一些蛋白质的缘故。
信使RNA 则可能来得更晚,是在DNA成为细胞之主的地位之后才发展出来的。信使RNA因此可以更长,序列的变化也很大。信使RNA是成熟的RNA,所谓成熟,指的是它们经过了修剪,除去了一些不必要的部分,而那些未经过修剪的信使RNA称为 前体信使RNA 。
核内小RNA 只能在信使RNA之后出现,因为它们是负责对前体信使RNA进行切割以得到成熟的信使RNA的。
其他各种类型的RNA,如 微RNA、小干扰RNA 等则可能发展出来的时间更晚,主要是因为它们的作用都是针对DNA的调控设计的,并同多细胞生物的发展有关。多细胞发育中有着非常多的微RNA,也说明了它们在进化上的姗姗来迟。 PIWI相互作用RNA 则是对动物的生殖系进行保护的,其发展历程就要更靠后了。
除此之外,还有一些其他的RNA,比如在蛋白质转运到内质网时,需要一个受体,这个受体主要由蛋白组成,但在蛋白质之中含有一个RNA,作为铰链连接蛋白将蛋白质分成不同的区域,这个RNA叫作信号识别颗粒RNA。真核细胞染色体会形成一个末端,叫作端粒,端粒中也有一种RNA,可以用来得到DNA复制中损失的DNA,叫作端粒RNA。
还有些RNA也有不可忽视的作用,但却连具体的名字也没有,例如,在DNA复制的时候,都需要一个 RNA引物 ,就像拉链头一样,以起始DNA的复制,这个RNA就没有名字,它们就像雨滴,只有一个总的名字,其中每一个却不会重要到需要命名 (表6.1) 。
5亿年,在第一个细胞出现前RNA为什么单独存在了如此长的时间呢?或者说,在这么漫长的时间里,RNA做了些什么呢?RNA可能在这段时间里,实现了对蛋白质的驯化,而这,可能始于一次亲密接触。
表6.1 RNA类型、名称与功能
嘌呤(purine): 碱基的一种,包含腺嘌呤和鸟嘌呤。
嘧啶(pyrimidine): 碱基的一种,包含胞嘧啶、尿嘧啶和胸腺嘧啶。
羟基酸(hydroxy acid): 同时含有羟基(—OH)和羧基(—COOH)的酸,三羧酸循环中的一些酸就属于羟基酸。
脂肪酸(fatty acid): 中性脂肪、磷脂和糖脂的主要成分。动物脂肪和植物油的一个主要差别是前者含有饱和脂肪酸而后者含有不饱和脂肪酸。
肽键(peptide bond): 由一个氨基酸的羧基与另一个氨基酸的氨基脱水缩合而形成的化学键。
抗体(antibody): 也称免疫球蛋白,是一种大的呈Y字形的蛋白质,被免疫系统分泌出来识别并中和外源物质如病原体和病毒。
抗原(antigen): 任何能结合于抗体或者T细胞受体的外源分子、分子结构或粒子。
朊病毒蛋白(prion protein): 一种蛋白质,具有错误折叠的结构并能将这种错误传递给正常蛋白质。
羊瘙痒病(scrapie): 一种存在于羊中的神经系统退行性疾病。
克–雅病(Creutzfeldt-Jakob disease,CJD): 人类的一种退行性脑功能失调性疾病,约70%患者在确诊后一年内死亡。
库鲁病(Kuru disease): 人类的一种罕见的、不可治愈的、致命的神经退行性疾病。
牛海绵状脑病(bovine spongiform encephalopathy,BSE): 牛的一种不可治愈的、致命的神经退行性疾病。
非周期性晶体(aperiodic crystal): 这是薛定谔在《生命是什么》中创造的一个词,最初用来形容染色体纤丝,以同周期性晶体(如氯化钠)相区别。在薛定谔看来,周期性晶体是物理学家所能遇到的非常复杂的物质,而非周期性晶体还要复杂得多,两者是糊墙纸和刺绣的区别。
核糖核酸酶P(ribonuclease P): 对转运RNA前体进行加工的酶,由RNA和蛋白质组成,主要活性来自RNA。
核酶(ribozyme): 由RNA构成的酶。
信使RNA(message RNA, mRNA): 用于携带基因信息的单链RNA。
前体信使RNA(precursor mRNA): 信使RNA的前体,经过加工成为信使RNA。
PIWI相互作用RNA(PIWI-interacting RNA, piRNAs): 动物细胞中最大的一类非编码RNA,主要参与针对转座子的沉默,也在生殖系中起保护作用。
信号识别颗粒(signal recognition particle): 细胞内一种丰富的、位于细胞质中的、保守的蛋白质-RNA复合物,在真核细胞中负责识别并引导蛋白质进入内质网,在原核细胞中识别并引导蛋白质进入细胞膜。
生殖系(germ line): 多细胞生物中将遗传信息传递给后代的细胞群。