购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

1号染色体
生命

一死一生,川流不息;

灭亡之后,振兴继之;

一祸一福,起伏相寻;

有如水中,忽生泡影;

自起自灭,幻化无穷。

——《人论》(亚历山大·蒲柏)

万物伊始,便有这么一个“词”。它携带着自身信息,自我复制,永不停歇,令大海焕发新颜。这个“词”揭示了如何重排化学物质,以便在无序之中因势而动,得以生存。它让地表从尘土飞扬的地狱变成了翠绿的天堂。这个“词”最终大放异彩,聪慧过人,制造了划时代的装置——人脑,而人脑得以发现并意识到这个“词”的存在。

每念及于此,我便头脑一团糨糊。在40亿年的地球历史中,我很幸运能够活在今天。在500万个物种里,我很幸运生下来便是一个有意识的人。地球上有60亿人口,我有幸能够出生于发现这个“词”的国家。这个“词”到底是什么呢?从地球历史、生物和地理的角度来看,在我出生前仅5年的时候,在距我仅200英里 的地方,两位我的同类,发现了DNA结构,并揭示了最伟大、最简单、最令人咂舌的宇宙奥秘。你可以嘲笑我的狂热,可以认为我对此缩写词的热衷实在是有点太过了,分明就是一位荒谬的唯物主义者。但是,请随我回到生命的源头,我希望能让你领略到这个“词”的无限魅力。

1794年,博学的诗人兼医生伊拉斯谟·达尔文(Erasmus Darwin)曾问道 ,“早在动物诞生之前,陆地和海洋或许就已经布满各类植物。而且有的动物出现得早,有的动物出现得晚。据此,我们是否可以推测出所有的有机生命均起源于同一种有生命的丝状物?”这在当时可是惊人之语,他不仅提出了所有有机生命都具有相同起源这一大胆推测,比他的孙子查尔斯(Charles)有关该主题的书早了65年,还奇怪地使用了“丝状物”一词。生命的奥秘确实就在一条细丝里。

然而,一条丝状物是如何造出生命的呢?生命很难定义,但它有两种截然不同的技能:复制能力和建立秩序的能力。生物产生与自己相似的副本:兔子诞下兔子,蒲公英繁殖蒲公英。不过,兔子的作用远不止于此。它们吃草,将其转化为兔肉,并以某种方式在随机而混乱的世界里构筑有序而复杂的身体。这并没有违背热力学第二定律——在封闭的系统中,一切都会从有序向无序发展,不过兔子不是封闭的系统。兔子通过消耗大量能量,构建起有序而复杂的身体堡垒。用埃尔温·薛定谔(Erwin Schrödinger)的话来说,生物从环境中“汲取秩序”。

生命这两个特征的关键是信息。有了配方(构筑新个体所需的信息),自我复制成为可能。兔子的卵子携带着如何组装新生兔子的指令。不过,通过新陈代谢建立秩序的能力还是得仰仗信息,是它发号指令来构建和维持机体并建立秩序的。就像按照蛋糕配方制作出成品那样,一只具有繁殖和新陈代谢能力的成年兔子,在它还是有生命的丝状物时就已预设好了。这一想法可以追溯到亚里士多德(Aristotle),他曾说:鸡蛋会孵化成鸡,橡树种子会长成橡树。亚里士多德对信息论的初步理解已被化学和物理学湮没多年,伴随着现代遗传学的发展,得以重见天日。马克斯·德尔布吕克(Max Delbruck)开玩笑地说,因DNA的发现,应给这位希腊圣贤追授诺贝尔奖。

丝状DNA即是信息,是由化学代码编写而成,每个字母对应一种化学物质。代码是用我们可以理解的方式所编写的,这确实很精妙。就像书面英语那样,遗传密码是一种笔直书写的线性语言。就像书面英语那样,它是数字的而非模拟的,里面的每个字母都同等重要。此外,DNA的语言相比英语要简单得多,因为它的字母表里只有四个字母,即通常所说的A,C,G和T。

如今我们知道基因是加密的内容,但以前很少有人能往此方面想。在20世纪上半叶,生物学界一直有个悬而未决的问题:什么是基因?这看似是个无解之谜。回溯到1943年,也就是在1953年发现DNA对称结构的10年之前,那些将在整整10年之后为解开此谜团而做出杰出贡献的人们,正在从事着其他方面的工作。当时,弗朗西斯·克里克(Francis Crick)正在朴次茅斯附近制造水雷,詹姆斯·沃森(James Watson)刚以15岁的低龄迈入芝加哥大学的校门并决心致力于鸟类学研究。莫里斯·威尔金斯(Maurice Wilkins)在美国协助制造原子弹。罗莎琳德·富兰克林(Rosalind Franklin)正在为英国政府研究煤炭的结构。

在1943年的奥斯威辛集中营,约瑟夫·门格勒(Josef Mengele)为进行其所谓的科学探究,将一对对双胞胎折磨致死。门格勒试图搞清楚遗传特征,但事实证明他的优生学并非正道。门格勒的研究结果对未来的科学家而言,毫无益处。

1943年,从门格勒及其同党手下逃脱的难民、伟大的物理学家埃尔温·薛定谔在都柏林的三一学院(Trinity College)进行了题为“什么是生命”的一系列讲座。他想弄清楚一个问题。他知道染色体中蕴含着生命的秘密,但他不明白这是如何做到的:“正是这些染色体……有着指导个体未来发育走向以及在成熟状态下如何运行的全部指令。”他说,基因太小,只是一个大分子。这一洞见将激励包括克里克、沃森、威尔金斯和富兰克林在内的一代科学家,让棘手的问题一下子变得简单起来。不过,尽管答案近在咫尺,薛定谔还是走偏了。他认为该分子具有遗传能力的奥秘可用他所钟爱的量子理论来进行解释,他那执迷不悟后来被证明是误入歧途。生命之谜与量子状态无关,无法从物理学中寻求到解答。

在1943年的纽约,时年66岁的加拿大科学家奥斯瓦尔德·埃弗里(Oswald Avery)的一项实验进入收尾阶段,该实验将决定性地证明DNA为遗传物质的化学表现形式。埃弗里通过一系列巧妙的实验证明,仅通过吸收一种简单的化学溶液,即可将肺炎双球菌从无毒菌株转化为有毒菌株。到1943年,埃弗里得出结论,认为纯化后的转化因子,就是DNA。但他发表的时候措辞审慎,以至于很久以后才有人注意到这项成就。在1943年5月写给哥哥罗伊(Roy)的信中,埃弗里较为直白地说道:

尽管尚待证实,但如果我们是对的,那将意味着核酸[DNA]不仅在结构上重要,还是具有功能的活性物质,对细胞的生化活动和特性起着决定性作用。此外,通过已知的化学物质可诱发细胞中可预测的遗传变化。这是遗传学家一直以来的梦想。

埃弗里几乎达成了这个梦想,但他仍沿着化学思路进行探索。扬·巴普蒂斯塔·范·赫尔蒙特(Jan Baptista van Helmont)在1648年猜测说,“生命是一种化学现象”。弗雷德里希·维勒(Friedrich Wohler)在1828年用氯化铵和氰化银合成尿素,打破了当时化学和生物界之间神圣不可侵犯的鸿沟,他说,至少有些生命是化学现象。要知道,尿素以前可是只能由生物产生的。生命是一种化学现象,此话不假,但很无趣,就好比说足球是一种物理现象那样。粗略地看,生命都是由氢、碳和氧这三种化学元素组成,生物体的98%都是由这三种原子构成的。然而,生命中真正有意思的,是那些涌现出来的性质(例如遗传力),而非这些组成元素。埃弗里无法了解DNA是如何承载遗传特性这一秘密的。化学无法给予解答。

1943年在英国布莱奇利,完全不为人知的是,一位才华横溢的数学家艾伦·图灵(Alan Turing)见证了他的天才想法幻化成真的时刻。图灵认为数字机可以进行运算。为了破译德军的洛伦兹密码机,根据图灵原理建造了名为“巨人号”的计算机:这是一台通用的机器,配有可编改的存储程序。当时很多人,包括图灵自己,都没能意识到他或许比其他任何人都要更为接近生命的奥秘:遗传好比一种可编改的存储程序,新陈代谢就是一台通用计算机,联结双方的是底层代码,是一种能以化学、物理甚至非物质形式来体现的抽象信息,其奥秘在于可进行自我复制。任何可以利用全球资源进行自我复制的东西都是有生命的,且最有可能的呈现形式是数字化信息——数字、脚本或单词。

1943年的新泽西州,深居简出的学者克劳德·香农(Claude Shannon)正在反复寻思他几年前在普林斯顿首次提出的一个想法:信息和熵是同一枚硬币的正反面,两者都与能量有着密切的联系。系统的熵越小,它所含的信息就越多。蒸汽机之所以可以通过燃烧煤来获取能量并将其转化为动力,究其原因是设计者给该发动机注入了很高的信息含量。人体亦是如此。香农融合了亚里士多德的信息论与牛顿的物理定律。和图灵一样,香农也没有考虑到生物学因素。但较之于大量的化学和物理学问题而言,他对于什么是生命这个问题的洞察更为深入:生命也是用DNA编写的数字信息。

本文开篇便提到的这个“词”,并不是DNA。DNA是在有了生命且出现化学反应和信息存储,以及新陈代谢和复制这两项独立的劳动分工之后才出现的。但是DNA记录了这个“词”的信息,通过后世原封不动地传递到了现在,令人惊叹。

想象一下显微镜下人类卵细胞细胞核的样子。如果可以的话,按大小顺序排列23对染色体,最大的在左边,最小的在右边。现在,放大那条姑且称之为1号染色体的最大染色体。可以看到,每条染色体都有一条长臂和一条短臂,两者的连接处称为着丝粒。仔细观察,你会发现在靠近着丝粒的1号染色体长臂上,一再重复出现120个字母(A,C,G和T)组成的序列。在每两个重复序列之间有一连串随机序列,然而这组由120个字母组成的段落却像熟悉的旋律一样不断重现,达100多次。这种小段落或许与我们之前所说的那个“词”最为贴近。

这个“段落”就是一个小的基因,或许是人体内最活跃的一个基因。这120个字母不断被复制成小段的RNA,我们将它称为5S RNA。它在核糖体中与一团蛋白质和其他RNA精细地交织在一起,而核糖体的职责是将DNA所规定的成分转化为蛋白质。正是蛋白质才使DNA得以进行复制。用塞缪尔·巴特勒(Samuel Butler)的话来说,蛋白质只是一个基因制造另一个基因的手段,而基因只是一个蛋白质制造另一个蛋白质的手段。厨师离不开菜谱,但是菜谱也需要厨师。生命就是蛋白质和DNA这两种化学物质相互作用的结果。

蛋白质代表着化学、生命、呼吸、新陈代谢和行为——生物学家将它称为表现型。DNA代表着信息、复制、繁殖和性——生物学家将它称为基因型。两者相辅相成,缺一不可。这是经典的“先有鸡还是先有蛋”的问题:是先有DNA还是先有蛋白质?不可能是先有DNA,因为DNA是被动存在的数学信息片段,无法催化任何化学反应;也不可能是先有蛋白质,因为蛋白质是纯化学物质,就目前所知,是无法准确进行自我复制的。DNA创造蛋白质应该是不可能的,蛋白质创造DNA应该也是不可能的。要不是这个“词”在生命之丝上留下了蛛丝马迹,人们或许会一直受困于此。正如我们现在知道的,蛋在鸡(所有下蛋鸟类的爬行动物祖先)出现之前就早已有之,也有越来越多的证据表明RNA的出现早于蛋白质。

RNA是跨界联结DNA和蛋白质的化学物质,它主要是将信息从DNA语言翻译成蛋白质语言。但就其运作方式而言,它毫无疑问是两者的先祖。如果说DNA是罗马的话,那么RNA便是希腊;如果说DNA是维吉尔,那么RNA便是荷马

RNA才是开篇所说的那个“词”。RNA比蛋白质和DNA更早出现,有4个方面的证据。首先,即便在今天,DNA的成分也是靠修饰RNA成分而非通过其他更为直接的途径来实现的;其次,DNA中的字母T是由RNA中的字母U转变而来;再者,如今的许多酶虽然成分是蛋白质,不过得依赖于一些小的RNA分子才能发挥作用;此外,DNA和蛋白质不同的是,RNA可以在没有外援的情况下自我复制:给予正确的成分,便会将其整合成信息。观察细胞中的任一部分,不难发现最原始、最基本的功能都需要有RNA的参与。由RNA组成的RNA依赖性酶,是由基因参与生成的,携带着信息。核糖体仿佛是一台带有RNA的翻译器,可以翻译出此信息,并由一种小RNA分子负责转运氨基酸。但最重要的是,不同于DNA,RNA可以起催化剂的作用,解开和连接包括RNA在内的其他分子。它可以解开这些分子,将其末端相连,合成并延伸RNA链。RNA甚至可以自行操作:剪掉一小段序列,然后将游离端重新拼接在一起。 20世纪80年代初,托马斯·切赫(Thomas Cech)和悉尼·奥尔特曼(Sidney Altman)发现了RNA的这些非凡特性,颠覆了我们对生命起源的理解。现在看来,第一个基因“ur-gene”很可能兼具复制和催化的功能,是一个消耗周遭化学物质以自我复制的“词”。它很可能是由RNA构成的。对试管中随机RNA分子的催化能力反复进行选择,就可以慢慢筛选出具有催化活性的RNA,从而模拟生命起源的过程。一项最令人惊诧的结果是,这些合成的RNA通常以一段非常类似核糖体RNA基因(如1号染色体上的5S基因)序列的RNA序列作为结尾。

在第一头恐龙、第一条鱼、第一条虫、第一棵植物、第一种真菌、第一株细菌出现之前,RNA统治着这个世界——大概是在约40亿年之前,那时地球刚形成,宇宙本身也只有100亿年的历史。我们并不清楚那时这些“核糖体生物”是什么样的,只能从化学角度猜想它们是如何生存的。我们无法知晓在此之前世界究竟是什么样子,不过基于现存生物的线索,我们可以肯定的是RNA确实曾称霸一时。

这些核糖体生物有一个很大的问题:RNA是不稳定的物质,在数小时内便会分解掉。如果这些生物到了热的地方,或是长得过大,将面临遗传学家所说的错误灾难,即基因信息的迅速衰减。RNA通过反复试错演化出了一种全新且更为强韧的类型——DNA,以及一种从中复制RNA的系统,此系统包含有一台被我们称为原核糖体的设备。它必须工作高效且务必精准。因此,它在遗传复制过程中将每三个字母编成一组,在效率和准确度方面都更好。每个三联体都带有一个由氨基酸制作的标签,以使原核糖体更易识别。后续,这些标签结合在一起形成蛋白质,而包含三个字母的词则成为蛋白质的一种编码形式,即遗传密码。(如今,遗传密码子由包含三个字母的词组成,每个密码子均对应着20种氨基酸中的特定一个,而氨基酸是蛋白质的合成材料。)由此诞生了一种更为复杂的生物,它将遗传成分存储在DNA上,依靠蛋白质来工作,并用RNA将DNA和蛋白质联结起来。

这种生物称为“Luca”,是指地球生物最原始的共同祖先。她长什么样,住在哪里呢?常见的回答是,她看起来像细菌,可能是生活在温泉旁温暖的池塘中,或是在海洋泻湖里。在过去几年里,大家更倾向于认为她的生活环境险恶,因为很明显,陆地和海洋下面的岩石中充斥着数以十亿计的化能自养型细菌。“Luca”如今通常生活在地底深处,炽热的火成岩裂缝中,以摄入硫、铁、氢和碳为生。时至今日,生活在地球表面的生命只是九牛一毛。地底深处的嗜热菌的有机碳总含量是地表生物圈的10倍,也许正是它们生成了我们所说的天然气。

不过,要想找到最早的生命形式,存在概念上的难题。那时,大多数生物都无法从父母那里获得基因,但并非总是如此。即便是现在,细菌也可以仅通过摄食其他细菌来获取基因。曾经可能存在着广泛的基因交换,甚至是基因窃取。在久远的过去,染色体可能多而短,每条染色体只有一个基因,很容易丢失或获得。卡尔·乌斯(Carl Woese)指出,如果是这样,那么该生物还不是一个持久不变的实体,只是一个临时搭伙的基因集合。因此,最终出现在我们所有人体内的基因可能来自许多不同的“物种”,试图将其分门别类是徒劳的。我们并非起源于唯一的祖先“Luca”,而是起源于携带有遗传信息的“生命共同体”。乌斯说,生命的来源在事实上可考,从系谱上却无法推导。

你大可以将“我们都是社会的产物,而非某个物种的后代”这样的论调看作宣扬全局意识的模糊哲学,这让人感觉良好,抑或是将其视为对自私基因理论的有力证明:那时基因之间的博弈相较今天而言可谓有过之而无不及,它们把生物体当作临时战车,仅形成短暂的联盟。而如今,更多的是团队合作。你觉得呢?

即便曾有很多个“Luca”,我们仍可推测它们居于何地以及以何为生。这是有关嗜热菌的第二个问题。三位新西兰人发表于1998年的调查结果很有意思,得益于此,我们开始认识到在每本教科书中都可见到的生命之树,是倒过来的。这些书都认为最初的生物就像细菌那样,是具有一个环状染色体的简单细胞,而所有其他生物都是由一群细菌联合在一起而形成的复杂细胞。真相很可能恰恰相反。最早出现的现代生物可能不像细菌,也没有生活在温泉或深海火山口中。它们更像是原生动物:基因组是由几条线性染色体,而非一条环形染色体组成,是“多倍体”,即每个基因都有以助纠正拼写错误的多个备份。此外,它们原本喜欢凉爽的气候。正如帕特里克·福泰尔(Patrick Forterre)长期以来一直声称的那样,现在看起来细菌好像是在有了DNA和蛋白质之后很久才出现的,是“Luca”的后代,功能高度异化,结构高度简化。它们的诀窍在于丢弃RNA时代的许多装备,从而得以生活在炎热的地方。而我们却在自己的细胞中保留了“Luca”的原始分子特征,这么说来,细菌比我们更为“高度演化”才是。

分子“化石”的出现为这一奇想提供了佐证:人类细胞核中的一些RNA(向导RNA、穹窿体RNA、核小RNA、核仁小RNA、自剪接内含子),做着类似于将自身从基因中切除的事情,好似没啥用处。细菌中就没有,这种机制与其说是我们人类发明的,倒不如说是细菌所废弃的。(令人惊讶的是,除非有其他的理由,否则相较复杂的解释而言,科学界更倾向于认为简单的解释可能性更大。这一原理在逻辑上称为“奥卡姆剃刀”。)细菌在进入诸如温泉或温度可高达170°C的地岩等高温环境时,精简装备,丢弃了这些看似可有可无的RNA,以最大限度地减少由高温引发的问题。摈弃掉这些RNA后,细菌发现在诸如寄生和食腐等环境中,它们的新式高效细胞装备使其得以在“贴身肉搏”时占据繁殖速度优势。人类保留了这些古老的RNA,尽管这些上古装备不再发挥作用了,但残骸依旧,从未被完全剔除。细菌世界竞争激烈,得靠简单快速才能取胜。不同的是,我们(所有动物、植物和真菌)从未遭遇过如此激烈的竞争,以致更倾向于变得复杂并拥有尽可能多的基因,而非使用高效的细胞装备。 每个生物中的三联体密码子都是一样的。CGA代表精氨酸,GCG代表丙氨酸——无论是在蝙蝠、甲虫、山毛榉,还是在细菌中,都是如此。甚至对于生活在大西洋海面以下数千英尺 的沸腾硫磺泉中的古细菌(名字具有误导性),或在那些被称为病毒的蜿蜒曲折的微囊里,亦是如此。无论在世界上的任何地方,无论看到的是哪种动物、植物、昆虫或其他东西,只要是活物,使用的都是同一套密码子和对照表,所有生命无一例外。除了一些微小的局部改变外(主要发生在纤毛虫内,具体原因未知),所有生物的遗传密码均是相同的。我们都使用完全一样的语言。

这意味着创世纪只有一次,生命是在这唯一的创世纪里被创造出来的(宗教人士或会认为此论据铿锵有力)。当然,生命也可能诞生在不同的星球上,并由宇宙飞船播种到地球,抑或起初有着成千上万种生命形态,但只有“Luca”能在贫瘠得一无所有的原始汤中幸存下来。然而,直到20世纪60年代破译了遗传密码,才得以知晓:万物归一。海藻是你的远亲,炭疽杆菌是你的尊长。生命是统一的,这是从经验中得出的事实。伊拉斯谟·达尔文有个论断与此异常相近:“所有有机生命均起源于同一种有生命的丝状物。”

通过翻阅基因组这本天书,可以得到一些简单的事实:生命具有的统一性,RNA的重要性,地球上最早生命的化学特性,以及大型单细胞生物可能是细菌的祖先(而非反过来)。由于缺乏40亿年前有关生命的化石记录,我们只得仰仗基因组这本天书。小指细胞里的基因是第一个复制分子的嫡系后裔。通过数以百亿计的复制,才有了如今身上承载着可追溯往昔峥嵘岁月的数字化信息的我们。如果人类基因组能够告诉我们有关原始汤中发生的事情,那么对于接下来的40亿年中会发生些什么,我们将知晓得更多。人类基因组实质上就是用遗传密码书写的人类历史。 uit6LDvmfgVr7llRARdudXvwMHpjrvZ64Ia/diRVv8WSQVQ6f3Eio2G3fYy28R7N

点击中间区域
呼出菜单
上一章
目录
下一章
×