1号染色体　生命

一死一生，川流不息；

灭亡之后，振兴继之；

一祸一福，起伏相寻；

有如水中，忽生泡影；

自起自灭，幻化无穷。

《人论》（亚历山大·蒲柏）

生命起源之初，地球汪洋一片，这时便有这样一个“词”，它携带着自己的信息，自我复制，永不停息，改变了整个海洋的组成。这个“词”能够重新排列化学物质的结构，以使它们从无序的环境中吸收负熵，从而成为有序的生命体，地球从风沙肆虐的地狱变成了郁郁葱葱的天堂。最终，这个“词”发展到极致，创造出一种奇妙的机器——人的大脑，而大脑则意识到了这个“词”的存在。

每当思考这个问题时，我的大脑就像煮沸的粥一样，翻腾不停。地球距今已有40亿年的历史，我能够活在当今这个时代，是一种幸运——地球上有500万个物种，我有幸成为一个有意识的人；地球上有60亿人口，我有幸出生在发现这个“词”的国家；更加幸运的是，我与DNA这一宇宙中最伟大、最本质而又最惊人的秘密有着密切的关系：就时间而言，这一秘密揭示之后的第5年，我便出生了；就地理位置而言，我的出生地与揭示这个秘密的地点，不过320多公里；就生物关系而言，揭示这个秘密的，是我的两个同类——人。当然，你可以嘲笑我对此的狂热，认为我如此热衷于DNA这样一个英文缩写词，简直不可理喻。但是，请跟随我去探索生命的源头，你将相信这个“词”是那么迷人。

早在1794年，博学的诗人兼内科医生伊拉斯谟斯·达尔文（Erasmus Darwin）曾提出这样一个问题：“在动物诞生之前，陆地和海洋就充满了各种植物；在某种动物诞生之前，其他动物就已经存在，据此，我们是否能够得出：所有的有机生命都源自同一种有生命的‘丝状物’？”在那个时代提出这样的假设，是令人震惊的。不仅因为他提出了“所有有机生命都有共同祖先”这一大胆的假说（65年后，他的孙子查尔斯才出版了相同主题的书），也因为他使用了“丝状物”这个古怪的词语。而事实上，生命的秘密就藏在一条细丝里。

问题是，一条“丝状物”怎么就能创造出有生命的东西呢？生命是很难定义的，但生命有两种能力：自我复制和建立秩序。有生命的东西能够产生与自身相似的副本。正所谓“龙生龙，凤生凤，老鼠的儿子会打洞”——兔子生兔子，蒲公英的下一代还是蒲公英。当然，兔子还会做些别的。这个世界本是随机而混沌的，但兔子吃草，却将其转化为骨与肉，从而形成有序而复杂的身体。这一转化过程并没有违反热力学第二定律——在一个封闭系统内，所有的事物都倾向于从有序变成无序。兔子不是一个封闭的系统，因此它通过消耗大量的能量，建立起一个复杂而有序的身体结构。用埃尔温·薛定谔（Erwin Schrodinger）的话来讲：生物从周围环境汲取秩序（从外界引入“负熵”）。

信息是生命这两种能力的关键所在。生命之所以能够自我复制，是因为存在着创造新的身体所需的各种信息。兔子的受精卵携带的信息可以“组装”一只新的兔子。生命通过新陈代谢建立起秩序，同样要依靠信息来创建和维护。如同在烘焙蛋糕时，要在准备蛋糕配方时就预先设计停当——一只有繁殖能力和新陈代谢能力的成年兔子，也是由它的生命“丝状物”预先规划和决定好的。这一理念最早源于亚里士多德。他曾说过，形成一只鸡的原理都蕴含在鸡蛋里，一颗橡实包含着整棵橡树的信息。亚里士多德这种原始的信息理论观点，曾被化学和物理学埋没多年，随着现代遗传学的发现又被重新挖掘出来。马克斯·德尔布吕克（Max Delbruck）开玩笑道：DNA是由这位古希腊哲学家发现的，为此应追授他诺贝尔奖。

DNA的“丝状物”就是信息，由化学物质的密码写成，每种化学物质即为一个字母。令人不可思议的是，DNA的密码是以一种我们能够理解的方式写成的。遗传密码和书面英语一样，是一种线性的语言，沿一条直线书写。遗传密码就像数字一样，每个字母都有着重要的意义。和英语相比，DNA的语言要简单得多，它的字母表里只有4个字母，即通常所说的A、C、G和T。

当我们了解到基因其实是一种加密的信息后，便很难理解为何提出这种可能性的人少之又少。20世纪上半叶，生物学界有个问题一直被反复提及——什么是基因？那时，DNA简直就是无解之谜。DNA的对称结构于1953年被发现，但让我们首先回到10年前的1943年。1943年，那些将在10年后为破解DNA秘密做出卓越贡献的人，都正从事着其他工作。那一年，弗朗西斯·克里克（Francis Crick）在朴茨茅斯（Portsmouth）设计水雷；15岁的“神童”詹姆斯·沃森（James Watson）刚刚被芝加哥大学录取，立志要倾其一生去研究鸟类学；莫里斯·威尔金斯（Maurice Wilkins）在美国协助研发原子弹；罗莎琳德·富兰克林（Rosalind Franklin）在英国政府工作，研究煤炭的结构。

1943年，在奥斯维辛（Auschwitz）集中营里，约瑟夫·门格勒（Josef Mengele）为完成其“科学探究”，将一对对双胞胎折磨致死，可谓惨绝人寰。门格勒尝试去理解遗传的原理，但他的“人种优化论”被证明是伪科学，对于改善人类基因是没有用处的，他的实验结果对之后的科学更是毫无意义可言。

1943年，在都柏林，有一个从门格勒那种人的手下逃出来的难民——大物理学家埃尔温·薛定谔，正在三一学院开展“什么是生命”的专题讲座。他知道染色体内蕴含了生命的秘密，但生命的秘密是以何种形式存储的，却不得而知。于是，他尝试着去解决这个问题：“就是这些染色体……使用某种编码，存储了一个人未来发育的全部信息，以及发育成熟后的各种机制和功能。”他说，基因太小了，应该归为一种大分子。他的这一见解似乎为这个问题提供了解决思路，包括克里克、沃森、威尔金斯和富兰克林在内的一代科学家受到启发，开始攻克难题。然而，尽管距离答案触手可及，薛定谔却偏离了方向。他钟爱量子论，认为可以从中找到这种分子承载遗传信息的原因。他固执地坚持自己的观点，却最终被证明走进了死胡同。生命的秘密与量子状态无关，无法从物理学中找出答案。（注：Schrödinger，E.（1967）.What is life？Mind and matter.Cambridge University Press，Cambridge.）

1943年，在纽约，66岁高龄的加拿大科学家奥斯瓦尔德·艾弗里（Oswald Avery）的一个实验进入收尾阶段。这个实验即将决定性地证明DNA就是遗传信息的化学物表现形式。此前，他经过一系列精心的实验，证明一种与肺炎有关的细菌，通过吸收一种化学溶剂，就能从无害的变为有毒菌株。到了1943年，艾弗里已经得出了结论：发生转变的就是DNA。但在发表自己的成果时，他的表达过于保守，致使很长一段时间内无人关注。1943年5月，艾弗里写信给他的兄弟罗伊，信中的表述也仅仅放开了一点点：

尽管尚待证明，但如果我们是对的，那就意味着DNA不仅在结构上重要，而且是一种功能活跃的物质，它对于细胞的生化活动和某些特性起着决定性的作用。这也意味着，有可能利用已知的化学物质，根据需要去改变细胞，并使这种改变遗传下去。这正是遗传学家们长期以来的梦想。

艾弗里几乎已经实现了这个梦想，但他的思考仍然仅局限在化学的层面。扬·巴普蒂斯塔·范·海尔蒙特（Jan Baptista van Helmont）在1648年做出一个猜想：“一切生命都是化学。”1828年，弗里德里希·维勒（Friedrich Wohler）说：“至少有些生命是化学。”那时，他刚利用氯化物和氰化银合成了尿素，从而打破了化学与生物学界之间不可逾越的界限，在此之前，尿素都是生物体产生的。说生命是化学，理论上是对的。但这个比喻让人兴致索然，就像有人说足球就是物理一样。粗略来讲，氢、碳、氧是构成生命的主要化学元素。生物体的98%都是由这三种原子构成的。真正令人兴致盎然的是生命中那些突出的特性，比如遗传性，而非组成生命的那些元素。然而，艾弗里是无法回答DNA是如何承载遗传特性的，因为这个问题无法从化学中得出答案。

1943年，在英国的布莱奇利（Bletchley），天才数学家阿兰·图灵在极度保密的环境下，亲眼见证了他最伟大的想法（首台可编程计算机）变成现实。图灵曾论证过数字能够自己进行运算。为了破译德国军方的洛伦兹编码器，英国根据图灵理论，制造了一台计算机，命名为“巨人号”（COLOSSUS）。这是一台可编程存储程序的通用计算机。当时，没有一个人意识到图灵也许比其他任何人都更接近生命的秘密。图灵更是没有意识到，遗传物质本质上就是一种可编程的存储程序，新陈代谢就是一台通用计算机。将两者连接起来的是一种编码，是一种化学的、物理的，甚至无形的抽象信息。其奥秘就在能够进行自我复制。任何能够利用世界上的各种资源进行自身复制的事物，都是有生命的。这种信息最有可能以数码信息的方式呈现：可能是数字、程序脚本，或单词。

1943年，在美国的新泽西州（New Jersey），克劳德·香农（Claude Shannon），这位默默无闻的学者，正在反复思考几年前在普林斯顿大学时的一个想法。他认为，信息和熵都与能量有着密切的关系，但属性却又是相反的。一个系统的熵越小，它所含的信息就越多。蒸汽机之所以能够吸收煤燃烧产生的热能，并将其转化为动能驱动机器运转，就是因为蒸汽机设计者为蒸汽机注入的信息量很大。人体也是如此。香农结合了亚里士多德的信息论和牛顿的物理学原理。和图灵一样，香农也没有考虑生物学的因素，但他的想法很深刻，远比堆积成山的物理化学理论更加接近“什么是生命”这一问题的答案。生命也是一种用DNA写成的数码信息。

本章在开头曾提到，生命起源之初，就有那样一个“词”，但那个“词”并不是DNA。DNA是在生命诞生之后才出现的，此时生命已经有了两种分工，一种是化学反应与信息存储，另一种是新陈代谢与复制，这两种活动是独立进行的。但是，在DNA中记录了这个“词”的信息，并将其原封不动地传递下来，历经岁月变迁，直到今天。

想象一下在显微镜下人类受精卵细胞核的模样，如有可能，将23对染色体从左到右按大小顺序重新排列。现在，在显微镜下放大最左边的那条，我们姑且称它为1号染色体。每条染色体都有两只手臂，一长一短。我们把连接两只手臂的节点称为着丝粒。仔细观察，你会发现，1号染色体长臂接近着丝粒的地方，有若干字母序列——长度为120个字母，包含A、C、G和T，周而复始，多次出现。每两个这样的序列之间，穿插了一些随机的字符，但这组由120个字母组成的“段落”，却仿佛熟悉的旋律一样，反复出现100多次。与我们所说的那个“词”最相近的，可能就是这种小段落了。

这里所说的“段落”，就是一小段基因，它也许是人体内最活跃的一个基因。这120个字母不断地被复制，形成小段的RNA，称为5S RNA。它位于核糖体内，与一些蛋白质和其他RNA小心地缠绕在一起。核糖体的功能是把DNA成分翻译成蛋白质。蛋白质又使得DNA能够进行复制。用塞缪尔·巴特勒（Samuel Butler）的话来说，蛋白质只是一个基因制造另一个基因的手段，而基因又是一个蛋白质制造另一个蛋白质的手段——厨师需要菜谱来做菜，菜谱也需要厨师才能变成菜。生命就是蛋白质和DNA这两种化学物质相互作用的结果。

蛋白质代表的是化学作用、生命活动、呼吸、新陈代谢和各种行为等的外在表现——生物学家称其为“表现型”。DNA代表的是信息、复制、繁殖和性行为等的内在特征——生物学家称其为“基因型”。两者相辅相成，缺一不可。这是一个经典的“先有鸡还是先有蛋”的问题：先有DNA还是先有蛋白质？不可能先有DNA，因为DNA只包含一些被动存在的数学信息，无法单独催化任何化学反应。也不可能先有蛋白质，因为蛋白质仅能够进行化学反应，却无法精确地进行自我复制。因此，不能说DNA创造了蛋白质，也不能说蛋白质创造了DNA。如果不是那个“词”在生命的“丝状物”里留下了蛛丝马迹，人们也许一直会困在这个问题上。现在我们知道，在鸡出现很早之前，就有蛋了（爬行动物是一切鸟类的祖先，它们是下蛋的）。越来越多的证据表明：蛋白质出现之前就已经存在着RNA。

RNA是联结DNA和蛋白质的化学物质。它的主要作用是将信息从DNA的语言翻译成蛋白质的语言。但从其运作机制来看，毫无疑问，RNA就是两者的祖先。如果DNA是罗马城，RNA就是希腊；如果DNA是维吉尔，RNA就是荷马。

RNA就是本章开始提到的那个“词”。有5条线索证明RNA的出现先于蛋白质和DNA。第一，人们发现，要改变DNA的组成部分，必须通过改变RNA相应组成成分的方式来实现，而无法直接进行更改。第二，DNA语言中的字母T是由RNA语言中的字母U演化出来的。第三，现在有很多酶，虽然其成分是蛋白质，但必须依赖一些小的RNA分子才能发挥作用。第四，RNA与DNA和蛋白质不同，可以在无须任何“外援”的情况下，依靠自己完成自我复制：给RNA所需的原料，它就能将其整合成相应的信息。观察细胞的任何一部分，你就会发现最原始、最基础的功能都需要RNA的参与。基因中的信息是由RNA产生的，由一种依赖于RNA的酶携带着。核糖体仿佛是一台带有RNA的翻译机，将基因的信息翻译出来，由一种小RNA分子负责搬运翻译的过程所需的氨基酸。第五，RNA与DNA不同，它本身就可以作为催化剂，切断或连接其他分子（也包括RNA本身在内）。它可以切断这些分子，连接不同的分子片段，使用它们制造出RNA结构，并加长RNA链。甚至，RNA能给自己“动手术”，即切除自己的某一段，再将两个游离端连接起来。

20世纪80年代初，托马斯·切赫（Thomas Cech）和西德尼·奥尔特曼（Sidney Altman）发现了RNA这些惊人的特点，彻底改变了人们对于生命起源的理解。现在看来，最初的基因应该是兼具复制与催化的，是一个消耗周围化学元素，从而实现自我复制的“词”。它很有可能就是由RNA构成的。将RNA分子放入试管中，让其发生催化反应，经过反复筛选，就可能得到RNA上和自我催化反应相关的序列，这就好像在模拟人类起源时的场景。RNA一部分序列的功能就是催化自身，进行复制和翻译等过程，而不需要外来物质介入。这个实验最惊人的结果之一是：最后筛选出的片段和1号染色体内的5S基因结构相似。

在出现第一只恐龙、第一条鱼、第一只虫子、第一棵植物、第一种真菌和第一种细菌之前，RNA统治着整个世界——那时大约距今40亿年前，地球刚形成不久，宇宙也不过只有100亿年的历史。这些核糖生物是什么样子的，我们无从考证，只能从化学意义上猜想它们是怎样存活的。尽管无法得知它们之前的世界是怎样的，但是通过今天生物中留下的线索，我们可以很确定地说，曾经，那真的是RNA的世界。

这些核糖生物面临着一个很大的问题。RNA是一种不稳定的物质，几个小时之内就会分解掉。一旦到了比较热的地方，或者个头比较大时，它们基因中的信息就会迅速坏死，遗传学家将这种现象称为“错误灾变”。RNA前仆后继，不断适应，终于进化出一个新的、更加坚强的类型——DNA，还创造了一个从DNA复制RNA的系统，里面包含了“原核糖体”。这个系统一定要又快又准，因此，它把基因信息中每三个字母分为一组，同时进行复制，这样更高效也更准确。每个三字母组都带有一个氨基酸“制成”的标签，以便原核糖体进行查找。很久以后，这些标签结合在一起，形成蛋白质，这些三字母组则成为这些蛋白质的密码，即遗传密码。（所以，直到今天，遗传密码里的每个词都包含三个字母，每个包含三个字母的词代表一种氨基酸，成为蛋白质成分的一部分。）这样，一种更复杂的生物诞生了。它将遗传信息存储在DNA中，依靠蛋白质运行，并通过RNA将DNA和蛋白质联结起来。

这种生物名叫“Luca”，是所有物种分化前的最后一个共同祖先。它长什么样子呢？它住在什么地方？传统上认为：它长得像细菌一样，可能居住在温泉旁温暖的池塘里，也可能生活在海岸泻湖里。但是，在过去几年里这一答案有所改变，更倾向于认为Luca生活在一个险恶的环境里。因为有清晰的证据表明地下与海底的岩石上生存着数以十亿计的细菌，这些细菌依靠食用化学物质存活。科学家现在认为，Luca应该生活在地下很深的地方，存在于炽热的火成岩裂缝中，它在那里靠吃硫、铁、氢和碳为生。直到今天，生活在地球表面上的生物，不过是地球上所有生物中的九牛一毛。地下深处的那些嗜热菌体内的总含碳量，也许是地面生物圈总含碳量的10倍，也许正是它们形成了我们日常使用的天然气。

然而，在确定最早生命形式时，出现了一个概念上的难题。通常认为，对于大多数生物体而言，它们的基因都只能从父母那里获取，但过去并非如此。即使在今天，许多细菌可以通过吞噬其他细菌获得其基因。在过去，也可能普遍存在着基因“交易”，甚至基因“盗窃”。可能在很久以前，生物体拥有很多染色体，但每条染色体都很小，只携带一个基因，因此很容易获得，也很容易丢失。卡尔·乌斯（Carl Woese）指出，如果果真如此，那么这样的生物体还不能被认为是一种可以存活下去的个体，只能看作一个暂时存在的基因集合。因此，人类体内的基因也许来源于许多不同的物种，将它们归类溯源是毫无意义的。从这种意义上说，我们的祖先并非Luca这一支，而是各种携带遗传物质的生命构成的“共生体”。正如乌斯所言，生命的来源在事实上可考，从宗谱上却无法推导。

对于“我们不是来自某个个体，而是来自某个‘共生体’”这样一个结论，你可以仅仅将其看作一种模糊哲学，旨在宣扬全局意识，让人感觉良好；抑或，你可以把它看作“自私的基因”这一理论最有力的证明，过去，基因间的战争比今天更加惨烈。它们将生物体作为临时的战车，两者的联盟是极其短暂的；而在今天，基因与生命体形成密切合作的团队，基因间的战争更像是不同团队之间的竞争。面对这两种观点，你更倾向于哪一种呢？

即便以前有很多种Luca，我们仍然可以猜想它们生活在什么地方，以什么为生。这也是关于嗜热菌的第二个问题。1998年，三个新西兰人公布了一些很有意义的调查结果，几乎所有教科书中关于生命进化的图谱，都是金字塔形的，从中我们也许能够找到关于生物进化历程的答案。这些教科书都认为最早的生命体都像细菌那样——单细胞，拥有环状的染色体，并且每条染色体都是一模一样的。当多个这样的生物体集结在一起时，便形成了复杂细胞，于是其他生物便出现了。如果把这个过程颠倒过来，似乎更具有说服力。最原始的现代生命体并不像细菌那样，也不居住在温泉或深海火山口里。它们更像原虫：它们的基因组由若干条线状基因组成，而非环状的一条。科学家将其称为“多倍体”，每个基因都有若干个独立的备份，以便修复基因复制过程中出现的翻译错误。除此之外，这些生命体应该喜欢比较凉爽的气候。帕特里克·福泰尔（Patrick Forterre）一直坚持认为：现在看来，细菌可能是后来才出现的，它们是Luca的后代，功能高度异化，结构高度简化。它们出现的时间远远晚于DNA和蛋白质，抛弃了许多“RNA时代”产生的特性，从而适应了炎热的生存环境。人类的细胞里却保留了Luca中那些原始的分子特征，从这个层面上讲，细菌比人类“进化得更高级”。

一些分子“化石”的出现支持了这一奇特的说法。那是人类细胞核中的一些微小RNA，整天做着一些可有可无的事情，比如把自己从基因里切除。它们分别是：向导RNA、穹窿体RNA、核小RNA、核仁小RNA和自剪切内含子。细菌中就没有这些，与其说人类发明了这些RNA，不如说细菌剔除了这些RNA，因为后者更加容易理解。（人们可能感到惊奇：如果对于同一现象有两种不同的解释，科学会采取比较简单的那一种，直到发现更多的证据。这一原理在逻辑上称为“奥卡姆剃刀”。）细菌在“入侵”高温的地方时，比如温泉或温度高达170℃的地下岩层时，就把这些无用的RNA剔除了。为了尽可能减少高温导致的问题，它简化了自身的无用结构。剔除这些RNA后，细菌发现：在寄生或食腐等生存环境中，能够迅速繁殖是一个优势，而简化后的细胞机制更有利于它们生存。人类保留了这些古老的RNA，尽管它们不再发挥作用，却从未完全剔除。细菌世界的竞争极为惨烈，只有简单快速才能取胜。而所有的动物、植物和真菌从未遇到过如此激烈的竞争。与简化和高效利用基因相比，它们更加重视积累尽可能多的基因，从而变得复杂起来。

三个字母组成的遗传密码在所有生物体内都是一样的。CGA代表精氨酸，GCG代表丙氨酸——无论蝙蝠、甲虫、榉树，还是细菌，都是如此。即使对于生活在大西洋几千尺深处沸腾的硫黄泉中的原始细菌（这些细菌现在仍然存在，因此名字具有误导性），或者生存在形态各异的微小荚膜中的病毒，这些遗传密码的意义也是一样的。不管你走到哪里，不论你看到什么动物、植物、昆虫和其他东西，只要它有生命，使用的都是同一套密码和对应的解码词典。从这个层面来讲，所有的生命都是一样的。除了一些微小的局部变异外（主要发生在纤毛虫原生动物门内，原因未知），所有生物都使用同样的遗传密码。所以，一切生物都使用同一种“语言”。

这意味着只有一次创世纪，生命是在这唯一的创世纪里被创造出来的——对于信仰宗教的人来说，这一论证十分有力。当然，生命也有可能诞生在其他星球上，并由宇宙飞船播种到地球上；也有可能最初有成千上万种生命形态，最终Luca过五关斩六将，打败其他对手，存活下来。然而，直到20世纪60年代遗传密码被破解后，才真相大白：所有的生命都是一样的——海带是你远方的表哥，炭疽是你亲戚的长辈。生命是统一的，这是从经验中得出的事实。伊拉斯谟斯·达尔文（Erasmus Darwin）当年的论断就与这一事实惊人的一致：“所有的有机生命都源自同一种有生命的‘丝状物’”。

“基因组”是一本书，通过阅读它，我们得到了一些简单的真理：生命具有统一性，RNA的重要性，地球上最早生命的化学特征，大的单细胞生物可能是细菌的祖先，而非细菌是单细胞生物的祖先。没有化石告诉我们40亿年前的生物是什么样子的，我们只能通过阅读“基因组”这部巨著加以了解。一个人小手指细胞里的基因，就是第一个具有基因复制功能分子的直系后裔。这些基因经过上百亿次的复制，生生不息，直到今天我们这里。从它们携带的数码信息里，我们还能依稀看到最原始的生存竞争的痕迹。试想一下，既然通过人类基因组可以了解那个原始混沌的世界里发生的事情，那么对于之后40亿年发生的事情，我们了解的还能少吗？人类基因组是一部用遗传密码写就的人类历史，人类依靠这些密码延续至今。

1号染色体 生命

1号染色体　生命