有些类型的生命已经在地球上存在了大约40亿年,在此期间,地球经历了小行星和彗星撞击、大规模火山喷发、全球冰川作用和太阳温度不可逆转的上升。然而,形式多样的生命仍欣欣向荣。贯穿地球生命故事的共同主线(在这里,我们可以从字面意义上理解“主线”一词)是一种名叫DNA的长分子,它最早是由瑞士化学家弗里德里希·米歇尔于1869年发现的。“molecule”(分子)一词来自拉丁语 moles ,在18世纪的法国流行起来,意为“极小的物质”。然而,DNA并不小。你体内的每个细胞都含有约两米长的DNA,它在分子中属于“巨无霸”,其著名的双螺旋结构上铭刻着生命的指令。这一基本配方适用于所有已知生命:人类与黑猩猩共享98%的基因,与小鼠共享85%的基因,与鸡共享60%的基因,与很多微生物有超过50%的基因相同。
地球上所有生命的信息基础都是通用的遗传密码。用字母表示的特定序列是形成某种特定蛋白质所需的信息,被存储在DNA的片段中。这些字母包括A、C、G、T,分别表示腺嘌呤、胞嘧啶、鸟嘌呤和胸腺嘧啶分子。它们被统称为碱基,能以任意组合的方式沿着DNA分子排列。不同的组合为不同的蛋白质编码。蛋白质由被称为氨基酸的其他类型的分子形成,一种典型的蛋白质包含数百个氨基酸,这些氨基酸首尾连接形成长链。氨基酸的种类有很多,但据目前所知,生命只使用了有限的20种(有时是21种)。蛋白质的化学属性取决于氨基酸的精确排序。碱基只有4种,而氨基酸有20种,所以DNA不可能用单一碱基编码每一个氨基酸;相反,它会同时用三个碱基编码一个氨基酸。因此,用4个碱基字母能产生64种三元组合,也称密码子(比如,ACT、GCA等)。这64种可能的组合远多于20种氨基酸,所以还存在冗余:很多氨基酸对应着两个或更多不同的密码子。少许密码子还被用作“标点符号”,比如“句号”(意味着“停止”)。
要想读懂形成某种特定蛋白质的指令,细胞首先要将来自DNA的相关密码子序列转录成一类被称为信使RNA (RNA即核糖核酸)的相关分子。核糖体是合成蛋白质的“分子机器”,可以从信使RNA中读出密码子的序列,并通过化学连接的方式将一个个氨基酸连在一起,从而一步步合成蛋白质。每个密码子必须准确地对应氨基酸,才能让系统正常运转。这一过程还需要转移RNA 的参与。这些RNA短链分子有20种变体,每种变体只能识别某种特定的密码子并与其绑定。重要的是,必须由合适的氨基酸与转移RNA绑定,才能与编码该氨基酸的密码子匹配,这些氨基酸等待着被运去制造不断增长的氨基酸长链。当核糖体结束合成工作时,氨基酸长链就会形成功能蛋白质分子。要想让这一过程顺利进行,20种氨基酸中必须有一种合适的氨基酸能接附在相应的转移RNA变体上。这一步骤是由一种叫作“氨酰tRNA合成酶”的特定蛋白质辅助完成的。这种蛋白质的名字并不重要。重要的是,这种蛋白质的形状对转移RNA和相应的氨基酸而言都是特定的,因此它可以将正确的氨基酸接附在相应的转移RNA变体上。由于有20种不同的氨基酸,因此也必定有20种不同的氨酰tRNA合成酶。需要注意的是,氨酰tRNA合成酶是信息链中关键的连接点。生物信息被存储在一类分子(DNA)中,但它要服务于完全不同类型的分子(蛋白质)。这两类分子“说”的是完全不同的“语言”!但氨酰tRNA合成酶可以说两种语言:它们既能识别密码子,又能识别20种氨基酸。这些起连接作用的分子对通用的遗传机制而言绝对是非常重要的,所有已知生命都要用到这种遗传机制。因此,该机制必定十分古老,而且一直运转良好。所有生命都取决于它!实验表明,该机制的确极其可靠,只有1/3 000的概率会出错(就像翻译出错那样)。我们很难不被这种精妙的机制深深吸引,在几十亿年中它一直稳定而良好地运转,这是多么令人震撼啊!
所有已知生命都在按照一个通用剧本表演,这一事实表明,生命有着共同的起源。地球上最古老的生命痕迹至少可以追溯到35亿年前,从那时起DNA的某些部分在很大程度上保持不变。同样没有发生变化的是生命的语言。DNA指令是用密码写成的,A、C、G、T这4个字母代表4种碱基,它们组合在一起,搭建了这种古老分子的结构。 在我们破解了碱基序列的密码后,人们发现其中详述了生物过程中耐用的“老黄牛”——蛋白质的合成方法。人类的DNA编码了约两万种蛋白质。尽管不同的生物拥有不同的蛋白质,但所有生物都有相同的编码和解码机制(迷箱2介绍了细节)。蛋白质是由氨基酸链构成的。一个典型的蛋白质分子包含数百条氨基酸链,它们被折叠成一种复杂的三维形状,这是该蛋白质的功能形式。生命以各种组合的形式使用20种(有时是21种)氨基酸。尽管A、C、G、T这4种碱基能以多种方式排序,为20种氨基酸编码,但所有已知生命都使用了相同的排序方式(参见表1),表明这是一种非常古老的方式,而且地球生命都深深烙上了这一特征的印记,包括几十亿年前的共同祖先。
尽管DNA非常古老,但也有其他实体留存至今,比如晶体。在澳大利亚和加拿大发现的锆石,其存在时间超过40亿年,它们在俯冲事件中得以幸存并进入地壳。DNA与晶体的核心差异在于,生物体与其所在环境之间的关系是不平衡的。事实上,生命常常极度远离平衡态。为了维系生存,生物必须从环境中获取能量(比如阳光或食物中的能量),还要输出一些东西(比如氧或二氧化碳)。因此,生物与其周围的环境一直在持续地交换能量和物质,而晶体内部是惰性的。当一个生物死去时,它的所有活动都会停止,并随着生物体的腐朽而逐渐进入平衡态。
当然,有些非生命系统也远离平衡态,但同样留存至今。我最喜欢的一个例子就是木星表面的“大红斑”,它是一种气体涡旋。自人们用望远镜观测到木星以来,它就一直存在,也没有显示出消退的迹象(见图1)。我们还知道很多其他的化学或物理学系统,它们也有类似的自主存在。其中一个例子就是对流元胞 。当对流元胞中的流体(比如液态水)被从下方加热时,它就会以一种系统模式涨落。此外,还有一些化学反应能产生螺旋形状或者有节奏的脉动(见图2)。像这样的系统呈现出有组织的复杂性的自发样态,化学家伊利亚·普里高津称这些系统为耗散结构。他在20世纪70年代大力倡导对耗散结构进行研究,并认为化学耗散结构代表了通往生命的漫漫长路上的驿站,它既远离平衡态,又支持物质和能量的持续交换。至今,仍有很多科学家相信这一点。
表1 通用基因代码
注:此表显示,所有已知生命都采用相同的编码方式。由碱基三联体(密码子)编码的氨基酸被列举在密码子的右侧,以缩写字母表示(比如,Phe代表苯丙氨酸;就我想在本书中表达的思想而言,所有这些氨基酸分子的名称并不重要)。这里要提到一个历史上的逸闻:“存在某种形式的基因密码”这一说法最早是由天文学家乔治·伽莫夫在1953年写给克里克和沃森的信中提出来的。伽莫夫以其在宇宙大爆炸理论中的开创性贡献闻名于世。
图1 木星表面的大红斑
图片来源:MPI /Stringer/Getty Images。
图2 一种化学耗散结构
当一种特定的化学混合物被迫远离平衡态时,它就能自发演化出如图所示的稳定形式。化学家伊利亚·普里高津坚称,这类系统代表了通往生命的漫漫长路上最初的几步。
图片来源:Prof. Arthur Winfree/Science Photo Library/Getty Images。
在生物体中,大多数化学活性都与蛋白质有关。新陈代谢(能量和物质通过生物体流动)对一切生命活动来说都是必不可少的,而由蛋白质完成的新陈代谢工作占据了最大的份额。如果生命始于由能量驱动的精巧化学循环(正如普里高津相信的那样),蛋白质必定很早就在生命这出伟大的戏剧中登场了。但如果仅靠自己,大量的蛋白质就会毫无用处。至关重要的生物体组织工作需要大量的编排和设计,也就是说,需要某种形式的指挥与控制结构。这一工作是由核酸(包括DNA和RNA)完成的。正如我们知道的那样,生命涉及核酸和蛋白质这两类截然不同的分子之间的大量交互和协调。很多科学家已经发现,生命的难题在于其因果难辨的本质,就好像“先有鸡,还是先有蛋”,两者缺一不可。没有众多的蛋白质围着DNA分子转,DNA分子就无法发挥作用。简言之,两者的工作职责如下:核酸负责存储关于“生命计划”的细节,蛋白质负责完成让生物体正常运转的枯燥工作。两者都必不可少,所以,生命的定义必须把这一点纳入考虑范围。我们不仅需要考虑建立了模式的复杂而有序的化学结构,还需要考虑接受指挥和控制的化学反应。总之,生命就是化学加上信息。