关于自己的部落祖先,每个人都听说过一些相应的神话传说,而这些神话传说也常常以宗教信仰的形式表现出来。关于祖先,人们满怀敬仰与崇拜。这也在情理之中,因为他们敬仰和崇拜的是掌握着生命之钥的曾经切实存在过的祖先,而非超自然神灵。所有降生于世的有机体,绝大部分都消亡在未能享尽此生之时。只有少部分幸存下来并完成繁衍,而其中只有极少部分能够千秋万代。这少数中的极少数者,这些先世精英,便是未来世代所称的祖先。祖先甚为珍稀,而后代则不足为奇。
所有曾经存在于世的有机体,每一只动物,每一株植物,所有的细菌和真菌,每一个能运动的生命,每一位本书的读者,都能回望自己的祖先,骄傲地宣称:他们的祖先没有一位在幼时离世。他们的祖先都长至成年,而且每一位都找到了至少一位异性伴侣,成功交配(严格来讲,也可能存在例外情况)。有些动物是无性繁殖的,譬如蚜虫。人工授精等技术使得现代人类可以在不进行交配的情况下怀孕生子。而且,由于试管授精所用的卵子可以从雌性卵巢中提取出来,人们甚至无须长至成年便可拥有后代。但在大多数情况下,上述说法是毋庸置疑的。他们的祖先中,没有一位在生下孩子之前被敌人打倒,被病毒夺去生命,或是失足掉下悬崖。人类祖先那成千上万的同辈,都因为种种原因而早早殒命,但现有人们的祖先中,没有任何一位被上述任何一个原因所困。很多事情既在意料之中,又难以理解,既清晰可辨又让人惊叹。所有这些,都是本书想要讨论的话题。
由于有机体的全部基因都遗传自祖先,而非祖先那些未能成功繁衍后代的同辈,因此所有有机体都倾向于拥有那些自带成功特质的基因。这些有机体天生便拥有成为祖先的本事,也就是说,它们善于生存繁衍。这也是为什么有机体倾向于遗传的那些基因,都有能力构建出一部设计精良的“机器”——一具积极工作、不停努力成为后代祖先的躯体。这就是鸟儿如此善于飞翔,鱼儿如此善于游动,猴子如此善于攀爬,病毒如此善于散播的原因。这就是我们热爱生命、热爱孩子的原因。因为所有人继承的所有基因,都来自从未中断过的一连串的成功祖先,毫无例外。这个世界充满了有能力成为后代祖先的有机体。而这样的现实,简而言之,就是达尔文主义。当然,达尔文的理论远超于此,如今我们也只是站在巨人的肩膀上,而本书的讲述才刚刚开始。
关于上一段落,有一种貌似合理、实则错误的理解方式。有人认为,当祖先成功繁衍,它们传递给儿孙的基因便由此获得了升级,超越了它们从父母处获得的基因。它们的成功对基因发挥了某些作用,而这就是为什么它们的后代如此善于飞翔、遨游、求偶。错,大错特错!基因不会在发挥作用的过程中得到提升,它们只是得到了继承,除了某些非常罕见的随机错误之外,基因根本不会发生变化。并不是成功塑造了优秀的基因,而是优秀的基因造就了成功。个体终其一生做过的所有事情,都不会对其基因产生丝毫的影响。生而具有优秀基因的个体,是最有可能成长为后代的成功祖先的。因此,优秀的基因更有可能被继承到未来。每一代都是一道过滤、一个筛子:优秀的基因容易穿过筛子,进入下一代;拙劣的基因容易留存在早年离世的个体身上,或是那些没有繁殖的个体身上。拙劣的基因也许会因为运气好,与优秀的基因共存于同一个躯体之内,闯过一两个世代的过滤。但是,若想成功闯过数千道连续不断的过滤,不能只靠运气。在数千个连续的世代之后,依然存在的基因大概率是优秀的基因。
我说过,世世代代之后依然存在的基因,将是那些有能力成为后代祖先的基因。这是事实,但有一个明显的例外情况必须在此指明,以免日后给读者带来困扰。有些个体没有生育能力的状态是无法逆转的,但是,它们生而具备的使命却是为了协助将自身基因继承到未来世代。蚂蚁、白蚁、蜜蜂、黄蜂之中的工蚁和工蜂都没有生育能力。它们终日劳作,不是为了自己成为祖先,而是为了让具有繁殖能力的兄弟姐妹成为后代祖先。在此有两点需要强调。第一,任何物种的兄弟姐妹之间都有很大概率共享相同的基因。第二,某只个体白蚁究竟会成为拥有繁殖能力的蚁后,还是成为不具备生育能力的工蚁,取决于环境,而非基因。所有的白蚁身上都具备在某些环境条件下将自身转化为无生育能力的工蚁的基因,以及在另一些环境条件下令自身拥有繁殖能力的基因。而负责繁殖的白蚁在工蚁的帮助下,也会将同样的基因拷贝继承下去。在基因力量的影响下,工蚁不知疲倦地卖命干活,而同样的基因也存在于负责繁殖的白蚁体内。这些基因中的工蚁拷贝都在努力协助拥有繁殖能力的白蚁拷贝穿过世代之筛。白蚁工蚁雌雄皆有,而蚂蚁中的工蚁以及蜜蜂和黄蜂中的工蜂都是雌性。除此之外,大原则都相同。同样的原则也适用于几种鸟类动物、哺乳动物和其他动物,这些动物中年长的哥哥姐姐都会在某种程度上照料年幼的弟弟妹妹。总的来说,基因可以通过迂回路线穿过世代之筛,协助自身成为后代祖先,也能协助有亲缘关系的个体成为后代祖先。
本书书名中谈到的“河”,是一条DNA之河。这条河在沿着时间之岸缓缓流淌。这是一条信息之河,而非血肉之河,是一条充满关于躯体构造的抽象指示的河流,而非由肉身构成的河流。信息经由躯体,对躯体产生影响,但在路过之时,却不会受到躯体的影响。这条河不仅不会受到其流经的一连串躯体在生命中获得的经历和成就的影响,而且也不会受到表面看来极其强大的潜在污染源——性的影响。
在你体内的每一个细胞之中,有一半来自你母亲的基因与一半来自你父亲的基因。母系基因与父系基因亲密无间的合作,造就了如今这个极为精妙且浑然一体的你。基因本身不会融合,只有基因带来的影响会发生融合。基因本身带有一种稳如磐石的完整性。当继承到下一代的时刻到来,某个基因要么进入后代的体内,要么不进入。父系基因和母系基因不会融合,而会彼此独立地进行重组。你体内的某个基因要么来自父亲,要么来自母亲。同时,这个基因也来自你4位祖辈中的一位,来自你8位曾祖辈中的一位且只有一位,以此类推。
除了用基因之河作为比喻,我们也完全可以将基因比喻成一群穿越地质时间的好伙伴。长期来看,一个繁殖种群的所有基因都是彼此的伙伴。短期来看,基因存在于个体之内,与共处一体的其他基因获得了暂时的亲密关系。基因只有善于构建优秀的躯体,令其善于以该物种选择的特定生活方式生息繁衍,才能穿越漫长的时间长河留存下来。为了生存,某一基因必须善于与同一物种(同一条河)的其他基因合作。不同物种的基因存在于不同的河流之中。不同物种的基因不必合作,至少是不必紧密合作,因为它们无须共享同一具躯体。
区别某一物种的依据就是,任一物种的所有成员体内都流淌着同一条基因之河,某一物种的全部基因要准备好成为彼此的好伙伴。当现有物种分裂成两个不同物种时,新的物种便出现了。随着时间的推移,基因之河会出现分岔。从基因的角度来看,物种形成(speciation)是“一场漫长的告别”。经过短暂的分离,两条河流便会各自独立,各自流淌,直到逐渐干涸,渗入沙地。在河岸的限制之下,河水通过有性重组,不断混合再混合。但河水绝不会涌出河岸,污染到其他河流。在物种分化之后,两套基因便不再彼此为伴。它们再也不会在同一具躯体之内相遇,也无须彼此合作。它们也不会再发生交叠,这里所说的交叠,是指它们的临时载体,即容纳基因的躯体之间发生的性交。
物种为何会产生分化?是什么启动了基因的漫长告别?又是什么促使一条河流产生分支,形成渐行渐远、永不交汇的支流的?具体原因饱含争议,但无人质疑的一点是,其中最重要的因素是偶然发生的地理分隔。基因之河随着时间不断流淌,而基因的重组发生在活生生的躯体之中。躯体会占用空间中的某个位置:北美灰松鼠如果有机会遇到英国灰松鼠,也许有能力与之交配繁衍,但它们相遇的可能性很小。北美灰松鼠的基因之河已经与相隔4 800公里大洋之外的英国灰松鼠形成了分化。事实上,虽然在假设的条件下,两队基因仍然有能力在恰当的时机成为好伙伴,但事实上它们已经不再彼此为伴。它们已经告别了,虽然这次告别目前来看并非无可挽回。再经过数千年的分离,两条河流就可能过于疏远,就算两种松鼠相遇,它们也不再有能力交换基因。这里所说的疏远,并非指空间上的疏远,而是指彼此相容能力上的疏远。
这类事件,几乎可以肯定与灰松鼠和红松鼠的分离有一定的关联。后者之间无法实现异种交配。在欧洲的某些地方,灰松鼠和红松鼠的活动范围有重合,虽然它们会相遇,很可能有时还会因为抢夺坚果而彼此敌对,但它们已经无法交配,更无法产下拥有繁殖能力的后代。它们的基因之河彼此太过疏远,也就是说,它们的基因不再适合在同一具躯体之中彼此合作。许多世代之前,灰松鼠的祖先和红松鼠的祖先是同一个个体。但后来,它们在地理上产生了分隔,也许是隔了一条巨大的山脊,也许是一条宽阔的河流,最终则演变成了大西洋,而它们的基因组合也愈加不同。地理上的分隔致使往日的好伙伴变成了水火不容的敌对者。水火不容的局面进一步深化,此时的道别便是永远。两条河流分离开来,命中注定渐行渐远。同样的故事也发生在人类祖先和大象祖先在久远的过去互道的永别上,发生在鸵鸟祖先和蝎子祖先的永别上。
如今,DNA之河拥有约3 000万条支流,这也是地球现存物种的估计数量。也有估计称,现存物种数量占据所有曾经存在过的物种数量的1%。由此推算,基因之河总共有过约30亿个分支。如今的3 000万条支流,都发生过不可逆转的彼此分离。其中许多支流注定会消失,因为大多数物种都会走向灭绝。如果你沿着这3 000万条支流回到过去就会发现,一条接一条的河流会与其他河流交汇。人类的基因之河汇入黑猩猩的基因之河的时间,与大猩猩的基因之河汇入的时间相仿,都发生在约700万年前。往前追溯几百万年,黑猩猩的基因之河会汇入非洲古猿的基因之河。再往前追溯,我们可以看到长臂猿基因之河汇入进来。而长臂猿基因之河在流淌的过程中,又在下游形成了几个不同的长臂猿和合趾猿物种。继续向前追溯,我们可以看到人类的基因之河与其他河流融汇。这些河流在流淌之中形成了欧洲猴、美洲猴以及马达加斯加狐猴。再往前,人类基因之河与那些后来发展成为其他主要哺乳动物的河流相汇,包括啮齿类动物、猫科动物、蝙蝠和大象。之后,我们会遇到后来发展出各类爬行动物、鸟类、两栖动物、鱼类和无脊椎动物的河流。
关于河流的比喻,有一点需要我们特别关注。当我们想到所有哺乳动物的河流,而不是像灰松鼠等具体动物的河流时,很容易将这条河流想象为一片宽阔的水域,犹如密西西比河或密苏里河那样浩渺无垠。毕竟,哺乳动物的基因之河注定要分岔再分岔,直到形成所有的哺乳动物,从俾格米人到大象,从地下的鼹鼠到树冠顶端的猴子。哺乳动物的基因之河注定要为成千上万条的重要水路提供给养,又怎么能不是一条宽阔壮丽、波涛汹涌的大河呢?但事实是,我们脑海中的这个画面大错特错。当全部现代哺乳动物祖先的基因之河与非哺乳动物的基因之河分岔时,这一事件的壮观程度,并不甚于其他任何一次物种形成。在当时历经此事的任何一位博物学家都不会有丝毫察觉。新的基因之河分支很可能就是一条涓涓细流,是某个不起眼的小型夜行动物和它那非哺乳动物表亲之间的差别,就像灰松鼠和红松鼠之间的差别一样,并不显著。我们只有在事后回顾时,才能看出哺乳动物的祖先是一只哺乳动物。在那段日子里,它可能就是某种貌似哺乳动物的爬行动物,与其他个头不大、撅着鼻子、靠吃虫子为生的恐龙捕食对象没什么区别。
同样,往前追溯,所有动物大类的祖先的基因之河分岔时也是悄无声息的。后来便形成了脊椎动物、软体动物、甲壳纲动物、昆虫、环节动物、扁虫、水母等。当发展成为软体动物等的基因之河与发展成为脊椎动物等的基因之河分道扬镳时,这两群生物可能(形若蠕虫)极为相似,甚至可以彼此交配。这些物种没有继续交配的唯一原因,就是它们碰巧被地理上的障碍间隔开来,比如干旱大陆将之前连成一体的水域分成了两片。没人能猜到,其中一群生物会发展成软体动物,另一群会发展成脊椎动物。两条基因之河还是尚未一刀两断的小溪流,两群动物也基本上没什么区别。
动物学家对此了如指掌,但他们在思考譬如软体动物和脊椎动物等真正的动物群体时,有时会淡忘这一点。他们会认为,主要的动物类别在分岔之时都会上演一场大戏。造成这一错误观念的原因在于动物学家在成长过程中都被灌输了一种坚定的信念,认为动物界的几大分支都充满了某种深刻的、独一无二的特性,用德语讲,就是“bauplan”。虽然这个词的字面意义是“蓝图”,却被学界当作了一个专有名词,以至于我虽然未能从最新版牛津词典中查到这个词(并因此感到颇为震惊),但也一直认为这是个英文单词。从专业角度来讲,bauplan经常被翻译为“基本设计”。“基本”一词的使用(或引用德语词汇以故作深奥)是灾难的源起,因为这样的说法很可能导致动物学家犯下严重的错误。
举例来说,一位动物学家曾提出,寒武纪时期(距今6亿年到5亿年前)的物种一定有着某种与后来的进化完全不同的发展过程。他的理由是,现如今是新物种不断出现,而寒武纪时期是诸如软体动物和甲壳纲动物等大类物种集体出现。其中的谬误简直晃瞎人眼!就连软体动物和甲壳纲动物这类彼此之间差异甚大的生物,最初也是同一物种因地理原因分隔开来的产物。在一段时间里,它们若彼此相遇,依然可以实现异种交配,但事实上并没有相遇。经过成百上千万年的各自进化,它们获得了各自的特征,使得现如今的动物学家在回望历史时,能分别将其认定为软体动物和甲壳纲动物。这些特征被冠以“基本设计”或“bauplan”这样的光环,但动物界的主要蓝图还是逐渐从同一个源头分岔后分别进化而来的。
的确,关于进化究竟在何种程度上展现出渐进式或跳跃式发展,还存在一个小分歧。但从未有任何人认为,进化的跳跃式发展能一步创造出一个完整而崭新的蓝图。我引述的作者的文章撰写于1958年。如今,没有几位动物学家还会公开支持这一立场,但他们有时依然在含蓄地表达这种观点,仿佛动物的大类都是突然间以完美形态降生的,就像雅典娜从宙斯头中婀娜而出,而不是古老种群因偶然的地理分隔而发展出来的分岔。
无论怎样,分子生物学研究都已证实,几大动物类别之间的关系比我们以往认为的更加亲近。你可以将遗传代码看作一部由64个单词构成的一种语言的词典(这种语言共有4个字母,排列组合成64个由3个字母组成的单词),与另一种由21个单词构成的语言相区别(20个氨基酸外加一个标点符号)。随机实现64∶21对照组两次的概率,比100万亿亿亿分之一还要小。然而,研究显示,遗传代码在所有人类研究过的动物、植物和细菌之中都是相同的。这片土地所养育的生命的确来自同一祖先。没有人会质疑这一点,但当人们不仅研究代码本身,而且研究遗传信息的具体顺序时,会在譬如昆虫和脊椎动物之间找到惊人的相似之处。有一套非常复杂的遗传机制专门负责编码昆虫的节状肢体,而我们在哺乳动物体内也发现了极其类似的遗传机制。从分子角度来看,所有动物之间都有着很近的亲缘关系,甚至动物和植物之间也并不远。我们要追溯到细菌才能找到人类的远亲,但即使是细菌,其遗传代码本身也与人类无异。之所以有可能对遗传代码进行精确计算,而无法对蓝图进行精密剖析,是因为遗传代码完全是数字化的,而我们可以对数字进行毫厘之间的计算。基因之河是一条数字之河,现在我有必要在此对这一工程词汇进行解释。
工程师对数字代码和模拟代码进行了重要的区分。留声机和录音机,还有后来出现的电话,使用的都是模拟代码。压缩磁盘、计算机以及绝大多数现代电话系统,则使用的是数字代码。在模拟电话系统中,不断波动的空气压力波(声音)被转换成为电线中相应不断波动的电压力波。留声机唱片也利用了类似的方式:波纹槽令唱针产生波动,唱针的运动被转换成为相应的电压波动。在另一端,通过电话听筒或留声机扩音器中的振动膜,电压力波又被转换回来,成为相应的空气压力波,于是我们就听到了声音。这里的代码简洁明了:电线中的电波与空气压力波成比例。在某个限度之内,所有可能存在的电压都能顺着电线传下去,而电压之间的区别便产生了效果。
数字电话中只有两个可能存在的电压,或是诸如8或256等代表可能存在的电压的某些离散数字,能顺着电线传下去。信息并不存在于电压本身,而是在离散电平的结构之中,我们称之为脉冲编码调制。任何时间的实际电压,都不太可能精确地等同于比如“8”等表面数值,但接收端装置会将其归类到最贴近的指定电压上。由此,另一端出现的内容便是几近完美的,虽然传输过程可能略为混杂。你需要去做的就是将离散电平设置得足够离散,这样接收装置就不会理解错误。这就是数字代码的好处,也是音频和视频系统以及信息技术整体都日益走向数字化的原因。计算机做的每一件事都在依靠数字代码。出于便利的目的,计算机采用的是二进制代码,也就是说,计算机只利用两个水平的电压,而不是8或256。
就算在数字电话中,进入话筒、输出听筒的声音依然采用的是模拟式的气压波动。采用数字方式的是从交换器到交换器之间的信息传输:要设定某种代码,对每一毫秒的模拟值进行翻译,转换成为离散脉冲序列,即数字代码表示的数值。当你用电话对着爱人柔情软语时,每一次微妙婉转,每一次抑扬顿挫,每一次叹息和探求,都是通过数字形式由线路传送过去的。只要数字能以足够快的速度得到编码和解码,你就会被打动得潸然泪下。现代电子转换装置速度极快,线路可被划分为好几个区间,正如象棋大师可以同时与20个人展开车轮大战一样。这就是说,数以千计的对话都能被嵌入同一条电话线路,表面看来是同时进行,从电子层面来看又是彼此分离的,不会相互干扰。中继线(如今的许多中继线已经不是实体线路,而是无线电射线,要么从一个山头直接传输到另一个山头,要么通过卫星传输)无异于数字汹涌的大江大河。但由于实现了独特的电子隔离,一条中继线就等于数千条数字之河。这些河流只不过共享了表面意义的同一个河岸而已。就像红松鼠和灰松鼠栖息在同一棵进化树上,但它们永远不会交换基因。
回到工程师的世界之中,只要不进行一遍又一遍的复制,模拟信号的缺乏并不是什么大问题。录音磁带上的杂音可能非常之少,让人很难留意,除非你放大音量,但与此同时你也放大了杂音的音量,也带来一些新的噪音。但是,如果你对一盘磁带转录、转录、再转录……经过100“代”之后,你能听到的就只剩下一片嘈杂。在只有模拟电话的时代,这类问题给人们带来了不少困扰。电话信号经过一段较长的线路就会出现衰减,每160千米左右就需要对其进行增强再放大。在模拟信号时代,这是个让人头疼的问题,因为每一个放大过程都会增加背景杂音的比例。数字信号同样需要增强。但是,正如我们之前解释过的原因,增强并不会引入任何错误。通过某些设置,信息就能完美地传送给对方,无论中间需要经过多少次增强。就算传送到千里万里之外,杂音也不会增加。
儿时母亲曾告诉我说,我们的神经细胞就是人体内的电话线路,但它们是模拟的还是数字的?答案是,神经细胞是模拟与数字的有趣混合体。与电子线路不同,神经细胞是一条又长又细的管道。其中,化学物质一波又一波地不断传送,就像一条细长的引线在地上冒着火花前行。与引线不同的是,神经细胞会很快复原,经过很短时间的休息,便可以再次点燃。化学物质的绝对量,即引线的温度,随着其沿神经的前行而不断变化,但这一点无关紧要。代码会无视这种变化,化学物质要么暂停,要么不暂停,就像数字电话中的两个电压电平一样。从这个角度来看,神经系统是数字化的。但是神经脉冲并不会被强制转化成为字节,不会被整理成为离散的编码数字。信息的强度,比如声音的大小、光线的明暗,甚至还包括情绪的激烈程度都会被编码成为脉冲频率。工程师称之为脉冲频率调制,在脉冲编码调制被广泛采纳之前很受欢迎。
脉冲频率是模拟的,但脉冲本身是数字的:要么有脉冲,要么没有脉冲,没有中间的选择。神经系统就像其他数字化系统一样可以从中受益。由于神经细胞的工作机制,人体内存在着相当于放大器的结构,在这里不是每160千米一座,而是每毫米一座。在从脊髓到手指尖的这段距离中,有800座站点。如果神经脉冲的绝对高度会产生影响,那么信息通过人手臂的长度便会被扭曲得无法识别,更别说经过长颈鹿的脖子了。每一座放大器都会引入更多的随机错误,就像一盘磁带被翻录了800遍,或是一张纸被复印800遍一样。经过800遍的复印,唯一留下的就是一片灰色的模糊暗影。数字编码为神经细胞的问题给出了唯一的解决方案,于是自然选择将其采纳,基因同理。
在我看来,解密基因分子结构的弗朗西斯·克里克(Francis Crick)和詹姆斯·沃森(James Watson)应该像亚里士多德和柏拉图一样受到人们的敬仰,直到千秋万代。他们拿到的是诺贝尔生理学或医学奖,这一点并没有错,但与他们所做的贡献相比,这一奖项不值一提。持续革命这个说法本身有些自相矛盾,但是医学,甚至我们对生命的整体理解,都因为这两位年轻人于1953年掀起的这场革命而持续不断地改头换面。基因本身以及遗传疾病不过是冰山一角。在后沃森-克里克时代,分子生物学真正的革命本质在于其走上了数字化道路。
沃森和克里克之后,我们了解到,基因本身的精细内部结构都是由纯粹数字信息组成的长链条。而且,此处所讲的数字是货真价实的数字,与计算机和压缩磁盘中所谓的数字毫无二致,而不是神经系统中意义牵强的数字。遗传代码并非计算机所使用的二进制代码,也不是某些电话系统所使用的8位代码,而是由4个符号组成的四进制代码。基因的机器代码与计算机极为相似。除了专业术语不同之外,分子生物学杂志中的篇章完全可以与计算机工程学杂志中的内容进行互换。这一数字化革命带来了意义深远的影响,而从生命的核心来看,则是对生机论 最终的毁灭性打击。直到1953年,还是有人认为,生命原生质存在某些本质上无法简化的神秘特质,而如今则不存在这种可能性。就连那些曾经满心向往生命机械论观点的哲学家,也不再对实现他们的狂野梦想抱什么期望了。
只要存在一种比如今的技术水平发展更快的新科技,那么下面即将讲述的科幻情节就充满了可能性。吉姆·克里克森(Jim Crickson)教授被外国邪恶势力所绑架,被迫在生物战争实验室工作。为了拯救人类文明,他必须将一些机密信息传递到外面去,但所有的通信渠道都被控制了。DNA代码包含64个3碱基密码子,足够容纳完整的英文大小写字母,外加10位数字、一个空格和一个句号。克里克森教授从实验室中拿到一些致命的流感病毒,对其基因组进行改造,将他需要传达的信息以正常的英文句型完整地编入其中。在被改造的基因组中,他一遍又一遍地重复着这段信息,并加入了一个非常容易识别的“旗帜”序列,比如前10个质数。之后,他让自己感染上病毒,再跑到一屋子人中间打上几个喷嚏,于是流感疫情便席卷了整个世界。各个国家的医学实验室为了设计出一款疫苗,纷纷开始研究流感病毒的基因组序列。很快人们便发现,其中存在一个不断重复的古怪模式。质数序列让人备感异样,因为这种序列不可能自然生成,于是有人想到了破译代码的技术。走到这一步,距离读懂克里克森教授用喷嚏传向全世界的完整英文信息就只有一步之遥了。
人类遗传系统的核心就是数字化的,而地球上所有的生命都拥有同样的系统。你可以将整部《新约》逐字逐句地编入人类基因组那些目前充斥着“垃圾”DNA的部分之中。垃圾DNA,就是没有被人体利用上,至少是没有被人体以惯常的方式利用上的DNA。你体内的每一个细胞都包含着46条容量巨大的数据带,通过数个同时运转的读数头不断传送着数字字符。每个细胞内部的数据带——染色体,都包含着同样的信息,但不同类型细胞中的读数头则会根据自身的特定目的而选择数据库中的不同部分,这也是肌肉细胞和肝细胞有所不同的原因。不存在靠神灵牵引的生命力量,没有悸动的、起伏的、凝聚的、原生质的、神秘而不可思议的凝胶,生命不过是由一个又一个字节组成的数字化信息。
基因是纯粹的信息,可进行编码、重编码、解码,而不会发生退化或意义改变。纯粹的信息是可经复制的,因为是数字化信息,所以保真度极高。DNA字符复制的准确程度远超现代工程师的最高水平。DNA通过复制世世代代沿袭下来,偶尔会出现错误,并通过这种方式引入变化。在变化之中,数量更多的编码组合在被解码并在体内被执行时,会自动让躯体采取积极行动,使同样的DNA信息进行保留和增殖。如今看来,达尔文主义就是适者在纯粹数字代码层面的生存。
现在回头想想,也不可能出现其他情况。假设存在一个模拟遗传系统,我们已经了解到,模拟信息在一连串的拷贝再拷贝之后会发生什么样的情况。这无异于一场传话游戏,无论是增强的电话系统,还是转录的磁带、复印件的复印件,模拟信号都是如此不堪一击,而累积的衰减只能令这种模式持续有限的世代。而基因就算自我复制1 000万代,也不会出现衰减或退化现象。除了经自然选择去除或保留离散突变之外,达尔文主义之所以能发挥作用,只是因为复制过程无懈可击。只有数字遗传系统才有能力历经久远的地质时间将达尔文主义贯彻下去。1953年是双螺旋元年,这一年不仅标志着生命神秘论和反启蒙主义观点的终结,也是达尔文主义最终走向数字化的起始之年。
想象一下,一条流淌着纯粹数字信息的大河,历经地质时间,一路奔涌向前,形成了30亿条支流,这是一幅多么壮观的场景。但是这条河流是在哪里留下了我们所熟悉的生命特征?在哪里留下了躯体、手臂、眼睛、大脑、胡须、树叶、树干和树根?在哪里留下了人类和我们身体上的各个构线?所有的动物、植物、原生动物、真菌和细菌是否只是供数字化信息河水向前流淌的河岸?从某种意义上讲,答案是肯定的。但又不仅如此。基因不仅仅会制作可以世世代代传递的自身拷贝,而且实实在在地在躯体之中度过一段时光,影响了世世代代为其提供容身之所的躯体的外形和行为。
躯体本身也很重要,举例来说,北极熊的躯体不仅仅是数字河水的河道,也是一部复杂的机器。整个北极熊种群的所有基因是一个集合体,也是一群好伙伴,在时间的历练中彼此陪伴,但它们不会在集合体中所有其他成员的陪伴下度过所有时间。集合体的定义,是有可能遇到集合体中任何其他基因的一套基因,但不会遇到世界上其他3 000万个集合体之中的任何成员。真正的会面永远只能发生在北极熊躯体之中的细胞之内,而这个躯体并非DNA的被动容器。
这些细胞的数量本身就多得令人难以想象:大型雄性北极熊拥有大约90万亿个细胞,每一个细胞内部又有一套完整的基因。如果将一只北极熊身上的细胞进行先后排序,其长度可以轻松地从地球到月球跑一个来回。这些细胞可以分为几百个类型,而对于所有哺乳动物来说,基本都是同样的几百种类型:肌肉细胞、神经细胞、骨细胞、皮肤细胞等。一种类型的细胞聚集在一起,就形成了组织:肌肉组织、骨组织等。所有不同类型的细胞都包含制造任意一种类型细胞的遗传构造。只有适用于该组织的基因会被打开,这就是为什么不同的组织有着不同的形状和大小。
更有趣的是,某种特定类型的细胞之中被开启的基因会让这些细胞生长成为拥有特定形状的组织。骨组织并非一坨毫无形状的坚韧组织,而是具有特定的形状,拥有中空骨干、球状关节、骨骼和骨刺等。细胞通过其内部被打开的基因而获得编程,从而产生行为,仿佛它们知道自己相较于周边细胞身处何方,也是通过这样的方式,才构建起其自身组织,形成耳垂、心脏瓣膜、晶状体和括约肌。
像北极熊这样的有机体,其复杂性要逐层分析。其躯体是诸如肝脏、肾脏和骨头等拥有精确形状的器官的复杂集合,每个器官是由特定组织构成的复杂结构,而其一砖一瓦则是细胞。细胞常常呈现出层叠结构,也会表现为固体块状结构。从更小的维度上看,每个细胞都拥有高度复杂的折叠膜状内部结构。这些膜状结构以及膜与膜之间的水,酝酿着数类庞杂的精密化学反应。英国帝国化学工业有限公司或美国联合碳化物公司的化学工厂里,可能会同时存在数百种不同的化学反应。这些化学反应通过烧瓶或试管壁彼此分隔。而一个活生生的细胞内部也拥有同时进行的相似数量级的化学反应。从某种程度上来说,细胞膜就像是实验室中的玻璃器皿,但这一比喻并不十分恰当,原因有二。第一,虽然许多化学反应是在膜与膜之间发生的,但还有许多化学反应是发生在膜体之中的。第二,将不同化学反应彼此分隔的是一种更为重要的方式,每种化学反应都需要借助特定的酶来催化。
酶是一种非常大的分子,其三维形状就像一个平台,能加快某种特定类型的化学反应。对于生物分子来说,最重要的就是其三维形状。我们可以将酶视作一个大型机器。这个机器小心翼翼地工作,制作出拥有某个特定形状的分子。因此,任何细胞内部都有可能同时发生着数百种彼此隔绝、各不相同的化学反应,而这些化学反应都发生在不同类型的酶分子的表面。某个细胞会发生哪种特定的化学反应,取决于当时存在哪种类型的数量充裕的酶分子。每一个酶分子,包括其至关重要的形状,都由特定基因先天注定的影响力所决定。具体来讲,基因中数百个代码字母的序列通过已知的一套规则(遗传代码),决定着酶分子中氨基酸的序列。每个酶分子都是一条线性的氨基酸链,而每一条线性氨基酸链都会同时卷曲成特定的三维结构,就像打了个结一样,使得链条的某些部分与其他部分形成交叉连接。打结的具体三维结构取决于氨基酸的一维序列,也取决于基因编码字母的一维序列。因此,细胞中发生的化学反应取决于被开启的基因。
那么,是什么决定着某个特定细胞中哪些基因被打开呢?答案在于细胞中已经存在的化学物质。这里存在一个“先有鸡还是先有蛋”的悖论,但并非无解。这一悖论的解释虽然在细节上很复杂,但从原则上讲非常简单——计算机工程师所知的引导指令(bootstraping)。我刚刚开始使用计算机时还是20世纪60年代,那时所有程序都需要通过纸带进行装载。在上传某个正式程序的大量纸带之前,先要上传一个叫作“引导装入程序”的小程序。引导装入程序只做一件事:告诉计算机如何装载纸带。“先有鸡还是先有蛋”的悖论在这里就体现出来了,引导装入程序的纸带本身又是如何装载的呢?在现代计算机里,引导装入程序都是预装在计算机里的,但早年间还是需要按照某个特定顺序来手动按下开关。这个顺序会告诉计算机,怎么开始读取引导装入程序纸带的第一部分。随后,引导装入程序纸带的第一部分会告诉计算机怎么读取纸带的下一部分,以此类推。等整条引导装入程序都装载完成,计算机就知道应如何读取纸带,成为一台能真正派上用场的计算机。
胚胎始于受精卵,然后由单一细胞分裂成2个,2个细胞各自分裂成为4个,4个细胞各自分裂成为8个,以此类推。无须很多代分裂,细胞数量就能达到万亿级别,这就是指数分裂的力量所在。但如果仅是如此,那么这几万亿个细胞将全部相同。细胞是如何分化成为肝脏细胞、肾脏细胞、肌肉细胞等的呢?答案就在于引导指令。虽然卵子的表面看起来像个球体,但其内部化学结构中是可以定位的。卵子拥有顶部和底部,在许多情况下,还拥有前部和后部,因此就有了左边和右边。这些位置以化学物质的梯度的形式呈现出来。从前往后移动时,某些化学物质的浓度会逐渐增加,从上往下移动时,另一些化学物质的浓度会增加。这些化学物质的梯度变化非常简单,但足以形成引导指令操作的第一个阶段。
举例来说,当卵子经过5次分裂,形成32个细胞时,这些细胞中的某几个将比其他细胞拥有更多的顶端化学物质,其他细胞则比这几个细胞拥有更多的底端化学物质。细胞从头至尾的化学物质梯度可能并不平衡,这些不同足以在不同细胞内部触发不同的基因组合。因此,不同组合的酶将存在于早期胚胎不同部分的细胞之中,这就使得不同细胞内部有更多不同的基因组合被开启。由此,细胞谱系开始出现差异,而不会保持与胚胎内部克隆祖先完全一致的模样。
这里所说的差异与我们之前讲到的物种差异完全不同。这些细胞差异都是经过编程的,在细节上可以预期,而物种差异则是地理变迁的偶然结果,无法预期。而且当物种出现差异时,基因本身也会出现差异,也就是我所戏言的“漫长的告别”。当胚胎内部的细胞谱系出现差异时,所有细胞都能接收到相同的基因。但是,不同的细胞会获得不同的化学物质组合,继而开启不同的基因组合,某些基因发挥作用,对其他基因发出开启或关闭的指令。就这样,引导指令继续工作,直到我们拥有一套完整的不同类型的细胞。
胚胎发育不仅是分化成为数百种不同类型的细胞,还会在外部和内部形状上发生简洁的动态变化。其中最具特点的就是早期发生的变化:原肠胚的形成。著名胚胎学家刘易斯·沃尔珀特(Lewis Wolpert)曾这样说过:“人一生中最重要的时刻并非出生、结婚或死亡,而是原肠胚的形成。”原肠胚的形成过程是一个由细胞组成的中空球体,弯曲形成一个带有内层的杯形结构。整个动物王国的所有胚胎都会经历同样的原肠胚形成过程。原肠胚是胚胎变化的统一基础。我在这里提到原肠胚,只是作为一个例子,也是一个颇有喜剧色彩的例子。从中我们可以了解到,胚胎发育过程中整个细胞进行的不知疲倦的、如折纸艺术般的运动过程。
在折纸大师表演结束时,在经历许多次细胞层的对折、突出、凸起、牵拉之后,在动态策划下,胚胎各个部件实现分化生长,在分化形成数百种化学和实质都有所不同的细胞之后,当细胞总数达到万亿级别时,最终的成果就是一个婴儿。不,就算是成为婴儿,也还没有结束,因为个体的整体生长还要经过成年期、老年期,所有这些都要被看作胚胎发育过程的延伸:全胚胎学。
个体与个体有所不同,因为它们的全胚胎学存在量化细节上的差异。某层细胞在自我折叠之前多长出了一点点,结果就形成了鹰钩鼻,而不是朝天鼻;也有人因此形成了平足。肩胛骨的某个特定形状,会让你擅长投掷长矛、手榴弹或板球。细胞层面的某些个别变化会带来悲剧性后果,比如婴儿天生只有残肢而没有双手。而单纯的化学层面的差异也会产生重要影响:无法消化牛奶、花生过敏,或是认为芒果有种松节油的怪味。
从实体和化学上来讲,胚胎发育是个非常复杂的过程。过程中任何一点上的细节变化,都会对未来产生深远影响。这并不足为奇,想想整个过程需要多么繁重的引导指令便能明白。个体发育方式上的许多不同之处是因为环境差异,比如缺氧、服用致畸形药物“反应停”等。还有许多是由基因造成的,不仅是处于隔离状态下的基因,还包括与其他基因产生互动的基因,以及与环境差异产生互动的基因。胚胎发育这样一个纷繁复杂、需要反复执行精密引导指令的过程,既充满活力,又十分敏感。之所以说充满活力,是因为这个过程有能力对抗许多潜在的变化,阻挡各种看似不可抵御的破坏性力量,产出一个活生生的婴儿。而与此同时,这个过程又对变化十分敏感,因为没有哪两个个体,哪怕是同卵双胞胎,会在所有特征上保持完全一致。
现在,我们来讲讲所有这些内容想要引出的话题。个体差异取决于基因,相关性大小不一,自然选择可以偏好胚胎折叠或胚胎化学中发生的某些古怪情况,而不偏好另一些情况。由于你上下挥舞的胳膊受到了基因的影响,自然选择可以对其产生偏好,也可以不产生偏好。如果投掷东西的能力会对个体生存产生有利影响,令个体可以存活足够长的时间生儿育女,无论这种有利影响多么微不足道,只要胳膊上下挥舞的能力受到了基因的影响,那么这些基因就会拥有更大的机会赢得传递给下一代的机会。任何个体都有可能因为与挥舞胳膊的能力毫不相关的原因而死亡。但是,令个体拥有挥舞胳膊的能力的基因会存在于许多躯体之中,无论好坏,并延续许多世代。从这个特定基因的角度出发,其他导致死亡的原因会达到某一均衡状态。从基因的角度来说,只有DNA之河世世代代流淌,而当下它们只不过是暂居在某个特定的躯体之内,暂时与其他或成功或不成功的基因伙伴共享一具躯体。
长期来看,这条河中充满了出于各种原因而善于生存的基因:稍稍提升的投掷长矛的能力,稍稍提升的尝出毒素的能力,等等。平均来看,不太善于生存的基因,也许是因为它们会导致后代视力散光,结果令后代在投掷长矛时击不准猎物;也许是因为它们令后代外表不够有吸引力,结果令后代不那么容易找到伴侣,这样的基因就有可能在基因之河中消失。了解到这些内容之后,请记住我们之前讲过的一点:在河流中生存下来的基因就是那些有助于该物种在典型环境中生存的基因。也许,典型环境中最重要的一个方面,就是该物种的其他基因,那些与该基因共享同一具躯体的其他基因,那些穿越地质时间,在同一条河流中流淌的基因。