在通往第1会合点的路上,我们遇见的第一块里程碑位于20万年前。跟后来气温骤降的强冰期相比,这一时期的气候相对温暖。气候变暖一定曾是这段时期人类历史的主要推动力。
有两个原因让我们选择在这个小站停留。首先是关于我们的最近女性共同祖先的。几种最主要的猜测都认为她就生活在这个年代。细胞的线粒体只来自母亲,因此我们可以利用线粒体里那一小段DNA来追踪母系家系,因此我们最近的女性共同祖先也常被称为“线粒体夏娃”(mitochondrial Eve)。基于线粒体DNA的推理方法曾在阐明人类晚期历史的过程中发挥了重要作用,我们将在《夏娃的故事》中讨论这一方法的陷阱。
在这里停留的另一个原因是想看看在埃塞俄比亚奥莫河畔(Omo river)发现的化石。这些化石最早是由理查德·利基(Richard Leakey)于1967年发现的,但在2008年又重新回到聚光灯下,因为据估计,它们的历史长达19.5万年。其中最有趣的两件化石是两块残缺的头盖骨,分别来自河流两岸,二者之间有细微的差异。第一块头骨几乎完全可以被当作现代人的,但第二块就跟我们的不太一样了:底部有点宽,额部则略平。更完整的样本来自赫托(Herto),也是在埃塞俄比亚,年代略晚一些,有16万年历史。这些化石当中的头骨也有类似的“近似现代”的形态。姑且不管“现代”和“近似现代”之间微不足道的差别,很明显这些头骨捕捉到了一个渐变的过渡时期,也就是如今被我们统称为“早期智人”(Archaic Homo Sapiens )的先辈向我们过渡的过程。
在有些权威学者笔下,“早期智人”一词的指代范围可以一直延伸到大约90万年前。时间越早,智人就越像另一个较早的物种,即直立人。其他人则倾向于给这些桥梁一般的中间物种各起一个单独的拉丁学名。在这里我们将避开这些争论,转而采用我的同事乔纳森·金登(Jonath an Kingdon)的英国式叫法,把它们分别称为“现代人”(Moderns)、“古人”(Archaics)和“直立人”(Erects),以及其他一些名字,我们稍后遇到的时候会再提到。不管是在古人和进化出古人的直立人之间,还是在古人和他们所进化出的现代人之间,都不可能划出一条清晰的界限。顺带一提,请务必小心不要混淆,因为事实上直立人比古人更“古老”,而这三种类型全都是直立的!
就我们所知,这种从古人到现代人的解剖结构转变只发生在非洲。不过古人类型的化石却在世界各地都有发现,年代不尽相同,但都有几十万年的历史,比如德国的“海德堡人”(Heidelberg man)、赞比亚的“罗得西亚人”(Rhodesian man,赞比亚曾被称为北罗得西亚)和中国的“大荔人”(Dali man)。古人也像我们一样有着硕大的颅腔,平均脑容量在1 200毫升和1 300毫升之间,比我们的平均值1 400毫升略小,不过古人和现代人的脑容量分布范围是完全重叠的。跟我们比起来,他们的躯体更强壮,颅骨更厚,眉骨更突出,下巴却没我们明显。他们比我们更像直立人,后见之明会把他们看成过渡类型。有些分类学家把他们当作智人的亚种,比如称其为海德堡智人( Homo sapiens heidelbergensis )。若是考虑亚种的话,我们就是现代智人( Homo sapiens sapiens )。另一些人则不把古人当成智人,直接称其为海德堡人( Homo heidelbergensis )。还有人进一步将古人分成多个物种,比如海德堡人、罗得西亚人( Homo rhodesiensis )和先驱人( Homo antecessor )。每个思考过这个问题的人都知道,如果对物种的划分毫无争议,那才是值得我们担心的事情,因为从进化的角度来看,生命本来就应该有一系列连续的过渡类型。
不幸的是,这一系列连续的化石形态会造成一种倾向,让人把它们想象成一条笔直单一的进化路径,比如把它们按照脑容量排列起来。我们将会看到,人类起源晚期历史的真实图景其实复杂得多。进化是一个乱糟糟的历史过程,不太可能直线前进。最明显的例子是尼安德特人。这类人最早的化石发现于尼安德河谷(Neander Valley),尼安德特人也由此得名 。
关于尼安德特人,一种看法是把他们当作我们的表亲,认为他们代表了从古人进化而来的另一个独立分支。我们是在非洲进化的,他们则是在欧亚大陆(Eurasia)和中东地区(Middle East)。在某些方面尼安德特人比我们更像古人,据信他们从古人分化出来的时间也比我们早一倍,大概是在50万年前甚至更早。西班牙北部的胡瑟裂谷(Sima de los Huesos )记录了他们的独立进化路径,这里有一批40万年前的珍贵化石,年代早于尼安德特人的经典类型,有许多尼安德特人标志性的特征,却又不完全相同。
在我们当前会合点所处的时代,这些生活在欧亚大陆上的人已经积累了一批足够鲜明的特征,使得有些人更愿意把他们归为一个单独的物种(即 Homo neanderthalensis )。他们保留了古人的一些特点,比如现代人所不具备的高眉骨(这也是为什么有些权威学者认为他们只是古人的一个类型)。作为对寒冷环境的适应,他们拥有粗壮的身材、短小的四肢和巨大的鼻子,想必他们还穿着温暖的衣服,而这衣服大概是由动物皮毛制成的。
尼安德特人的粪便化石使我们有机会推断出他们的食谱。他们的食物以肉为主,掺有少量蔬菜。人们常说他们的大脑比我们略大,但体重校正之后的结果证明,我们依然是更有脑子的那个,这方面内容请参见《能人的故事》。有些迹象表明他们会为死者举行葬礼,还创造简单的艺术,人们常对此进行过度解读。没人知道他们是不是有语言,关于这个重要的问题众说纷纭。考古学迹象表明,尼安德特人和现代人之间可能有双向的技术流动,但这完全有可能是借助模仿而非语言来完成的。
这就为我们带来一个棘手的问题,即尼安德特人和现代人的相互关系。随着现代人扩散出非洲,其活动区域开始跟尼安德特人有所重叠,最开始是在大约10万年前的中东,随后是西亚,最后是欧洲。现代人大概在4.5万年前进入欧洲,之后没过几千年,大概在4万年前,尼安德特人就基本上从化石记录中消失了。时间上的吻合让许多人猜测是现代人造成了尼安德特人的灭绝,不知是通过屠杀还是竞争。
研究者从多份尼安德特人遗骨中提取出了DNA,这一惊人的成果使得尼安德特人消失的问题出现了新的转机。一份研究表明,西欧和东欧的晚期尼安德特人之间存在一个重要差异。在现代人抵达之前,西欧的尼安德特人就发生了一次突然的遗传多样性下降,时间正好和一段极度寒冷的时期相吻合。这就证明,即使没有现代人的竞争,尼安德特人种群的规模和地点本身就存在波动。另外一些关于古代DNA的研究则有助于阐明尼安德特人是否曾和现代人混血,如果是的话,那就意味着他们根本没有灭绝。在本篇末尾《丹尼索瓦人的故事》的序言中我们会谈到这个问题。这篇序言将向我们介绍这个故事最惊人的观点,即除了尼安德特人之外,人类还有另一群表亲。这位神秘的“第三人”(实际上证据来自一位年轻的女孩)的存在完全是根据DNA证据推断出来的,这是我们第一次介绍关于基因的研究。
我们在《塔斯马尼亚人的故事》里介绍过系谱学上的祖先。在传统系谱学家眼里,当代人的祖先都是真实存在过的人物,是“人的祖先”。对人所用的方法同样可以用于研究基因。基因也有父辈基因、祖辈基因和孙辈基因之分。基因也有家谱,有家系图,有最近共同祖先。而且,跟传统的历史人物家系图比起来,基因家系图有一个巨大的优势:它的图样是印在现存的基因组里的。关于家族历史的书面记录在几个世纪之后就会渐渐消亡,而完全根据活着的人类推断出的基因历史和“基因家系图”却可以揭示数百万年的人类历史。
在继续讲述之前,我必须澄清一些可能的误解。误解跟“基因”一词的含义有关。对不同的人来说,这个词可能指代许多不同的东西。但当我在“基因家系图”的语境下谈论基因时,我指的是一段独特的DNA序列,这段序列作为一个整体代代传递。某些生物学家,特别是分子遗传学家,会称其为遗传性变异体(genetic variant)、变异体(variant)或等位基因(allele),有时候也叫单倍型(haplotype)。他们留着“基因”一词用来表示染色体上的某个特定的位置,即基因座(locus),特别是包含特定信息的区域,用来指导已知生物分子(通常是某种蛋白质)的合成。而“等位基因”表示坐落在那个基因座上的基因的不同版本。举一个过度简化的例子,眼睛的颜色主要由某个基因决定,而这个基因有不同的版本或等位基因,包括蓝色等位基因和褐色等位基因。另一些生物学家,特别是我所属的这一群,有时被叫作社会生物学家、行为生态学家或动物行为学家,倾向于用“基因”这个词来表示等位基因所包含的意思。当需要表示任何一组等位基因在染色体上的位置时,我们倾向于使用“基因座”一词。我们这些人喜欢说,“设想一个基因决定了蓝色的眼睛,而一个对立的基因决定褐色的眼睛”。不是所有的分子遗传学家都能接受这种做法,但这是我们这类生物学家相沿成习的,而我将时不时地遵循这一惯例。
“基因家系图”和“人物家系图”有一个明显的区别。人有两位父母,但基因只有一位。你的任何一个基因要么来自你的母亲,要么来自你的父亲,必定来自而且只来自你四位祖辈当中的一位,必定来自而且只来自你八位曾祖辈当中的一位,以此类推。但当一个人按照传统的方式追溯自己的祖先时,其血脉将平均地来自他的一双父母、四位祖辈、八位曾祖父母,以此类推。这意味着“人物家系图”比“基因家系图”更混杂。在某种意义上,任何一个基因都只不过是从人物家系图上那许多纵横交错的路径中择取了一条单独的路线。基因的遗传方式跟姓氏更像。你的姓氏在完整的家系图上选了一条细线传到你这里,它强调的是你的父系家族史:由男性到男性再到男性。除了我稍后提到的两个明显例外,DNA不像姓氏那么性别歧视:基因以均等的概率沿着父系和母系追溯它的祖先。
人类家谱最完好的记录来自欧洲王室。我们来看看萨克森–柯堡王室(House of Saxe-Coburg)的家谱(见下页),请注意四位王子:阿列克谢(Alexei)、沃尔德玛(Waldemar)、海因里希(Heinrich)和鲁珀特(Rupert)。他们有一条基因是有缺陷的,这对他们来说是种不幸,但对我们来说却是运气,因为疾病让这条基因的家系变得非常易于追踪。这条缺陷基因让四位王子以及他们不幸家族中的许多其他亲属都罹患一种很容易辨识的疾病,即血友病:他们的血液不能很好地凝结。血友病的遗传方式很特别,属于X染色体遗传。男性只有一条X染色体,得自他们的母亲。女性有两条X染色体,一条来自父亲,一条来自母亲。只有当来自父母双方的基因都是缺陷版本时才会患上血友病,也就是说,血友病是隐性遗传的。男性因为只有一条X染色体,缺少额外的保障,所以只要这条X染色体携带缺陷基因就会患病。女性患病的情况少得多,但很多女性都是致病基因的“携带者”。携带者的任何一个孩子都有50%的概率遗传到她携带的缺陷基因。因此怀孕的女性携带者会希望生出一个女儿,但不管女儿跟谁结婚,她的外孙仍然有相当高的患病风险。如果一个男性血友病患者活得足够久,生育了后代,那他不可能把致病基因传给儿子(男性绝不可能从父亲那里得到X染色体),却必定会传给女儿(女儿一定会得到父亲唯一的X染色体)。知道了这些规律,又知道了哪名男性王族成员患有血友病,我们就可以追踪致病基因的家系图。我们已经在家系图上做了标注,血友病基因的上溯路径由粗线表示。
不幸的萨克森–柯堡王室血脉
突变似乎来自维多利亚女王 ,而不会是阿尔伯特(Albert),因为他的儿子利奥波德王子(Prince Leopold)患血友病,而儿子的X染色体不会来自父亲。维多利亚的旁系亲属之中无人患有血友病。她是第一个携带这个基因的王室成员。基因的错配突变要么发生在她母亲萨克森–柯堡的维多利亚公主(Victoria of Saxe-Coburg)的某个卵细胞中,要么像史蒂夫·琼斯在《基因的语言》( The Language of the Genes )中解释的那样,发生在“她父亲肯特公爵爱德华那庄严的睾丸中”。
尽管维多利亚的父母都没有血友病,也都不携带致病基因,但其中一人有一条亲代基因(严格来讲叫等位基因)最后突变成了王室的血友病基因。尽管无法检测,但我们可以想象维多利亚的血友病基因在突变之前的源流。尽管维多利亚的基因副本致病,而该基因的前身却不致病,但致病与否除了诊断上的便利之外,跟我们的用意并不相关。当我们沿着家系图回溯基因的历史时,我们不关心这个基因的具体作用,除非它有助于显示基因的存在。血友病基因的家系一定早于维多利亚,但继续往前回溯它突变为血友病基因之前的历史,那些可见的线索就消失了。我们从中得到的信息是,每个基因都必然有一个亲代基因,哪怕突变使它们变得不完全相同。同样,它只有一个祖辈基因、一个曾祖辈基因,以此类推。这么想也许显得有些奇怪,但请记得,这是一场寻根觅祖的朝圣,我们现在所做的练习让我们能够从基因而非生物个体的视角看清一场寻根觅祖的朝圣应该是什么样子。
在《塔斯马尼亚人的故事》里,我们提到了“最近共同祖先”,把它当作“共祖”的另一个说法。我们把“共祖”这个词留着专指人类或其他生物个体的最近共同祖先,所以当谈论基因的家系时,我们就用“最近共同祖先”一词。不同生物个体体内的两条或多条等位基因当然有一个最近共同祖先,也就是说,每一条等位基因都是当初那条古老基因的副本(很可能是突变的副本)。普鲁士的沃尔德玛王子和海因里希王子的血友病基因有一个最近共同祖先,它坐落在二人的母亲、黑森和莱茵的伊莲妮公主(Irene von Hesse und bei Rhein)的某一条X染色体上。当伊莲妮还是个胎儿的时候,她携带的那条血友病基因生成了两个副本,并传递给两个卵细胞,这两个卵细胞便是她两个儿子不幸的源头。同样,这些基因跟俄国王储阿列克谢(Tsarevitch Alexei of Russia,1904—1918)的血友病基因也有同一个最近共同祖先,由他们的外祖母、黑森的爱丽丝公主(Princess Alice of Hesse)携带着。最后,把我们选择的这四位王子的血友病基因全部囊括进来,它们的最近共同祖先正是最初宣示自己存在的那个基因,也就是维多利亚自己的那个突变基因。
遗传学家常用“合并”或“溯祖”一词来描述一个基因的逆向源流。逆着时间回溯,两个基因的家系会在某一点合并。而如果顺着时间去看,亲代基因的两个副本又正是在同一点被传给了两个子代。这个合并点就是它们的最近共同祖先。任何一个基因系谱图上都有许多合并点。沃尔德玛和海因里希的血友病基因合并为他们的母亲伊莲妮所携带的最近共同祖先基因,然后又与阿列克谢王储所在的支系合并。就像我们看到的那样,所有王室血友病基因的大合并发生在维多利亚女王身上。她的基因组里有整个王朝的血友病基因的最近共同祖先基因。
在这个例子里,四个王子的血友病基因在维多利亚身上合并,而维多利亚正是他们的共祖,他们家谱上的最近共同祖先。不过这只是一个巧合。如果我们选择另一个基因(比如眼睛的颜色),它在家系图上的路径将会非常不同,而这些基因将会在一个比维多利亚古老得多的祖先那里合并。如果我们挑出决定了鲁珀特王子褐色眼睛的基因,和决定了海因里希王子蓝色眼睛的基因,那它们的合并至少跟眼睛颜色基因在古代的分离事件同样古老,而一个基因分成褐色和蓝色两种亚型,这件事发生在史前时期。每一段DNA都有自己独立的家系图,不同于我们通过出生、婚配和死亡记录追踪姓氏得到的家系图,而是与之平行。
我们甚至可以用同样的方法研究同一个人身上两条相同的基因。查尔斯王子 有一双蓝眼睛,由于蓝色眼睛是隐性遗传的性状,这意味着他有两条蓝色眼睛基因 。这两条基因必然在过去某个时候合并,但我们不知道它发生在何时何地。通常是在几千年前,但对于查尔斯王子的特殊情况来说,这两条蓝眼睛基因的合并可能晚至维多利亚女王。这是因为,查尔斯王子的家系实际上可以经由两条线追溯到维多利亚女王:一条线是通过国王爱德华七世(King Edward VII),另一条是通过黑森的爱丽丝公主。在这个假设的框架下,维多利亚的一条蓝眼睛基因在不同的时间复制了两个副本。这同一个基因的两个副本分别传递给了现任女王 (爱德华七世的曾孙女)和她的丈夫菲利普亲王(爱丽丝公主的曾孙)。因此,来自维多利亚的一个基因的两个副本便可能在查尔斯王子身上再度相遇,分别坐落在他的两条不同的染色体上。事实上,几乎可以肯定这样的事情一定会发生在他的某些基因上,不论它是不是决定蓝眼睛的基因。而且,不管他那两条蓝眼睛基因是在维多利亚女王那里合并,还是在更早的某位祖先那里合并,这两条基因必定在过去某个特定的时候有个最近共同祖先。不论我们谈论的这两条基因来自同一个人(比如查尔斯),还是两个不同的人(比如鲁珀特和海因里希),逻辑都是一样的。对于任何一对等位基因,不管它们来自同一个人还是不同的人,下面的问题总是适用的:回溯历史,这些基因在什么时候、在谁身上合并?扩展开来,我们还可以针对种群里位于相同遗传位点(基因座)的任意三条或更多条基因问同样的问题。
如果回溯到更古老的时代,我们还能针对不同基因座的基因问出同样的问题,因为基因可以通过“基因复制”过程在新基因座生成新基因。在《吼猴的故事》和《七鳃鳗的故事》中我们还会遇到这种现象。
每个基因或DNA片段都有一系列合并点以特有的样式绘成特定的基因家系图。血缘相近的两个人会在许多基因的家系图上处于相邻的位置。但同时会有另一些基因家系图投“少数票”,让他们跟血缘较远的亲戚相邻。我们可以把人的亲属关系看成基因投出的多数票,好比某些DNA片段投票认为女王是你的一位不算太疏远的表亲,还有一些DNA片段则争论说你跟另一些表面上看起来要疏远得多的个体更亲近,而就像我们将会看到的那样,有时候那些亲戚甚至属于不同物种。若是询问它们关于历史的看法,每个基因都会有自己的独特见解,因为它们各自在代际搏杀出了一条不同的道路。只有对基因组上许多区域进行取样,我们才有希望获得一个全面的图景。但如果一对基因落在同一条染色体上相距很近的位置上,那我们就必须小心了。要想理解其中的道理,我们需要对重组(recombination)现象有所了解。
每个精子或卵细胞在形成的过程中都会发生重组。发生重组时,随机选择的DNA片段在染色体之间进行了交换。平均而言,人类每条染色体只发生一次或两次交换(形成精子时少些,形成卵细胞时多些,尚不清楚为什么会这样)。经过许多许多代以后,最后染色体上许多不同的片段都曾被交换过。一般来说,同一条染色体上的两个DNA片段距离越近,二者之间发生交换的可能性越低,也就越有可能被同时遗传给同一个后代。
因此,我们考虑基因的“选票”时必须记得,一对基因在染色体上的距离越近,就越有可能经历相同的历史。这就驱使着相邻的基因投出相同的选票,以至于在极端的情况下,整段整段的DNA紧紧绑定成一个单元,整体穿过历史的长河。在生物遗传的国会里,有许多这样的党团,其中两个尤为引人瞩目,不是因为它们的历史观更加可靠,而是因为它们常常被用来解决生物学中的争端。二者都有着性别歧视,一个只借助雌性的身体遗传,而另一个从来不曾离开过雄性的身体。我们之前提到的基因遗传都是无偏见的,而这两位便是最大的例外。它们是Y染色体和线粒体。
就像姓氏一样,Y染色体(的雄性特异性部分)总是只通过男性遗传。和其他少数几个只有雄性才需要的基因一起,Y染色体包含的遗传物质实际上可以将哺乳动物胚胎切换为雄性发育模式,而脱离雌性模式。另一方面,线粒体DNA只通过雌性家系遗传,但线粒体并不负责让胚胎发育成雌性,雄性也有线粒体,只不过它们不会把线粒体传递给后代。就如我们将在伟大的历史性会合中看到的那样,这群小东西的前身曾经是自由生活的细菌,大约在20亿年前,它们住进了细胞里,从此只在细胞内以简单分裂的无性生殖方式进行复制。它们丧失了作为细菌的诸多特质和大部分DNA,但仍保留了足够的DNA让遗传学家们可以施展手脚。我们体内的线粒体构成了一个独立的遗传复制家系,跟主流的细胞核家系并无关联,而后者包含着我们认为属于“自身”的基因。
Y染色体和线粒体都被用于追踪人类的历史。有一份设计精巧的研究在现代不列颠地区沿直线取样,研究了Y染色体上小片段DNA的情况,发现盎格鲁–撒克逊人的Y染色体从欧洲大陆向西横穿英格兰,在威尔士边境戛然而止。不难想象为什么这条只由男性携带的DNA不能代表基因组的其他部分。举个更明显的例子,维京人的Y染色体(连同其他基因)乘着长船,散布到遍及各处的人群中。在大多数人类社会中,跟女性比起来,男性更倾向于在离他们的出生地不远的地方定居和繁衍。看来似乎维京人的Y染色体违背了规律。从统计上看,跟背井离乡的冒险者比起来,其他维京基因更偏爱家乡的土地,而Y染色体有更丰富的“旅行经历”:
你抛下了怎样的女人,
还有炉火和田亩,
去追随那灰色苍老的寡妇制造者?
——鲁德亚德·吉卜林 《丹麦女人的竖琴之歌》
线粒体DNA同样可以透露许多信息。比较一下你我的线粒体DNA,我们就能知道它们多久之前有着同一个线粒体祖先。而且,由于我们的线粒体全都来自我们的母亲、外祖母、曾外祖母……对线粒体的比较就能使我们得知,最近母系共同祖先生活在什么年代。对Y染色体做同样的事情应该能告诉我们最近父系共同祖先生活的年代,但由于技术上的原因,实际上并没有那么简单。Y染色体和线粒体DNA的美妙之处在于,它们都不会受到两性基因组混合的影响,因此这类特殊的寻根任务变得容易。
如果确定了所有人类线粒体的最近共同祖先,我们也就锁定了作为我们的母系最近共同祖先的那个“人”。有时候她被称为线粒体夏娃,也就是这个故事的主人公。显然,对应的父系共同祖先也可以被称为Y染色体亚当(Y-Chromosome Adam),所有男人都携带着亚当的Y染色体(神创论者们请克制,不要刻意误引这句话)。如果姓氏的遗传总是严格遵循着现代西方的规则,那我们也都随着亚当的姓,不过这样的话姓氏也就失去了存在的意义。
“夏娃”这个说法很容易招致误解,因此最好略做防范。实际上这些误解很有启发意义。首先很重要的一点是,需要在此强调线粒体夏娃不是距离我们最近的“所有人的母亲”,就像Y染色体亚当也不是“所有男人的最近共同祖先”。类似的话常被用作新闻标题,却是罔顾事实的说法,引起了很多误解。实际上,我们沿着不同的路径追溯历史时会遇见许多男性最近共同祖先和许多女性最近共同祖先,而夏娃和亚当只不过是其中的两人。当我们分别沿着从母亲到母亲再到母亲,或从父亲到父亲再到父亲这样的特殊路径穿过家系图,我们找到的共同祖先就会是夏娃和亚当。但基因还可以通过许多不同的路径贯穿家系图:母亲——父亲——父亲——母亲,或母亲——母亲——父亲——父亲等,不胜枚举。每一种可能的路径都会有一个不同的最近共同祖先,所有的最近共同祖先共同将全人类联系成一个整体,有些最近共同祖先要比亚当或夏娃晚得多。
其次,夏娃和亚当并不是一对夫妇。即便他们曾经相遇,那也纯粹是概率极低的偶然事件,他们甚至可能相隔了几万年。有多方面的独立证据支持更进一步的观点,即女性共同祖先要早于男性共同祖先。在繁殖成功率方面,男性之间的差异要大于女性之间的差异。不同女性的子女数量可能相差5倍,但最成功的男性的子女数量可能是不成功者的数百倍。这意味着,一个成功的男性,一个史前时代的“成吉思汗”(Genghis Khan) ,能以很快的速度成为一名共同祖先。而一个成功的女性需要更多代才能达成同样的壮举,因为她的家庭规模不可能很大 。在不同人群中比较父系和母系的基因家系图,大多数情况下的结果都支持这一论断。不过,这不是一个严格的规律,而是一个一般情况下成立的统计结论。而且,也许有些出乎意料,但最近的遗传研究表明我们现在的Y染色体亚当就是一个特例,他生活的年代可能早于我们现在的线粒体夏娃。
第三,亚当和夏娃是个不断易主的荣誉称号,而非某个特定人物的名字。如果明天某个边远部落的最后一名成员突然死去,那么亚当或夏娃的接力棒可能会骤然前推几百年。根据不同的基因家系图定义的其他最近共同祖先也是同样的情况。为了说明其中的道理,让我们假设夏娃有两个女儿,其中一人最终繁衍出塔斯马尼亚的原住民,另一人则是剩余全体人类的祖先。再做一个完全有可能的假设,即联结“剩余全体人类”的母系最近共同祖先所生活的年代比夏娃还要晚1万年,其他所有并行的夏娃后代分支当中只有塔斯马尼亚人幸存,别的支系全部灭绝了。当最后一名塔斯马尼亚人楚格尼尼死去的时候,夏娃的头衔就立刻被推进了1万年。
第四,亚当和夏娃在他们生活的年代并没有什么可以让他们脱颖而出的特别之处,除却那富有传奇色彩的头衔。线粒体夏娃和Y染色体亚当并不孤单,他们各自有着许多同伴,甚至可能各自有许多性伴侣,并和他们留下了至今仍在的后裔。他们唯一与众不同的地方在于,亚当最终在纯父系家系上留下了许多后代,夏娃则在纯母系家系上留下了许多后代。他们同时代的其他人则在别的家系上留下了后代,而且总数并不逊色于他们。
“夏娃”和“亚当”不光名字引人遐想,而且在逻辑上也同样令人信服。一条单一的纯母系家系和一条单一的纯父系家系必然曾存在于某个时间点,这是家系图的原理所决定的。 但这两个名字指向的各是一个变动的点,一个庞大的树状基因家系图的根部。如果要用线粒体和Y染色体来解析人类历史,那我们就不能只关注夏娃和亚当。在这两个基因家系图上,其他所有合并点要重要得多。而且即便是在处理其他合并点时,我们也必须极其小心。
在我写本书第一版时,有人送给我一部BBC的电视纪录片《故土》( Motherland ),号称是“一部极为深刻的电影”“非常美丽,令人难忘”。影片的英雄主人公是三位从牙买加移民来到英国的“黑人” 。他们的DNA被拿去跟全球数据库比对,试图找到他们被掠作奴隶的祖先来自非洲哪个地区。然后制片公司安排了一场伤感的“重逢”,让我们的英雄和他们失散许久的非洲家人相认。他们用来进行序列比对的是Y染色体和线粒体DNA,正如我们前面提过的,这部分DNA比基因组其他部分更容易追踪。但是不幸的是,制片人从来没有讲清楚这些方法的局限,特别是他们近乎有意欺骗了这些人还有他们失散的非洲亲戚们,使重逢场面越发地催人泪下。从电视制作的角度看,他们这么做毫无疑问有着充分的理由,但事实上这场重逢根本不值得如此动情。
让我解释一下。当马克(Mark,后来改用部落名Kaigama)访问尼日尔的卡努里(Kanuri)部落时,他相信自己回到了“族人”的土地。葆拉(Beaula)来到几内亚外海的一个小岛,8名布比族(Bubi)妇女迎接了她,把她看作失散许久的女儿,她们的线粒体DNA跟她吻合。葆拉说:
就像血与血相融……就像是一家人……我只是哭,眼睛里充满了泪水,心怦怦狂跳,脑子里只有一个念头:“我回到了故土。”
这些煽情的话尽是胡扯!她不应该被如此欺骗,以至于产生这样的想法。就已有的证据来看,不管是她还是马克,他们访问的那些人其实只是与他们共享线粒体而已。事实上,马克已经被告知他的Y染色体来自欧洲,这让他很不安,后来他得知自己的线粒体有着令人骄傲的非洲根源,就明显松了一口气。葆拉当然没有Y染色体,但他们显然没想着去看看她父亲的Y染色体,尽管这会很有趣,因为她的肤色其实相当浅。没人告诉葆拉和马克以及观众们,他们线粒体外的DNA几乎一定来自许多不同的“故土”,跟那个出于纪录片的目的而确定的故土距离遥远。如果追踪他们的其他基因,他们就会在成百上千个不同的地方都有同样催人泪下的“重逢”,遍及非洲和欧洲,很可能还有亚洲。当然,这样也就破坏了片子的戏剧性。
请记住这个例子,因为我们接下来将要处理一个关于人类起源的主要争论,论辩所用的证据也是线粒体和稍晚些的Y染色体DNA。“走出非洲”理论认为非洲以外地区所有现存的人类都来自大约10万年前到5万年前的一次大迁徙。争辩的另一方是“独立起源”理论或“多地区起源说”,持这种观点的人相信如今生活在亚洲、澳大利亚和欧洲的人在远古时代就是分开的,各自独立地从当地的早期直立人进化而来。这两派的名称都有些误导。“走出非洲”这个名字的不足之处在于,其实所有人都承认,只要追溯得足够远,我们的祖先必定来自非洲。“独立起源”同样不是一个理想的名字,也是因为只要追溯得足够远,不管哪个理论都承认,分歧将不复存在。真正的分歧在于我们走出非洲的日期。所以我们换用另一种说法,把两种理论分别称为“晚近非洲起源说”(Recent African Origin,RAO)和“古代非洲起源说”(Ancient African Origin,AAO)。这种做法还有一个额外的好处,即强调了二者之间的连续性。
既然这篇故事名为“夏娃的故事”,那我们就先说线粒体证据。前面讲过,线粒体完全复制自母亲,这意味着它们的祖先源流合并而成的树状图整齐而清爽。在非洲以外地区,原住民的线粒体似乎总是属于两条分支之一,或者可以把这种分支称为“单倍群”(haplogroup):不是M型(主要在亚洲)就是N型(广泛分布于欧亚大陆)。一般来说,一段属于M型的DNA序列和另一段属于N型的序列相差大约30个DNA突变。既然知道了线粒体DNA里哪一部分比较重要,哪一部分可以随便变化而不影响功能,我们就可以用“分子钟”技术(参见《天鹅绒虫的故事》后记)来估测积累这些突变大概需要多长时间。人类和黑猩猩的线粒体相差的不是30个突变,而是大约1 500个。假设人类和黑猩猩之间累积这些差异花了700万年(我们将在《黑猩猩的故事》里检视这个有争议的数字),那么M型和N型之间的差异大概需要5万到9万年的进化。还有别的方法可以用于测算线粒体的突变率。利用从人类化石中提取的DNA,并对化石进行放射性测年,也得到了相似的结果,大概在6.5万年到9万年间。
从更大的范围看,M型和N型不过是繁茂的非洲基因树上的两根小枝丫,而最深的合并点(夏娃)还要古老两到三倍。很明显,最近走出非洲的线粒体替代了之前一直占据剩余世界的古老版本。无论是欧洲人、亚洲人、北美原住民,还是澳大利亚原住民以及其他人群,他们的纯母系家系全都是晚近非洲起源的。虽然我们知道,某个合并点跟特定历史事件的联系往往是松散的,但线粒体的例子还是支持近期走出非洲的观点。更准确地说,M型和N型分支内部分型的地理分布提示我们,大迁徙的人群离开非洲之角(Horn of Africa) ,绕过阿拉伯半岛南部海岸,通过亚洲到达世界其他地区,抵达澳大利亚的时间刚好可以解释蒙戈人化石 所具备的完整的现代人特征。
不过请记得,这些故事都是基于一小段DNA。若是把线粒体当作人类历史的象征,那就落进了跟电视纪录片《故土》一样的陷阱。起码我们还要再咨询一下Y染色体的意见。
Y染色体的DNA含量比线粒体丰富数千倍,这意味着它的信息含量更加丰富,却也更难研究。目前的证据指向一个跟线粒体大致相同的进化模式,所涉及的分型虽不相同,但我们的Y染色体应该也是同样源出于非洲。我们还不能为最古老的合并点给出一个准确的时间估计,部分是因为2013年出土了一个罕见的非洲支系的遗存,这也许意味着可能有一个新的“亚当”生活在“夏娃”之前。在本篇后记中我们会再回到这个故事。随着越来越多非洲人的基因组得到测序,我们很可能会发现更古老的亚当(可能还有更古老的夏娃)。
非洲以外地区的纯父系家系就像是梢头伸出了几根细枝,除此之外,Y染色体的家系图完全是集中于非洲的。每一根细枝根部分叉的时间都跟线粒体大致相同(也许稍早一点)。在欧洲和亚洲,更细的分型的地理分布大致对应着今天线粒体的分布,却并不完全相同。多个分支可能对应着多次迁徙,或者同一次迁徙携带了多组不同的Y染色体,其中有部分得以流传至今,欧亚大陆上的男人们仍然携带着这些Y染色体的后代。
截至目前,晚近非洲起源说的情况还不错。但是,不管是线粒体还是Y染色体,都具有潜在的欺骗性。这并不只是因为它们都只代表了我们基因组中很小的一部分,甚至不是因为它们都只偏重于单一性别。问题在于,任何一个单一的家系图都受到偶然机会和自然选择的巨大影响,其中后者的影响更为隐蔽。以Y染色体家系扩散出非洲为例,它可能代表了一次人类大迁徙,却也可能只是一次偶然,或者是自然选择的结果,也许根本不存在什么大迁徙。我来解释为什么这是可能的。想象一个几十万年前的世界,人口稠密,人们从不迁徙,只和邻居通婚,如果Y染色体上出现了一个潜在有利的新基因,比如说让胡子变得更加茂密,让我们来考虑一下这个新基因的命运。在严寒的气候下,这个基因会比其他版本更受青睐。而且,由于Y染色体上的全部DNA都是整体一起遗传的,那些碰巧位于有利基因附近的基因也同样得到了这个“正向选择”的好处。当这个Y染色体和它的后代们通过通婚散布北半球的时候,旧的版本就会被替代。如果我们今天只看Y染色体,就很容易错误地以为它的家系图代表了整个种群的快速扩张和替代,而实际上那不过是单个“基因”的快速扩张和替代。换句话说,尽管基因像涟漪一样传播开去,可种群自己有可能还停留在原处。
这个假想的情形说明了一个重要而普遍的原则,即单个基因家系图不足以把自然选择那看不见的手跟更普遍的变化区分开,比如种群规模的变化、迁徙活动或者部族的分裂。要重建历史上的人口学特征,我们的DNA证据需要横跨整个基因组。
在这场探索中,遗传重组是我们的盟友。你应该还记得,重组是切开并重新连接DNA片段的过程。有些基因曾频繁地被重组过程分开,比如在染色体上相距很远的基因,它们可以为人类历史提供多方面的见证。事实上,只选择相距遥远的基因实在是过于局限了。我们正在开发把全部DNA都加以利用的新技术。这是未来的必然趋势,但它要求我们先解决面前的问题,即重组的复杂性。
首先想象一下如果我们逆着时间追溯一群人的全部DNA会发生什么。如果一段DNA序列的两个副本可以追溯到某一条单独的染色体,我们知道它们会在某个共同祖先那里合并。但如果涉及的是一大段DNA长序列或者一整条染色体,我们就必须考虑另一种可能性。一段DNA序列副本内部的片段有可能来自多个不同的祖先。顺着时间去看,如果来自父亲的片段和来自母亲的片段合并成了一条新的染色体,那么就会发生这种事情,即我们逆着时间追溯的时候所见到的不再是两条家系合并成一条,而是一条家系分叉生成两条。这条染色体不同部分的历史在这个岔路口分道扬镳,各自回退。
家系逆向合并或分支形成的图形被称为祖先重组图(ancestral recombination graph,ARG),此处所谓的“图”指的是交错的线条组成的网络。有时候它还被称为遗传历史学家的“圣杯”,因为计算出这幅图就好比是把一大堆基因组携带的系谱学信息全部压缩起来。不幸的是,这种计算是不可能实现的。哪怕只是寥寥几个基因组之间的关系,也需要无穷多的祖先重组图来表示,而且我们永远不能确定到底哪个才是完全准确的。遗传学家采用的是替代的办法,使用计算机将一系列概率较高的可能性进行平均。这样做或许显得粗糙,但基因组包含的信息是如此丰富,哪怕只对几个人使用这种方法都能得到丰厚的回报。惊人的是,哪怕只有一个人的基因组也同样可以运用这种方法,因为我们的大多数DNA都有双份副本,一份来自母亲,一份来自父亲。来自剑桥桑格研究院(Sanger Institute)的理查德·德宾(Richard Durbin)和李恒 (Heng Li)发明的这个方法能够挑选出一些可能的祖先重组图,它们可以合理地解释你的父源DNA和母源DNA之间的差异。配合“分子钟”技术,这种方法可以估算任何一段染色体的父源序列和母源序列在古代合并成共同祖先的年代。基因组各个部位都可以提供一个合并的年代,从而为你的基因历史绘制出一张全面的图谱,并且免于自然选择影响单个基因所导致的偏差。
刚刚说的是“你”的基因历史,当然这个方法首先需要获取你的个人基因组序列。本书的作者之一(理查德·道金斯)有幸对他自己的全部DNA进行了测序,当时是为了拍四频道(Channel 4) 的一部电视纪录片《性、死亡和生命的意义》( Sex, Death and the Meaning of Life )。我们在此用道金斯的基因组做例子,但重要的是,再过几年等测序变得足够便宜之后,每个读者都可以用自己的基因组做同样的事情。谁不想看看自己的基因组里记录着什么样的历史呢?
考虑到我们在《塔斯马尼亚人的故事》里看到的那些时间点,也许你会像我们当初一样,以为这些个人合并点也会相当晚近。这样的话你就错了。欧洲王室家庭姑且不论,大多数人的父源和母源基因的合并点都发生在至少2万年以前。事实上,有相当多的合并点距今超过100万年(这跟之前的结论并不矛盾,即个体的最近共同祖先要比基因的最近共同祖先晚得多)。因此,道金斯的DNA,或者任何一位读者的DNA,都可以被用于三角推断,一直追溯到我们的非洲根源,捕捉到人类的大部分历史。
要弄懂这种了不起的推理背后的道理,需要明白合并点的位置反映了种群过去的规模。种群规模越小,祖先家系碰撞的可能性越高,合并的速度也就越快。所以,如果基因组内许多不同的部位都在相似的时间合并,就暗示着一个较小的种群规模,在极端情况下甚至代表“瓶颈”的存在。相反,合并点的匮乏也就意味着在一段时间里种群规模很大。因此,“道金斯合并点”的频率可以被用于推断过去不同时间点的“有效种群规模”,如下图。
从个人基因组中读出人类的历史。 黑线反映了道金斯的父源和母源DNA(都来自欧洲)的共同祖源,即它们合并的年代。灰线来自一个典型的尼日利亚人。这种被称为PSMC的方法是由李恒和理查德·德宾发明的[247]。
图中随时间变化的线条揭示出一个典型的特征,即在大约6万年前,种群规模发生了一次急剧下降,这一点在非洲以外地区所有人类当中都是成立的。把这个下降看成一次数千名先驱者走出非洲的大迁徙,这种想法不仅诱人,而且很可能是正确的。尽管非洲撒哈拉以南地区的基因组显示,这里的种群规模也发生了一次下降(灰线来自一位尼日利亚人),但远远达不到同等严重的程度。事实令人震惊,哪怕你是地球上最后一位活人,也依然能从你个人的基因组里读出人类的大部分历史。
如果从单个卑微的个体能得出这样的故事,那么想象一下若是我们能够比较数十上百乃至上千人的基因组并为每个基因座推演完整的家系图会有怎样的威力!可惜,如此繁重的计算任务远远超出了当今计算机的能力。不管怎样,理查德·德宾实验室的同事斯蒂芬·谢弗尔斯(Stephan Schiffels)发明了一些捷径办法,使得我们可以估算更简单的东西:为少数几个人的每一个基因座计算出最近的合并点。下页图展示的结果就来自这样的分析,数据来源是9位来自全球不同地方的本土居民。在他们的基因组中有数百万个合并点,很好地为我们描绘了过去几十万年间人类内部通婚和分裂的历史。图中横线标注的时期存在极少数共享的合并点,意味着必然发生了通婚,不过极为罕见。这很有力地总结了我们从何而来的问题。
跟线粒体或Y染色体家系图比起来,这种全基因组分析才是对晚近非洲起源说的真正考验。为了强调这一点,我们把图上非洲以外的分支标成了白色。这些分支并不是从一开始就彼此分离的,与之形成对比的是墨西哥人的分支,干脆利落地标记着原住民对美洲的殖民。大约在6万年前确实发生过一次走出非洲的大迁徙,但它可能不是一劳永逸的。在最初的分离之后,出走的人群和其他非洲族群之间依然存在有限的通婚,可能持续了数万年。另外还有两个发现,让人对完全的晚近非洲起源说产生了疑虑。第一个发现是关于欧洲人和亚洲人的(特别是中国人和墨西哥原住民)。从图上可以看出,欧洲人和亚洲人分离的时间较晚,大概是在2万年前。但图上没有显示的是,谢弗尔斯和德宾发现,这些基因组中大约有十分之一早在10万年前就已经表现出了欧亚分离。这个时间意味着,早在近期走出非洲的大迁徙前,就存在着某种早期迁徙。第二个发现是,北欧基因组与尼日利亚基因组的差异之中有一小部分甚至来自20万年以前。这跟接下来那个故事里的证据是一致的。大多数欧亚人都会有百分之几的DNA来自尼安德特人或者别的某种古人。
人类来源总结。 本图反映了各地原住民基因组片段的最近合并点的分布情况。水平线代表各组之间少量的共享祖源所在的时间点。图片来自谢弗尔斯和德宾。
化石证据表明,现代人的解剖特征扩散到世界各处靠的是近期走出非洲的大迁徙。但似乎单独一次、孤立的走出非洲大迁徙是个过度简化的模型。关于这一点,我们的基因比他们留下的化石揭示得更清楚。诚然,一个典型的非洲以外地区的人有超过95%的DNA可以在最近10万年里追溯到非洲,但即使是这部分DNA也很可能来自不同的路径。而基因组中剩余的那一小部分隐藏着古老得多也神秘得多的祖先源流。考虑到我们每个人在过去任何时刻都有着海量的系谱学意义上的祖先,那么这种混合的情况也许并不出奇。不管你是谁,几千代以前,你的大部分祖先都是非洲人。不过,有几位祖先来自非洲以外地区当然也并不奇怪。就像我们将要看到的那样,非洲以外地区的人同样也有来自欧亚大陆的祖先,很可能可以追溯到各个地区的直立人。《夏娃的故事》提供的证据摧毁了那种简单的“亚当和夏娃”式的叙事。因为我们在那么多不同的地区有那么多祖先,根本不可能从如此多样的人类追溯到一个单一的种群,更不必说追溯到某一对配偶!最好从人的叙事转向基因的叙事:每一段DNA都有各自的历史,而我们的寻根之路就是把它们编织成一面挂毯。
《夏娃的故事》警告我们不要只凭一小段DNA就试图得出有普遍意义的推论。人们太容易轻易地假定单个基因的家系图可以为整个物种的历史代言,甚至连专业的生物学家都难逃这个陷阱,阿尔伯特·佩里(Albert Perry)和Y染色体亚当的故事就是一个例子。阿尔伯特·佩里是一位非洲裔美国人,曾是南卡罗来纳州的一名奴隶。他在死后名声大振,起因是2013年他曾孙的DNA被意外提交给一家商业系谱学公司,其Y染色体的家系被确认属于一支很早之间就分裂出去的支系,以前从未见过。阿尔伯特·佩里的古老家系得到了家族另一名男性成员Y染色体的确证,那是另一支族人的一位玄孙。随后在亚利桑那大学(University of Arizona)进行的遗传搜索工作也成功找到了几条位于同一个古老分支上的Y染色体。它们的那一小群携带者生活在今天的喀麦隆西南部,很可能佩里先生不幸的先祖就是从那里被掳走的。
Y染色体基因家系图上新近发现的这个古老分支意味着,我们需要重新确定一个新的“Y染色体亚当”。自佩里先生的父系家系跟我们其他人的家系分离以来,家系图的各个分支已经积累了成千上万的新突变。在最初宣布这个发现的时候,支系分离的年代被确定为大约34万年前,而用于支持这个结论的只是其中一小部分突变。最近通过分析全球各地的完整Y染色体,包括这个罕见的喀麦隆类型,研究者发现这个合并点以及相应的Y染色体亚当的年代为大约24万年前。不管我们采信哪种估计,它都早于现代人类的出现时间,这就是陷阱之所在。有些遗传学家(他们本不该如此无知)提出质疑,声称这根本就不可能:怎么可能一个现代人的基因甚或一整条染色体居然早于现代人自身的起源?
自不必说,神创论阵营抓住了这个说法,急于证明他们还有着更深层的误解。请放心,这样古老的分歧不仅可能,而且在意料之中。实际上,跟其他基因比起来,它们还算不上特别古老。根据迈克尔·布卢姆(Michael Blum)和马蒂亚斯·雅各布森(Mattias Jakobsson)2011年的发现,人类基因家系图上最早的分支点往往出现于超过100万年以前。也就是说,我们今天的许多基因差异都早于现代人类的起源,而且往往要早几十万年。我们再一次遇到了基因思维和个体思维的差异。
遗传学上的差异甚至可以追溯到几千万年以前,尤其当自然选择倾向于保存种群内部多样性的时候更是如此。下面这个例子就是这样。假设有A和B两种血型,赋予了机体对不同疾病的抗性。一种血型具有抗性的疾病对于另一种血型来说却是易感的。当某种血型数量众多的时候,能够攻击这种血型的疾病也就肆虐起来,因为它能传播开来。所以,如果B血型的人(姑且称为B类人)在种群中很常见,那么能够感染他们的疾病就会得以传播。于是B类人就会死亡,直到他们不再常见,而A类人会增加。反之亦然。只要我们有两种类型,稀少的类型就会因其稀少而受到青睐。这是保持多态性(polymorphism)的秘诀:为了维持多样性而青睐多样性。作为一种著名的多态性,早被人们熟知和理解的ABO血型系统很可能就是出于这种原因而被保持至今的。
某些多态性可以相当稳定,以至于哪怕新形成的物种也依然继承了这种多态性。我们的ABO血型多态性同样存在于许多猿类甚至是猴类当中。有些研究者认为,基于相同的原因,所有这些物种各自独立地“发明”了这种多态性。但是最近的研究表明,我们都是从同一位祖先那里继承了它,然后各自独立地把它保留了数百万年,留给不同的后代,原因很可能是那些疾病或者类似的疾病在此期间一直存在着。实际上,负责形成A型血和B型血的那些基因很可能在我们跟旧世界猴分离之前就已经分化了,那大概是在2 500万年前。进化上出现的这种特殊现象被称为跨物种多态性(trans-specific polymorphism),它无疑表明,人类内部的差异可能追溯到人类自己尚不存在的时期。
我们可以进一步演绎出更加惊人的结论。从某些基因的角度来看,你可能跟一些黑猩猩比跟其他人更相似。我跟一些黑猩猩的相似性要高于你我之间(或者我跟“你的”黑猩猩之间)的相似性。不管是作为个体的人,还是作为物种的人类,都不过是基因临时的载体,承载着不同来源的基因混合物。基因穿过历史的路径彼此交错,而个体是路上临时的交会点。这是在以家系图的方式重新阐释我在第一本书《自私的基因》中的核心观点。就像我在那本书中说过的:“我们完成我们的职责后就被弃于一旁,但基因却是地质时代的居民——基因是永存的。”在美国一次会议的会后晚宴上,我背诵了这样的诗句:
一个巡回的自私的基因说:
“身体,我见过许多许多。
你自以为聪明,
可我长生不朽。
你只是我用以生存的机器。”
作为身体对基因的即时回应,我拙劣地模仿了之前引用的那首《丹麦女人的竖琴之歌》:
那是怎样的身体,你先占据了她,
哺育了她,然后又抛弃了她,
去追随那盲眼钟表匠?
这本书是一部DNA的自然史。不同的路径贯穿时间,一堆看起来黯然无生气的指令把它们编织在一起,而这本书就是关于这些指令的历史。尽管听起来平凡乏味,但实际却截然相反。每一代,每一天,每一小时,这些指令都被织造成精细而多样的生命形式,使我们的朝圣由平淡趋向庄严。
从古代遗体中提取DNA肯定能跻身于我们这个时代最伟大的科技成就之列,相当于遗传学上的起死回生术。这门技术困难重重。随着时间的流逝,DNA会逐渐降解,即便留下了一些片段,也必定经过了化学修饰。死后不久就有大量微生物侵入了骨骼,将它们的基因组跟死者原先的基因组混在一起。更隐蔽的危险则是无处不在的污染问题,来自现代的DNA覆盖着每一个裸露的表面,充斥着我们周遭的空气:真菌孢子、飘浮的细菌、飞沫携带的病毒、人体皮屑以及各种生命过程留下的各种遗传碎屑。我们必须遵循极其严格烦琐的程序,才能可靠地对古代DNA筛选、扩增、测序和鉴定。
尽管人们想要克隆出已灭绝的物种,可直到最近都很少重构出完整的基因组,考虑到该技术的难度,这毫不奇怪。作为替代,大多数研究都着眼于小片段DNA,其中常被选用的就是我们前面在《夏娃的故事》里提到的线粒体DNA,因为这种母系序列在每个细胞里都有数千个副本。最早从尼安德特人遗骨中提取出的DNA序列片段就是线粒体DNA。用来提取DNA的那根骨头也不一般,正是来自最初在尼安德河谷发现的那具骨架,即“尼安德特1号”(Neanderthal 1)。1997年,德国斯万特·帕博 实验室公布了相关结果,该结果被广泛用以说明尼安德特人是跟现代人完全分离的支系。他们的线粒体跟我们相差平均超过200个DNA字母,而现代人内部的差异最多不超过大约100个字母。但请记得《夏娃的故事》里的教训。不同的基因会讲不同的故事,而线粒体DNA实际上相当于单个基因。本书第一版曾提醒大家小心其中的陷阱,因为当时只有线粒体DNA可用。今天我们可以更加全面地解决这个问题,这要多谢尼安德特人生活的严寒环境对DNA的保护。
2010年,帕博实验室公布了一个残缺不全的尼安德特人基因组草稿,用于提取DNA的遗骨来自三份克罗地亚地区的样本,距今大约4万年。3年之后,他们公布了一位5万年前的西伯利亚尼安德特妇女的完整基因组。时至今日,已经有许多尼安德特人的基因组可用,提供的数据量是线粒体DNA序列的几十万倍。
全基因组为我们打开了一扇窥见尼安德特人生活的窗户。比如那位西伯利亚尼安德特人,我们可以通过她的父源和母源DNA的相似性,推断出她的父母基本上是血亲通婚,其血缘亲近的程度相当于同父异母或同母异父的兄弟姐妹或者叔伯和侄女的关系。也许他们是由于种群人数的匮乏而不得不如此。我们在《夏娃的故事》里曾利用道金斯的基因组计算祖先的种群规模,同样我们也可以用单个尼安德特人的基因组来呈现尼安德特人种群在几十万年间的逐渐衰减,而同一时期里我们生活在非洲的祖先似乎正在经历种群规模的增长。我们还可以通过已知基因的突变来寻找进化变迁的证据。帕博实验室最近发表的一篇文章这样写道:“我们发现,跟骨骼形态相关的基因在尼安德特人的祖先家系中改变更多……而跟行为和色素相关的基因在现代人类家系中改变更多。”
不过可以理解的是,公众媒体只关心一个问题:我们是否曾和尼安德特人杂交?或者我们的基因组中是否有一部分来自他们?尼安德特人和现代人的DNA都不过是一串串字母,而且大部分是雷同的,那我们怎么才能确定尼安德特人在我们的基因组中是否留下了足迹?我们又不能拿一串现代人的序列,轻轻巧巧挑出里面散发出尼安德特人臭味的区域。
有一个办法可以回答这个问题。它依赖于一个事实,即尼安德特人生活在欧亚大陆。我们在尼安德特人和现存欧亚人当中寻找现存非洲人不具备的新突变,这些新突变可以作为近期共享祖源的指征。首先要找到在现代人内部存在差异的DNA位点,亦即同一段序列存在两个有细微差别的版本。通常这种差别只是单个字母的突变,即所谓的“单核苷酸多态性”(SNP )。人类基因组中分散着百万个甚至千万个常见SNP,平均每2 000个字母中就有一个。它们通常存在于基因以外的区域,未必有重要的功能。我们在这里要找的是中性的“标记”。
只是找到尼安德特人和(大多数)欧亚人共享的字母还不足以推断近期祖源。因为有这么一种可能,即他们共享的是旧版本,非洲人的才是新版本。为了核查这种可能性,我们还需要看看黑猩猩或大猩猩的对应序列,因为它们的版本通常是最初的版本。这样我们就可以找到把欧亚人和尼安德特人联系起来的新突变或“衍生”的突变。这方面有确凿的证据让我们得出结论:尽管并不频繁,但人类和尼安德特人绝对曾经杂交过。我们的基因组中有许多DNA长片段——通常是几万或几十万个DNA字母组成的连续片段——表现出这种共享的衍生突变的痕迹。
这种大段DNA包含着丰富的信息。比如,我们可以利用它们的长度来计算杂交发生的时间。之所以可以这么做,是因为时间过得越久,基因组中的长片段就越有可能被重组过程切断和交换。完整片段越长,杂交之后经过的代数就越少。与尼安德特人同时代的现代人DNA确认了这个现象。作为样本的古人类来自西伯利亚,有着现代人的形体特征,是名副其实的现代人( Homo sapiens sapiens ,即现代智人)。对他们来说,与尼安德特人的杂交必定是相当近的事件,而他们基因组里的完整尼安德特人片段确实要比我们的长。基于这些考量,我们与尼安德特人杂交的时间应该在6万年前到5万年前,让人想起我们走出非洲的大迁徙的时间 。
一个可以追问的问题是,这些共同的DNA片段到底是尼安德特人传给我们的,还是反过来由我们传给他们的?要回答这个问题,我们可以看看同一段DNA中所包含的其他SNP。如果这个片段最初来自现代人,那么它所包含的其他单字母突变应该在现代欧亚人和非洲人家系中累积,却不会出现在尼安德特人的祖源家系中。这样的突变非常少。出人意料的是,几乎所有DNA传递都是由尼安德特人向古代人类的传递。随着更多的古代基因组被测序,这个估计也许会有些微改变,但如果它是普遍的现象,那是不是意味着是尼安德特人的血脉混入了现代人,混血的后代在现代人的部族里长大成人?不一定。主流解释是,混入现代人基因组的尼安德特人搭上了现代人种群扩张的顺风车,而传入尼安德特人的现代人基因很可能在尼安德特人种群缩减的过程中丢失了。
还有一个有趣的现象:我们的基因组好像是“尼安德特人的荒漠”,相隔很远才有一个共同的SNP。最惊人的要数整条X染色体。通过对其他哺乳动物杂交的研究,我们知道许多影响生育力的基因都位于X染色体上,而且通常影响的是雄性的生育能力。有人指出,人类和尼安德特人的混血后代,特别是男性后代,可能会有生育问题,这也许可以解释为什么那些主要表达于睾丸中的基因较少来自尼安德特人祖源。如果这是真的,那我们的尼安德特人血脉很可能是经由混血女性而非男性传递下来的。
假设这些共同的DNA片段大多是由尼安德特人传递给我们而非反过来,那么我们到底有多少尼安德特人基因(neandergene)呢?你可以找一家商业公司测测你有多少“尼安德特成分”,结果将会微乎其微。一个现代欧洲人平均含有1.2%的尼安德特人DNA,而现代亚洲人则有大约1.4%,非洲人几乎不含任何尼安德特人基因。但如果我们把许多人基因组中的尼安德特区域合并在一起,它大概能覆盖20%的基因组,而随着越来越多活着的人的基因组被测序,这个比例还有望增加。事实上,我们可能携带着总体高达40%的尼安德特人基因组,零落分散在不同的现代种群中。显然,尼安德特人并不曾彻底灭绝,而且,如今很难再把他们当作一个跟我们不同的物种。
只需单个高质量的尼安德特人基因组,我们就可以进行如上推理。对古代DNA进行测序的能力为我们理解自己的进化历史打开了一扇神奇的新大门。与此同时,它还为我们引出了新的谜团,而这篇长序言使我们有了足够的准备,去理解其中最诱人的一个谜题。
《丹尼索瓦人的故事》很短,和我们对这群人的了解倒是相符,因为我们知道得太少了。他们得名于西伯利亚阿尔泰山的丹尼索瓦山洞(Denisova Cave),这个洞穴是因一位曾住在这里的18世纪的隐士丹尼斯(Denis)而得名。在10多年以前,几乎没人听说过这个地方,更别说知道这个地名怎么发音 。而现在,在关于近期人类进化史的争论中,它处于舞台正中央。2009年,约翰尼斯·克劳斯(Johannes Krause)和付巧妹(Qiaomei Fu) 尝试从4万年前的半个指骨中提取DNA。这块化石采自丹尼索瓦洞底深处,据报道,一位考古学家曾将其描述为“我见过的最貌不惊人的化石”。
事实证明,这块化石的惊人之处不仅在于其DNA保存得极其完整,更在于它后来对人们既成观念的扭转发挥了作用。最先被测序的是线粒体DNA,结果发现它跟现代人和尼安德特人都不相同,应该来自基因家系图上一个更古老的分支。大概1年之后,两颗出土于丹尼索瓦挖掘点几乎同一地层的臼齿贡献了更多的线粒体DNA。它们明显比尼安德特人的牙齿更大,更像是直立人或更早些的原始人类 的牙齿。等我们的朝圣走得更远一些,我们会遇见这些原始人类。如今那个指骨化石已经被彻底破碎用以提取DNA,于是我们现有的关于丹尼索瓦人的全部有形证据就只剩下那两颗牙齿。
迄今我们描述的发现尽管激动人心,但作为新的人类亚种存在的证据却尚薄弱。但现在你应该有了一些警惕,不会对从一个变成化石的线粒体中提取出来的那点儿DNA进行过度解读。幸运的是,那个丹尼索瓦人的手指尖在被毁灭的过程中给予我们的非凡馈赠是一个完整的基因组,而不只是线粒体DNA。这个基因组保存得如此完好,它所提供的DNA序列的可靠性堪与活人序列媲美。显然这为丹尼索瓦人赢得了在此讲述一个故事的资格。
跟他们的线粒体DNA比起来,丹尼索瓦人的完整基因组整体上看起来跟尼安德特人更为相似,不过它依然支持先前由线粒体得出的结论,即丹尼索瓦人是一个独立的亚种。尼安德特人在大约80万年前跟古人分离,而计算表明,丹尼索瓦人跟尼安德特人分离的时间大约在64万年前。根据基因合并点的年代推断,丹尼索瓦人的种群规模似乎也经历了跟尼安德特人相似的大衰减,而且很可能是在同一时期。那个手指尖化石所属的女孩大概是她的族群最后的幸存者之一。
更让人惊讶的结果来自丹尼索瓦人跟现代人的比较。因为已经知道尼安德特人也曾生活在西伯利亚,我们也许会猜测丹尼索瓦人的情况跟尼安德特人类似。还记得吗?现代欧亚人继承了尼安德特人的DNA,数量不多却不容忽视。可是相反,大部分现代人几乎没有任何丹尼索瓦人的DNA,只有一个族群例外。这个例外族群生活在位于遥远的东南方的……大洋洲!没错,距离西伯利亚有数千英里之遥而且气候迥异的大洋洲。今天,携带丹尼索瓦人DNA最丰富的是澳大利亚原住民、新几内亚人和菲律宾人,携带比例稍少一些的是波利尼西亚人 和西印度群岛 岛民。我们这里说的DNA数量也不是个小数目:它可以高达基因组的8%。发布丹尼索瓦人基因组的戴维·莱克(David Reich)和同事们还注意到,与这些地区临近的印度尼西亚东部族群几乎没有任何丹尼索瓦人DNA,他们因此推论说,丹尼索瓦人DNA并不是简单地经由现代人携带到大洋洲的。相反,丹尼索瓦人曾生活在大洋洲,就像他们曾生活在西伯利亚,只是西伯利亚的证据更加充分。看起来似乎现代人和丹尼索瓦人的混血主要只发生在大洋洲,但他们的混血后代没能再返回亚洲大陆,也许是受到了华莱士线(Wallace line)的阻隔。这是一条著名的生态分界线,由于深海海峡的阻隔而形成,我们将在《树懒的故事》里遇到它。但并不是说在别的地方就完全没有混血情况的存在。有个不无道理的说法认为,藏族人从丹尼索瓦人那里继承了跟高海拔适应性有关的基因,而他们生存的区域正好位于西伯利亚和大洋洲之间。
如果这还不够令人惊奇,那么让我们以另外两个结论作为收尾。目前提取出来的最古老的人属( Homo )DNA来自西班牙的胡瑟裂谷,我们前面讲到尼安德特人的时候曾提起过它。那些骨头比我们说的这些基因组还要古老10倍。尽管片段化严重,但他们的大多数DNA都提示他们属于尼安德特人,跟我们预期的一样。但他们的线粒体DNA要分开来看,因为线粒体DNA序列显示他们属于丹尼索瓦人。不用说你也知道西班牙离澳大利亚有多么远。
最诱人的结果是丹尼索瓦人、尼安德特人和现代非洲人之间的三重比较。你应该还记得,根据计算,平均而言丹尼索瓦人和尼安德特人的基因组之间的差异小于他们各自跟现代非洲人的差异。但是,在基因组的某些区域,非洲人和尼安德特人关系更近,反倒是丹尼索瓦人属于一个远远的分支。目前最好的解释是,丹尼索瓦人的部分基因组可以追溯到一个生活在非洲以外地区的古老得多的群体,仿佛有人在小声说:直立人。是不是某些现代东南亚人的祖源可以直接追溯到爪哇人这一目前已发现的最古老的古人类化石 ?也许是的。我们能证明吗?在这个飞速发展的领域,很难预计到底还有些什么惊人的证据躺在角落里。变化的节奏这么快,无疑我们现在写作的这些内容用不了几年,甚至只要几个月就会过时,甚至被推翻,这也提醒我们这个故事到这里就该收笔了。
在本书前一个版本中,尼安德特人讲了一个故事,而这个故事在这里被《丹尼索瓦人的故事》取代,尽管我们对丹尼索瓦人的了解远不如对他们的表亲尼安德特人的了解。丹尼索瓦人带给我们两条启示,这些启示并不局限于任何一组人类祖先。他们代表了我们关于自身历史的伟大新知,而这些新知只需通过一个指尖就可以得到。更重要的是,他们代表了我们的无知。人类的故事远比我们过往相信的更复杂。可以确定的是,在前方还有许多丰实的工作会让一代又一代研究人类进化的学生们耗费毕生的精力。而几乎可以肯定的是,我们仍然有望发现其他有待发现的古代人类亚种,而他们之间有着复杂的混血历史。在历史上不同时期里,人类很可能也做过同样的事情。我们会在自己的近亲黑猩猩中见到这样的情况,在稍远一些的亲戚比如长臂猿中也是如此,实际上这样的情形在前方整个朝圣之旅中都不鲜见。
本篇的两个故事都只关注人类和人类的基因。当然,所有物种都有自己的家系图,所有物种也都传递着遗传物质。所有有性生殖的物种——实际上这涵盖了大多数物种——都有自己的亚当和夏娃。基因和基因家系图是地球上所有物种普遍具有的特征。猎豹的DNA揭示了1.2万年前的种群瓶颈,这个瓶颈对于猫科保护主义者来说非常重要。玉米DNA上打着明显的印记,标记着它在墨西哥长达9 000年的驯化史。不同HIV 毒株在家系图上的合并模式可以被流行病学家和医生们用来理解和控制这种病毒。基因和基因家系图揭示了北半球动植物群的历史,比如冰川消涨带来的大规模迁徙:冰川扩张迫使温带物种进入欧洲南部的避难所,而冰川消退使极地物种被困在孤立的山峰上。所有这些事件以及更多其他事件都可以通过DNA在全球的分布情况来追踪。
迄今为止,对其他物种进行的遗传研究主要着眼于单个基因,但对人类DNA的分析正使得一连串的全基因组技术如星火燎原一般迸发,这注定将革新整个生物学领域。我们的孩子将会以崭新的眼光看待地球生命的进化,这是确定无疑的。虽然我们自己的基因组已经得到了深入的研究,但我们知道这些技术仍然只是碰到了皮毛而已。我们知道,基因组里还有更多的历史包含在“基因家系图”的形状和结构里,同样的历史还包含在一代代传下来的DNA片段的身份里。我们还知道,各种各样的生物还有不知道多少亿的基因组正等着讲述它们自己的故事。
我之前提到过我在《解析彩虹》一书中用到的一个说法,“死者的遗传之书”。在那本书里,我用这个说法来让当时的预言显得更戏剧化:也许DNA最终能让我们详尽地读出我们的祖先曾在什么样的状况下生活。如今虽然我们自己的DNA故事篇章不曾改变,但《丹尼索瓦人的故事》为我们提供了一种略微不同的解读。现代技术对DNA的解读方式使我们可以从时间上和空间上定位史前人类种群经历的关键事件:他们的迁徙,分裂和重逢,瓶颈和扩张。我为当今统计遗传学技术的鉴证能力所折服,它让那些深埋在过去中的信号重见天日。我预见还将有更多惊人的发现,不光是人口学和地理学方面的,而且还会有关于我们祖先的整个生活的,那将是一部讲述祖先的故事的数字编年史。