对莫诺金句一种幽默的展示
资料来源:Dr. Simon Silver, University of Illinois-Chicago.
只要适用于大肠杆菌,就同样适用于大象。
——雅克·莫诺(Jacques Monod),生物学家
“我们拟提出脱氧核糖核酸(DNA)的一种结构。这种结构的崭新特点具有重要的生物学意义。”以这句话作为开头的詹姆斯·沃森(James Watson) 和弗朗西斯·克里克(Francis Crick)在1953年合作发表的论文,宣布他们找到了一个新的,并且是正确的遗传物质模型。DNA是一种重要的遗传物质,在古细菌界、细菌界、原生生物界、真菌界、植物界与动物界的生物中作为遗传基础。之后又过10多年的时间,基因密码也被破解。还有更多的遗传奥秘等待我们去发现。
每个生物界的成员,它们的细胞、组织和器官(如果有)都在一些重要方面有很大的不同。每一生物领域里面也存在丰富的多样性,比如动物界的跨度就从微小浮游生物一直到“巨无霸”级别的海生与陆生哺乳动物。生物的分类,也是根据相似与不同划分,一直以来主要以形态作为依据。长期作为主流的假设是,两个物种在形态上的差别越大,它们在基因层面的共同之处(如果真有)就越少。
待你读到本章结尾,你就能体会到生物外表可能具有欺骗性。本章将会揭示多个科学家茅塞顿开的时刻,包含数个令人震撼而又美丽的关于发现的故事,这些发现足以塑造和重塑我们对动物进化历程的认识。从中可以看到,不同生物形态之间存在深入而又出人意料的联系。我会从一种小到只能用显微镜观察的细菌带来的一些深刻见解说起,由此揭开基因作用逻辑的基本原理。接下来进阶探讨一些更复杂的生物以及果蝇体内的同源异形基因,再一路拓展到整个动物界。
想想我们体内一些不同类型的细胞,它们都在做什么,各自又是怎么做到的。血液里的红细胞将氧气带给组织,消化器官里的细胞处理我们摄取的食物,神经元携带电脉冲在我们的整个神经系统穿梭,肌肉细胞驱动我们的身体部件。这些细胞类型的特化关键在于它们有选择地合成蛋白质,正是这类物质承担了我们身体内部全部的工作。红细胞合成海量的、能跟氧气结合的血红蛋白,胰腺里的细胞不断分泌胰岛素和其他一些蛋白质,以便将食物分解为可用成分,神经元合成可以形成电势的蛋白质,肌肉细胞合成的蛋白质可以形成长纤维,这些纤维收缩产生力。不过,尽管这些细胞都各有自己的特化 任务,但也同时具备一模一样的基因信息,也就是一模一样的DNA分子。看上去就像是通过某种方式,每一类型的细胞都只合成某些蛋白质而不会合成其他蛋白质,由此跟其他细胞形成区分。像这样只在特定位置而不在其他位置、只在特定时间而不在其他时间有选择地合成蛋白质,是细胞顺利构造复杂生物必不可少的条件。
但是在想明白动物体内的各种细胞到底是怎么特化出来的之前,生物学家先要解决一个基本谜题:像大肠杆菌这么简单的一种生物,它们的基因信息怎么存储、复制与解码?大肠杆菌有很多种,有的对我们的身体有益,有的非常凶险。但在分子生物学家看来,大肠杆菌一直是一支绝妙盟军,教给我们很多关于基因与蛋白质的作用机制与逻辑的基本规则。由这种简单细菌引发的深入思考,为人们探寻更复杂生物的发育和进化奠定了具有决定意义的基础。
最早引起生物学家兴趣的,是一种现在被称为“酶诱导”的现象。大肠杆菌十分喜爱葡萄糖这种单糖,但如果找不到葡萄糖,大肠杆菌也能分解其他糖类供自己使用。比如乳糖属于双糖,大肠杆菌用一种叫“β-半乳糖苷酶”(Betagalactosidase)的物质就能将它分解为葡萄糖和半乳糖。有趣的是,如果研究者用葡萄糖或其他碳源培养大肠杆菌,全程几乎检测不到β-半乳糖苷酶,大肠杆菌合成这种酶的速度缓慢到近乎难以察觉。显然,这种情况下,大肠杆菌并不准备浪费自己的能量去生产一些它不需要或不能使用的酶。但只要研究者往一团不含葡萄糖的培养菌群中加入乳糖,大肠杆菌生产β-半乳糖苷酶的速度就会暴增1 000倍,研究者只需等待短短3分钟就能确定无疑地检出这种酶的存在。这就是说,大肠杆菌以某种方式感觉到了乳糖的出现,并且立刻“意识”到自己现在用得上β-半乳糖苷酶,于是如受诱导般开始源源不断地合成该酶。问题是,这么简单的一种细菌怎么会“知道”自己应该制造哪一种酶呢?最适用的酶刚好受它“命定”要分解的化合物诱导而合成出来,这又是什么神奇规律?
这些问题的答案由弗朗索瓦·雅各布(François Jacob)和雅克·莫诺率先揭晓,他俩凭这些发现与安德烈·利沃夫(André Lwoff)分享了1965年的诺贝尔生理学或医学奖。这三位可不是不问世事的象牙塔中的理论家。第二次世界大战期间莫诺在法国抵抗运动中担当领导人,利沃夫收集过情报,偶尔还在自己的公寓收留不幸被击落的盟军飞行员,雅各布以自由法国医疗兵的身份参加了非洲战役,再后来,1944年8月,他在法国诺曼底战役中受了重伤。第二次世界大战结束之后,雅各布与莫诺就在巴黎的巴斯德研究所(Pasteur Institute)合作。
这就是三位科学家在他们的研究工作开始之际所处的特殊的历史背景,他们的发现对现代生物学具有根本性的重要影响,加上他们三位各具特色的非凡个性,使细菌的酶诱导现象与基因作用逻辑成为现代生物学史上最扣人心弦的故事之一。
我们必须掌握DNA、RNA以及蛋白质的结构与功能的基础知识,才能充分理解酶诱导现象的作用原理及其对更复杂生物的意义。我也知道这些词看上去可能很陌生,甚至令人生畏,但只要我们能分析出这些成分怎样起作用,并理解它们的不同职责与相互影响时,这背后的生物学逻辑就会浮出水面。最重要的是,我们很快就要讲到一些重大发现,至于这些发现能为我们带来什么启发,就取决于我们对构成现生生物的各类不同分子的理解程度。
DNA、RNA与蛋白质之间的关系,可以归纳为DNA是指导合成RNA的模板,RNA又是指导合成蛋白质的模板。于是存储在DNA里的遗传信息就可以分两步解码,用于合成在细胞和生物体内发挥实际作用的蛋白质。
我先解释一下染色体、基因与DNA这几个名词(见图3-1)。细胞里每个很长的DNA分子构成一条染色体。基因是DNA分子上的一个个片段。DNA由两条核苷酸长链组成,每个核苷酸分子都带有4种截然不同的碱基(base)中的1种,这些碱基分别简写为A(Adenine,腺嘌呤)、C(Cytosine,胞嘧啶)、G(Guanine,鸟嘌呤)和T(Thymine,胸腺嘧啶)。DNA的两条长链由基于碱基互补配对原则(A-T、G-C)两两配对的每一对核苷酸碱基之间的氢键连接在一起,形成双螺旋结构。
图3-1 染色体、基因与DNA
注:染色体是主要由DNA和蛋白质构成的大分子,编码了上千甚至更多的基因。DNA由两条核苷酸链缠绕而成,这些核苷酸按所带碱基不同也分为4种,两条核苷酸链由对应碱基之间的氢键连接在一起。基因是长短不一的DNA片段。
资料来源:Leanne Olds.
不同生物的染色体数量不同,可能少到只有一条(比如大肠杆菌),也可能更多(比如人类就有23对染色体)。DNA里独一无二的碱基序列(比如ACGTCGAATT……)正是编码在每个基因里的独特信息。
现在就来看看DNA里的信息是怎样解码的。要解码一个基因的信息,第一步为转录(transcription),这牵涉到要为这个基因合成一段转录副本——单链的信使RNA(简称mRNA),mRNA应与这个基因所在的一段DNA单链按照前面提到的碱基互补配对原则形成互补。第二步,细胞通过翻译将这段mRNA直接解码为一段氨基酸序列(见图3-2)。在这个过程中,细胞用通用遗传编码方法,将RNA序列翻译为氨基酸序列。蛋白质是由许多氨基酸像搭积木一样连接形成的长链。基因的碱基序列与蛋白质里的氨基酸序列存在直接对应关系。每种蛋白质含有的氨基酸序列决定了这种蛋白质的形状与化学特性,是否携带氧气、形成肌肉纤维或分解乳糖,等等。
图3-2 解码DNA里的信息通常分两步进行
注:第一步是转录形成一个信使RNA分子,第二步是将这个信使RNA翻译形成一个蛋白质分子。
资料来源:Josh Klaiss.
回到大肠杆菌里发生的酶诱导现象,理解的难点在于这种细菌怎么做到只在乳糖出现时制造β-半乳糖苷酶。雅各布与莫诺共同研究发现这种酶的产生由β-半乳糖苷酶基因上的一个开关控制。如果乳糖不存在,这个开关就处于关闭状态,只要乳糖一出现,开关就仿佛“啪”的一下打开。开关有两个关键部件,其一是一种蛋白质,叫作“乳糖阻遏物”(lac repressor),其二是这段乳糖阻遏物可以结合一小段DNA序列,该序列位于β-半乳糖苷酶基因附近。一旦这种阻遏物跟这段DNA序列结合,基因就会关闭,此时不会有任何RNA或蛋白质产生。
但只要乳糖出现,这种阻遏物就会从那一小段DNA上脱落,RNA转录与β-半乳糖苷酶合成进程随即开始(见图3-3)。借助乳糖阻遏物调控酶的合成进程是基因作用逻辑的经典实例,表明基因只在有需要时才发挥作用。大肠杆菌有4 288个基因,但在任意给定时刻只会用到其中一部分。人类有超过25 000个基因,但任何一类细胞或器官都只会用到其中很少的一部分。我们将从细菌的基因作用逻辑中看到以下两个特征:
图3-3 基因开关在大肠杆菌细胞中控制β-半乳糖苷酶形成与乳糖代谢
注:如果周围没有乳糖,阻遏物就跟这个开关结合,使基因不能进行转录。一旦周围出现乳糖,该阻遏物就从基因开关上脱落,转录与翻译发生,酶的合成开始。
资料来源:Josh Klaiss.
从细菌里发现基因开关带来的观念冲击,怎么强调都不为过。这不仅仅是控制细胞生理学的精巧机制,雅各布和莫诺还立即想到,他们这些发现有助于解开复杂生物体(比如我们自己)调控细胞分化进程的谜团。他们发现,血液、大脑、肌肉等的细胞功能,其特征都是为这些组织制造专用于完成其具体承担任务所需的蛋白质。细菌的酶诱导现象为我们思考动物和器官里的特化细胞功能做了概念上的铺垫。雅各布和莫诺的天赋并不限于遗传学领域——他们全都写得一手好文章,在20世纪60年代早期发表的科研论文一直属于整个生物学文献里最优美、最明晰、最具说服力的作品。他们的才华在为他们的工作及其意义著书立说之际得到更淋漓尽致的体现。与在生物学界一样,莫诺的《偶然性和必然性》( Chance and Necessity )在文学界与哲学界广为人知,雅各布也写了好几部经典著作,包括一部非同凡响的自传。
这些潜在影响是那么深远,人们开始引用莫诺的金句:“只要适用于大肠杆菌,就同样适用于大象。”考虑到当年生物学知识的水平,这可是很大胆的一个主张。
要知道1965年那会儿我们离了解大象的生物学机制还很遥远。莫诺说得对吗?在这么微小的一种细菌身上发现的规律真的同样适用于当今陆地上体型最巨大的生物吗?告知我们答案的不是一头大象,而是一只小小的昆虫——果蝇,一系列全然出乎意料的革命性发现即将从这小东西身上喷涌而出。而这一切还得从那些同源异形怪物说起。
果蝇的同源异形突变体一直以来吸引了大批的年轻生物学家。它们有的在头上长出足来,有的多长了一对翅,有的甚至在口器位置长出足来,看上去就像低预算影片拍出来的怪物,这是它们引人注目的一部分原因。更具学术吸引力的是这些惊人怪物出现的原因居然是:单个基因发生突变,从而导致身体部件整个儿变成完全不同的结构。为什么仅仅改变一个基因就能让身体发生如此戏剧性的改变?这些让人大开眼界的基因,它们的“正常”工作到底是什么?
求解这些问题离不开基因克隆技术的发展。随着这些方法得到越来越广泛的应用,果蝇的同源异形基因也吸引了一些勇敢的生物学家加盟研究。他们得到了遗传学多年研究成果的加持,这些研究揭示了这些同源异形基因位于果蝇第3号染色体的具体位置(果蝇只有4对条染色体)。有趣的是这些基因挨得很近,聚成两簇。一簇命名为双胸复合物,包含3个基因,影响果蝇的后背部分;另一簇命名为触角足复合物,包含5个基因,影响果蝇的前胸部分。更让人感到十分有趣的是这两个基因簇的相对顺序恰好对上它们要影响的身体部分的相对顺序(见图3-4)。这些难以捉摸的神秘关系给研究带来了希望,在这些基因复合物里可能就藏着关于身体生长模式总体逻辑的一些重大线索。
图3-4 果蝇一条染色体上的8个基因
注:分布在果蝇一条染色体上的8个基因(简称分别为lab、pb等),每个基因对应控制果蝇身上沿体轴分布在某一位置的身体部分的发育(由阴影及虚线标记)。
资料来源:Leanne Olds.
到1983年,这两个基因复合物的DNA已经被分离出来并进行了分析。研究者首要目标之一是搞清楚这总共8个同源异形基因编码的蛋白质类型。第一个重大发现是每个不同的同源异形蛋白全都由1 000个左右的碱基编码而成,这8个基因都有一小段包含大约180个碱基对且排序高度相似的部分。这些基因片段在蛋白质层面的体现就是一段包含60个氨基酸的结构域,后者可作为每个蛋白质分子的一部分。
这是相当令人激动的发现,因为它提示我们,尽管每个同源异形基因都在特定的身体区域与身体部位发挥特定作用,但这些同源异形蛋白质具有一些相似的功能特性。分子生物学家一直都有给他们在DNA上发现的特征命名的传统。因为这些同源异形基因全都带有相似的一套180个碱基对序列,这些序列在长长的DNA序列里看上去就像一个一个小“方框”,所以这套通用的DNA序列就被称作“同源异形框”(homeobox),其编码的对应蛋白质结构域被称为“同源异形结构域”(homeodomain)。带有这些同源异形框的同源异形基因也相应简称Hox基因。
同源异形结构域有何功能,它表现出什么样的特性?我在实验室的同事艾伦·拉丰(Allen Laughon)当时就忙于确定触角足复合物里其中一个基因的序列,想知道它到底怎么起作用。一般情况下,生物学家研究未知的事物,其中一种策略就是从分子里找特征,在新发现的分子与已经相当熟悉的分子之间寻找相似之处。于是拉丰开始仔细查看这个同源异形结构域,想知道它跟生物学上已有研究的其他蛋白质有没有相似之处。他认为,如果存在某种相似结构,就能为解开同源异形结构域的功能之谜提供一点线索。他觉得自己好像在哪儿见过一种结构,跟同源异形结构域很像……
那个乳糖阻遏物!并且,不仅仅是那个乳糖阻遏物,还包括整整一类在细菌和酵母菌里负责跟基因开关结合的DNA结合蛋白。
答对了。
它们之间存在相似性就意味着同源异形结构域是一种可以跟DNA结合的结构域,能折叠成跟那些蛋白质一样的结构。一个顺理成章的推测是同源异形蛋白质可能还负责在动物发育过程中调控那些基因开关,这就是它们会影响整个结构的形成与特征的原因。
这是重磅好消息,但持怀疑态度的人认为,我们充其量就是从研究一种小小的细菌进步到研究一只小小的飞虫罢了。对于人类真正在意的威风凛凛的大型动物,或是人类自身,这小东西又能告诉我们什么呢?
我很熟悉这类抱怨。事实上,在我拿到博士学位之后去研究果蝇那会儿,就有好几位资深科学家跟我说这么做是彻底的不务正业。果蝇?它们能带来关于人类或哺乳动物的什么启示?曾几何时,在研究诸如小鼠、大鼠和其他一些用于人类生物学研究的传统模式动物的生物学家与研究其他“更低级”动物的生物学家之间存在的巨大文化差异。还有动物学本身,过去几十年来一直在强化以下这种观点:哺乳动物跟昆虫或蠕虫在生理学和发育规律上存在天壤之别。这差别大到曾经使一些人相信在果蝇之类身上做研究无关宏旨。
有些大惊喜等着那帮人呢。
比尔·麦金尼斯(Bill McGinnis)和迈克·莱文(Mike Levine)就没有那样的偏见,他们不认为毛茸茸的大型动物就该享有特殊待遇。他俩当时都在瑞士巴塞尔大学(University of Basel)沃尔特·格林(Walter Gehring)教授的实验室工作,也被同源异形突变体迷住了。当他们发现果蝇的每个同源异形基因都有各自的同源异形框时,就迈出了对他们来说相当合乎逻辑的下一步。他们找遍了巴塞尔一带,还从别的实验室讨来各种各样的生物及组织,先提纯DNA,再从中寻找同源异形框,这些物种包括各种小昆虫、蚯蚓、青蛙、奶牛,还有人。
挖到宝了!
他们从这些实验材料找出一大堆同源异形框。他们仔细检测这些同源异形框的序列,结果发现不同物种同源异形框序列之间存在的相似度高得叫人目瞪口呆。以同源异形结构域的60个氨基酸为例,一些小鼠和青蛙的蛋白质编码序列在总共60个位点上有多达59个位点跟果蝇的序列一模一样。这么高的序列相似性简直令人震惊。毕竟,最终分别形成果蝇和小鼠的那两条进化路线早在5亿多年前就已经分开,甚至比著名的寒武纪生命大爆发还要早一点。在这一比对结果出现以前,还从没有生物学家有过哪怕最模糊的概念,想到差异如此巨大的不同动物在基因上可能存在这么高的相似度。这些Hox基因是那么重要,以至于它们的序列得以在时间跨度巨大的动物进化历程中一直保持不变、传承至今。
关于这些同源异形框,起初有不同的解释。有人依然怀疑它们的重要性,认为它们编码的可能只是一些普通功能,诸如为相应蛋白质标记它们在细胞里的目的地之类。但事实很快证明,这些同源异形框能为我们带来深远的真知灼见。牛津大学的乔纳森·斯莱克(Jonathan Slack)将发现同源异形框与1799年意外在埃及发现罗塞塔石碑(Rosetta Stone)一事相提并论,那次发现让我们最终得以解码古埃及的象形文字。那么,同源异形框是不是破解所有动物发育谜题的密钥呢?
从脊椎动物和其他动物身上发现Hox同源异形基因之后又过了大约两年,研究者们有了一个可以说更惊人的发现。搞清楚小鼠身上的Hox基因排布后,他们发现这些基因都成簇出现(一共4个),跟果蝇身上的情形一样。并且,更神奇的是,每一簇的基因顺序也跟它们在小鼠身上表达的身体区域的顺序相对应。也就是说,不同动物之间的相似性不仅体现在这些基因本身的排序,还体现在这些基因的成簇组织方式以及它们在胚胎里的作用方式(见图3-5)。
图3-5 Hox基因簇确定不同类型胚胎的基因模式
注:上图,果蝇一个Hox基因簇的基因在果蝇胚胎的不同部位表达;下图,小鼠4个Hox基因簇的基因在小鼠胚胎的不同部位表达。
资料来源:Leanne Olds.
这是不容忽视的。一个又一个Hox基因簇塑造了从果蝇到小鼠这样差异巨大的不同动物的发育过程,并且现在我们已经知道该规律几乎适用于动物界的全部物种,包括人类与大象。即使是一直以来最热情支持研究果蝇的人们都没能预计到Hox基因的重要性和普遍性。这影响是震撼性的。迥然不同的动物不仅由相同类型的“工具”构造而成,而且,千真万确,“工具”居然就是几乎相同的基因!
但惊喜可不止于Hox基因。
乍看上去,果蝇的身体构造跟我们人类确实没有什么共同之处。我们没长触角和翅,只有一双可以转动的眼睛,眼睛也不像昆虫的复眼有800多个面,不能从一个固定位置向外望向各个方向。我们的血液由一个具有四腔室结构的心脏通过由动脉和静脉组成的闭合循环系统有条不紊地泵向全身,果蝇则不然,它们的血液在整个体腔里四处游走;我们走路用的是由结实的骨骼支撑的两条腿,不像果蝇,它们虽然有三对足,却都那么娇小微细。既然人类在解剖结构上跟果蝇存在如此巨大的差别,你大概也不会认为,一只果蝇能就人类的器官与身体各部分发育进程给出哪怕一点有用的信息吧?的确,长期以来的看法就是,在动物进化史上,类似眼睛这样的器官从零开始构造了多达40次,才拥有现在如此繁杂多样的解剖设计与光学特征。
正因如此,研究负责构造果蝇眼睛的基因不会引起太多的关注。但是,等到沃尔特·格林实验室的研究人员将无眼基因(因该基因一旦发生突变就会导致果蝇失去眼睛而得名)分离出来,他们才发现这个基因跟人类身上一个已知基因是相对应的。人类身上的这个基因也有名字,叫无虹膜基因。这名字取自人类身上的一种突变,该突变会导致眼睛的虹膜面积变小,严重情况下甚至导致虹膜缺失。无虹膜基因跟小鼠身上的小眼基因是相同的,后者发生突变会导致小鼠的眼睛变小甚至缺失。这样的发现不仅出人意料,而且引人深思,毕竟我们如相机一般带透镜结构的眼睛跟果蝇的复眼从结构上看有天壤之别,这两种眼睛早就各自适应并正在承担截然不同的功能。为什么截然不同的两种眼睛会在形成过程中用到同一种基因?这仅仅是偶然现象,还是暗示了更深层次的东西?
另外两个实验将这个疑问变成焦点。第一个实验是研究人员借助一些操作手段在果蝇的诸如翅、足或其他身体部位启动这个无眼基因,这些部位就会长出果蝇的眼部组织(见图3-6)。这一现象以及前述无眼突变效应都表明,无眼基因就是负责眼睛发育过程的一种“主控”基因。没有它,眼睛就不会形成,并且,在它起作用的地方会形成眼部组织。第二个实验是将小鼠的小眼基因引入果蝇体内,同时在果蝇的不同部位启动这个基因的表达,你觉得接下来会发生什么事情?
图3-6 主导眼部组织形成的主控基因
注:左图,正常的果蝇头部,长有巨大的复眼。中图,发生无眼突变的果蝇缺了眼部组织。右图,在果蝇翅上诱导无眼基因表达,从而诱导眼部组织在果蝇翅上形成。
资料来源:Georg Halder, M.D. Anderson Cancer Center.
结果跟果蝇基因的实验一样:启动小眼基因表达的果蝇被诱导形成眼部组织。当然,有必要强调指出,那些果蝇形成的是果蝇的眼睛组织,而不是小鼠的眼睛组织。也就是说,尽管这两个基因彼此很相似,并且在各自的物种上也有着相似的作用,但它们最终诱导形成的形态还是由实验所用的受体物种来决定的,而不是基因的供体物种。具体到这个例子,就是小鼠的小眼基因在果蝇身上诱导启动了果蝇眼睛的发育程序。
这几个基因包括无眼基因、无虹膜基因以及小眼基因,还有一个远没有这么形象的共同的名称,叫Pax-6。名字的起源不重要,但Pax-6以及它与眼部发育过程的对应关系在整个动物界广泛存在这一事实很重要。目前已经发现Pax-6跟不同动物所形成的各种类型的眼睛都有对应关系,既有像扁形动物眼睛那样的简单结构,也有像脊椎动物眼睛那样复杂得多的结构。关于Pax-6与眼部发育的对应关系在动物界广泛分布,有两个不同的解释。一个解释是这可能纯属巧合,不同类型的动物的眼睛在很久以前开始进化的时候,不约而同地全都启用了Pax-6。另一个解释是这一现象可能反映了Pax-6担任的角色非常古老,Pax-6从所有这些动物的远古共同祖先发育某种类型的眼睛之际就已经登场,并且在动物的进化之路上一直担任调控眼睛发育形成的角色,没有中途退场。不过,在我就这两种解释给出意见之前,我还要再讲几个同样出现在动物发育过程中的惊人的相似现象。
在我的实验室里,我们一直对动物附肢的起源与进化非常感兴趣,因为足、翅、鳍等结构对拥有这些部位的动物来说就是它们发生适应性改变的重要“工具”。几年前,我们还在研究远端缺失基因(Distall-less,简称Dll),顾名思义,这个基因一旦发生突变,蝇足最远处的末端或者说末梢部位就会缺失。让我们感到好奇的是,这个负责构造肢的基因会不会也在其他物种身上起作用。结果,我们欣喜地发现,Dll基因同样作用于蝴蝶、甲壳纲动物、蜘蛛和蜈蚣等动物各肢的远端末梢部位。也就是说,Dll基因在各种节肢动物的各肢形成过程中起同样的作用。这也激发了戴夫·巴里(Dave Barry)的灵感,他是一位著名的幽默专栏作家,他决定用我们的论文作为他不吃龙虾的理由之一,因为这篇论文说明龙虾也不过是一种个头很大的虫子而已。这当然不是进化论相关论点里面最具艺术性或最正确的一个,但不管怎样,我们还是感激他关注我们的工作。既然所有这些动物在分类上同属一门,而且共同拥有一种带分节的肢,那么,在所有这些物种身上都看到Dll基因在起作用就变得顺理成章。真正出乎我们意料的发现,出现在我们与合作者对非节肢动物近亲的动物的附肢进行考察之际。
我们发现,从动物身体主干延伸出来的各种结构,其形成全都需要Dll基因的参与。其中包括小鸡的腿、鱼的鳍、海生蠕虫的疣足、海鞘的壶腹与口器,甚至还有海胆的管状足。跟Pax-6一样,这是一个在构造一些具有天壤之别的结构时都会用到的工具包基因,这些结构拥有的唯一共同点是,它们全都从身体主干延伸出去。这些动物又是动物进化树上几个主要分支的典型代表。如此看来,可能适用于Pax-6与眼睛进化过程关系的那些解释,同样适用于Dll与肢的进化过程的关系。要么这些动物进化这些结构时全都独立地多次用上Dll,要么它们有一位共同祖先,后者用Dll构造过某种突出于身体的部位,之后这一作用在动物进化之路上反复得到利用。
在果蝇和脊椎动物的基因与结构上还发现了很多的相似性。我再举一个例子:果蝇的心脏位于身体上半部,通过不断收缩的方式泵动液体在果蝇体内循环。果蝇体内有一个开放的循环系统,也就是说它们的血液并不是被包裹在血管里运行,而是直接浸润着它们的组织。若用人类的标准来衡量,果蝇的心脏根本就算不上是一颗心脏,但它确实在果蝇体内担负心脏的职责。遗传学家发现了构造果蝇心脏必须用到的一个基因,将它命名为tinman,这个名称来自童话《绿野仙踪》里面那个没有心脏的角色。
令人惊喜的是,研究人员先后在哺乳动物身上发现了好几个发挥着跟tinman一样作用的基因,并且发现这些基因在包括人类的脊椎动物的心脏形成过程中发挥着一种重要作用。但这些基因的名字就没那么奇幻了,直接被命名为NK2家族。尽管果蝇跟脊椎动物在心脏解剖结构与循环系统上存在巨大的差异,但两者心脏的构造与生长模式均由同一类型的基因调控。
关于Pax-6、Dll以及tinman基因家族在果蝇、脊椎动物以及其他动物身上对应的蛋白质,还有一个重要的事实必须补充,即这些蛋白质中的每一种都包含一个同源异形结构域。这就告诉我们,它们全都是可以跟DNA结合的蛋白质。这些同源异形结构域与Hox蛋白的结构域相似,却不尽相同。或者应该这么说,我们现在知道,可能存在20多个同源异形蛋白家族。Hox蛋白、Pax-6蛋白、Dll蛋白以及tinman蛋白全都分属不同的家族。不同动物体内的Pax-6蛋白,相互之间的相似度要高于它们跟其他同源异形蛋白家族成员的相似度。同样,Hox蛋白、Dll蛋白以及tinman蛋白也跟各自家族出现在其他动物身上的成员更相似,跟其他同源异形蛋白没那么相似。不同类的同源异形结构域之间的区别也反映在功能特化的区别上,它们负责结合DNA上不同的调控序列。它们每个都能结合DNA,从而对器官或附肢发育产生巨大的影响,我们现在知道它们分别在眼睛、肢或心脏发育之际调控基因,使基因处于打开或关闭的状态。它们会对发育过程具有如此重大的作用,要么是因为它们对数量巨大的基因有调控功能,要么是因为它们从器官构造进程的早期就开始发挥作用,又或者两者皆有。不管属于哪种情况,缺了它们,器官或身体部件就不能正常形成。
昆虫、脊椎动物与其他动物身上具有功能相似但设计截然不同的身体区域和身体部件,这些区域和部件的构造与形成过程是由同样的一组基因调控的,这一发现促使我们重新反思动物史、动物身体结构起源与多样性本质。长期以来,比较生物学家和进化生物学家一直以为,被漫长的进化时间分隔开的不同类群的动物是分别经由完全不同的方式构造与进化出来的。在一些类群的成员之间,比如不同的脊椎动物,又或是脊椎动物与其他同样带有脊索的动物,它们之间的关系堪称源远流长。但是,果蝇与人类,又或是扁形动物与海鞘,能有什么关联?关于巨大进化差距这一观点曾是那么盛行,进化生物学家、现代综合进化论的提出者之一恩斯特·迈尔在20世纪60年代给出这样的评述:
目前已掌握的基因生理学知识清楚表明,搜寻同源基因恐怕是徒劳的,除非将搜寻范围限定在具有密切亲缘关系的物种之间。如果只存在一种高效解决方案可以满足一种特定的功能需求,那么研究彼此差异很大的基因复合物就适合用这种解决方案,不管具体选了怎样的路线才能找到。“条条大路通罗马”这句俗语,不仅可用于描述日常事件,用来描述物种进化也是同样准确的。
这个观点是完全错误的。斯蒂芬·杰伊·古尔德在他的里程碑式著作《进化论的结构》( The Structure of Evolutionary Theory )中已经指出,发现Hox基因簇和常见身体构造基因足以颠覆现代综合进化论的一个主要观点。古尔德写道:“我们即将在发育遗传学方面达成的共识,其重要性的核心并不在于单纯发现完全未知事物……而在于这些发现具有出人意料的特性,以及由此导致进化论必须进行修订与拓展。”
同源基因不仅存在(这推翻了迈尔一个可能相对次要的错误预测),而且它们通向“罗马”(比如说一种进化适应)的道路的数目似乎也不像人们曾经以为的那么多。Pax-6基因的故事表明,许多类型的动物眼睛的发育至少全都“走”了调用Pax-6基因这条路。借用拟人说法,“自然选择”并没有完全从零开始构造各种各样的眼睛,而是动物身上存在一种共同的基因,用于构造每一种不同类型的眼睛,就跟构造那么多种不同的附肢和心脏等结构一样。这些共同的基因肯定是很久、很久以前就存在了,久远到还没有出现脊椎动物或节肢动物的时期,甚至可以一直追溯到首先用这些基因构造用于感知事物、摄食或运动的结构的动物。对包括人类在内的绝大多数现生动物来说,前面提到的这些动物就是远古的祖先。关于这些祖先和动物进化的历程,我在第6章还有更多的故事要讲;但在那之前我必须再介绍一些基因工具包里其他类型的基因,并揭晓另一组出人意料的神奇关联。
Hox基因以及用来构造眼睛、肢与心脏的基因大概是很多主控基因里最著名的十几种,但它们只不过是组成动物发育所用基因工具包的一部分而已。跟果蝇的结构与生长模式有关的基因林林总总加起来有好几百种,但这数目跟果蝇基因组里发现的总共13 676个基因相比差距较大。这里面绝大部分基因都有其他的职责,跟实现果蝇细胞的常规和特化功能有关。
我们了解这个工具包里很多基因的方法跟当初发现第一个构造身体基因的方法是一样的,都是将那些不正常的变异型或突变体分离出来。尤其值得一提的是,从20世纪70年代后期到80年代早期,遗传学家克里斯蒂安娜·纽斯林-沃尔哈德(Christiane Nüsslein-Volhard)和埃里克·威斯乔斯(Eric Wieschaus)着手分辨所有对构造果蝇幼虫来说必不可少的基因。他们找到了果蝇形成正确数目与模式的身体节段必不可少的基因,大概有几十个,还找到果蝇幼虫用以形成它的三个组织层的必备基因,另外还发现许多基因跟果蝇身上精致的外观细节的形成有关。我稍后就会深入介绍这些类型的基因,这里首先强调的重点是纽斯林-沃尔哈德和威斯乔斯的研究做得十分系统而彻底,使他俩成功识别出目前已知构造果蝇必备基因中的绝大部分。其次,在脊椎动物和其他动物身上也能找到具备相似功能的基因,而且能找到这些基因在很大程度上也要归功于他俩在果蝇身上做的开创性工作。纽斯林-沃尔哈德、威斯乔斯与爱德华·刘易斯(Edward Lewis)分享了1995年诺贝尔生理学或医学奖,理由是他们的发现给胚胎学以及后来的进化发育生物学的研究和发展提供了更多的新方向。
说到纽斯林-沃尔哈德与威斯乔斯收集的突变体,它们最令人震惊也对研究最有帮助的特征是它们都在胚胎发育与成形过程中存在严重而又独立的缺陷。举例说吧,有些突变体丢失了整整一组基因位点,有些是位点数目只剩下正常的一半。这些突变影响了最基本的解剖结构模块,导致组成昆虫身体的节段不能正常成形。还有第三种突变体,其每个位点的极性在昆虫成形过程中都被打乱了,这就说明这些基因影响昆虫成形过程的组织方式。纵观所有这些不同类别的突变体,其发育过程都未发生“崩盘”的情况,而是只有某个特定进程受到干扰,与此同时其他所有的进程继续正常推进。
现在我们已经深入认识了这个基因工具包里的许多基因。总体而言,这个工具包里的所有基因都是通过在发育过程中影响其他基因启动或关闭的具体方式来影响发育走向的(见图3-7)。这个工具包有很大一部分由转录因子组成,它们是通过结合DNA而直接启动或关闭基因转录的蛋白质。
图3-7 影响动物发育的基因工具包
注:动物身体的构造与生长模式就是由基因工具包里的各类基因和分子进行调控的。
资料来源:Josh Klaiss.
工具包成员还有一类称为信号通路。细胞之间通过发送信号进行沟通,这些信号之一就是从源头释放的蛋白质。它们会作用于其他细胞,在那儿触发一系列事件,包括改变细胞形状、迁移、让细胞开始或停止增殖、激活或抑制基因的表达,等等。随着组织不断生长,不同细胞群之间的信号传导在很大程度上塑造了发育中结构里的局部模式。一只果蝇身上的信号通路数目大约为10条,并且每一条通路都有多种组分,后者包括信号分子、受体蛋白与各种中间体。这些组分常常带着信号穿行于细胞各区室之间:从细胞膜出发,通过细胞质,进入细胞核。任何一种组分一旦发生突变就会严重影响信号传递并扰乱发育进程。
随着生物学家认识到果蝇发育要用到的基因往往在脊椎动物身上也可以发挥类似作用,于是,每当有人从果蝇身上识别出一种新的工具包基因,大家就会在脊椎动物身上跟着追寻一番。这也引出了很多重大发现,接下来我就用其中最令人震惊的一个发现作为这一章的压轴内容。
纽斯林-沃尔哈德和威斯乔斯系统地收集了那些肉眼可见地影响了幼虫生理特征的果蝇突变体,并给这些突变体代表的每个基因都取了一个名字。这些令人印象深刻的描述性名称,为果蝇遗传学领域增添了不少色彩。其中有很多是用德文命名的,因为他俩的工作是在德国图宾根(Tübingen)进行的。于是,基因工具包里就有了诸如knirps(小男孩)、Krüppel(残疾者)、spitz(尖嘴狗),以及shavenbaby(剃头宝宝)、buttonhead(纽扣头)、faint little ball(弱弱的小球)等多种基因。其中最受欢迎的是hedgehog(刺猬),这个名字源于该突变体的幼虫浑身长满细毛,看上去就像刺猬一样(见图3-8)。hedgehog是一种对果蝇的生理活动十分重要的基因,但说到真正声名鹊起,还要等好几个研究团队从脊椎动物身上搜寻到hedgehog基因之时。
图3-8 hedgehog突变
注:正常果蝇幼虫的角质层(A),对比hedgehog突变果蝇幼虫的角质层(B)。发生突变的幼虫身上的细毛或者说细齿状突起全都糅在一处,看上去一团凌乱,就像刺猬背上的毛刺,正常幼虫身上分布着间隔均匀的条带。
脊椎动物的体内有3个hedgehog基因,由于果蝇遗传学圈里的搞怪精神,这3个基因被分别命名为索尼克音猬 (Sonic hedgehog)、沙漠刺猬(Desert hedgehog)与印度刺猬(Indian hedgehog),后面两种恰好也是现实世界存在的动物。第一个美妙的时刻来了,哈佛大学医学院的克利夫·塔宾(Cliff Tabin)和同事们在观察Sonic hedgehog在小鸡一个正在发育的肢上表达时,发现它就在小鸡肢芽后沿处启动。这个位置非常接近桑德斯在几十年前通过移植实验定义的极性活性区,这不让人产生联想是不可能的。Sonic hedgehog会不会也在ZPA发挥了作用?为了检验这一令人瞩目的可能性,研究人员用各种手段在肢芽的其他部位启动Sonic hedgehog,获得了跟之前桑德斯实验同样的多指/趾模式,多余的指/趾沿相反的极性形成。这就是说,Sonic hedgehog并不限于“表达区域是ZPA的一部分”这么简单,而是“ZPA的活性完全源自Sonic hedgehog的表达”。还有,Sonic hedgehog可不仅仅出现在小鸡的故事里。
还记得之前描述的人类的多指吗?现在已经非常清楚,有一类多指是由人类肢发育过程中发生一种影响Sonic hedgehog表达的突变造成的。这不仅生动演示了脊椎动物各肢之间的同源性,也是一个极佳的例子,表明果蝇身上的发现可以给人类的医疗遗传学赋能。
还没完呢。
还记得第2章提到的独眼绵羊和那种叫环巴胺的致畸物吗?现在我们已经知道环巴胺在哺乳动物身上是Sonic hedgehog信号通路的一种抑制剂。它会阻断受体的一部分,使本应对Sonic hedgehog做出响应的细胞没有任何响应。在脊椎动物发育过程中,Sonic hedgehog信号通路对于发育胚胎腹侧中线上的部位也有重要影响。从这些“底板”细胞发送的信号对它们上方组织的生长模式及其进一步分化为眼域和大脑半球左右两侧具有至关重要的意义。若将处于这些事件发生的关键时刻的胚胎暴露在环巴胺之下,正常的分化步骤就会受阻,导致新生羊羔变成独眼。人类胚胎不会暴露在环巴胺之下,但乙醇似乎也能造成类似的影响。比如胎儿酒精综合征是由人类孕期关键阶段发生的酒精中毒造成的,可能导致胎儿前脑无裂畸形。此外,Sonic hedgehog基因失活或是信号通路的其他组成部件活性的突变也能导致独眼畸形。
先天缺陷是脊椎动物工具包基因步入“歧途”的一个后果,另一个是癌症。一旦细胞挣脱了它们的内外调控制约,肿瘤就开始形成,这可能源于细胞信号的响应出现异常。基底细胞癌就是一个恰当的例子,这是与皮肤相关的最常见癌症,肿瘤细胞尤其容易出现在经常晒太阳的人的脸和脖颈上。这些肿瘤细胞大多携带一种Sonic hedgehog信号受体的突变基因,这些突变造成信号通路活性过高。基于这一深刻见解,肿瘤化疗的一个手段就是配合使用信号通路的抑制剂,其中包括环巴胺。从致使羊羔流产到植物毒素,再到用于人类癌症的化疗,环巴胺的科学之路走得可谓异常曲折。一些脑癌和胰腺癌现在也用影响hedgehog信号通路的作用因子进行靶向治疗,因为这些癌症也跟该信号通路相关基因的突变有关。
我不认为纽斯林-沃尔哈德和威斯乔斯在20世纪70年代后期开始研究果蝇幼虫突变体的时候就抱着要搞明白多指、独眼畸形以及癌症来龙去脉的想法。但发现果蝇基因工具包带来的影响是如此之深远,超出了当时所有人的预见。现在,随着这份共同基因“资产”获得越来越广泛的认同,生物学家和医学科学家开始常态化地在果蝇以及其他“低等”物种身上探寻有助于了解人类疾病的线索。
发现通用型基因工具包改变了我们对进化多样性的思考方式。我们从很多动物身上学到了关于工具包基因的很多知识。这个工具包里的基因分布告诉我们,这个基因工具包非常古老,在绝大多数种类的动物开始进化以前就已经存在。我们还拥有了果蝇、线虫、鱼、小鼠、人类以及其他一些动物的全基因组序列。通过比对这些基因组可以看到,不仅果蝇跟人类拥有一系列相似的发育相关基因,就连小鼠也跟人类有大约25 000个基因高度相似,黑猩猩跟人类的基因组相似度接近99%。这个通用工具包以及不同物种基因组之间的高度相似性提出了一个显而易见的悖论:既然大量的基因在如此广泛的不同物种中都存在,物种之间的差异又是哪儿来的?比如丰富多彩的节肢动物,同一套Hox基因是怎么将其一一雕琢出来的?各种哺乳动物,灵长目动物,抑或类人猿与人类,它们之间的巨大差异又是怎么出现的?要搞清楚同样的基因怎样构造出不同的解剖结构,我们必须先了解动物个体的解剖结构是怎么组装的。这可是一个大篇幅的故事,也是接下来两章的核心。