购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

真核生物功能基因数的估计

奥布赖恩

编者按

在人类基因组计划定位了数万个人类基因组中的蛋白质编码基因之前,30年间关于真核生物的基因数目存在很多争议。基因的总数被认为远少于单倍体基因组中DNA的数量,这导致一些人提出90%以上的真核生物基因组是没有功能的或者是“垃圾”。在本文中,遗传学家斯蒂芬·奥布赖恩质疑了这个假说,指出垃圾DNA实为功能基因对自然选择的反应的证据。现在认为非编码DNA占据了人类基因组的大部分,但是“垃圾”一词要谨慎使用,因为已经发现了一些所谓的“垃圾”序列的功能。 英文

近来有许多研究都着眼于构建生物模型系统来充分描述真核生物发育过程中基因行为的调节 [1-5] 。就一个单倍体基因组所能够容纳的DNA量来说,已发现哺乳动物和果蝇中的基因数目要比其少1到2个数量级 [2-7] 。以1,000个核苷酸对构成一个基因来计算,尽管果蝇和哺乳动物细胞核含有足够的非重复DNA分别形成10 5 和10 6 个基因 [8,9] ,但是看来对功能基因的数量更低的估计是更合理的 [2-7] 。反过来说,这些结论则提示真核生物基因组超过90%的DNA可能由非功能性或者不编码信息的“垃圾”DNA组成。本文中我们的结果显示这些估计都没有得到有力地证明,相反它们都是基于一些简化的假设所获得,而这些假设本身的正确性值得怀疑,其中有些甚至与实验数据相矛盾。 英文

克里克 [5] 提出的模型指出,在果蝇巨大唾液腺染色体中,编码蛋白质的结构基因通常都位于观察到的染色体条带之间。调控元件和大量含有无编码信息的DNA序列位于染色体条带上,这些染色体条带包含了绝大多数DNA。据此该模型预测果蝇大约有5,000个结构基因,这也是能够观察到的唾液腺染色体带的大致数量。 英文

该模型得到了贾德等人的出色工作的有力支持 [10] 。他们研究了黑腹果蝇位于X染色体末端 zeste white 区域内的121个致死性和显著影响形态的点突变。该区域内一共有16个唾液腺染色体带或染色粒,与16个形态学改变或致死性点突变的互补群互为对应。此外一系列重叠的缺陷支持一个条带一个互补群的关系。外推至整个基因组,大约5,000个这种互补群或者基因对应于5,000个染色体带。也有人估计了果蝇基因组中致死基因座的总数。通过筛查自然群体中或者经过辐射处理后的群体中的大量可致死染色体,就有可能通过简单的泊松分布将等位性的频率与致死基因座的数目联系起来,这样得到的果蝇中致死基因座的数目大约是1,000~2,000个 [11,12] 英文

在这种利用精细结构分析和致死性数据外推到功能基因数目过程中存在一个我们无法回答的问题:有多少基因突变后能够产生致死性的或者显著影响形态的表型?这无法明确地回答,但是已有数据提示所有基因产物中只有很少一部分重要到其缺失能够导致生物的死亡。在果蝇中,超过30个基因的基因产物是已知的 [13] ,其中只有14个在具有“无效”等位基因时能够导致蛋白质及其活性或RNA产物的完全缺失,而这其中(表1)只有 bobbed 基因座具有致死性的等位基因 [14] 。然而,这个基因座是核糖体RNA(rRNA)的结构基因,其大多数等位基因即使在所产生的rRNA浓度非常低时也能有活力。其他编码酶的基因即使它们对于正常代谢是必需的,在纯合的完全“无效的”等位基因中也没有一个是致死性的。 英文

表1. 具有确定基因产物和可恢复性“无效”等位基因的黑腹果蝇基因

0202-01

* 扬,个人交流。

英文

上表中前11个基因座中的无效等位基因是通过凝胶电泳组织化学染色条带丢失检测出来的。这种方法的敏感性至少能够检测出正常酶水平5%的量。在一些例子中( Acph-1 rosy Adh 、α Gdph-1 ),灵敏度接近0.1%野生型酶水平的酶分析法也不能在“无效”纯合子中检测到痕量的酶活性。在通过交叉反应物质(CRM)检测的两个例子中( Acph-1 ry ),测到的酶活性也是微乎其微。 英文

在杂交实验中,无效等位基因中的至少两个基因座被诱导而恢复了致死性(α Gdph-1 Acph-1 )。在自然或实验室群体中发现的“无效”等位基因中( Est-C Est-6 Aph Aldox Idh ),也能检测到一种致死性“无效”等位基因,这种等位基因与有着不同电泳迁移率的正常等位基因形成一个异常杂合子。 英文

14个基因座中有5个具有能够产生可见的隐性表型的等位基因,其中 ry cn v 影响眼睛的颜色, bb 影响刚毛,而α Gdph-1 “无效”突变使果蝇尽管在形态学上表现正常,但丧失了持续飞行的能力。但是5/14这个比例并不能作为产生可见表型的“无效”等位基因在基因座中所占比例的估算值。因为所研究的5个基因座中的4个(除了α Gdph-1 )最初就是作为形态学的突变而被发现的,其基因产物已经从它们的可见表型中推断和鉴定出来,所以这个数值很可能是被高估的。 英文

眼睛颜色相关基因的突变会影响眼色素生物合成过程中的相关酶,而通常显示产生一系列蛋白质合成相关症状的 bobbed 基因座已被确定为rRNA基因。如果不是以前就清楚α Gdph-1 产生的酶在昆虫飞行中的重要性 [15] ,就很容易忽视α Gdph-1 的“无效”突变的表现型。另外11个基因座都仅仅是被鉴定为特定酶的基因,并没有发现其“无效”等位基因具有致死性或者导致任何形态表型的改变。 英文

有两个构建了双重“无效”突变体的例子,碱性和酸性磷酸酶突变体(麦金太尔,个人交流)以及 Zw 6-Pgd 突变体(扬,个人交流),它们均被证实能够生存、繁殖并且形态上正常。同时,在5个具有可见表型的例子中, bb 和α Gdph-1 这两个突变的受累动物出现了表型修饰。在 bb 中,减少的rDNA顺反子被“放大”,以至在数代内达到野生型rRNA的水平 [16] 。遗传上缺乏α–甘油磷酸脱氢酶(α Gdph-1 )的果蝇由于α–甘油磷酸循环被破坏而丧失了持续飞行的能力 [15] ,但是经过25代以后,这种表型发生了变化而且果蝇恢复了正常飞行的能力(奥布赖恩,未发表数据)。对具有重要功能的结构基因损伤进行生理补偿的生物学适应能力一定非常广泛,使得果蝇能相当有效地免受这些遗传敏感的基因座的影响,即使是那些功能被假定很关键的基因座。 英文

有人可能说大多数情况下即便是最小的细胞学可见突变都是隐性致死的 [10,14,17] 。但是要确定这种细胞学上的改变,所需要的分辨率是至少能检测到果蝇多线染色体中5,000个染色粒中的一个发生了缺失。这个技术精确度是在10 6 个核苷酸水平,差不多是一个染色粒的平均大小,即足以构成20个平均长度的基因的DNA。我认为每个区域可有多达20个功能基因,在其突变谱中可能只有一个是致死性突变。 英文

另一个被广泛采用的论点提出了真核生物基因组中信息DNA的最小量(小于可获得的DNA的10%),并且认为如果哺乳动物用所有的DNA来携带和传递生物学信息的话,那么突变了的遗传负荷就会过度。大野 [4] 认为对含有足够组成3×10 6 个基因的DNA的哺乳动物来说,如果突变率是10 –5 ,而且所有的DNA都是携带信息的,那么每个配子会含有30个新的突变,这样的遗传负荷会使得哺乳动物在很多年前就灭绝了。评估这些突变和替换的负荷所限制的功能基因数目取决于基因替换的中性选择这个尚未解决的问题,而且需要从两方面进行考虑。 英文

如果接受大部分基因替换和多态性都是中性选择的,那么遗传负荷对于功能基因数目的限制就变得微不足道了。中性的基因替换当然不会有助于替换负荷或突变负荷的累积,因为这些负荷的作用是由其选择劣势决定的。因此我们必须估计是否有个最少的功能基因数目,或者更确切地说,大部分基因替换不是自然选择的结果。中性选择的支持者们觉得大部分替换都是中性的,这就消除了突变对于大量功能基因座的任何限制。 英文

对于中性选择的作用曾有很多严肃的反对意见 [18,19] 。该假设最薄弱的一条是它很大程度上基于对适应的倍增性,即假设选择的作用是独立的并且以加和的方式在群体中所有的基因座发挥作用。数名作者已经中肯地指出事实并非如此 [20-22] 。要点在于选择是作用于整个生物体,而不是群体中每个个体的每个多态位点的基因型 [22] 。如果倍增性适应是一种不现实的假设,那么除了对于中性选择作为主要作用力的质疑,突变和替换负荷对于功能基因数目的限制也可不再考虑。 英文

包括我本人在内,很多人认为一个种群有多种方法摆脱所谓倍增性适应,或者更确切地说是直接选择的结果。这些包括二倍性 [23] ,上位显性 [20,21] ,同义碱基替换 [7] ,频率依赖的选择性 [24] ,连锁不平衡 [25] 和替代代谢通路等(表1)。由于这些因素可以有效地保护新的突变免于遭受严酷的自然选择,尽管突变在其他遗传环境中可能是有害的,这些因素也可以与倍增性适应的假设相抗衡。如果不考虑这个假设,那么果蝇和哺乳动物中也不必考虑对于基因组大小的限制。 英文

真核细胞中的信使RNA一般连有很长的(150~300个核苷酸)多聚腺苷酸序列 [26-28] 。尽管人们假设多聚腺苷酸添加到信使RNA末端发生在转录后 [29-31] ,细胞核DNA中存在类似长度的多聚胸苷酸提示转录时添加也是可能的 [32] 。RNA-DNA杂交动力学显示高达0.55%的哺乳动物核DNA退火后结合多聚腺苷酸,对应于1.1%的多聚脱氧腺苷酸–脱氧胸苷酸序列 [32] 。这提示至少有5×10 4 个多聚脱氧腺苷酸–脱氧胸苷酸位点。如果这些序列的每一个都与邻近的结构基因一起转录,再加上转录后加入的多聚腺苷酸序列、非信使RNA基因以及所有的非转录性调节基因,那么功能基因数肯定会超过5×10 4 。这个数目可能是相当可观的。 英文

在细胞型黏菌盘基网柄菌阿米巴虫中,28%的非重复性核基因组在26小时的发育周期中表达为细胞RNA [33] 。如果任何基因中只有互补DNA链中的一条被转录,那么此估计值代表56%的单拷贝DNA。因为黏菌的非重复性基因组含有将近3×10 7 个核苷酸对 [34] ,所以在细胞周期中存在至少16,000到17,000个平均基因大小(1,000个核苷酸)的RNA转录产物。与之类似,小鼠脑组织中10%的单拷贝序列表达为细胞RNA。这个杂交结果提示单独在小鼠脑组织内部可能存在至少300,000个平均拥有1,000个核苷酸的不同序列 [35] 。用果蝇幼虫RNA进行的RNA-DNA退火实验显示15%~20%的特异性核基因组都表达为幼虫RNA(洛根,个人交流),相当于30,000~40,000个平均长度的RNA基因转录产物。由于小鼠和果蝇的数据仅仅分别包括了特定的组织和发育阶段,所以根据黏菌不同发育阶段RNA序列差异的程度,很可能将转录的特异DNA总量低估了10%~30%。 英文

将DNA–RNA杂交实验作为对功能基因数量的估计的解释可能会被认为不可靠,因为细胞RNA的大部分都是很快降解的“核不均一RNA”,它们从不离开细胞核去进行蛋白质翻译 [26,28,36] 。但是RNA并不是一定要翻译成蛋白质才具有功能,事实上RNA除了翻译之外还有很多功能。综合考虑有三点可以支持RNA的基因功能:第一,基因的实际存在;第二,信息的转录;第三,不同发育阶段和不同组织中不同的非重复序列的转录 [33,35] 英文

主流的观点认为大部分的真核DNA既不用于转录,也非功能性,支持这一论点的主要依据是功能基因对于自然选择的反应。大量延缓了突变可能产生的有害作用的生理和(或)遗传补偿机制使得我们需要重新评价这个论点。此外,针对多聚腺苷酸位点和RNA转录物估算的分子数据显示比预计数量更多的基因活动的存在。 英文

尽管不可能精确测定真核生物功能基因的数量,但接受这些最小数量的证据似乎还有些为时过早。 英文

本研究由国立综合医学研究所的博士后奖金资助。 英文

感谢麦金太尔、索弗、盖塞姆、贝尔、米切尔博士的意见和讨论。 英文

(毛晨晖 翻译;曾长青 审稿) g2joPyXGx5nJ/NTmt03jj8AlxSL2zmB22VBrsw2EWwsIvpSSTlSKtOMJkW3z1tJS

点击中间区域
呼出菜单
上一章
目录
下一章
×