购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

第9章
成簇重复序列

弗朗西斯科·莫伊卡

石野良纯(Yoshizumi Ishino)在日本大阪大学就读期间,其博士研究就包括为大肠杆菌的一种基因测序。当时是1986年,基因测序虽然费时费力,但是石野良纯最终成功地测定了该基因的1 038个碱基对。次年,石野良纯就该基因发表了一份长篇论文。他在论文的最后一段提到一件怪事,但他认为这件事无关痛痒,所以未在论文摘要中提及。他写道:“我发现了一种非同寻常的结构。5段高度同源的29个核苷酸组成的片段重复相连。”换言之,石野良纯发现了5个一模一样的DNA片段。这些重复序列中的每一个都含有29个碱基对,分布在他命名为“间隔序列”的看起来正常的DNA序列之间。他并不知道这些成簇的重复序列有何意义。在论文的最后一行,石野良纯写道:“这些序列对生物学的意义尚不清楚。”他并未就这一话题展开探讨。 1

阿利坎特大学坐落于西班牙靠地中海的海岸。弗朗西斯科·莫伊卡是该大学的一位研究生,同时是首位尝试弄清重复序列功能的研究人员。1990年,莫伊卡开始撰写一篇关于古菌的博士论文。古菌与细菌一样,是没有细胞核的单细胞生物体。莫伊卡研究的古菌在盐池中大量繁殖,此类盐池的盐度是海洋盐度的11倍。他希望通过测定基因序列了解这类古菌嗜盐的原因。而他注意到了14个完全相同的DNA序列,它们每隔一定距离便会重复。它们看起来是回文结构,即顺读或反读的序列一致。 2

最初,莫伊卡认为,自己的测序工作出错了。他面带笑容,充满活力地说道:“我当时以为我犯了个错误,因为测序并非易事。”但是到1992年,莫伊卡的数据不断表明,这些规律间隔的重复是存在的。他想知道,其他人是否也发现了类似的情况。那时,谷歌搜索引擎尚未问世,联机索引也并不存在。因此,莫伊卡在一套名为《现刊目录》(Current Contents)的印刷版学术论文索引中,通过查找“重复”一词的引用,人工对其进行分类。因为事情发生在20世纪,人们鲜能在网络上找到刊物,所以每当找到一份看上去会有所收获的列表,莫伊卡就一定会前往图书馆,找到相关期刊。最终,他找到了石野的文章。

与莫伊卡研究的古菌相比,石野研究的大肠杆菌是一种截然不同的微生物。因此,两人均发现了重复序列和存有间隔的片段便令人颇感惊讶。1995年,石野发表了一篇论文。在论文中,石野和他的导师将其命名为“串联重复序列”(tandem repeats)。两人错误地推测,此类重复可能与细胞复制相关。 3

1997年,在盐湖城和牛津迅速完成两段博士后工作后,莫伊卡回到距离自己出生地仅数千米远的阿利坎特大学,在那里成立了研究小组,研究这些神秘的重复序列。但研究资金的获取并非易事。莫伊卡说:“有人告诉我,不要再对这些重复执迷不悟,因为微生物体内存在许许多多此类现象,我研究的微生物可能并没有什么特别之处。”

但是莫伊卡知道,细菌和古菌所含的基因组很小,没有必要将基因组序列浪费在没有重要功能的序列上。因此莫伊卡坚守使命,想努力弄清此类成簇重复序列。也许,此类序列能帮助塑造DNA的结构,或形成无规则的环状结构,使蛋白质能够依附。最终的情况证明,两种猜测同样不正确。

“CRISPR”之名

当时,研究人员已经在20种不同的细菌和古菌中发现此类重复序列,随后为之起了许许多多不同的名字。莫伊卡对石野和他的导师所起的“串联重复序列”这一名字并不满意。因为此类序列中存在间隔,并未彼此直接串联。因此,莫伊卡起初将此类序列重新命名为“规律间隔短重复序列”,也叫SRSR(short regularly spaced repeats)。这一名称虽然解释性更强,但是难以记忆,其英文缩写无法组成可念出的词。

莫伊卡一直与吕德·詹森(Ruud Jansen)保持通信来往。詹森在荷兰的乌得勒支大学任职,当时正在研究结核菌中的此类序列。虽然詹森一直将这些序列称为“直接重复序列”(direct repeats),但是他也认为两人需要想出更好的名字。一天晚上,莫伊卡开车从实验室回家,他灵光乍现,想出了CRISPR这个名字。CRISPR是“规律间隔成簇短回文重复序列”的缩写。虽然人们几乎不可能记住其冗长的表达,但缩写的CRISPR的确简洁明快,朗朗上口,听上去不会令人紧张不安,而是感到亲切愉快。 莫伊卡到家后,问妻子觉得这个名字怎么样。他的妻子说:“它听起来非常适合作为狗的名字。Crispr,Crispr,到这儿来,小狗狗!”莫伊卡忍俊不禁,认定这个名字非常合适。

2001年11月21日,在一封回复莫伊卡建议的电子邮件中,詹森选定了CRISPR这个名字。詹森写道:“亲爱的弗朗西斯,CRISPR是很棒的缩写词。我认为,每换掉其中一个字母,这个词便会少散发一分活力。与SRSR和SPIDR相比,我更喜欢活力四射的CRISPR。” 4

在2002年4月发表的一篇论文中,詹森正式确定使用CRISPR作为该序列的名称。该篇论文介绍了由他发现的似乎与CRISPR相关的基因。在大多数含有CRISPR的生物体内,重复序列的邻近位置都存在一类基因,它为生成一种酶所需的指令进行编码。詹森将这些酶命名为“与CRISPR相关的”酶,亦叫Cas酶 5

防病毒机制

1989年,莫伊卡开始对其嗜盐微生物的DNA测序时,基因测序过程非常漫长。彼时,最终催生出快速测序方法的人类基因组计划刚刚起步。而到2003年莫伊卡专注于研究CRISPR的作用时,近200种细菌(以及人类与老鼠)的基因组测序已经完成。

当年8月,在阿利坎特以南约20千米的圣波拉,莫伊卡正在沙滩上度假。度假期间,他住在岳父岳母的房子里。在他看来,那并不是一段美好时光。他以一种尽职尽责的科学家的口气说:“夏天的沙滩酷热难耐,人潮涌动。我不喜欢沙子,也不喜欢在夏天待在沙滩上。我的妻子会躺在沙滩上晒太阳,而我则掉头离开,然后开车前往我在阿利坎特的实验室,在那里度过一天。虽然她在沙滩上过得很开心,但是对我来说,分析大肠杆菌序列能让我得到更多快乐。” 6

“间隔序列”令莫伊卡颇为着迷。看似普通的DNA片段出现在间隔序列中,而间隔区位于重复的CRISPR片段之间。莫伊卡将大肠杆菌间隔序列置于数据库中进行比对。他发现了一个有趣的现象:大肠杆菌的间隔序列与攻击大肠杆菌的病毒的序列一致。莫伊卡立刻惊呼:“噢,我的老天!”

莫伊卡对自己的发现确信无疑。一天晚上,他回到海滨别墅后,向自己的妻子解释该项发现。莫伊卡说:“我刚刚发现了一件惊人的事情。细菌有一套免疫系统。它们能够记住以往攻击它们的病毒。”妻子笑了,告诉莫伊卡自己并不太理解。但是妻子说,她相信这件事情一定举足轻重,因为莫伊卡非常激动。莫伊卡回答说:“几年后,你将看到,我刚刚发现的这一情况会登上报刊,载入史册。”对于这段话,莫伊卡的妻子并不相信。

莫伊卡已站在地球历史上最为漫长、规模最大、最为残酷的战争前线,这是细菌与病毒之战。此类病毒名叫“噬菌体”,会向细菌发动攻击。噬菌体是自然界中数量最为庞大的病毒种类。到目前为止,噬菌体的确是地球上数量最多的生物体,总数达10 31 个。每粒沙子上就有1万亿个噬菌体,超过所有生物体(包括细菌)数量的总和。一毫升海水中就有多达9亿个该类病毒。 7

随着我们人类努力抗击新型病毒株,我们发现细菌耗费约30亿年与病毒作战颇具实际意义。几乎自地球生命诞生起,细菌和不停进化的病毒间便持续进行着一场紧张激烈的军备竞赛。细菌进化出抵御病毒袭击的复杂而细致的手段,而病毒则千方百计地攻破细菌的防御。

莫伊卡发现,面对含相同序列的病毒,含有CRISPR间隔序列的细菌具有免疫性,可以免受该病毒感染。但是,没有间隔序列的细菌的确会感染病毒。这是一套设计精巧的防御系统,但是它还有更加令人拍案叫绝的能力:该套系统能够适应新威胁。病毒入侵时,幸存的细菌能够合并该病毒的部分DNA,进而在子代细菌中形成针对该病毒的获得性免疫力。莫伊卡回忆道,自己发现这一现象后,激动得热泪盈眶。 8 有时,自然之美的确会令你情不自禁。

如此巧妙绝伦的发现的确令人震惊,它将产生巨大反响。但是莫伊卡在发表此项发现的相关论文的过程中,度过了极为艰难的时光。2003年10月,他向《自然》杂志递交了一篇论文,标题为《原核重复序列与免疫系统相关》。换言之,CRISPR系统是细菌获得对某些病毒的免疫力的一种方式。杂志编辑甚至未将该篇论文送审。编辑们错误地认为,该篇论文不存在以往CRISPR相关论文中未包含的内容。编辑们还宣称,莫伊卡并未提供实验室的相关实验结果,以证明CRISPR系统的有效性。该说法在一定程度上言之有理。

另外两家刊物也拒绝发表莫伊卡的论文。最终,莫伊卡在《分子进化杂志》上发表了自己的论文。该杂志虽然未享有盛誉,但却是一份能获得同行评议的刊物。就算是这本杂志,莫伊卡也不得不对效率低下的编辑死缠烂打。他说:“我积极行动,几乎每周都努力与编辑联系。每一周都糟糕透顶,如同噩梦。因为我知道,我发现了至关重要的东西。我知道,在某个时刻,其他人会获得同样的发现。我无法让编辑们了解,该项发现有多么重要。” 9 2004年2月,该杂志接收了莫伊卡的论文,但直到10月才有了定论。2005年2月,论文才得以发表。那时距离莫伊卡获得该发现已过去两年。 10

莫伊卡说,自己对自然之美的热爱推动自己前进。他有幸在阿利坎特进行研究,无须展示如何将研究成果转变为具有实用价值的产物。莫伊卡从未设法为自己发现的CRISPR申请专利。他说:“当你像我一样研究奇奇怪怪、生活在诸如盐池等非常规环境中的生物体时,好奇心是你唯一的动力。我们的发现似乎不可能适用于其他正常生物体。但我们错了。”

正如在科学史上令人们习以为常的情况一样,科学发现可能具有意料之外的用途。莫伊卡说:“在好奇心的驱使下开展研究时,你永远不知道,在某一天,这种研究将把你引向何处。”某些基础发现可能在以后产生广泛影响。莫伊卡告诉妻子,自己预测,未来某一天自己的名字将载入史册。结果证明,他的确有先见之明。

莫伊卡的论文是一个开端,它掀起了一波发表论文的浪潮。此类论文均提供了证据:CRISPR的确是细菌遭受新型病毒袭击时所使用的一种免疫系统。尤金·库宁(Eugene Koonin)在美国国家生物技术信息中心(NCBI)任职。一年之内,库宁就证明了CRISPR相关酶的作用是:抓取入侵病毒的DNA片段,随后将其融入细菌自身的DNA。该过程类似复制粘贴危险病毒的面部照片。尤金·库宁以此发展了莫伊卡的理论。 11 但是,库宁和其团队犯了一个错误。他们猜测,CRISPR防御系统是通过RNA干扰发挥作用的。换言之,他们认为,细菌使用病毒“嫌犯”照片,从而找到干扰信使RNA的方法,而信使RNA携带着DNA编码的指令。

其他人也持相同看法。正因所有人观点一致,作为加利福尼亚大学伯克利分校RNA干扰研究的权威专家的珍妮弗·杜德纳最终意外接到一位同事的电话,这位同事当时正设法研究清楚CRISPR。 mubKbjoI0+OwqRW+XRpsRFbQmJFh9gK6FIECX4okHJ/or4n7YqueQ8tQDp+GLHng

点击中间区域
呼出菜单
上一章
目录
下一章
×