J.P.是一个四十多岁的已婚男人。照片中的他面带微笑,淡定自若。资料显示,他目前生活在纽约,在一家优秀媒体公司工作。我们原本是生活在大西洋两岸的陌生人,但是有一天,J.P.在23andMe网站上向我发来了好友添加请求,于是我们开始了联系,就像大家使用Facebook(脸书)、Twitter(推特)或Instagram(照片墙)交友一样。区别在于,我们的社交纽带并非双方喜欢的电影或音乐、一起上过的学校,或者在社交媒体平台上经常分享的其他内容,而是我们共同的DNA序列。我参与唾液DNA检测,原本是希望深入研究我的基因组,探寻自己未来健康的秘密。但是,通过DNA检测,我发现了一个围绕我的基因所建立的一个庞大的社交网络,一个能让我与世界各地的陌生人建立联系的DNA平台。
自从我的唾液样本被取走并寄往加利福尼亚州以来,发生了许多事情。当样本到达目的地后,我的DNA被提取、解码并存档。然后,一个名为Relative Finder(血脉搜寻)的应用程序将我的档案与所有其他客户的档案进行比较,旨在寻找我的家族成员。
结果表明,J.P.和我是第五代表亲关系。在欧洲的某个地方(很可能在都灵 附近,我们稍后就会知道),我们有一个共同的曾曾曾祖父或曾曾曾祖母。但是每个人都有成千上万的远房表亲,而J.P.只是我的众多表亲中的一员。在Relative Finder上,我的表亲队伍在不断壮大,就像在Facebook上不断增加的新朋友一样。如果我们往前推五代,假设我们的每个前辈都有两三个孩子,并且代代繁衍生息(研究人员认为这些数字是相当准确的平均值),那么我们每个人的第五代表亲上的成员数量将达到4 700人,这足以塞满一个中等规模的礼堂。
在我的23andMe的档案上,这个群体的人数一直在缓慢增加。最初时仅有几个人,而随着越来越多的人注册服务,以及Relative Finder的高效匹配,现在已经发展成为一个庞大的家族。我的大家庭现在共有1 800个成员,还在不断增加,我们每个人都有自己的个人资料和一个“添加好友”按钮,我可以很方便地联系他们。如果没有这个基因组匹配系统,我很难在网络或现实生活中与这些人相识。我有一位第四代表姊妹埃莉诺(Eleanor),根据Relative Finder中她的个人资料(附有照片),她是拥有乌克兰和爱尔兰血统的美国居民。还有一位目前定居在美国费城的第五代表姊妹玛丽(Marie),已90岁高龄。她与我母亲一样,都来自西西里岛的同一个小镇。在加拿大,我还有一位表姊妹凯瑟琳(Kathleen),她在1981年通过配子捐赠出生。她非常渴望找到自己的亲生父亲。“我只想找到我的家人”,她在个人资料中发布了寻人启事并且贴出一张自己和小儿子的照片。我还有一位第三代表兄弟奥雷里奥(Aurelio),目前居住在意大利。他是一个六十多岁的男人,我们之间有一段非常接近的DNA片段。我需要花费几十年的时间进行“沙发旅游” ,才能遍访我所有的表亲。哪怕只有一半的人邀请我参加家庭庆典活动,我在余生中都将不停地参加各种婚礼、洗礼、首次圣餐、感恩节和毕业典礼,那将是多么可怕的经历啊!
我应该如何应对这些准亲戚?他们对我来说有何意义?
我们经常会将DNA技术与白大褂联系起来,即那些硬科学 研究人员,以及从事判断、治疗疾病的医生,或通过遗传线索寻找真凶的侦查人员。但是,J.P.、凯瑟琳、奥雷里奥和我并不是医生或者警察,我们只是普通老百姓。当我们坐在家中的沙发上,孩子们正在旁边看着奈飞(Netflix)电影,厨房里正热气腾腾地煮着意大利面条时,我们用手机建立了联系。我们通过基因组在数字世界中建立社交关系,就像在Facebook或YouTube上共享照片、消息或视频一样。
基因组社交网络标志着我们管理生物信息的方式发生了范式转变。我曾经认为我的基因组报告就是一套诊断和预测性检测,这是一个非常隐私的问题,最多可以与我的医生或好友进行私下探讨。而现在,我发现自己被放置到一个平台上,需要与成千上万的陌生人共享我的基因组,这是一个非常成熟的DNA社交网络。23andMe的联合创始人安妮·沃西基在谈到自己的公司时曾说:“我想获取自己的基因组信息,并且想用它建立一个社交网络。”
从某种角度来说,Relative Finder的匹配结果总是正确的。它获取客户的DNA信息并进行比较,并告知用户它们之间的紧密关系。这个系统比较科学可靠,但是我们的家族史早已消失在时间长河中。当我们在网络上首次相识后,科学工作就此告一段落,接下来主要就是回忆工作。为了确认我们的家族关系,我和我的表亲们需要比较我们祖父母的姓氏、祖籍、居所的变迁,以及我们目前了解的有关祖先的所有信息,然后记录下来,代代相传。当我和J.P.成为“好友”之后,我们可以看到彼此的更多信息,就像使用其他社交网络平台一样。J.P.的个人资料包括一长串他已知祖先的姓氏和出生地,有些能与我的祖先匹配,或者唤起我的记忆。他的某些祖先来自意大利北部的皮埃蒙特(Piemonte)地区,我和我父亲也出生于此地。而且,我们还拥有一些相同的家族成员,这充分证实了我们具有亲戚关系。在这个非凡的社交网络上,分享彼此祖先的详细信息是常规礼仪的一部分。此外,还有诸如Ancestry.com这样的专业平台,可以帮助人们回忆,将个人遗传资料与来自庞大系谱数据库的世界各国注册者的档案和家庭树 资料进行交叉比对。
J.P.和我现在已经成为网络“好友”。我们彼此约定,如果我有机会路过纽约,或者他有空来到我居住的托斯卡尼(Tuscany)附近,我们就好好聚聚。尽管我们目前仍未谋面,但是我觉得如果我们将来能有机会相聚,把酒言欢,聊聊我们共同的祖先,那将会非常有趣。毫无疑问,J.P.是个好人。然而,仅依靠真假难辨的遗传相似性而不是通过实际接触来建立新关系是一种全新的却有些令人恐惧的体验。从统计学角度来说,我的1 800多个表亲的大家族中肯定包含很多无聊的人,甚至是罪犯!我这辈子都不想和这些人见面。
为了避免混淆,Relative Finder把我的联系人称为“遗传亲属”或“DNA表亲”。纽约哥伦比亚大学的社会科学家阿朗德拉·内尔森(Alondra Nelson)认为,这种定义有些多余,因为“表亲”和“亲属”这样的词语已经表明了生物遗传联系,无须再使用“DNA”和“遗传”这类词语进行限定。内尔森指出,这种冗余定义表明Relative Finder提供的是一种不精确的谱系,通过这个平台找到的联系人虽然具有遗传学上的关联,但与我们的原生家庭成员仍有很大区别。
当我查看自己在Relative Finder上的资料时,深深感受到了这种谱系的不精确性。正如Facebook通过将在线联系人变成“好友”,重新定义了朋友的概念一样,23andMe也为我提供了一个全新的陌生人群体,让我把他们视为家庭成员,从而重新定义了亲戚的概念。在社交网络时代之前,“朋友”的定义是明确的,我们非常清楚,在日常生活中与自己关系密切的少数人才是自己的“真正”朋友,而在Facebook上的“好友”只不过是在线联系人。现在我应该如何看待我在23andMe上找到的第三代或第四代表亲呢?他们是我的表亲、远亲、路人,还是其他人?需要多近的亲缘关系才能将某人视为家庭成员呢?我们目前还没有合适的词语或参考资料来定义这些全新的遗传准亲戚,所以可能很难将他们与我们的原生家庭成员进行区分。
Relative Finder到底是如何确认不同人之间的家庭联系呢?我们很容易想到一个答案,即基因组越相似,人与人之间的亲缘关系就越密切。而事实上,要想判断两个人在多大程度上具有亲缘关系是一个非常复杂的过程。我们人类有共同的祖先,所以,无论是否具有亲戚关系,我们的DNA都是相似的。因此,要确认亲缘关系,不能只比对人们之间有多少相同的DNA字母,因为这种差异性实在是太小了,以至于我们每个人看上去都具有亲缘关系。
Relative Finder不会比较字母的序列,而是将每个染色体分成若干区块,判断不同个体间的染色体区块的差异,并以此为基础来确定亲缘关系。亲兄弟之间拥有相同的包含数百万字母的较长DNA片段。相比之下,第一代表亲相同的染色体块数量相对较少且长度较短,以此类推,当延续到第十代左右时,这个搜寻系统就再也无法追踪任何家庭亲缘关系。这种遗传现象称为互换(crossing over),你上初中时应该学过。
在卵子和精子的结合过程中,来自母方和父方的各一对染色体在分裂时就会发生互换。互换过程中的分子变化细节非常复杂,但你可以把它想象成一场浪漫戏剧的高潮,父亲和母亲的染色体拥抱在一起,像恋人一样久久不愿意分开,而细胞系统则绞尽脑汁想要把它们拉开。它们最后的拥抱激情澎湃,紧紧缠绕在一起,并进行部分基因互换。父亲的染色体将从同源母亲的染色体中获取DNA块,反之亦然。
该过程将基因卡片重新洗牌,并在每一代中创造无数种的染色体组合。如果没有互换,染色体将以单块形式传递。后代中的基因组合将非常有限,遗传学将变得非常枯燥,物种将没有足够的遗传变异性来进化、抵抗感染以及适应环境变化。此时,你就可以看到这种基因重组对于Relative Finder来说非常有用。亲兄弟之间只有一次互换的差别,而第一代表亲则有两次互换的差别,以此类推。通过测量相同的DNA块的数量和长度(这些DNA片段被称为“同源相同基因”),这种算法可以估算出两人之间具有多少次互换的差异,并确认他们的关系。
雄性Y染色体是一个值得注意的例外。由于它没有雌性的对应染色体,因此不受互换的影响,并且从上一代到下一代几乎没有变化。我和我的兄弟拥有从父亲那里继承的相同的Y染色体,而我父亲则是从爷爷那里继承这种Y染色体,以此类推。显然,这一特征对于我们追溯几千年前的父系非常有用。
在2013年的喜剧电影《百万精先生》( Delivery Man )中,大卫·沃兹尼亚克(David Wozniak)[文斯·沃恩(Vince Vaughn)饰]是一位捐精者,并因此拥有了533个亲生孩子,他不得不竭力隐瞒自己的身份。这部电影并未提及DNA社交网络,但是如果主角在这个网络上注册一个账号,那么他为保护隐私而进行的努力从最初就将注定失败。如果说有一类人能从Relative Finder上发现意外惊喜,那么肯定就是捐精者及其后代。
出生证明可能会随着时间推移而泛黄或丢失,姓氏也可能会拼错,但是我们的DNA可以世代相传,它就像藏匿在我们染色体中的一个黑匣子一样。我们可能是两位匿名捐赠者的孩子;我们可能与亲生父母失去联系;我们可能主动或不得已与亲戚们疏远;我们可能会移民到其他国家;我们甚至可能会更改我们的姓名、身份和个人详细资料。但不管怎样,我们总能通过DNA线索来寻觅到我们的谱系。尽管许多国家的精子库都会保证不透露捐精者的身份,但是如果将父子或兄弟姐妹的DNA文件上传到同一基因组社交网络中,系统会立即识别他们的关系,并透露给那些对此感兴趣的人。
2005年,有位15岁的男孩成为首位将其DNA发送到在线系谱服务平台来寻找亲生父亲的人。而他的父亲是平台当初承诺不透露其信息的捐精者。这种情况现在非常普遍,以至于在2016年《人类生殖》( Human Reproduction )期刊上发表的一篇科学论文正式宣称捐精者已不存在匿名保证。作者指出:“有关各方必须意识到,在2016年,捐精者的匿名性将不复存在。”
即使你从未使用过基因组服务,且你的DNA文件也不在数据库中,你的后代仍然可以通过对基因组社交网络上收集到的信息进行三角定位 来找到你。许多被收养者或通过配子捐赠出生的孩子们通过求助围绕他们DNA文件建立的表亲或同父异母(同母异父)兄弟的社交网络,同时收集有关其原生家庭的信息,成功找到了未在系统注册的亲生父亲。
随着消费者基因组学的不断发展,我们在网上看到了很多家庭团聚的感人故事。我曾经读过这样一个故事:一位51岁的女士(用户名:hippiemum)在Relative Finder上找到了她的亲生父亲,才知道抚养她长大的那个人并不是自己的亲生父亲。于是,她就在我关注的一个基因论坛上写下了她的故事。数百名用户纷纷为她提供精神支持和实用建议,试图帮助她与亲生父亲建立联络。故事的结局非常圆满:hippiemum(她后来透露了自己的真实姓名,以及她居住在美国佐治亚州的信息)最终联系到了她的亲生父亲,而且还联系到了她的祖父母,并与这对精神矍铄的老人建立了非常美好且亲密的关系。
然而,除了这些幸福美满的结局外,人们很想知道究竟还有多少故事以泪水甚至创伤收尾。根据数据统计,像hippiemum这样的经历并不少见。根据多年的分析,大多数遗传学家认为,实际上约2%到10%的人的父亲并非亲生父亲。这就为那句古老的拉丁语名言提供了科学理论的支持,即Mater semper certa est, pater semper incertum est(母亲的身份总是确定的,而父亲的身份则不一定)。这就意味着,成千上万的唾液受测者的亲生父亲并非抚养他们长大的那个人。同样,成千上万的人可能会在Relative Finder上收到这样的消息:你好,爸爸!我想见见你。
《波士顿环球报》( Boston Globe )2019年的一篇报道声称,支持人们通过唾液检测来寻找自己亲生父亲的团队数量正在增加。来自得克萨斯州的凯瑟琳·圣克莱尔(Catherine St Clair)与hippiemum的经历非常类似。她55岁时,发现叫了一辈子“爸爸”的男人并不是她的亲生父亲。这个消息对她来说如同晴天霹雳。从那以后,她组建了一个在线互助团队,目前成员数量已达到5 000多。她在网站上写了以下这段话:“我们知道50~70年前是一个完全不同的时代,没有人预料到这些秘密现在能通过科学的手段被轻松解密。然而,我们现在深刻感受到了解密以后给人们带来的巨大创伤。我们希望随着这种全新易用技术的推广,人们的文化态度能不断改进,逐渐消除这种行为的‘非法性’污名”。
你可能会认为,父亲身份的错误匹配会让想尝试使用Relative Finder的人们望而却步,但事实恰恰相反。许多人,尤其是那些已经知道或怀疑自己被收养的人,或者那些对自己的亲生家庭的真实性有疑问的人,都会使用在线基因组服务。他们的目标非常明确,就是要找到他们的亲生父母或亲兄弟姐妹。23andMe甚至还鼓励每个家庭都参与DNA检测,“以便提升亲缘关系的体验”,并且拥有与兄弟姐妹和家庭成员重逢团聚的美好而快乐的回忆。
然而,对于某些人来说,这种经历简直就是一场噩梦。帕姆(Pam)和约翰·布拉努姆(John Branum)是来自美国的一对已婚夫妇。2014年,当他们将自己的唾液样本和女儿安妮(Annie)的唾液样本寄送给23andMe进行DNA检测时,他们根本没想到这会披露一场震惊全国的重大丑闻。根据Relative Finder的检测结果,安妮的“亲生”父亲约翰甚至没有被列入安妮的“DNA亲戚”清单中,这引起了家庭成员的疑虑。安妮当时二十多岁,原本被认为是通过帕姆的卵子和约翰的精子在体外受孕而生。她的表亲网络与其父亲的表亲网络完全不符。根据系谱学家的建议,布拉努姆夫妇将安妮的唾液样本寄送到其他DNA系谱平台,最后发现安妮的亲生父亲是托马斯·利珀特(Thomas Lippert),他在犹他州的一家生育诊所工作。二十几年前,布拉努姆夫妇曾在那里做过人工授精手术。据称,利珀特用自己的精液替换了约翰和许多其他捐赠者的精液。利珀特在这次精子调包事件被披露之前就已经去世。他是一位大学教授,长期酗酒,而且因犯重罪而被判刑,曾参与绑架他的一名女学生进行心理实验。
本次事件曝光后,媒体纷纷表示强烈谴责,要求这家生育诊所必须公开道歉,并要求有关部门对其进行审查。总之,这一新闻并非我们期待的结果。有些时候,事情并不会像公司网站所说的那样,DNA检测能够帮助家庭“提升亲缘关系的体验”。
从医学的角度来看,分子系谱学是保持中立的,因为它没有提供与健康直接相关的信息,但它却会带来很多意外事件。到目前为止,我在Relative Finder上只找到了自己的远亲,但是随着数据库不断扩大,我能确保将来不会有意料之外的孩子或兄弟姐妹来造访我的网络空间吗?我虽然一直信任我的父母,但我能确保他们从来没有搞过婚外情吗?我能确保我的同父异母或者同母异父的兄弟姐妹不会在某一天突然来到我面前吗?我当然不能。无论你的想法是多么单纯,只要你试图寻找自己的远房表亲,都很可能会发现有关自己基因遗传的意外事件和令人震惊的事实,你需要做好这方面的思想准备。
1979年,迈克尔·杰克逊(Michael Jackson)发行了他的突破性专辑《疯狂》( Off the Wall ),英国爆发了自1926年以来最大的一次公共部门罢工,阿亚图拉·霍梅尼(Ayatollah Khomeini) 返回伊朗,旅行者1号飞船 拍摄到了木星的光环。同年,哈佛商学院的年轻学生丹·布莱克林(Dan Bricklin)开发了世界上第一个在个人电脑上运行的电子表格软件VisiCalc。由于以前从未出现此类软件,无数人争先恐后地购买电脑,只为能够运行这个软件。这个电子表格软件将家用电脑从书呆子的玩具转变为“必备”的商用办公工具,从而导致整个行业的爆炸式增长,并推动该行业掀起一场改变世界的革命。如果某个应用程序非常实用或满足需求,能够决定某项技术的商业成功,那么在营销术语中,它就被称为“杀手”。后来,史蒂夫·乔布斯(Steve Jobs)将VisciCalc称为电脑时代的“杀手级应用程序”。
在DNA时代,系谱学就像当年的VisciCalc一样,是一种“杀手级应用”,将DNA检测从早期只有少数人使用的小众服务变成如今非常流行的大众服务。在消费者基因组学问世之初,大家普遍认为医疗应用将成为其吸引用户的主要途径。但事实证明,如今大多数消费者购买DNA检测套件主要是为了寻觅他们的祖先和分布在世界各地的亲戚。在DNA检测问世以前,系谱搜寻就已经广受欢迎,并且建立了庞大的全球市场。在美国,它已经成为大众的第二大日常爱好,仅次于园艺。系谱爱好者社区的成员总计约9 200万人,主要分布在北美、澳大利亚和英国。在澳大利亚、加拿大、德国、瑞典、英国和美国,约有36%的成年人使用互联网来了解他们的家族史。根据欧盟的一份报告,目前欧洲人对于系谱搜寻的花费和兴趣也呈指数级增长。BBC(英国广播公司)曾拍摄了一部有关系谱的系列纪录片《寻根问祖》( Who do you think you are ),取得了巨大的成功,目前已播出13季,并在18个国家和地区发行了多个国际版本。
此外,消费者基因组学的横空出世彻底改变了系谱行业。总部位于美国犹他州的Ancestry.com和以色列的 Myheritage.com是两个世界上最大的系谱网站。在DNA检测套件面世之前,这两个网站的数据库中就已经存储了4 500万个家族档案。此外,还有些小型网站发展的也不错,比如名字有些怪异的Findagrave.com或英国网站Findmypast.co.uk,目前拥有1 800万个用户。Ancestry.com和Myheritage.com是最早提供DNA基因血统检测的公司,现在已经发展成拥有数百万个唾液受测者的遗传社交网络,后来,几乎所有系谱公司都遵循这种模式发展。
如今,越来越多的人投入系谱研究中,关注健康产品的消费者也日益增多。DNA检测服务也想乘势而上,努力寻求市场成功。系谱学正在吸引越来越多的客户参与唾液检测,并已成为整个行业的最大驱动力。它有力地推动了消费者基因组学的发展,没有任何其他应用可以与之匹敌。根据美国疾病控制中心(CDC)的说法,系谱DNA检测套件在日益流行的同时也推动了其他类型基因检测的应用,尤其是在捆绑销售时更是如此。