购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

用穷举法证明绝嗣

我们固然可以对这个群体中每一个男性的Y染色体以及姓氏进行穷尽式跟踪,但这无疑是个极其耗费精力的任务。幸运的是,统计学的发展让我们对这个问题有了更优的解法,这是一个非常典型的随机分支过程。

对于绝嗣的恐惧并非中国人独有。早在19世纪后期的英国,就有人发现姓氏在一代代的传承中似乎在逐渐消亡。和中国一样,在意自己尊贵的姓氏是否能够传承下去的主要是社会上层。首先提出这个问题的是弗朗西斯·高尔顿,他是大名鼎鼎的达尔文的表弟。高尔顿家和达尔文家都属当时的英国社会上层,高尔顿又自幼聪慧,因此他对姓氏传承产生兴趣也就不足为奇了。1869年,高尔顿在著作《遗传天才》中就探讨了社会不同人群的绝嗣问题。1873年,他正式从统计学角度提出了绝嗣率应该如何计算。

之所以对绝嗣问题这么感兴趣,可能是因为此时已经年过五旬的高尔顿意识到他自己很有可能会绝嗣。1873年时高尔顿和夫人已经结婚20年,未有一儿半女。很快,数学家沃森提出了自己的想法,在1874年,二人正式发表了一篇论文试图解决绝嗣问题。值得一提的是,沃森也是教会的祭司,因此终身未婚。两人的结论是所有姓氏绝嗣的可能性都是1,也即所有姓氏都会绝嗣。这个结论相当耸人听闻,不过这是由于两人在这个数学问题上出错导致,实际的情况是到了1930年终于有了正确解法,结果虽然惨淡,但也并没有全军覆没这么悲观。

我们之前假设的“每个男性都各生两个孩子”的理想模型显然太过简单。在真实的社会中,每个男性有多少男性后代是不一致的。

我们可以把一个男性的男性后代数量,看作统计学上的一个随机变量,这些变量均为大于等于0的离散型变量(数值只能用整数单位计算的变量,如0、1、2、3等)。

我们设代数为n,某代的所有男性排序为k,把一个男性的男性后代记为 ,某一代所有的男性数量记为 。假如开始时只有唯一的一个男性,则 ,他有两个儿子,则就是 。假设这两个儿子中的第一个又有两个儿子,第二个只有一个儿子,则

如果我们要求在第n代时一共要有多少个男性,则可以用 来表示,即某一代(n+1)是由前一代(n)的男性从k=1的男性后代数量到 的后代数量的总和。

此时我们需要设定一名男性会有不同数量男性后代的可能性。这个可能性遵循一定的分布规律,我们把一名男性的后代数量以m表示,每个m的可能性为 ,这个分布就设定为

毫无疑问,这个人群中的男性在Y染色体以及姓氏传承上的成功率就由概率分布F决定。假设每一代的所有男性都能有两个儿子,即 。则这个群体就会按照第n代男性的数量 ,即按照1、2、4、8、16、32、64、128、256……的数列迅速扩张。

当然在绝大部分情况下,有没有这么好的运气是大可以怀疑的。我们按照另一种情况来设想,在这种设定下,每个男性只可能有0个或者1个男性后代,即 。在这种情况下,这个人群就会发生所谓“数代单传”的现象,最终在某一代因概率使然,最终绝嗣,从此销声匿迹。

以上两种情况当然都和现实相差太远,且过于极端。为了有现实的参考意义,我们还是需要更加符合实际的F。由于假设 ,即“没有男性会有两个或以上的男性后代”,在这样的概率分布下,必然导致男性人口只减不增且快速绝嗣。因此我们设定m 2也必须要有一些概率,把这个人群平均预期男性后代数量的期望值设为μ>0。因为每个男性实际有几个儿子会有差别,因此方差σ2>0。

想要推导一个人群在第n代时会有多少男性后代,这个计算并不困难。由于我们事先假设,一名男性会产生的男性后代数量,与自己的男性先辈的男性后代数量无关,也和其他男性无关,那么,这个随机过程就符合马尔可夫性质,即未来状态的条件概率分布仅依赖于当前状态,和过去的状态无关。这就使得我们可以据此较为轻松地推定这个过程的迭代预期。如果我们把 的值设为i,那么 。虽然初始人群里可能有多个男性,但是我们完全可以只关注第0代时某个特定男性的情况,即 。所以在某代有多少个男性后代就变成纯粹由μ决定,即 。这样就可以看出假设μ小于1,从远期的预期看男性数量必然会逐渐归零。

但是对于绝嗣问题,我们并不仅仅关心平均预期的男性后代数量。更重要的是,单个家族在传代过程中会繁荣昌盛还是趋于消亡。

为了让这个结论更加直观,我们设置一个简单的情况,即这个人群中每个男性有60%(即0.6)的可能性会有一个儿子,20%(即0.2)的可能性没有儿子,20%(即0.2)的可能性有两个儿子,则:

μ=0.2×0+0.6×1+0.2×2=1

那么方差公式则是:

从长期来看,这个状况似乎比较稳定,平均预期男性数量不增不减。

然而具体落到每个个体身上,情况就大不相同了。

我们让这个情况传承两代,则两代后就会出现13种情况(如下表所示)。

这13种情况的概率总和为0.2+0.12+0.36+0.12+0.008+0.024+0.008+0.024+0.072+0.024+0.008+0.024+0.008=1,它覆盖了所有情况。在这些场景中,两代后绝嗣的概率为0.2+0.12+0.008=0.328;两代后原地踏步、仍然还是一个男性的概率为0.36+0.024+0.024=0.408;两代后扩张为2、3、4个男性的概率分别为0.12+0.008+0.072+0.008=0.208、0.024+0.024=0.048和0.008。可见在这种概率分布下绝嗣和原地踏步是绝大多数男性的宿命。

不过俗话说,良好的开端是成功的一半。这一点在我们的小模型上尤其明显。假设第二代成功扩张为两个男性,则在下一代绝嗣的概率就由0.2迅速下滑为0.2×0.2=0.04。也可以看出仅仅经过两代之后,人群的命运就开始发生巨大的分化。

当然,读者大概已经看到,像这样穷尽式地枚举分支过程是多么繁冗的事。因此,我们还需要借助一些统计学方法来继续探讨绝嗣问题。 8ZLSEWPmKNFb+1AEbINgtoE5vUb2tM4DJaaR0RjndhiRzT/ZiTVO5iMcg506IM8x

点击中间区域
呼出菜单
上一章
目录
下一章
×

打开