购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

2.3 《观察》中的创新思想

格朗特在《观察》一书中,分析了60多年伦敦居民死亡的原因及人口变动的关系,首次提出通过大量观察,可以发现新生儿性别的比例和不同死因的比例等人口规律;并且第一次编制了“生命表”,对死亡率与人口寿命做了分析,使人口统计学成为一门相对独立的学科。他的研究清楚地表明了统计学作为国家管理工具的重要作用。我大胆借用前人的论述,列举其中的四个创新点:

1. 格朗特提出了“数据简约”的概念,即把数量庞大的杂乱无章的数据,依分类标准整理成一些意义明晰的表格,使得数据中包含的有用信息能够凸现出来。这一思想在当今的数据分析中仍是基础性的工作。

2. 格朗特提出了数据的“可信性”问题,指的是,是否有人出于某种目的而对数据作了篡改,或在获取数据的过程中出现了重大的失误,如实验仪器未调准或登录网页时书写有误。样本中这样的数值叫作异常值。鉴别数据中是否有异常值,这是一个直到当今在应用中仍然很重要并在方法研究上受重视的问题。

格朗特分析的具体例子如下:

1603年和1625年都是黑死病大流行的年份。统计所得1603年后9个月死亡总人数为37 294,其中黑死病死亡人数为30 561,约占82%。1625年后9个月死亡总人数为51 758,其中黑死病死亡人数为35 417,比率为68%,黑死病死亡率显著降低了。另一方面,格朗特从这两年的受洗人数推知,该两年的死亡率基本相当且都达到最大。于是就有问题:1625年黑死病死亡率比1603年低,是真的表示当时黑死病死亡率确实降低了,还是数据有问题。他注意到在1625年前后没有黑死病的年份,死亡总数在7000—8000,而1625年死亡总人数为54 265人,1625年非黑死病人数则达到54 265—35 417=18 848。这个数字比邻近年份多出约11 000人。这显然不合理,说明1625年黑死病死亡统计过低,原因有可能是死者家属行贿,让执事者把本因黑死病身亡的人改为其他原因。这种情况按上述计算约有11 000人。若把这数加入1625年统计的黑死病死亡人数35 417,从而该年黑死病死亡率为46 417/54 265=85.5%,与1603年的82%相当。这证明了上述校正的合理性。格朗特这一方法的创意和启发性是重大的,直到当今“数据的可信性”问题仍然存在。

3. 统计比率的稳定性。指某种特性出现的频率,随着观察次数的增加而趋于稳定。他处理的一个具体问题就是伦敦和罗蒙塞两地男女出生数和死亡数的统计。以8年为一时段看出两地男女出生比率趋于稳定且略有不同。他推断在伦敦男女出生比率为14∶13,而在罗蒙塞为16∶15。这在历史上是首次通过具体资料证明男女出生率略有差异。这种统计比率的稳定性也启发了后人如伯努利的“大数定律”。

4.生命表,是指现存人口的年龄分布。这有几方面的用途,例如可计算在某一年龄间隔内的人数的百分比,可计算一个活到某一年龄 a 的人中,至少再活 b 年的百分比,而这对于保险金、年金的计算有直接的关系。格朗特在书中首次提出了这一概念,成了现今“精算术”的萌芽。 [3] uBDAGD08GYyFwoh8kTKesxB/W+8R/82hKxCgTHOZp3eLfpRevlMM7SixIB0+L6tt

点击中间区域
呼出菜单
上一章
目录
下一章
×