托马斯·贝叶斯以及他身边那个家境富裕的数学爱好者圈子,对伯努利和棣莫弗两个人都非常熟悉。贝叶斯的传记作者戴维·贝尔豪斯跟我说:“我认为贝叶斯、菲利普·斯坦诺普伯爵两个人当时正在学习1733年棣莫弗出版的那本《机会论》。我的观点是,正是这本书点燃了贝叶斯对概率论的兴趣。”“当时”指的是1735年前后,此时贝叶斯已经30多岁了。
与此同时,英国还有一个和托马斯·贝叶斯同名的人,即托马斯·辛普森,他的研究方向和棣莫弗差不多。辛普森是莱斯特郡一名纺织工人的儿子,继承父业之后,他开始自学数学——这种现象在当时相当普遍,辛普森后来加入了斯皮塔菲尔德数学学会,该学会有一半的会员是纺织工。
根据史蒂芬·斯蒂格勒的说法,辛普森的人生非同寻常:他19岁时娶了一个50多岁、育有两个孩子的寡妇为妻(还有些传记认为他娶了自己的房东,两个孩子都是二人生的
);“不知是他还是他的助手,在占星术课堂上打扮成魔鬼的样子,吓坏了一个女孩”,自此之后全家人不得不搬离纳尼顿逃往德比
(据说那节课刚好赶上了日食)。1736年,一家人已经搬到伦敦生活。
辛普森与本书内容关系最密切的数学成果诞生于1755年。那是一篇分析天文学观测误差的论文:如果有6位天文学家都观测到了某行星,但各自的记录数据却略有不同,那么我们该如何记载它的确切位置呢?
辛普森认为,我们应该使用所有观测结果的均值(就像当时很多人建议的那样),而不是“亚里士多德均值”——最大值与最小值加起来除以2。利用大数定律的某个特例,他成功证明了自己的观点。
这里我不打算展开细说,主要是因为这些内容和标准差那部分的内容有很多重复的地方,但其中有两个重要细节我得强调一下。第一,辛普森确确实实地在分析推断,而不是样本。换句话说,他关心的是“如何根据已经得到的结果推算某个假设成立的概率”,而不是“如何根据已经构建好的假设推算出现某个特定结果的概率”。他做的事情是根据观测数据确定行星位置,而不是根据行星的确切位置去分析出现误差的概率有多大。虽然辛普森是在对误差分析进行了极度简化的情况下才得出了结论,但这仍是一次伟大的尝试——统计学终于脱离了“赌场老手的数学游戏(或赢钱秘诀)”的范畴,成为一种有广泛意义的推理工具。史蒂芬·斯蒂格勒甚至给出了这样的评价:“据我所知,辛普森是历史上第一位向实验科学家给出统计建议的数学家。”而该建议其实很简单:在求平均值时,观测数据应尽可能多一些。
第二,辛普森这篇论文的审稿人刚好就是正在坦布里奇韦尔斯担任牧师的托马斯·贝叶斯。贝尔豪斯表示:“当时,他对概率知识的掌握已经相当娴熟,对论文的一些细节提出了非常宝贵的见解。”如今被称为“测量误差”的概念就是其中之一。贝尔豪斯还表示:“贝叶斯对这篇论文的主要评价可以总结成一句话——没错,这篇论文在数学方面没有任何问题,但如果测量仪器本身就存在误差该怎么办?在这种情况下,求平均值也没用。”
在写给物理学家约翰·坎顿(也是纺织工的儿子)的一封信中,贝叶斯写道:
仪器本身的缺陷、人类感官的不完美,也会导致误差的出现。我认为仅仅增加观测次数无法消除这种误差,也无法将其降低至近乎零的水平。恰恰相反,使用带有缺陷的仪器进行的观测次数越多,似乎就越能说明,这种误差的大小和仪器的缺陷程度成正比。如果不是这样,在那些需要多次观测的场合下使用更精密的仪器也就没有什么意义了,也就不会有人发现误差了。
比如你现在想测试一个人跑1英里需要多长时间,但你的秒表稍微快一些——它走1分钟,正常的表才走59秒。这种情况下对数据取平均值是没有用的,你只会越来越相信那个错误的答案。
辛普森听取了贝叶斯的意见,并在论文的修订版中加上了这样一段话:“我的结论是有前提的——测量仪器不能含有固有缺陷,导致每次结果都包含相同的误差;每次数据过大、过小的概率应当一致,或基本一致。”
总而言之,贝叶斯至少在1755年之前就开始思考“统计推断”,或者说反概率的问题了——还记得吗,统计推断研究的是“如何根据已经得到的结果推算某个假设成立的概率”;而“概率推断”恰恰相反,它关心的是“如何根据已经构建好的假设推算出现某个特定结果的概率”。如果贝尔豪斯的记载没错,那么早在18世纪30年代中期,读到棣莫弗的著作的时候,贝叶斯就已经对反概率产生了兴趣。