你可能听说过“数字不会说谎”这句话。这一说法固然没错,但人们常常利用数字来歪曲事实,使其有利于自己想要表达的观点。举个例子,两家报社对失业率进行了报道,一家报社支持政府,另一家报社反对政府。第一份报纸在大标题中写道:“失业总人数保持平稳。”报道的第一段如下:
过去一个月内,失业率基本保持不变。11月9日,失业人数增加了3 972人,总数达601 874人,失业率继续保持在2.6%。
另一份报纸的标题是:“失业人数或将达到70万。”标题下面的导语写道:
失业人数持续攀升。本月失业人数再度超过60万,这意味着11月的失业形势将创下30年来最惨淡的纪录。
这两则相互矛盾的报道甚至用了不同的图表以直观地说明自己的观点(见图3-3)。如图所示,左图显示失业率变化很小,而右图显示10月到11月失业形势发生了巨大的变化。
图3-3 同样的统计数据可以被用以佐证两份截然不同的报道
除了大量不符合逻辑的错误(你能一一指出它们吗?),这个例子还说明,为了把读者引向某种观点,媒体会有选择性地使用统计数据。
第一份报纸希望其所发布的文章给人一种稳定的印象。他们或许对所有可能的数字进行了分析,从中找出一个变化极小的数字,即百分比。
反对政府的那份报纸同样发现了一个具体的统计数据,而这个数据可以让问题显得十分严重。
这个例子揭露了更多有关统计学的问题,而非仅仅说明人们经常引用的“数字不会说谎”。它告诉我们,只有知道统计数据背后的意义,才能对情况有较为准确的认识。此外,我们还可以从中看出统计数据的提供者有什么偏见。
这种统计方法甚是有趣:它不仅呈现了数字信息,还增加了读者对材料背后的动机的了解。
有许多方法可以有目的地选择数据,使结论偏向一方。从错误的平均值假设这类简单的方法,到操纵图表这类复杂的方法,它们可以让好事变成坏事,让坏事看似没有那么糟糕。如果你有兴趣了解数据背后的真相,你可以选修统计学基础课程或自行阅读统计学方面的书籍。只要你具备对统计学的基本了解,寻找逻辑谬误就会成为一项愉快且有益的业余爱好。