撰文:安德鲁·格尔曼(Andrew Gelman)
翻译:郭凯声
统计学家在估计小规模人数时很容易出错,因为被错误分类的比例可能远远高于真实的群体大小。
随着美国军方开始着手审查所谓“不问,不说”政策(Don't Ask, Don't Tell,即军方不可询问军人的性取向,军人也不能向军方透露自己的性取向,最终审查结果将于晚些时候公布),人们自然会想:有多少军人受到这项政策的影响?为了回答这个问题,五角大楼于2010年夏天对军队进行了调查,询问军人们在服役期间或以前在服役时是否有他们认为是同性恋者的战友。此调查存在一个明显的问题—它所依据的完全是推测。撇开这一点不说,这项调查还提出了一个常见的统计学问题,即群体大小的不对称性。由于军人中绝大多数是异性恋者,因此,异性恋军人被误当作同性恋者的情况,将比同性恋军人被当作异性恋者的情况多得多。
这是问卷调查中普遍存在的一个问题。哈佛大学研究人员戴维·海明威(David Hemenway)证明,某些广为人知的调查把美国人用于自卫的枪支数目高估了10倍之多。即使所有受访者中错误回答问题的人只占1%,这个错误率与持枪用于自卫者在总人口中所占的比例(据一些靠谱的调查披露,此比例约为0.1%)相比也够大的了。换言之,被错误分类的比例远远超过了真实的群体大小。要想避开这个问题,更明智的做法是,相信对犯罪受害者的调查结果,因为这类调查把使用枪支的问题限制在一个规模更小的群体上。
对于我们开头提出的那个问题,要调查军人中同性恋者所占的比例,一个还算不错(但仍不完美)的解决办法就是,把下面两项估计综合起来:一是估计同性恋者在总人口中所占的比例(从全国性调查中得出这一估计值易如反掌);二是估计同性未婚伴侣中曾在军队中服役者所占的比例(用概率表示)。从总人口类推到军人,并把分析限制在同性未婚伴侣这个小圈子里,从而缩小了可能被误判为同性恋者的群体。加利福尼亚大学洛杉矶分校的加里·盖茨(Gary J. Gates)用这种方法估算出美军中1.5%的男性和6.2%的女性是同性恋者或双性恋者。