社会学调查的问卷设计的一般流程,是在选定一个理论之后,把它转化为问卷中的具体的相关假设(袁方,2000;风笑天,2009;巴比,2009;郝大海,2009)。
在自然科学界流行一句话:提出一个好的假设就是成功的一半。社会学的问卷调查对自然科学亦步亦趋,因此提出一个好的假设是问卷设计的灵魂。也就是说,研究者想获得的那个结论,实际上早已经渗透在自己所设计的问卷里面了。因此,问卷设计的缺陷,无法用统计学来弥补。
对于一个好的问卷设计来说,哪怕仅仅集中于一个研究目标,也至少需要同时具有5种假设而且缺一不可。但是,其中的理论假设已经在前文论说过,所以下面只列出4种假设。
核心假设
一般来说,一个社会学问卷里不会只有一个假设。这就需要研究者把自己的各个假设进行分层,找出而且紧紧抓住最根本的、足以牵一发而动全身的那个假设,然后以它为中心来建设自己的假设体系。这就是核心假设。
这一点说起来容易做起来难。笔者在教学实践中经常发现:有的问卷设计者虽然可以确定自己的核心假设,却很容易忽视了据此去构建“假设之树”,结果那个核心假设就降级为首要假设了。
在笔者的四次全国调查的问卷设计中,核心假设是来自于交换理论的“般配假设”。因此必须经过不断的调试,把问卷中的其他各个假设,都尽量设计为“般配假设”的派生产物。例如:“对于男女在性生活中的角色的认同”本来属于脚本理论,“双方相识之初的各自社会归属”原本是社会网络理论的提问,但是在核心假设的统领之下,都被有意识地设计为足以对“般配”进行扩展的检验。
操作假设
研究者准备使用哪些概念,哪些指标,哪些变量来检验自己的假设呢?表面上看来,这不外乎就是假设的卷面实现,在我国的教科书里普遍都作为指标与变量的设计来论述(袁方、王汉生,1997;洪小良,2005;风笑天,2009;郝大海,2009)。可是,正如本书前文所述,研究者每提出一个指标、变量、提问、备选答案,其实都是在做出一个假设。因为只有研究者认为它们是可能与调查目标最相关的,才会舍弃也许是无穷多的其他选择。
控制因素的假设
没有控制因素,问卷就会变成“放之四海而皆准”“千秋万代不变色”“不以人的意志为转移”的思维怪胎。可是,控制因素是不会自己跑到问卷上面去的,任何统计分析也无法帮研究者事后找出来控制因素。因此,研究者必须精心设计控制因素。
更加重要的是,在任何一个调查报告里,问卷设计者都应该明确地写出:在我的这个问卷里,控制因素究竟有哪些。这并不是说不写出来就会影响数据分析之结果,而是说非如此不足以表明作者的学术水平,也不足以让读者进行评价。笔者希望这能够逐步成为中国社会学界的规范之一。
最必不可少的控制因素就是时空假设。它在问卷中无处不在,几乎每一个提问都应该加上“在什么时间段内”“在什么情况下”这两个条件。也就是说,研究者最终所得到的每一个统计学的相关关系或者检验结果,都仅仅是由于研究者在这样一个总体中与时空范围内,调查了这样一个时期内发生于这样一种情况下的某些现象,才能够得到这样的结果。如果研究者懒得把这些边界说清楚,那么引起别人误解与质疑的可能性就会大大增加。
除了时空因素以外,每一个调查目标都必然还会有其他许多控制因素。例如,调查一切与劳动相关的现象(收入、流动等),至少必须设置“健康状况”这个控制因素而且提出对于它的作用的假设。
当然,对于专家来说,各个假设之间互为控制因素是完全可以做到的,那么就请把这些相互关系写出来,以方便后来者求教。
分析方法的假设
在设计问卷的时候,如果没有确定将来要使用什么样的统计方法来进行分析,那么就像米下锅了还不知道要烧饭还是熬粥,其恶果不仅仅是最后做出夹生饭来,而且很可能中途就把锅烧坏了。
对于人类的性行为与性关系来说,最重要的是“有没有过”,这是古往今来对于人群的最基本的分类,也是最不容易错答的提问。至于“有过多少”,相对更加难以准确回答,很少有被调查者有能力有意愿进行哪怕是最简单的计算,反而容易迫使他们乱答,因此宁可舍弃这样的提问。
由此,笔者的四次全国调查都是事先就准备采用逻辑回归来分析。所以,必须把这些提问的备选答案尽可能地转化为两极选择(是不是、有没有),哪怕被外行人认为是太简单了也罢。反过来看,既然笔者已经确定了要使用的统计分析方法,那么如果在问卷中更多地设置定比的或者定量的备选答案,那就反而成为一种失误了。
如果准备进行时间序列分析或者多层分析,那么在问卷中就必须设计出所需要的各种专门的变量、限定条件与特殊的备选答案。反过来也一样,如果事先没有进行过这样的设计,那么统计学是无能为力的,除非“强行分析”。正是因为笔者的第二次“性调查”中设计了社区调查表,获得了被调查者个体居住区的特征数据,本书作者之一的王东在博士毕业论文中建构了对“多伴侣性行为”的多层次解释模型,在个体解释维度之外,探索了整体(社区、地区)因素的影响,从而扩展对多伴侣性行为的理解。
当然,分析方法的假设并不意味着问卷设计一定要跟着任何一种统计方法的具体要求跑。如果研究者从社会学自己学科的需求出发,设计出某种统计学方法目前尚且无法分析的调查问卷,那么就应该只管去做,而不应该削足适履。
综上所述,在问卷设计中,如果说对于确定人的社会归属存在着“五朵金花”(年龄、性别、文化程度、职业、收入),那么在提出假设的时候也同样有上述的“五朵金花”,而且五花齐放才是春。
这也是一个常见的问题。专业人员都知道,统计学意义上的相关绝不是因果关系,也绝不是单向的,一定是双向的,A如果跟B有关系,那么B一定跟A有关系;A如果作用于B, B一定作用于A。这在统计学上都是常识,可是在设计问卷的时候却容易忽视这一点,只假设A对B起作用,却没有考虑B对A起不起作用。这并不是说一定要把所有的变量都设成双向相关,而是研究者必须考虑到单向的相关假设很可能是一个错误,很容易造成解释上的偏差。
如果想通过问卷调查去探明两者的关系,那么使用单向假设去设计问卷就达不到目的。因为这无异于在寻求答案之前,就已经规定了答案必须是什么样。这就会导致在分析资料的时候,对社会现象做出片面的解释。
在笔者的问卷中也存在这样的忽视。例如,笔者设置了居住环境对于性生活的影响这样一个相关关系,但是它却是一个单向假设,仅仅假设了居住环境可能影响性生活,却没有假设性生活对于居住环境可能产生什么样的影响。例如,笔者在“地下性产业”研究中了解到,有些路边小旅馆就是因为许多“小姐”住进来“做生意”,使得旅馆也变身了。只可惜这个认知晚于笔者的全国问卷调查,所以未能应用进去。
在单向假设下所收集到的数据,到了统计分析的阶段也就只能进行单向的检验,不可能分析两者之间的相互关系,因此客观上等于把一种相关关系误当作因果关系了。
因此,本书主张应该尽量多提出一些双向的假设。例如,情绪和性生活频率的关系就是双向的,既可能是因为情绪不好而性生活频率不高,也可能是性生活频率少而使得情绪不好。提出这样的假设之后,在分析数据的时候,如果发现两者相关,就不会片面地解释为“情绪影响性”,而是说“情绪与性相互影响”。也就是说,从变量间的双向关系出发进行假设,就可以更加充分地使用信息资源,可以做出更加关键和全面的解释。
调查者不能仅仅从证实本命题正确这样一个角度去想问题,还要从检验反命题的角度去设计。也就是说,研究者不但要想到自己可以证明什么是相关的,还要考虑可以证明什么是不相关的。这就是否定假设。
这是经常被人们忽视的,尤其是人们的一些生活常识也经常会被忽视掉。例如,研究下岗问题,很多人都假设出了很多很多相关因素。可是,有一个假设却很少有人提出,那就是下岗的人笨或者懒。这是因为谁都不愿意承认这个因素。可是,如果不去设置这样的一个提问,不去检验它与下岗之间的关系,怎么能够知道它与下岗确实不相关呢?这样的研究的意义就被极大地损害了。这就是常见的缺陷,不能叫错误,而是一个缺陷。
笔者是性社会学家,可是必须提出一个否定假设:诸多的生理因素对于“性”的作用,都小于社会因素的作用。正因为如此,笔者的调查结果修正了“抽烟喝酒必然会损害性能力”这种说法。因为这个结论是医生做出来的,他们也调查,可是仅仅提出了可以证明他们的命题是正确的假设,却没有考虑到社会因素的作用,也就是没有提出任何否定假设。笔者则是两方面都调查了,结果发现各种社会因素的作用远远大于吸烟喝酒。因此,笔者才足以修正医生的结论。最通俗的例子就是:如果双方不再相爱了,那么无论抽不抽烟喝不喝酒,性生活都会剧减。
否定假设往往能够给研究者带来很难得的认知。笔者在性研究中,肯定地假设了社会因素的作用,同时也否定假设了生物因素的作用。可是,恰恰是因为这两种假设加在一起也仍然不足以满意地解释当前中国人的“性”,才迫使笔者另辟蹊径,开始寻找新的视角与理论,最终走上主体建构论的研究路线。
问卷设计者提出的任何一个相关假设,实际上都是否定了其他众多的相关假设,但是那些相关假设该不该否定,研究者实际上并不知道。这就等于人为地先验地把它们给排除掉了。例如,假设女性怀孕会影响她的性生活频率,那么妇女的不孕症与她的性生活频率就没有关系吗?再如,还有很多种性交方式没有提问,也是一种潜含假设,就是预计它们的社会文化意义不是那么大。
既然这些潜含假设都已经从问卷上抹掉了,那么应该如何检验它们呢?笔者的经验是:首先,要把这些被删除的潜含假设逐一地详细记载下来;然后,在统计分析完成以后,如果某些预期的统计结果并没有出现,那么就拿出以前的记载,细细分析,真正相关的非常可能就在其中。
是的,这仍然不能解决“什么相关”的问题,但是却足以给研究者提供一个坚实的前进基石,为下一次调查准备好充足的假设。
进行社会学调查的问卷设计者必须将自己的所有相关假设都烂熟于心,脱口而出,形成下意识反应。在教学实践中,笔者往往是从一个问卷里随便抽出一道题,请学生立刻清晰地说出它的相关假设,否则就算这个问卷的设计不合格。同样,问卷里每一个没有问到的问题也都是一个相关假设,笔者也要求学生脱口而出。
更进一步,笔者会要求学生必须清楚地说出每一个相关假设的来源与目标。
所谓来源就是这个相关假设的根据是什么,或者来源于某个理论,或者来源于某个前人研究,或者就是自己拍脑袋想出来的。
所谓目标是指,一个变量与另外哪个变量去做相关,设计者必须了然于胸。
总之,所谓社会学调查的问卷,其实就是众多的不同相关假设,一层一层地构建起来的一个大厦,绝不可以“边施工边设计”。