本书把问卷调查分为两类,第一类是普通问卷调查,另外一类是社会学的问卷调查。在国内现有的教科书里,基本上还没有这样的分类。但是这样分类是必需的,因为普通问卷调查仅仅是社会学调查的基础,后者可以包含前者,前者却无法成为后者。
对于社会学研究来说,这个划分很重要,因为笔者们在教学中屡屡发现,一些研究生甚至是博士生,仍然在使用普通问卷调查的数据来进行社会学的研究,结果根本无法达到应有的层次。可是,他们却常常通过了答辩,因此这已经是一个学术界的共同问题了。
仅仅描述现象的就是“普通问卷调查”,它主要有两种形式:
1.绝对数调查
它是在基本上不了解某种社会现象的情况时,运用问卷调查的方法来发现其数量。简单地讲,就是想知道有多少人做过某种事,或者某种社会现象涉及多少人。
这种调查的统计结果,往往表现为一个具体的数字,例如“中国有8亿农民”这样的命题就应该是来自绝对数调查。
2.百分比调查
它实际上是把某个范围之内的总体当作分母,把自己所要考察的社会现象的发生频数作为分子,求出一个百分比即可。例如“中国农民中已经有20%的人进城打工了”这样的说法,其中的“中国农民”就是总体,“进城打工”的人数是频数,“20%”则是调查的统计结果。有些这类调查仅仅考察总体的一部分(样本),从中求出一个百分比,然后用样本的百分比去估计、推算总体的百分率。
百分比调查的特点是,虽然它的提问可以有很多,但是调查现象都是相互独立的、没有瓜葛的。研究者也并不期望从中发现别的什么,仅仅得到各种现象的百分比就足矣。
笔者们之所以能够提出“社会学调查”这一概念,首先是来自中国历史的启迪。
从20世纪50年代初到20世纪80年代初的30年里,社会学作为一个学科被取消了,任何学术意义上的或者具有专业意义的社会学调查都烟消云散了。但是,普通社会调查却仍然存在,而且在“大兴调查研究之风”的政治口号之下被捧到了“没有调查,没有发言权”的吓人高度。这个口号甚至在全民中被普及,成为那个时代的日常语言。
在这种历史环境中,两种对学术研究非常有害的思维定式就流传下来了。一种是“无论什么人都可以做调查”,另外一种则是“无论怎么做都是调查”。甚至在社会学恢复了20多年之后的21世纪,其他专业的多数人仍然认为“只要调查社会就是社会调查”,不会想到也听不懂“社会学调查”这样的“奇谈怪论”。
这段历史雄辩地说明:社会学调查与普通社会调查确实非常不一样。这两者之间的区别并不是学者们在书斋里冥思苦想搞出来的,甚至并不是中国学术发展所带来的,而是一个历史遗产。正是从这个意义来说,提出“社会学调查”这样一个概念,不仅是一个中国纯粹本土的问题,而且具有正本清源的意义。
进一步说,为什么在取消了社会学之后,普通社会调查还能够大行其道?如果暂不考虑其政治含义,那么这其实就是一个“社会学有用没有”的根本问题。说白了就是,如果人人都可以做社会调查,那么还要社会学家干什么?
可惜,在目前国内的社会学文献中,作者们基本上都是把“社会学有用”这一点作为“公理”来看待的。结果,许多社会学的教科书都想当然地把所有类型的普通社会调查统统归在社会学的名下,似乎它们是同质的,只有形式之分。
还有的社会学家则仅仅从技术的层次上来论证自己存在的必要性,似乎只要社会学家去操作,只要采用了某些高级统计技术,那么就自然变成“学术的”了。
上述两种普遍存在的意识都忽视了这样一个现实:恰恰是由于社会学界没有很好地论述清楚社会学调查与普通社会调查之间究竟有什么样的区别,这种区别的学术意义何在,因此直到现在,各行各业的人都在各行其是地进行着各式各样的“社会调查”,却并不认为自己需要什么社会学知识,更不需要社会学方法论方面的学术修养,甚至根本就不认同“社会学有用”这个命题。
为什么非要专门分出一个“社会学的问卷调查”
我国社会学研究中的方法论问题,其实并不仅仅是统计学意义上的水平较低的问题,更加重要的而且较少引起注意的问题其实是“心中无数,笔下却有数”,也就是调查问卷缺乏设计,写论文却是依据其统计结果。
有太多的社会学界人员所进行的问卷调查,太缺乏事先的设计。他们甚至根本不知道问卷还需要设计,就盲目地动工、完工,然后进行“数据发掘”,其实就是在原本毫无关联的调查数据中找出一些变量来分析。
如果仅仅是社会学的初学者出现这样的问题,倒也罢了,可是相当一部分学者也出现这样的问题,甚至在我国顶级的学术刊物上发表的依据问卷调查结果所写出的论文,绝大多数也是只说统计结果,只字不提自己的问卷设计,乃至出现过用A调查来说明B情况的个案。这不应该是篇幅所限的问题,而是因为我国社会学界的主流力量尚未旗帜鲜明地提出“社会学的问卷调查”这一概念,尚未把它与普通问卷调查相区别,尚未在学界努力构建这方面的浓厚意识。
现有的许多教材与多位学者的著作中其实都已经渗透了“社会学的问卷调查”这样的思想,风笑天教授贡献尤多(风笑天,2005,2009)。但是,实践仍然迫切需要一个鲜明的新概念、一面旗帜。
什么是“社会学的问卷调查”
人们通常认为,只要是社会学家所做的调查,或者其统计结果具有某些社会学意义的调查,就当然是社会学的调查。这样的理解忽视了一个根本的问题:科学仅仅来自于科学的研究方法,而不是别的因素。
笔者们试图用极端的命题来引起讨论:唯有相关“假设-检验”式的问卷调查,才能算是“社会学的”,而不是“普通问卷调查”。这是因为,问卷调查是对于自然科学研究方法的一种模仿,而后者的灵魂就是必须首先提出自己的相关假设,再对它进行检验,从中获得自己的认识。舍此,自然科学再无其他研究方法。因此在问卷设计中,没有相关假设就等于“撞大运”,没有检验就等于“空口说白话”,即使“瞎猫碰上死耗子”,也不足为训。
社会学的定量研究最基本的预设就是社会运行存在着某些规律,而社会学的任务就是要找出这样的规律并且加以解释。 为此,社会学不得不运用相关“假设-检验”式的问卷调查,或者说,不这样做就无法实现社会学研究的目标。
当然,根据功能与侧重来划分,社会学的问卷调查还可以分为许多种(袁方、王汉生,1997;风笑天,2009),但是万变不离其宗,都必须有相关“假设-检验”式的设计。
例如在比较调查中,如果仅仅比较某个社会现象本身,那么充其量也只能得出一些关于变化幅度的统计数字,就像国家每年公布的GDP数字一样。这就把自己的研究降低到普通问卷调查的层次上去了。
反之,社会学所说的比较调查与追踪调查,目标在于发现A的规律与B的规律是否存在着差异,这些差异来自什么因素,以便对A的规律或者B的规律进行修正或者补充,得出更加深刻与准确的认识。这就需要对A和B提出一个共同的相关假设,然后在检验的过程中发现各种影响因素的异同,最终检验研究者的相关假设。
因此,不但调查的总体不同不能进行比较调查,而且相关假设不同也无法进行这样的调查。例如,如果在A地区调查的时候,假设农民因为穷才进城打工,但是在B地区调查中却假设农民进城打工存在性别分工(男多或者女多),那么这两次调查无论在调查总体上多么一致,也不能算是社会学的调查。因为它只能说明某种社会现象的时空差异,却无法说明该现象中的规律的异同。
分布调查:中间过渡形式
对于了解社会来说,人们更想知道某些情况的各种分布状况。例如了解“中国农民中已经有20%的人进城打工了”这个说法还远远不够,人们还想知道:究竟是多大年龄的农民进城打工了呢?是男人多还是女人多?是穷人多还是不那么穷的人多?这就需要进行分布调查(李强,2004)。也就是说,研究者必须把自己所关心的时空、分层、范围等,设置在问卷里。社会学通常更加关心某种现象在不同的社会阶层中的分布,那么研究者就必须在问卷中设置一些考察被调查者的社会阶层归属的问题。
分布调查的统计结果一般都表现为“各个分层里面的不同百分比”,因此也可以叫作双因素调查或者交叉表调查(史希来,2006;莱文、福克斯,2008;卢淑华,2009)。
社会学界有一种“五朵金花”的说法,就是说,几乎任何一个问卷调查,至少都必须要问到五个最基本的社会阶层归属的问题:年龄、性别、文化程度、职业、收入。舍此,研究者就无法判别被调查者究竟属于哪个社会阶层,也就无法知道某种现象在不同的社会阶层中有什么样的差异,这个调查也就不具有社会学的意义,也就在性质上下降为百分比调查了。
分布调查其实就是从普通问卷调查向社会学调查过渡的形态。它已经设置了最基本的相关假设。也就是说,无论把“五朵金花”中的哪一个指标设置到问卷里,都意味着在假设所考察的社会现象与所设置的这个指标存在着某种相互关系。只不过还不知道这种关系是什么样的,因此才需要调查。调查的统计结果,可能表明双方确实是相关的,也可能表明相关假设是错误的。
由此,调查者对这种社会现象的认识才能加深一步。例如,在笔者的“性调查”中,在问卷中设置了“职业”这个指标,这其实就是在假设:不同职业的人会有不同的性关系与性行为。如果没有这样的相关假设,那么问卷就根本不应该询问“职业”这个问题。如果统计结果表明两者是相关的,那么这个假设就可以成立。如果两者不相关,那么此假设就不能成立,但是可以反证:无论什么职业,人们的“性”都是一样的。
可惜的是,虽然分布调查被运用得最广泛,但是许多调查者并没有意识到在自己设计的问卷里面存在着相关假设,也就不知道应该对相关假设进行检验。这仍然是一种“无设计的问卷”。最常见的例子就是,几乎每一个分布调查的问卷都会问到被调查者的性别,但是几乎没有一个调查是准备对该社会现象进行“社会性别视角的分析”,也没有假设自己要考察的主要现象究竟是不是男女有别。那么,为什么要询问性别呢?不问又有什么不可以呢?
总而言之,所谓的“普通问卷调查”就是仅仅调查一个现象的各种情况,也就是社会学通常所说的“单纯的描述”。因此,无论调查者的专业级别多么高,调查的规模多么大,涉及的内容多么深入,使用的统计方法多么复杂,做出的分析多么高深,只要是仅仅描述一个对象,只要不是在研究一个问题,那么就统统是“普通问卷调查”。
因此,从理想状态来说,普通问卷调查中的分布问卷调查,就是社会学调查的起点。但是从中国的实践来看,绝大多数分布调查由于缺乏有意识的相关“假设-检验”设计,还不足以成为完全的社会学调查。
笔者所进行的四次全国调查,都是具有“假设-检验”设计的社会学的调查,是为了在性的领域中检验脚本理论、交换理论与社会网络理论。这是因为,虽然人类大概从自己诞生伊始就开始研究自己的性问题了 ,虽然至晚从1885年开始西方学者就创建了“性学”,虽然众多的学者曾经做过众多的对于性问题的问卷调查,虽然其中一些曾经在传媒上引起了极大的轰动 ,但是真正的、具有相关“假设-检验”设计的社会学调查(同时也是世界上第一个全国成年总人口随机抽样的调查)却迟至1992年才在美国出现(Laumann et al.,1994)。它的调查结果不但没有新闻性,也没有文学性,更没有娱乐性,只是干巴巴地检验了一个相关假设是成立的,即人们如此隐秘的性行为,其实是发生于一个“性的社会网络”之中的,而且不知不觉地受到整个网络难以察觉的巨大影响。
这一研究成果不仅说明“性社会学”在国际上诞生了,也预示着在中国进行“性”的研究,再也不能停留在普通问卷调查的水平之上了。或者说,研究者与其费时耗力地进行一次并不见得更容易的普通问卷调查,还不如直接从国际学术的高峰起步,把性社会学在中国尽早地建立起来。
笔者的四次全国调查必然都是社会学的调查。这一性质主要体现在三方面的研究中:“长期性伴侣”之间的关系(蔡鑫,2004;黄琦,2006)、个人行为与社会因素之间的关系(潘绥铭,2004)、生理因素与社会因素对于“性”的作用程度的差异(潘绥铭,2006)。这三方面都有着明晰的相关假设与检验的设计。
问卷中还有一些“分布调查”的提问。笔者并不准备用它们对相关假设进行检验,仅仅想知道它们的阶层分布,例如“找小姐”行为、“性交易”行为等。此外,针对“同性恋”这样的极小概率的现象,笔者还设置了四个“百分比调查”的提问,仅仅希望获得发生率即可。这样做的原因可想而知:笔者对于中国人的“性”的了解实在是太少了,哪怕多一点点信息也是好的。
不过反思起来,笔者的四次全国调查也绝非尽善尽美。
首先,由于中国现有的性方面的调查结果太少,所以问卷中的“分布调查”偏多,多少挤占了相关“假设-检验”的问卷空间,使得笔者在第二次调查的时候,虽然继续设计了一些更加深入的检验提问,但是仍然显得不够充足。
其次,由于艾滋病在中国日益成为一个“问题”,在2000年第一次调查的时候,笔者就不得不使用了较多的问卷空间来设置考察“高风险性行为”,在后来的问卷中又增加了一些这方面的“分布调查”。但是,在发布调查结果的时候,笔者始终申明这四次全国调查都不包括关于艾滋病传播的相关假设。但是,仍然有位美国学者批评说,笔者的问卷不足以构建艾滋病传播的模型。看来,误解社会学调查的人远远多于了解它的人。
最后,在第一次调查之后公布结果的时候,由于缺乏应对传媒的经验,笔者把“分布调查”的结果说得多了一些,没想到被大众传媒再次简化为“百分比调查”的数据,甚至仅仅是“绝对数调查”,而且大肆炒作,完全走样。例如所谓的“无性婚姻”,其实只不过是夫妻性生活频率很低的那些人。虽然笔者是用它的分布来说明:双方的关系(甚至一些表面上看来与性无关的因素)会显著地影响性生活的频率,但是大众传媒却仅仅抓住其中低频率者的百分比,扭曲成了“无性婚姻”这一经久不衰的热门话题,甚至计算出具体的人数来。到了2006年,某城市甚至出现了“无性婚姻介绍所”。
反思起来,笔者应该拒不公布这样的百分比,应该反过来更加坚定地推广“社会学调查”这一概念。