现象需要定义
首先需要对现象本身进行定义。例如笔者的“性调查”首先需要定义“性”的内涵与外延是什么。这可能并不需要直接在问卷中细说,而是体现在所有提问汇合而成的总体中;或者在许多问题上,表现出“性”的定义的不同层次。例如,笔者之所以要分别询问“异性全身按摩”“接受三陪服务”“网上看黄”等情况,不仅仅是因为笔者需要了解这些方面的实际情况,更是因为笔者认为它们属于“性行为”的不同层次,所以不可以混同起来调查。反之,笔者没有调查比接吻更加轻微的人际接触(例如勾肩搭背等),这就表明笔者至少在这个问卷里认为,接吻才是“性”的最初层次。
其次需要确定该现象的时空范围。在笔者的问卷里,大多数提问都有一个很啰唆的前提:“在××个月之内”或者“只有××情况下的才算”。这就是对于该现象的时空的限定。社会调查的教科书也说这是必不可少的,否则就很容易把仅仅存在于一定时空之内的现象误以为是永恒的与普适的。
最后,最关键的定义会带来“分流”。在笔者的“性调查”中,被调查者“婚否”“有无性生活”“有无其他性伴侣”。这三个问题不仅是生活实践中最关键的情况,而且对方一旦选择“有”或者“无”,后面就会接着回答一连串完全不同的提问,牵一发而动全身。因此在这三个“分流问题”之前,都必须出现相当长的一段解说文字,来说明问卷问的究竟是什么样的情况,不厌其详,不得跳过。
定义就是“元假设”
这样说,有认识论上的依据。
研究者必须时时刻刻牢记:人类的一切现象都是光谱式的存在,没有任何固有的边界或者分层,因此也就不可能具有任何天然存在的定义。问卷调查其实就是试图去量化地测量这个光谱式的存在,因此不得不使用一些研究者自己发明出来的测量工具,那就是问卷中的各种“定义”。它们是先验的,事先无法判定其对错,因此它们都仅仅是一种假设,一种对于研究者所要调查的现象的预先的界定。这就是元假设。
元假设包含两个方面的意思。
第一个方面是“对于真实性的元假设”,就是研究者认为,在光谱式存在的该现象中,应该存在着自己所设置的这种界定,研究者仅仅是不知道它的分布状况而已。例如,调查“同性恋者”而且不得不给出其定义是“只跟同性的人做爱的人”,那么就等于研究者认为人类中不仅应该存在着这样的“同性恋者”,而且“同性恋者”就应该仅仅是这样,其他情况一概不算在内。这是问卷调查所必需的,但是也是它的原罪,因为无论研究者设计出什么样的定义,总有可能与现实生活不符。
第二个方面是“对于适用性的元假设”,就是认为研究者所设置的各种“定义”(测量工具)足以对自己所调查的光谱式存在的该现象进行足够精确的测量。例如,既然设置了“同性恋者”的定义,那么就是说,使用“只跟同性的人做爱的人”这个定义进行测量的结果(无论是绝对数、百分比还是分布状况)都是准确的。这当然也是一把双刃剑。
元假设的上述两个方面,在问卷设计的实践中往往可以合二为一地进行考虑。可问题的关键是,光谱式存在的该现象究竟是不是研究者所描绘的这样呢?研究者的测量工具究竟是不是足够合适呢?这些都不可能在调查结果出来之前知道,因此研究者的任何定义就都只能是假设,是猜想,是先入为主。只不过由于定义是问卷之根,所以也可以称之为“元假设”。
可惜,目前的文献对于问卷中所体现出来的这样的“元假设”进行论述的尚且不多,对其进行检验的研究成果就更少。这对于研究者其实是可以做到的。例如,如果某个调查发现“同性恋者”的比例过于出乎人们的日常经验,那么除了其他因素,就完全可以怀疑它对于“同性恋”这个定义的元假设(包括针对真实性的与适用性的)可能出现了偏差。
总而言之,即使是最简单的普通问卷调查,其实也是建立在“元假设”的基础之上,只不过指的是对于所要调查的现象进行的定义,而不是考虑问卷之内的各个提问之间的关系。
一个提问就是一个元假设
笔者经常使用这样的提问方式:“您有过……情况吗?”这其实就是提出了这样一个假设:无论被调查者是什么样的人,都必定有可能出现这种情况。
可是,许多情况对于许多人来说根本就毫无可能。结果,这样提问就有可能冒犯了被调查者的情感甚至是自尊心。例如,网民经常说的例子,问:“给你一百万你会干什么?”答:“先给我再说。”
反过来,研究者在设计备选答案的时候,都知道必须涵盖一切可能性。可是,大千世界,无奇不有,研究者“涵盖”一切的把握究竟有多大呢?尤其是“观念调查”与“原因调查”,几乎没有涵盖的可能性。这就是本书反对进行这两种调查的主要原因。
这不仅仅是“设计提问时没有考虑调查对象”的技术层面上的问题,问题还在于研究者缺乏“元假设”这个清晰的概念与意识。
每一个字都是元假设
由于在问卷中,任何一个“定义”都必须用文字表达出来,所以写在问卷里的每一个字,实际上都是一个元假设。
还举上面的例子。在人们的日常语言中,“同性恋者”往往被简称为“同性恋”,没有那个“者”字。但是两者的区别非常大。“同性恋”既可以指称某种性行为,也可以指称某种性关系,还可以指称某类人。但是,“同性恋者”却只能指称某类人。因此,在问卷中写下的究竟是“同性恋”还是“同性恋者”,这可就是牵一发而动全身的大事,会带来非常不同的调查结果。例如在笔者的四次调查中,有过某种“同性恋行为”的人,要远多于自认为是“同性恋者”的人。
在社会学界最常见的例子,就是收入调查中所遇到的种种麻烦,尤其是它的外延。有些研究者经常为了“人均收入”的多少而争论得面红耳赤,其实双方仅仅是对于“收入”的定义不同。可是,制定出一个多数人都能够接受的定义又是难于上青天的事情。
不仅名词如此,动词也是如此。例如,“工作”究竟说的是一种什么状况呢?老师们在寒暑假期间,究竟算不算还在该学校里“工作”呢?
整个问卷就是由不同层次的许多个元假设构建出来的。
笔者在教学实践中,经常采用这样的方法来培养学生充分的“元假设”意识:请解释清楚你在问卷中写下的每一个字,甚至包括标点符号。这就是提倡一种思维方式:且不论被调查者能不能明白、是不是适用,研究者自己首先要知道自己在说什么、希望得到什么。
意识到元假设的重要意义之后,在问卷设计的操作上就必须提出以下的原则。
首先必须假设出光谱的两极,就是在研究者可能知道的情况下,认定某个现象的两个最极端的表现应该是什么样的。例如对于“同性恋”现象,早在1948年金西就提出了同性恋的光谱式的七级分类:一个极端是绝对同性恋,从来不与异性有任何性意义上的接触;另外一个极端是绝对异性恋,从来不与同性发生性接触。其他的种种现象都是处于这两个极端之间的某个位置上,至于研究者如何确定这个位置,这已经是第二步的问题了。也就是说,如果问卷设计者没有确立其中任何一个极端的话,那么这个问卷从一开始就已经失败了,勉强操作下去只能是劳民伤财。
确定研究对象的光谱的两极还有一个重要的作用,就是可以时刻提醒研究者自己与读者,还有“紫外线”与“红外线”的存在。也就是说,在研究者确定的“两极”之外,研究对象必然存在着某些目前还不可能调查到也无法感知到的领域。例如,在“小姐”这个群体中,最高端的那些在私人会所中工作的人以及最低端的“工棚女”,对于笔者来说是可望而不可即的,在笔者的调查中也就无法包括进来,并不是她们不存在。研究者清醒地知道这一点,而且坦白地承认这一点,应该成为社会学调查的基本学术要求。
这种“确立两极”的方法,必须体现在所设计的问卷中的任何一个提问所表述的任何一个概念、词语与言外之意。因为无论研究者设置了什么样的备选答案,被调查者都必须根据研究者的提问来回答。提问中的“两极”一变,所收集到的资料的含义也就跟着改变了。
常见的失误就是:研究者对研究对象缺乏最起码的了解,在一无所知的情况下就设计问卷、进行调查。尤其是非专业工作者,往往误以为做问卷就是调查自己所不知道的情况。这是一个很初级的但是很常见的误解。
可惜,知道这一点的人还不够多。笔者曾经遇到一些热情的研究者希望去调查“一夜情”“交换性伴侣”“虐恋”等这些被认为是“最隐秘”的现象。可是仔细一谈却发现,他们根本不知道需要“确立两极”,因此也就假设不出来该现象的两个极端究竟是什么样。例如,从“一夜情”参加者的双方关系来看,熟人甚至恋人之间的算不算?花钱的算不算?从持续的程度来看,时隔很久再次发生的第二次算不算?从活动的具体内容来看,除了插入之外什么都做过的算不算?这些问题都没有考虑过,怎么可能去调查这种现象呢?此外,他们也没有发现自己的逻辑矛盾:既然是“最隐秘”的现象,那么研究者事先就提出一个很好的元假设的可能性究竟有多大呢?结果,笔者只好劝告他们不要去调查。
提出“元假设”这个概念的重要性还在于,它可以帮助研究者树立这样一种意识:问卷中所写的任何一个定义,都意味着除此之外的任何情况我们都不予调查,哪怕它再重要也罢。这就是排除,而且我们所排除掉的一定比留下来的要多得多。
也就是说,在问卷中每写下一个提问、选项、概念、词语、标点符号,就意味着研究者已经排除了或者舍弃了其他的许许多多的相似的或者相反的内容。那么,研究者究竟排除了什么呢?应该不应该排除呢?排除得合适不合适呢?这些都必须考虑,而且应该能够清楚地说出来。
表面上来看,这是为了使了解到的情况更加精确,其实它们渗透着另外一层意思,除此之外的任何情况研究者都不会去了解,因为它们不符合研究者的定义。例如,笔者在“性调查”中没有询问“主动强奸他人”的任何问题,这并不仅仅是因为不会有人真实回答,更是因为这不属于“性”的范畴,是笔者不准备调查的强暴行为。
再例如在调查“农民工来源”的时候,如果询问“你的家乡在哪里”,就等于假设他们都是来自原生家庭的家乡,就排除了那些云游打工的、曾经迁移过的人、先外嫁再出来打工的女性。
再如,问卷中的“性别”这个提问往往仅仅列出“男”与“女”这两个选项。这就意味着问卷设计者不准备考察属于“变性人”“跨性别者”等人群的这类人的情况。
这样的设计不存在“对不对”的问题,问题在于这样的排除是否适合于所要调查的现象,是否足以实现自己的调查目标,尤其是设计者自己是否考虑过这些问卷问题。如果说“性别只问男女”很可能适用于大多数“非性的”问卷,但是“家乡”这个提问,如果设计者说不出自己究竟排除了什么,说不出排除它们的道理,那么问卷设计就是不合格的,哪怕其他方面设计得非常好。
在教学实践中,笔者经常抓住学生作业中的一个提问,甚至仅仅是一个名词,追问“你排除了什么”这个问题。如果学生有备而答,那么他(她)就是合格了。
截至2007年11月15日,中国的各大门户网站都开展了“国家法定节假日调整草案网上调查”(调查内容由国家法定节假日调整研究小组提供),大约155万网民参加了此项调查。其内容如下:
1.对于将国家法定节假日总天数由10天增加到11天,您的态度是(支持、反对、无所谓;下同):
________________________。
2.对于将“五一”国际劳动节调整出的2天和新增加的1天用于增加清明、端午、中秋三个传统节日为国家法定节假日,您的态度是:
________________________。
3.对于保留“十一”国庆节和春节两个黄金周,您的态度是:
________________________。
4.对于将春节放假的起始时间由农历年正月初一调整为除夕(大年三十),您的态度是:
________________________。
5.对于调整前后周末形成元旦、清明、国际劳动节、端午、中秋5个连休三天的“小长假”,你的态度是:
________________________。
6.对于国家全面推行职工带薪休假制度,您的态度是:
________________________。
问卷一出,马上就有网友发帖子指出:这是给猴子吃桃子的那个“朝三暮四”的老把戏。在这个问卷里,问卷设计者仅仅是把自己所设计出来的调整方案拿出来,一个一个地问大家同意不同意,根本就没有设置其他任何的可能性。如果我反对任何调整,或者认为应该再增加一些法定节日,或者认为应该彻底取消任何一个黄金周,或者持有问卷之外的任何看法,那么我就根本无法在这个问卷中表达我的意见。
也就是说,这个问卷的调查结果是事先就被预设好的,无论大家怎样回答,其统计结果一定是“几乎所有人都拥护进行调整”,差别仅仅在于拥护哪一种调整。即使我对每一个提问都表示反对,也并不能表达出我根本就“反对进行任何调整”这样一个态度。这就是该问卷在内容设计上的“元假设”,是一种“霸王条款”。
这样的情况其实非常普遍。例如,绝大多数调查个人行为的问卷,都是直接询问被调查者有没有过,却都缺少这样的选项:“这个现象根本就不存在”或者“问卷对于这个现象的定义是错误的”。
再例如,大多数调查个人收入的问卷,都没有设置“负值”,例如借钱过日子、赔本、遭难等。这就等于设计者事先就不承认被调查者可能遇到这样的事情。结果,中国的贫穷问题的规模就被有意无意地缩小了。
等而下之的某些商业调查,在询问顾客满意度的时候,居然干脆就没有“不满意”这个选项。
这样的问卷设计与上述的例子是一样的,都是把调查内容的范围事先进行了界定。这虽然是必需的,但是如果没有在调查内容的范围这个层次上涵盖所有的可能性,那么问卷所提出的“元假设”就等于是预设了这个问卷的调查结果,因此不仅可能具有非常强烈的诱导性,而且可能成为弄虚作假,甚至可能变成明目张胆的欺骗。
无论如何具体地定位一个所研究的现象,都必须把该现象置于所能确定的两个极端之中来思考与审视。这就是光谱式思维,它有四个思考原则。
第一,光谱是无限延伸的,它很可能根本就没有什么两极。例如“社会性别”已经从男女二元增加为几十种划分,那么光谱就很有可能日新月异、绵延不绝。只不过研究者为了研究它,不得不事先就界定好这两个“两极”。否则,研究者就不可能知道自己究竟要调查什么。
第二,光谱是浑然一体存在着的,本来是无法分割的。一切所谓定位与分类,其实只不过是由于种种条件的限制,不得不人为地、生硬地截选了这个光谱式存在的某个区间,甚至仅仅是某些点。这绝对不等于该现象的全部,所截选的结果对于这个光谱也没有什么代表性。
其三,无论如何截选光谱,研究者所使用的截选标准都是自己先入为主地人为创造出来的。无论它有多么雄厚的理论基础或者经验准备,都是一种元假设,而不是由于生活中真的存在这样的划分标准。
其四,调查设计中的一切失误,都是来自研究者在上述的“认知光谱”与“截选区间”这两个方面的偏差。
最常见的例子就是:中国的城乡之间的人口流动是一个现象。它的两极是“根本不流动”与“根本不定居”。可是,现有的很多研究,意识到这样的两极的存在了吗?涵盖了其中的各种情况了吗?究竟是截选了其中的哪一个区间呢?尤其是,有人提及过“根本不定居”这种极端情况吗?有些研究的定义,不仅在“流动人口”“进城农民”与“农民工”这些不同的定义之间游离不定,而且从来也不解释自己为什么割舍了农村孩子进城上学、市民下乡经商、外来媳妇、城市之间的漂泊等常见的现象。结果,无论得到什么样的调查结论,也只能是以其昏昏,使人昭昭。
退一万步说,即使论文中没有必要说那么详细,但是问卷设计者自己至少应该写出一句话来:“我考虑了截取光谱的问题。”
一切社会现象,一切要调查的现象,绝对不可能是天生如此、一成不变的,必然有一个产生和发展的过程。如果把这个纵向的过程分析清楚了,都给出了相应的元假设,那么就是建构主义的研究,往往也叫作“谱系学研究”。它比传统上那种仅仅针对此时此地、此情此景的因果分析要深刻得多,因为所谓的“成因”,其实就隐含在发展过程当中,绝不会是一次定终身。
下面推荐的逻辑分析的方法,应用得已经非常广泛,其实就是按部就班地提出对于四个条件的假设。
第一步:必要条件
就是每个现象在客观上出现的可能性,如果没有这个条件,一切都不可能发生。在中国情境中,最近40年来性方面的一切变化,至少必须有下列这些必要条件。
第一个必要条件就是“饱暖思淫欲”,不是饱暖了就必然思淫欲,而是只有饱暖了以后才可能思淫欲。中国最根本的变化就是中国人民吃饱饭了,要减肥了。在饿肚子的时代里,性不会带来快乐,只能带来罪恶感。
第二个必要条件就是“公权力的隐身在场”。公权力如果要消灭“性混乱”,是分分钟的事情。只是它给社会留出一小块空间,就是私领域。公权力时时刻刻都存在着,但是它也隐身了,不再时时刻刻盯着人们的一举一动。
第三个是独生子女国策彻底瓦解了两千年来的“性仅仅是为了生孩子”的社会潜意识。
必要条件的分析很重要,例如“无性恋”(asexual)这个新词,应该是虽然拥有足以做出相应的性反应的能力却并不真的出现性反应。否则那就不是“无性”而是“非性”(non-sexual),例如某些疾病患者或者残障者。
对于社会学调查来说,必要条件的假设之所以重要是因为,研究者万万不可把某个现象的必要条件当成自己的调查目标,否则就成了因果倒置。例如,在调查那些参与“一夜情”的人之后,结论是他(她)们的性观念都很开放。这就变成“大河无水小河干”那样的逻辑荒谬。
第二步:控制条件
有了必要条件还不够,还要看看有哪些和什么样的因素在控制着必要条件,就是客观可能性究竟在什么范围内才能够存在。如果控制条件太苛刻,那么必要条件就名存实亡,发挥不了原有的作用。反之,控制条件越宽松,必要条件就会越扩大越加强。
中国的性变迁,就是因为抑制变迁的控制条件极大地减少了,而促进它的控制条件却极大地增加了。这主要表现为:
1.信息革命给中国社会带来了移动互联网生活,包括“约炮”。
2.中国人走进陌生人社会了。以往的性道德控制主要靠两条:第一条是“革命群众的眼睛是雪亮的”,可是现在,门对门的人都见不到面了;第二条是“杀鸡给猴看”,可是现在虽然鸡还在杀,猴子却已经不看了。
3.个人的独处化,对“他人床上事”既冷漠,也宽松。
在社会学调查中,这就是问卷设计中的那些必不可少的控制变量。例如,“性”只能在一定的生理条件下才可能呈现为如此这般。因此笔者在四次全国调查的问卷里,都设置了身高/体重(肥胖度)、高血压、糖尿病、心理/情绪状态等12个指标/提问。只有在控制/排除这些因素的影响之后,才可能发现/检验其他因素与性现象之间的作用关系。否则就成了拿危重病人与奥运冠军做比较,只会误人害己。
第三步:充分条件
必要条件和控制条件仍然仅仅是可能性。即使每个人在这两方面都是一样的,有些事情还是有的人能做,有的人却做不到。那些能够做到的人,一定是具有某些充分条件,才能够获得现实的可行性。
性变迁中的那些领跑者或者说越轨者,并不仅仅是“下半身决定上半身”,更不可能随心所欲,而是至少需要有足够的个性魅力、充分的人际交往能力、最佳的时机、可靠的安全保障、强大的支持系统等。这些就都是他(她)们的充分条件。反之,那些循规蹈矩的人也不仅仅是出于“洁身自好”的思想,更可能是因为缺乏这些充分条件。
强调充分条件,这是一种更加实事求是的思维方式。它反对完全的“动机论”和“偶然论”。在问卷设计中,如果没有把各种充分条件尽可能多地、尽可能细致地设置为指标/变量,那么此后的统计分析无论多么高级都会变得毫无意义。
第四步:发展条件
一个现象产生了,不可能永恒不变。它产生了什么样的结果,带来了什么样的反馈,招来了什么样的外力,这些都会影响到该现象如何发展变化。这就是发展条件。例如,在“约炮”这种情况中,如果被骗了,如果感觉并不好,如果被别人发现了,那恐怕就没有下一次了。即使还有,也不可能跟上次一模一样。反之,才能乐此不疲。
发展条件的思维方式更加重要,在其他学科的研究中还很少提到,但是它是建构主义思路的核心内容,就是要反对一成不变地看待任何现象。例如笔者的四次全国调查发现,最近15年来,一方面,实际发生的性骚扰其实一直在急剧减少;可是另一方面,认为自己有可能受到性骚扰的人却在剧增。为什么会这样?就是因为社会舆论大张旗鼓地反对性骚扰,把它的发展条件给改变了。本来应该是性骚扰越少大家越安心,可是一些人老是宣传“性骚扰就在你身边”,结果大家被吓傻了,反而更加人心惶惶(黄盈盈、潘绥铭,2013c)。
元假设这个概念,在我国社会学界尚未明确地提出,但是它之所以重要,主要是由于以下三点。
第一,它强调了生活的第一性
在调查问卷中设计出来的任何一个提问,其实都是研究者自己对于现实生活的先入为主的猜测与假设。因此,哪怕是调查研究者最熟悉的现象,也必须首先尽可能多地掌握现实情况及其变化,才能设计出更好的问卷与实施方案。这就是元假设这个概念的第一个重要意义。
在操作层次上,如果研究者具有了元假设的意识,就不得不努力收集与消化各种可能得到的文献资料,把它们融会贯通到问卷设计里面去,不得不百倍认真地进行甚至是多次进行试调查与修改问卷,不得不扬弃那种“从理论中找调查题目”的研究方法与调查方法,不得不走进生活,并且从生活出发,而不是仅仅做书斋学者。
第二,它强调了问卷调查的“人为预设”这个根本的局限性
任何一种问卷,最主要的问题并不在于操作层次上适合于调查什么和不适合于什么,而在于认识论层次上的一个根本问题:研究者的每一个提问其实都是人为地、带有预设地去剪裁生活。这就是问卷调查的最大的局限性,也就是笔者提出“元假设”这一概念的另一个重要意义。
这并不是说就不应该进行问卷调查了,而是说,研究者只有充分地认识到问卷调查的这个根本的局限性,才能够更好地完善与发展问卷。
通俗地说,研究者在设计每一个提问的时候,都应该清醒地知道:现实生活其实并不是这样的,之所以要问这个问题以及要这样问,其实是因为自己在脑子里已经把生活给框定成某种自己想象出来的样子了。从调查操作的角度来说,这是必不可少的,舍此就无法进行任何调查。但是,从认识论的角度来说,这又是远远不够的。它不仅很可能给研究者的认识带来偏差甚至是误解,而且很可能阻挡进一步认识所调查的现象。
因此,如果具有了“元假设”的意识,那么研究者就更可能全面地、历史地、动态地、置身于情境地、互动地去看待自己的调查结果,就更可能对调查结果做出更符合生活现实的解释。通俗地说,没有元假设这个工具,研究者就无法设计问卷;没有元假设这种理论认识,研究者就无法更好地解释自己的调查结果。
第三,它能够促进问卷设计者改善自己的思维方式
元假设这个概念的关键就是“生活是光谱式的存在,一切界定都是研究者人为形成的”。
具有了这样的理论意识,研究者的思维方式就会更上一层楼。在试图考察任何一种现象的时候,首先进入脑海的就不再是“我对它的定义是什么”,而是“它的两极是什么”。这并不是说研究者就一定要按照该现象的两极来设定自己的提问范围,而是说,一旦按照这个思路开始寻找某个现象的“两极”,研究者就很容易发现,自己对于该现象的定义原来是多么局限与肤浅。这样,才能发现该现象的真实存在状态,才能衡量研究者所设定的提问是否合适,才能做出最佳选择,才能避免在调查结果出来以后,被别人认为“其实不调查也知道”。
在笔者的研究实践与教学实践中,元假设这个灵魂屡屡使自己茅塞顿开,乃至听到一个名词就会不由自主地想问人家“它包括最极端的情况吗”,都会去想“它的区间与截取标准是什么”。在现实生活中,这恐怕是“书呆子气大发作”,但是对于学术研究来说,这种思维习惯却使研究者获益匪浅。