广告调查的形式和方法有很多种,但问卷调查法始终是最重要也是最有效的。
问卷调查是调查中广泛采用的调查方式——由调查机构根据调查目的设计各类问卷,然后采取抽样的方式(随机抽样或整群抽样)确定调查样本,通过调查员对样本的访问,完成事先设计的调查项目,最后,由统计分析得出调查结果。问卷调查严格遵循概率与统计原理,科学性较强,便于操作。样本选择、调查员素质、统计手段等因素会影响调查的质量,问卷设计也影响调查的质量,问卷设计的好坏与设计制度(原则)有关。
1.合理性
问卷必须与调查主题紧密相关,设计之初要找出与调查主题相关的要素。
如:“调查某化妆品的用户消费感受”——这里并无现成的选择要素的法则,从问题出发,结合行业经验,能够寻找出要素:
一是使用者(可认定为购买者)。包括她(他)的基本情况(自然状况:如性别、年龄、皮肤性质等);使用化妆品的情况(是否使用过该化妆品、周期、使用化妆品的日常习惯等)。
二是购买力和购买欲。包括她(他)的社会状况收入水平、受教育程度、职业等);化妆品消费特点(品牌、包装、价位、产品外观等);使用该化妆品的效果(评价。问题应具有一定的多样性、但又限制在某个范围内,如价格、使用效果、心理满足等)。
三是产品本身。包括对包装与商标的评价、广告等促销手段的影响力、与市场上同类产品的横向比较等等。
设置与这几个要素有关的问题,被访问者也容易了解调查意图,从而配合。
2.一般性
问题应具有普遍意义,这是问卷设计的基本要求,达不到这个要求,不利于调查成果的整理分折,而且使委托方轻视调查者的水平。如针对“居民广告接受度”的调查。
问题:你通常选择哪一种广告媒体:
答案:A.报纸 B.电视 C.杂志 D.广播 E.其他___
如果答案是另一种形式,结果就完全不同:
A.报纸 B.车票 C.电视 D.墙幕广告 E.汽球 F.大巴士 G.广告衫
H.其他_____
如果我们的统计指标无须如此细致,那么某些过于细致的问题实际上对调查结果是无助的。在一般性的问卷技巧中,还需要注意的是,在问题的内容设置上不能犯错误。如:
问题:你拥有哪一种信用卡?
答案:A.长城卡 B.牡丹卡 C.龙卡 D.维萨卡 E.金穗卡 F.其他_____
其中,D的设置是错误的,应该避免。因为维萨卡是按发卡组织划分,它与中国银联卡是同一层次不同类别的概念。
3.逻辑性
问卷的设计要有整体感,问题与问题之间要具有逻辑性,独立问题本身也不能出现逻辑上的谬误。从而使问卷成为相对完善的小系统。
1.你通常每日读几份报纸?
A.不读报 B.1 份 C.2 份 D.3 份以上 E.4 份以上
2.你通常用多长时间读报?
A.10 分钟以内 B.半小时左右 C.1 小时 D.2 小时以上 E.2 小时以上
3.你经常读的是下面哪类(或几类)报纸?
A.×市晚报 B.×省日报 C.人民日报 D.参考消息
E.中央广播电视报 F.足球 G.其他___
以上几个问题紧密相关,因而能够获得比较完整的信息。调查对象也会感到问题集中、提问有章法。相反,假如问题是发散的,就会给人以随意而不严谨的感觉,企业就会对调查失去信心。
逻辑性要求与问卷的条理性、程序性关系密切,在综合性的问卷中,差异较大的问卷应该分块设置,保证每个块的问题都密切相关。
4.明确性
问题设置应该规范,命题应该准确,提问应该清晰明确、便于回答,使被访问者能够明确回答问题。
设置“10 分钟”“半小时”“ l小时”等答案是为了了解用时极短(测览)的概率、用时一般(粗阅)的概率、用时较长(详阅)的概率。答案若设置为“10—60分”,或“l小时以内”等,调查意图则难以明确,难以说明问题,令被访问者很难作答。
再则,问卷中常有“是”或“否”一类的是非式命题。如:
问题:您的婚姻状况?
答案:A.已婚;B.未婚
显而易见,此题还有第三种答案(离婚/丧偶/分居)。如按照以上方式设置则不可避免会发生选择上的困难(因为离婚/丧偶/分居的人,没办法选择),这就违背了“明确性”的原则。
5.非诱导性
问题设置要中立,不提示或主观臆断,完全让被访问者独立与客观判断。
问题:你认为这种化妆品对你的吸引力在哪里?
答案: A.色泽 B.气味 C.使用效果 D.包装 E.价格 F.其他____
这种设置是客观的。若换一种答案设置:
A.迷人的色泽 B.芳香的气味 C.满意的效果 D.精美的包装 E.其他___
这样设置具有诱导性,掩盖了事物的真实性。
6.便于整理、分析
成功的问卷设计除了要紧密结合调查主题与方便信息收集,还要考虑调查结果的整理和分析难度。首先,这要求调查指标能够累加和便于累加;其次,指标的累计与相对数的计算有意义;再次,能够通过数据清楚明了地说明所要调查的问题。只有这样,调查工作才能收到预期的效果。
根据调查行业和调查方向的不同,问卷的设计在形式和内容上应有所不同,无论哪种问卷,设计过程中都必须要注意以下几个要点。
1.明确调查目的和内容
设计必须明确调查目的和内容——为什么调查,调查要了解什么?市场调查的总体目的是为决策部门提供参考,制定长远的战略性规划,也可能是为制定具体政策。问卷设计必须清楚认识调查目的,将其具体细化和文本化,以指导设计。调查内容可以涉及意见、观念、习惯、行为和态度等抽象问题,也可以涉及接触媒介习惯、品牌喜好、消费习惯等具体行为,但应避免使被调查人难以回答,或者是需要长久回忆而导致模糊不清的问题。
2.措辞得当
题目必须有针对性,充分考虑受调人群的文化水平、年龄层次和协调合作的可能性,题目难度和题目性质的选择上应该考虑上述因素,措辞上也应该进行相应调整。面对家庭主妇的调查,语言上应通俗;对于文化水平较高的城市白领,措辞可以比较书面。
3.数据统计和分析应易于操作
数据统计和分析两个环节的工作一般是分离的,整合和衔接上容易出现偏差,设计时应充分考虑使这两部分工作相互衔接,具体来说,题目必须容易录入,可以具体分析,主观题目的答案也要具有很强的总结性,等等。
4.说明
问卷调查面对广大调查对象,调查的目的和内容不同,针对的群体也不相同,受调查对象配合态度的影响甚大。问卷设计时应该尊重调查对象,应该尽量规范,使调查对象充分了解相关情况。卷首最好要有说明(称呼、目的、填写者受益情况、主办单位),如涉及个人情况,应有隐私保护说明。
5.问题数量合理化、逻辑化、规范化
形式和内容固然重要,但数量同样是问卷调查成功的关键因素,由于时间的关系,人们往往不愿意接受繁杂冗长的问卷,即使接受,也不可能认真完成。问题设计也应该注意逻辑,不能相互矛盾,且应尽量避免假设性问题。对相关类别的题目进行列框,使受调人员一目了然。应该避免主观性的题目,或将其放在最后。问卷初步设计完成,应该设置相似环境,小范围试填写,及时修改。
6.问卷的组成部分
正式的调查问卷一般包括以下三个部分。
(1)前言。主要说明调查的主题、调查的目的、调查的意义,向被调查者表示感谢。
(2)正文。这是调查问卷的主体部分,一般设计若干问题要求被调查者回答。
(3)附录。这一部分可以登记被调查者的有关情况,为进一步统计分析收集资料。
7.提问的方式
提问的方式有以下三种。
(1)封闭式提问。在每个问题后给出若干个选择答案,被调查者只能在这些被选答案中选择。
判断题。判断题也叫是非题,一般是两极答案中选一。
问题:您的性别?
答案:A男 B女
问题:您喜欢耐克鞋吗?
答案:A喜欢 B不喜欢
单选题。
问题:您喜欢以下哪一款手机?
A.诺基亚 B.摩托罗拉 C.西门子 D.波导 E.三星 F.TCL
G.其他
问题:您对刚才看过的广告,喜欢程度如何?
答案:A.非常喜欢 B.比较喜欢 C.无所谓 D.比较不喜欢
E.非常不喜欢
多选题。
问题:您最喜欢的体育品牌有哪些?请按喜欢的程度依次排列。
答案:A.耐克 B.李宁 C.阿迪达斯 D.锐步 E.安踏
F.彪马 G.其他
问题:请选出您最经常获得有关啤酒产品信息的途径:(可多选)
A.报纸杂志 B.宣传单 C.朋友介绍 D.电视广告
E.公共车身广告 F.户外广告 G.其他
(2)开放式提问。允许被调查者用自己的话来回答问题,采取这种方式提问会得到不同答案,不利于资料统计分析,不宜过多使用。
问题:您认为惠泉应如何塑造品牌形象?请陈忠和做代言效果如何?
_______________________
问题:您对惠泉啤酒的建议是:_______________
(3)李克特量表。李克特量表是评分加总式量表中最常用的一种,属同一构念的这些项目是用加总方式来计分,单独或个别项目是无意义的。李克特量表由美国社会心理学家利克特于 1932 年在原有的总加量表基础上改进而成,量表由一组陈述组成,每一陈述有“非常同意”“同意”“不一定”“不同意”“非常不同意”五种回答,分别记为 1、2、3、4、5,每个被调查者的态度总分就是他对各道题的回答所得分数的加总,这一总分可说明他的态度强弱或他在这一量表上的不同状态。
李克特量表形式上与沙氏通量表相似,都要求受测者对一组与测量主题有关的陈述语句发表自己的看法。它们的区别是,沙氏通量表只要求受测者选出他所同意的陈述语句,而李克特量表要求受测者对每一个与态度有关的陈述语句表明同意或不同意的程度。另外,沙氏通量表中的一组有关态度的语句按有利和不利的程度都有确定的分值,李克特量表仅对态度语句划分有利和不利,以便事后进行数据处理。
李克特量表构作的基本步骤如下。
收集大量(50—100)与测量的概念相关的陈述语句。
研究人员根据测量的概念将每个测量的项目划分为“有利”或“不利”两类,一般测量的项目中有利的或不利的项目都应有一定的数量。
选择部分受测者对全部项目进行预先测试,要求受测者指出每个项目是有利的或不利的,并在下面的方向—强度描述语中进行选择,一般采用所谓“五点”量表:
A.非常同意 B.同意 C.无所谓(不确定) D.不同意 E.非常不同意
对每个回答给一个分数,如从非常同意到非常不同意的有利项目分别为 1、2、3、4、5 分,对不利项目的分数就为 5、4、3、2、1。
根据受测者的各个项目的分数计算代数和,得到个人态度总得分,并依据总分多少将受测者划分为高分组和低分组。
选出若干条在高分组和低分组之间有较大区分能力的项目,构成一个李克特量表。如可以计算每个项目在高分组和低分组中的平均得分,选择那些在高分组平均得分较高并且在低分组平均得分较低的项目。
李克特量表的构作比较简单而且易于操作,因此在市场营销研究实务中应用非常广泛。在实地调查时,研究者通常给受测者一个“回答范围”卡,请他从中挑选一个答案。需要指出的是,目前在商业调查中很少按照上面给出的步骤来制作李克特量表,通常由客户项目经理和研究人员共同研究确定。
李克特量表的优点是:容易设计;使用范围比其他量表要广,可以用来测量其他一些量表所不能测量的某些多维度的复杂概念或态度;通常情况下,李克特量表比同样长度的量表具有更高的信度;李克特量表的五种答案形式使回答者能够很方便地标出自己的位置。
李克特量表的缺点是:相同的态度分区可能具有不同的态度形态。因为李克特量表是一个项目总加的分代表一个人的赞成程度,它可大致上区分个体间谁的态度高,谁的低,但无法进一步描述他们的态度结构差异。
统计数据质量有多个子项:统计设计质量、统计调查质量、统计整理质量、统计分析质量、数据发布传输质量,等等。统计设计质量是保证统计数据质量的首要环节,在统计数据质量保证体系中起着关键作用。统计设计质量也可细分调查问卷设计质量、调查方案设计质量,调查问卷设计质量指通过问卷测量得到的,反映调查对象客观现象的统计数据的准确性和有效性。调查问卷设计质量的好坏,需要通过问卷测量能力的高低来检验。
问卷测量能力与两个指标有关:问卷测量结果的准确性和有效性。好的问卷不仅保证在多次重复使用下得到可靠的数据结果,即准确性;也可以保证所得测量结果能够反映它所应该反映的客观现实,即有效性。通常使用信度和效度这两个技术性指标来评估问卷的测量能力。通过分析问卷测量能力来检验问卷的设计质量,对问卷设计进行质量控制,进而发现问卷设计中的问题。在此基础上不断改进问卷设计,提高其测量能力。
(一)问卷设计质量的信度检验
信度检验针对问卷测量结果准确性,检查问卷在多次重复使用下得到的数据结果的可靠性。在实际应用中,信度检验多以相关系数表示,常用的方法有:重测信度、复本信度、折半信度、克朗巴哈信度、评分者信度等。这里不一一详述,仅列出相关公式作为参考。
(1)重测信度,也叫稳定系数或再测信度,对同一组调查对象采用同一调查问卷进行先后两次调查,采用检验公式
r
=
,其中
σ
x
1
x
2
为两次调查结果的协方差,
σ
x
1
为第一次调查结果的标准差,
σ
x
2
为第二次调查结果的标准差。系数值越大说明信度越高。在SPSS中,重测信度可以通过“Analyze”菜单里的“Correlate”选项中的“Bivariate”命令,求得两次调查结果的相关系数来实现。
(2)复本信度,也叫等值系数,对同一组调查对象进行两种相等或相近的调查,要求两份问卷的题数、形式、内容及难度和鉴别度等方面都要尽可能地一致。检验公式同稳定系数公式,系数越大,说明两份问卷的信度越高,具体调查时使用哪一份都可以。
(3)折半信度,也叫分半信度,将调查的项目按前后分成两等份或按奇偶题号分成两部分,通过计算这两部分调查结果的相关系数来衡量信度。当假定两部分调查结果得分的方差相等时,检验用Spearman-Brown公式来表示:
,其中
r
*
表示折半信度系数;当假定方差不相等时,采用Flanagan公式:
r
= 2
,其中
分别表示两部分调查结果的方差,
σ
2
表示整个问卷调查结果的方差。折半信度高,说明问卷的各项题之间难度相当,调查结果信度高。在SPSS中,折半信度可以通过“Analyze”菜单里的“Scale”选项中的“Reliability Analysis”命令,选择“Split-half”模式,求得分半信度来实现。
(4)克朗巴哈信度,也叫内在一致性系数,是对折半信度的改进,检验公式是:
,其中,
k
表示问卷中的题目数,
为第
i
题的调查结果方差,
σ
2
为全部调查结果的方差。
σ
信度系数是目前最常用的信度分析法。在SPSS中,克朗巴哈信度可以通过“Analyze”菜单里的“Scale”选项中的“ReliabilityAnalysis”命令,选择“Alpha”模式,计算信度系数Cronbacha的值,求得克朗巴哈信度来实现。
(5)评分者信度,包括
θ
信度和Ω信度,将问卷中的每道题看作是一个变量,然后通过调查的结果得分对所有问题做因子分析。得到
Ω
=
,其中,λ是最大特征值,
N
是问题数,
h
1
2
是因子分析法的第
i
个问题的共同度。
(二)问卷设计质量的效度检验
问卷设计质量的效度检验指问卷测量结果有效性的分析,即对设计问卷的测量结果反映它所应该反映的客观现实的程度的检验。具体来说,效度检验必须针对其特定的目的功能及适用范围,从不同的角度收集各方面的资料分别进行。常用的效度检验有内容效度、结构效度、难易效度、准则效度等。有关效度分析方法的详细内容,不再一一赘述。
(1)内容效度,也叫单项和总和的相关效度分析,指调查问卷所采用的题项能否代表所反映的内容或主题。通常是用单个问题的得分与总得分的相关系数来反映,如果相关系数不显著,表示该题的鉴别力低,就不应该再将该题纳入调查问卷。
(2)难易效度,在调查反映观念、态度的问题中采用检验公式:难易效度=2 m N ·2 m L ,其中 m N 、 m L 分别代表高分组和低分组样本数, p N 、 p L 分别代表高分组和低分组通过该题的样本数。计算结果越大,表示该题越容易,反之该题难度较大。
(3)鉴别效度,在对观念、态度问卷单个题的评价中采用公式:鉴别效度
,符号含义同难易效度公式。一般希望调查问卷的每道题的鉴别效度高一些,这样可以更好地反映被调查者对问题看法的差异性。
(4)准则效度,又叫独立标准效度分析。根据已经掌握的理论,选择一个与调查问卷直接相关的独立标准,把它当作自变量。然后再分析调查结果的特性与该自变量的关系,对于自变量的不同取值,调查结果的特性表现出显著差异与掌握的理论有很强的相关性,说明调查问卷是有效的。
(5)结构效度,该检验主要就是将问卷中的每道题看作一个变量,通过调查的结果得分对所有问题做因子分析,提取一些较为显著的因子,通过各个问题在每个因子上的载荷将问题分类。其目的就是为了检验问卷中的属于相同理论概念的不同问题是否能落在同一因子上,结果符合理论,即属于相同概念的题都归为同一因子,说明问卷结构效度良好。
(三)问卷设计质量信度、效度检验间的关系
以X表示测量值,T表示真实值,E表示随机误差,则他们之间的关系为X = T+ E,测量值总方差
可分解为
,信度可用真实值的方差占测量值的总方差来表示,即信度=
如果将T进一步分解为想要测量的目标真值TX ,与测量目标无关的系统偏差T0 ,效度可用想要测量目标真值的方差占测量值总方差的比重来表示,即效度
。很明显
大并不一定保证
也大,也就是说信度高时效度不一定高。反过来,在
一定时,
大则保证
也一定大,也即效度高时信度一定高。反过来,在
一定时,
大则保证
也一定大,即效度高时信度一定高。所以信度检验是效度检验的必要条件,但不是充分条件。效度检验结果的好坏直接决定了整个调查研究的价值,如果设计的问卷不能充分表示所要研究的对象,那么整个研究也就失去了意义。高效度一定隐含着高信度,如果问卷设计是有效的,那么一定是可信的。如果调查问卷有信度而没有效度,其测量结果则可能并不是理论上想要研究的结论。信度与效度关系如图 2-1 所示。
图2-1 信度与效度关系
(四)如何提高调查问卷设计质量
1.问卷设计信度、效度检验中的启示
(1)信度检验的启示。调查对象的范围与信度的关系。由于信度检验采用的是相关系数的形式,因此受调查对象范围的影响。如果调查对象的特征分布范围较大,则变异性越大,信度系数就会越小;相反调查对象的特征分布较集中,则变异性较小,信度系数就会越大。
调查问卷设计长度与信度的关系。通常来说,采用折半信度分析方法时,由于同一份问卷不太容易分为等同的两部分,折半信度分析的效果不如采用整体分析的效果,这可以通过Spearman-Brown公式观察出,整体的信度系数是折半信度系数的两倍多。因此如果对于同一目的和同一调查对象所设计的两份调查问卷,其中一份是在另一份问题的基础上增加若干道同类型的问题,那么问题多的问卷的信度一定会较高。同时,问卷的信度会随着问卷同质问题的增多而增大。
调查问卷的设计与信度的关系。由于信度检验是在对调查问题答案编码打分的基础上进行的,如果调查问卷设计过程中存在偏差,例如正向问题偏多或逆向问题偏多、备选答案易让被调查者打高分或低分的问题偏多等都可能造成认为信度分析的偏差。所以问卷的设计是保证信度的一个前提条件。
影响信度检验的其他因素:调查对象的持久性、合作态度等影响;调查实施者是否按规定实施调查;调查环境与条件是否适当;调查内容是否恰当、问题数目是否适中等这些也都是影响调查问卷设计信度检验的主要因素。
(2)效度检验的启示。调查问卷的问题设计与效度的关系。问题是构成调查的要素,调查问题的性能就成为影响调查问卷效度的因素之一。从效度检验可以看出问题的取材、长度、鉴别力、难度及编排方式都和效度有关。问题的取材合理、长度适中、有相当的鉴别力且难度分布适当、编排也较合理,调查结果的检验就会有很高的效度。
调查的实施和效度的关系。问卷调查的效度检验要得到保证,调查督导员应该适当控制调查情况,而调查员应当严格按照访问手册的规定实施调查。在调查过程中,如果场地的选择、调查材料的准备、调查方式的说明、调查时间限制等,如不按照调查手册程序进行,则必然降低问卷调查测量的效度。
被调查者的态度和效度的关系。被调查者的兴趣、动机、情绪及是否合作以及合作程度等都影响到问卷结果的可靠性和正确性。无论是什么调查内容,只有借助调查对象的真实反映,才能了解到真正的调查情况。
关联效度准则的选取与效度的关系。适当地选择关联准则是关联效度分析的先决条件,选择的准则不当,会导致效度分析的错误,问卷调查的真实效度就可能被掩盖。一个问卷准则效度分析时,选择的准则不同,其效度分析的结果会相差很大。从统计分析的观点来看,一个准则关联效度受以下三个因素的影响作用最大:问卷的信度、准则变量的信度、准则变量和调查变量之间真正的相关程度。
调查对象的选取和效度的关系。在调查中,最注重的是选取样本的代表性。好的样本代表性能够提高问卷调查的效度。一个调查应用与不同的调查对象,由于对象在性别、年龄、教育程度、背景上的差异,效度也随之变异。
2.改善问卷设计质量,提高调查数据的质量
通过以上得到的信度和效度检验的启示,可以明确,问卷调查测量能力的好坏,关键在于调查问卷的设计阶段。
通过分析具体调查指标的特性,进行充分的文献综述和资料检索,正确设计有针对性的调查问题;问题的措辞恰当、长度安排合理;问题对于所要了解的调查内容有相当的鉴别力和适当的难度;并分别给予每一个问题适当的答案选项;问题的前后顺序编排合理等这些设计要求的满足,有助于明显提高问卷的信度和效度,使得我们能够用一份完善的调查问卷去收集所要调查的数据内容,从而为得到高质量数据创造了前提条件。
在实施调查过程中,严格的按照调查方案选择调查对象,确定合理的调查时间、地点、环境,以及在调查过程中积极争取调查对象的合作,访问过程中严格按照计划实施等是我们对收集高质量调查数据的保证。
通过以上的分析和论述,可以看到能否通过问卷调查收集到准确的、有效的高质量数据,完善的问卷设计是前提,而周密的按照调查方案实施数据收集是保证。此外,对调查结果的正确汇总、整理、分析,以及选用适当的信度和效度检验方法也是我们提高问卷调查数据质量不可或缺的条件。
收集到的问卷资料还要整理、分类及统计运算,把庞大的、复杂的、零散的资料集中简化,使资料变得易于理解和解释。简言之,资料整理就是将问卷资料转变成数据结果,以便于研究者了解、揭示其中的含义。
资料采集后,所有资料都要汇总,以便统计处理。为避免信息损失,评价访问员的工作成绩,负责人要对资料进行登记分类,如按地区、访问员等分类,分别记录各地区、各访问员交回的问卷数量、交付时间、实发问卷数量、丢失问卷数等情况。
编码是把原始资料转化为符号或数字的资料简化过程。通过编码,资料输入计算机进行统计就简单多了。所以,编码通常是不可忽略的程序,合理、正确的编码将极大方便统计计算和结果解释。编码包括下列方面的工作。
(一)规定变量名称
市场调查问卷通常包含若干问题(变量),为方便统计处理,数据输入计算机前必须先给每个问题或变量起一个变量名称。变量名称一般是英文字母与阿拉伯数字的组合,如S、Age、X 1 、Y 2 ,等等。
定义变量名要把个人基本情况与其他问题区分开,受调查者的个人基本情况如年龄、性别、文化程度、职业等,这些变量通常可以直接用英文单词、英文的第一个字母或前几个字母来命名。例如,性别可规定为“ Sex”,年龄规定为“Age”,文化程度定义为“Edu”等,也可以用汉语拼音字母等方法来命名,命名由研究者或编码者决定。
其他问题的题目数量通常比较多,常用“X 1 、X 2 ……X n ”或“Y 1 、Y 2 ……Y n ”等字母与数字系列组合方式来表示,也可以按问题的含义来定义。
(二)规定各量表值
量表值依据数据的类型可以用字符串表示,也可以用数字表示,一般用数字来表示比较方便。
问题:您的性别
答案:A.男 B.女
可把“男”规定为 1,“女”规定为“0”或“2”。
问题:您对芳草牙膏的喜欢程度
答案:A.非常喜欢 B.比较不喜欢 C.难以确定 D.比较喜欢 E.非常喜欢
这个量表中,可以直接依答案顺序分别规定为 1、2、3、4、5,最好按递增程度排序,若颠倒过来排序对结果的理解而言,增加了难度。
定义量表值时,还应当注意有些受调查者不按问卷设计要求作答,如多选或漏选,如果是个人基本项目出现这种情况,那么该问卷就是无效问卷,不纳入统计处理。如果是个别其他问题出现多选或漏选现象,则要另加一个或两个量表值,把它们归为一类或两类,以例 2 来说,可将“漏选”和“多选”分别规定为“7”或“0”。
在规定变量名称和量表值时,还要注意以下几种情况。
1.非问卷题目的有关问题
大规模调查中,通常包含许多地区,统计时需要分析不同调查地区的差别,地区本身就是一个变量,命名规定量表值时要考虑它。例如,分别在北京、上海、广州和成都四个地区开展调查,可以将该变量命名为“Seg”,将北京规定为“1”、上海为“2”、广州为“3”、成都为“4”,没有注明或不知为哪个地区的规定为“9”。
2.多选题
对于单选题来说,每个问题就是一个变量,一个问题有n个答案,就有n + 1个量表值。而对于多选题来说,情况就复杂一些,下面我们用一个例子来说明。
例:您是通过哪些渠道知道× ×品牌的?
A.电视广告 B.报纸广告 C.杂志广告
D.广播广告 E.户外广告 F.听别人介绍
G.在商店看到 H.其他____
对于这样一个问题的编码,就要将 8 个答案变成 8 个变量,然后依照顺序分别命名,如分别规定为“X 9a 、X 9b 、X 9c 、X 9d 、X 9e 、X 9f 、X 9g 和X 9h ”。而每个变量的量表值则根据是否被选择作规定,如选择规定“1”,没选择规定为“2 或 0”。如果研究者还需要了解作答者选择答案数量的分布情况,还需要增加一个变量,如命名为“X 9 ”,量表值则根据作答者的答案选择数量作规定,如选择 1 个答案规定为“1”,2 个答案为“2”,……
3.开放性问题
有些开放性问题在统计处理时只想了解究竟有多少人作答,这时的编码就比较简单,只要给每一个题目相应地起一个名称,然后用“1”表示“作答”,用“0”表示“未作答”即可。但是如果要对答案进行量化分析,那么编码工作就比较复杂一点。编码员首先要将多数作答者的答案浏览一遍,列出各种可能答案,根据答案是单选或多选,规定变量名称和量表值,然后将每一位作答者的答案进行分类。例如对于“您为什么喜欢瓶装植物油而不喜欢散装植物油?”这样一个开放题,答案可以分类为:卫生、质量、购买方便……,变量名称为:X h1 、X h2 、X h3 ……,每一个变量的量表值为“1”时表示答案“涉及”该方面内容,“0”表示答案“未涉及”该方面内容。
当所有变量和量表值都规定清楚之后,编码人员要编写一本编码簿,说明各英文字母、数码的意思。因为在市场调查研究中,通常都有大量变量和数据资料。这些资料一旦输入电脑时,只有编码人员知道各变量名称以及数码的意义。不制作手册,很可能遗忘,其他人也不得而知。
编写一本编码簿,用以说明各种符号、数码的意义,具有三种功能:
(1)录入人员可根据编码簿说明来录入数据。
(2)研究者人员或电脑程序员根据编码簿编拟统计分析程序。
(3)研究者阅读统计分析结果时,不清楚各种代码的意义时,可以从编码簿中查询。
在大多数较为复杂的市场调研中,编写编码簿是一项必要的程序。但是在编写编码簿时,各项说明要尽量详尽。
编码簿通常包含有六个主要项目,即变量序号、变量含义、相应问卷题号、变量名称、是否跳答、数据宽度、数据说明。
变量序号是给各变量的数码,表示各变量在数据库中的输入顺序;变量含义,即问卷中问题意思的概括,使研究者或程序设计师很快得知这一变量的意思;相应问卷题号指变量属于问卷中的第几题,便于查寻原来的题意;变量名称是变量的代号,代号便于计算机识别和统计操作,列入编码簿可使研究者便于从代号查寻其含义;数据宽度包括该变量的数据最多是几位数及小数点之后有几位数;数据说明是对各数码代表受访者的何种反应的说明。
有了编码簿,储存于计算机中的资料,其含义就一清二楚。录入之后的问卷材料就可以束之高阁。在目前常用的SPSS统计软件中,编码簿的主要内容可以输入文件之中,以便直接在统计结果中体现出来。
为了深入研究总体的特征,揭示总体中的矛盾,要进行统计分组,根据广告研究的目的,按照一定的标志,将统计总体区分为若干个组成部分。这些若干部分中的每一个部分就叫作一个“分组”。例如,研究某一地区人口状况对广告效果的影响时,可按年龄这一标志将人口区分为不同年龄组,各组的年龄不同,每个组中人口所表现的年龄特征相同。统计分组的根本任务就是区分事物之间存在着的质的差异,通过分组,把总体中各个不同性质的单位区分开,把性质相同的单位归在一个组内。这样才能从数量方面剖析该变量对广告的影响,揭示变量内部的联系,深入研究总体的特征,认识变量的本质及规律性。
统计分组是基本统计方法之一,经常使用。广告调查方案必须对统计分组做出具体规定,才能搜集到能够满足分组需要的资料。资料整理的任务是使零散资料系统化,但怎样使资料系统化,本着什么去归类,这就取决于统计分组。因此,在取得完整、正确的统计资料前提下,统计分组决定整个广告研究成败的关键,直接关系广告分析的质量。
目前,统计工作中常用的分组如按生产资料所有制性质分组、按国民经济行业分组、按单位隶属关系分组、按地区分组、三次产业划分、企业按大中小型划分、职业分类等,其中重要的分组都有全国统一的分类标准。
统计分组根据分组标志的性质,分为按品质标志分组和按数量标志分组。品质标志说明事物的性质或属性特征,反映总体单位在性质上的差异,不能用数值来表现;数量标志直接反映事物的数量特征,反映事物在数量上的差异,如人口的年龄、企业的产值等。统计分组方法就是指这两种标志的具体分组方法。
(一)按品质标志分组
品质标志分组一般较简单,分组标志一旦确定,组数、组名、组与组之间的界限也就确定。有些复杂的品质标志分组可根据统一规定的划分标准和分类目录进行。
(二)按数量标志分组
按数量标志分组的目的并不是单纯确定各组在数量上的差别,而是要通过数量上的变化来区分各组的不同类型和性质。数量标志分组方法从以下几个方面来说明。
1.单项式分组和组距式分组
对离散变量,如果变量值的变动幅度小,就可以一个变量值对应一组,称单项式分组。如居民家庭按儿童数或人口数分组,均可采用单项式分组。
离散变量如果变量值的变动幅度很大,变量值的个数很多,则把整个变量值依次划分为几个区间,各个变量值则按其大小确定所归并的区间,区间的距离称为组距,这样的分组称为组距式分组。一般组距式分组组数以 5—7 组为宜,最多不超过 10 组,组间距最好为整数。
也就是说,离散变量根据情况既可用单项式分组,也可用组距式分组。在组距式分组中,相邻组既可以有确定的上下限,也可将相邻组的组限重叠。
连续变量由于不能一一列举其变量值,只能采用组距式的分组方式,且相邻的组限必须重叠。如以总产值、商品销售额、劳动生产率、工资等为标志进行分组,就只能是相邻组限重叠的组距式分组。
在相邻组组限重叠的组距式分组中,若某单位的标志值正好等于相邻两组的上下限的数值时,一般把此值归并到作为下限的那一组(适用于连续变量和离散变量)。
组距式分组会损害资料的真实性。组距式分组的假定条件是:变量在各组内的分布都是均匀的(即各组标志值呈线性变化)。
通过组距式分组,抽象出各组内部各单位的次要差异,突出各组之间的主要差异,这样各组分配的规律就容易把握。根据这个道理,如组距太小、分组过细,容易将属于同类的单位划分到不同的组,因而显示不出现象类型的特点;但如果组距太大,组数太少,会把不同性质的单位归并到同一组中,失去区分事物的界限,达不到正确反映客观事实的目的。因此,组距的大小、组数的确定应根据研究对象的经济内容和标志值的分散程度等因素,不可强求一致。
2.等距分组和不等距分组
等距分组是各组保持相等的组距,也就是说各组标志值的变动都限于相同的范围。不等距分组即各组组距不相等的分组。
统计分组时采用等距分组还是不等距分组,取决于研究对象的性质特点。在标志值变动比较均匀的情况下宜采用等距分组。等距分组便于各组单位数和标志值直接比较,也便于计算各项综合指标。在标志值变动很不均匀的情况下宜采用不等距分组。不等距分组有时更能说明现象的本质特征。
3.组限和组中值
组距两端的数值称组限。其中,每组的起点数值称为下限,每组的终点数值称为上限。上限和下限的差称组距,表示各组标志值变动的范围。
组中值是上下限之间的中点数值,以代表各组标志值的一般水平。组中值并不是各组标志值的平均数,各组标志数的平均数在统计分组后很难计算出来,就常以组中值近似代替。组中值仅存在于组距式分组数列中,单项式分组中不存在组中值。
组中值的计算是有假定条件的,即假定各组标志值的变化是均匀的(与组距式分组的假定条件相同)。一般情况下,组中值= (上限+下限)÷ 2。
对于第一组是“多少以下”,最后一组是“多少以上”的开口组,组中值的计算可参照邻组的组距来决定。即:缺下限开口组组中值=上限-1 /2 邻组组距,缺上限开口组组中值=下限+ 1 /2 邻组组距。
4.分类变量、连续变量和离散变量
分类变量的变量值是定性的,表现为互不相容的类别或属性。分类变量可分为无序变量和有序变量两类。
(1)无序分类变量指所分类别或属性之间无程度和顺序的差别。它又可分为:二项分类,如性别(男、女),广告反应(正面、负面)等;多项分类,如职业(教师、公务员、商人、学生、农民),品牌选择(飘柔、海飞丝、潘婷、百年润发)等。
对于无序分类变量的分析,应先按类别分组,清点各组的观察单位数,编制分类变量的频数表,所得资料为无序分类资料,亦称计数资料。
(2)有序分类变量。各类别之间有程度的差别。如喜欢程度按非常喜欢、比较喜欢、难以确定、比较不喜欢、非常不喜欢分类。对于有序分类变量,应先按等级顺序分组,清点各组的观察单位个数,编制有序变量(各等级)的频数表,所得资料称为等级资料。
变量取值只能取离散型的自然数,就是离散变量,比如,一次掷 20 个硬币,k个硬币正面朝上,k是随机变量,k的取值只能是自然数 0、1、2……20,而不能取小数 3.5、无理数
,因而k是离散变量。
如果变量可以在某个区间内取任一实数,即变量的取值可以是连续的,这随机变量就称为连续变量。比如,公共汽车每 15 分钟一班,某人在站台等车时间x是个随机变量,x的取值范围是[0,15),它是一个区间,从理论上说在这个区间内可取任一实数 3.5、
等,因而称这随机变量是连续型随机变量。连续变量的数值是连续不断的,相邻两值之间可作无限分割,即可取无限数值。例如,人的身高、体重、粮食亩产、零件误差的大小等,它们的计量单位可以取小数点以后的任意一个位数,而且必须用测量或计量的方法取得其值。
变量类型不是一成不变的,根据研究目的的需要,各类变量之间可以进行转化。
(三)SPSS中实现过程
选择“Transform”菜单的Compute项,打开如图所示的“Compute Variable” (计算变量)对话框,如图 2-2 所示。
图2-2 “Compute Variable”(计算变量)对话框
在该对话框中的“Target Variable”(目标变量)框中输入符合变量命名规则的变量名,如a。目标变量可以是现存变量或新变量。
“Numeric Expression”(数值表达式)框用于输入计算目标变量值的表达式。分组时,第一次操作输入“1”,表明a = 1,计算器板下面有个“If”按钮,单击该按钮打开条件表达式对话框,如图 2-3 所示。在条件表达式对话框中指定一个逻辑表达式。在该图中,只对满足“[weight > 0]&[weight < = 2000]”(汽车重量在 0 和2000 之间,不包括 0 但包括 2000)条件的样本进行计算,符合该条件的赋值为a =1,依次类推该操作根据需要进行分组,最后新产生的变量a为分类变量。
图2-3 条件表达式对话框
数据量化的类型则无外乎四种:定类尺度、定序尺度、定距尺度、定比尺度。其中,定类尺度和定序尺度是定性数据,定距尺度和定比尺度是定量数据。
实际中常用的广告统计数据的直接来源主要有三种:普查、抽样调查、统计报表。除外,实际中有时也用到重点调查和典型调查。广告统计数据的间接来源主要有三种:中国广告年鉴;会议资料及报告;历史文献与著作。此外,还有报纸、杂志、广播、电视、网络等,都为数据的收集提供了丰富的信息来源。
统计数据的内容质量是统计数据最基本的特征,它包括相关性、准确性与及时性。统计数据的表述质量包括可比性、可衔接性和可理解性。统计数据的约束标准有:可取得性、有效性。
问卷设计的原则有:合理性、一般性、逻辑性、明确性、非诱导性、便于整理、分析。设计过程中都必须要注意以下几个要点:明确调查目的和内容,问卷设计应该以此为基础;明确针对人群,问卷设计的语言措辞选择得当;在问卷设计的时候,就应该考虑数据统计和分析是否易于操作;卷首最好要有说明(称呼、目的、填写者受益情况、主办单位),如有涉及个人资料,应该有隐私保护说明;问题数量合理化、逻辑化,规范化。调查问卷提问的方式可以分为以下三种形式:封闭式提问、开放式提问、李克特量表。
我们采用问卷的信度和效度分析来评估其测量能力,进而实现对问卷设计质量的检验。在实际应用中,信度检验多以相关系数表示,常用的方法有:重测信度、复本信度、折半信度、克朗巴哈信度、评分者信度等。常用的效度检验有内容效度、结构效度、难易效度、准则效度等。
对资料的编码,包括下列几个方面的工作:规定变量名称、规定各量表值。统计分组根据分组标志的性质,分为按品质标志分组和按数量标志分组。分组可以在SPSS软件中得以实现。
1.数据量化有哪几种类型?
2.实际中常用的广告统计数据的直接来源和间接来源分别有哪些?
3.什么是统计数据的内容质量?什么是统计数据的表述质量?
3.问卷设计的原则有哪些?
4.如何实现对问卷设计质量的检验?
5.编码包括哪些内容?在SPSS13.0 中如何进行分组?
指导语:尊敬的先生/女士您好:我们是× ×大学新闻传播学院大三学生,耽误您几分钟时间请教几个啤酒市场方面的问题,希望您能为我们提供宝贵的意见。谢谢您的支持与合作!您填写的资料我们会为您保密!
您的年龄是:A.18-25 岁 B.26-45 岁 C.46-55 岁 D.55 岁以上
您的性别是:A.男 B.女
您的职业是:A.学生 B.业务人员 C.工人 D.企业中高级管理人员
E.个体工商 F.政府官员/公务员 G.科教/文化工作者 H.技术人员
I.其他____
您每月的经济收入是:A.1000 以下 B.1000—3000 C.3000—5000
D.5000 以上
您喝啤酒吗?A.是 B.否
回答“是”请跳过第一题直接进入第二题及其之后的问题;回答“否”请只做第一题
1.您不喝啤酒的原因是?(可多选)
A.酒精过敏 B.没有喝啤酒的习惯 C.不习惯啤酒的味道 D.喝酒伤身
E.其他_____
2.请选出您最经常饮用啤酒的场合:(可多选)
A.家庭 B.朋友聚会 C.娱乐场所 D.酒吧 E.公务应酬
F.其他____
3.请选出您最经常购买啤酒的地方:(可多选)
A.超市 B.便利店 C.酒吧 D.娱乐场所 E.餐馆
F.其他_____
4.请选出您最经常获得有关啤酒产品信息的途径:(可多选)
A.报纸杂志 B.宣传单 C.朋友介绍 D.电视广告 E.公共车身广告
F.户外广告 G.其他____
5.哪一种牌子的啤酒是您最经常喝的:(单选)
A.青岛 B.惠泉 C.雪津 D.珠江 E.燕京 F.清源
G.其他____
6.您为什么会经常喝这个牌子的啤酒?(可多选)
A.口感好 B.包装精美 C.受广告代言人影响 D.受家人朋友影响
E.价格合理F.购买方便 G.其他____
7.请列出您在买啤酒时对不同考虑因素的重视程度(在对应框内打“√”)
7.您认为惠泉应如何塑造品牌形象?请陈忠和做代言效果如何?
______________________
8.您对惠泉啤酒的建议是:_________________
问卷结束,再次感谢您提供的宝贵意见!
调查时间: 调查地点: 调查对象:
编码:
续表
续表