回到博文《访问量的启示》中,你还能看出哪些分析视角?
图3-3反映了新发博文当日阅读量与当日博客访问量之间的正向相关关系,新发博文当日阅读量越高,当日博客访问量也越高。这运用了相关视角。
相关视角探索的是事物间的某种联系。这种联系可能是因果关系,也可能是共存关系。利用相关视角,企业可以开展规模预测和精准营销。
利用相关视角可以帮助企业进行规模预测。
例如,企业想有产出,就要有生产要素的投入。生产要素包括技术、资本和劳动力。企业的技术越高、资本实力越雄厚、劳动力越多,产出量往往越大。技术、资本和劳动力是影响产出的关键因素,存在正向因果关系。因此,企业可以建立回归模型,根据技术、资本和劳动力的投入预测自己的产出规模。这个模型就是道格拉斯生产函数— (其中, y 表示产出, A 、 K 、 L 分别表示技术、资本和劳动力, α 为资本弹性系数, β 为劳动力弹性系数, μ 为随机干扰项)。
利用相关视角还可以帮助企业开展精准营销。
假设设置了下面的题目。
请问你最喜欢以下哪种颜色?
A灰色 B黄色 C绿色 D橙色 E紫色 F其他_____________【请注明】
根据这个题目对受访者进行调查,统计结果如图3-8所示。
这样的结果能支持精准营销吗?显然不能!
这个统计结果只能告诉我们受访者整体的颜色偏好,却不能告诉我们到底什么人喜欢什么颜色。而当我们不知道什么人喜欢什么颜色时,就无法开展精准营销。换句话说,要开展精准营销,就要搞清楚用户特征与用户态度偏好的相关关系。
图3-8 整体颜色偏好统计结果
以性别和颜色偏好为例,需要回答两个问题:
●用户性别是否会影响用户对颜色偏好的选择?
●如果有影响,男性偏好什么颜色、女性偏好什么颜色?
于是,我对受访者的性别进行调查,并将受访者的性别与颜色偏好做交叉分析,得到如表3-3所示的结果。
表3-3 性别和颜色偏好交叉分析结果
从表3-3中能得出什么结论?男性更喜欢灰色,而女性更喜欢黄色、绿色、橙色和紫色。
这个结论严谨吗?
不严谨!因为在判断男性和女性各喜欢什么颜色之前,首先要判断性别是否会对颜色偏好产生影响,即颜色偏好是否与性别相关。若不相关,那么就不存在不同性别的用户在颜色偏好上的对比。
如何判断相关性?可能你会想到相关系数 r ,但是相关系数要求变量是数值型数据,而这里性别和颜色偏好都是分类型数据,不适合计算相关系数。可以使用方差分析。
什么是方差分析?以表3-3为例,该表中的数据是总体信息(SST),它由两部分构成:组间差异(SSR)和组内差异(SSE),三者的关系是:SST=SSR+SSE。
什么是组间差异?顾名思义,组间差异就是指组和组之间的差异。在本例中是用性别分组的,因此,组间差异反映的是由于性别的不同引起用户对颜色偏好的差异。
什么是组内差异?顾名思义,组内差异就是指每组内部的差异。比如,同为男性的颜色偏好差异或者同为女性的颜色偏好差异。所以,组内差异不是由性别引起的,而是由性别以外的其他因素引起的,比如收入、年龄、职业、抽样等。
在什么情况下,才能说不同性别者对颜色偏好存在显著性差异,即性别与颜色偏好相关?
试想,如果组内差异很大、组间差异很小,则说明颜色偏好的不同不是由性别引起的,即性别不是产生颜色偏好差异的主要因素。因此,若要得出性别与颜色偏好相关的结论,则需要组间差异足够大、组内差异足够小。
而同时刻画组间差异和组内差异的指标是 F 统计量。你不需要记住 F 统计量的计算公式,只需知道 F 统计量的伴随概率为 P , P 表示组间差异SSR=0发生的可能性即可。
如前所述,若性别与颜色偏好相关,则组间差异要足够大,这意味着SSR=0是一个小概率事件,即 P 的值很小。小到什么程度?在统计学中,要比显著性水平 α 还小。所以,方差分析的检验标准是 P < α ( α 的默认值为0.05)。
如表3-4所示是本例方差分析的结果。从该表可知, P (即表中的显著性)=0.047,小于 α ( α 的默认值为0.05)。通过方差分析检验,表明性别与颜色偏好相关,不同性别者在颜色偏好上存在显著性差异。所以,在颜色上,应该针对不同性别者开展精准营销。
表3-4 单因素方差分析结果
结合前面交叉分析的结果(见表3-3),可以果断地得出结论:
针对男性,应主打灰色的产品;而针对女性,则可推出黄色、绿色、橙色和紫色的产品。