购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

3.2 网站数据趋势分析

通过学习和了解网站的基础指标,也许我们已经可以做出一些报表了,每张报表都包含了一定的基础指标,如果只是将这些基础报表开放给数据的消费者,也许会招来很多抱怨,我们可以通过问卷调查(Survey)的方式来了解用户抱怨的原因到底有哪些,假如问卷最终收集的信息总结得到如下的几个重要反馈:

上面都是数据的消费者,并且对当前提供的报表数据有诸多的不满,他们的反馈反映了目前提供的数据的一些缺陷和不足,也是他们的主要分析需求的体现,下面就来逐一解决这些问题。

3.2.1 同比、环比、定基比

公司的决策层希望看到一些关键的汇总数据,他们很少会按天去查看数据,他们更关心的是关键指标在月度和季度中的表现情况,同时他们必须掌握这些关键指标的变化趋势,从而明确公司整体层面业绩的表现,所以他们要的不只是本月的数据,他们会结合上月和去年的数据一起分析,于是在这里引入同比、环比和定基比的方法再合适不过了。

一个网站或者一个公司的发展一般都会定一个基点,从这个时间点开始公司开始走向成熟,运营步入正轨,那么之后统计的一些指标一般会以这个点的数据作为一个比较基准来考核之后公司的发展速度,这个就是定基比的基本思想。而同比和环比是接触较多的概念,环比通过与前一期数据的对比反映当前发展趋势,而同比则是前后两个发展周期之间相同时间点的比较,反映的是周期性的发展变化,比如年、季、月、周等。如图3-4所示,可以来看一下同比、环比和定基比增长率的计算方法。

图3-4 同比、环比、定基比展示图

同比增长率是为了消除数据周期性波动的影响,将本周期内的数据与上一周期中相同时间点的数据进行比较。

早期的应用是销售等受季节等影响较严重,为了消除趋势分析中季节性的影响,引入了同比的概念。常见的是今年的月度数据与去年相同月度的数据进行比较,如图3-4中以2011年7月作为本期,那么与2010年7月的比较结果就是同比。

环比增长率反应的是数据连续变化的趋势,将本期的数据与上一期的数据进行对比。最常见的是这个月的数据与上个月数据的比较,如图3-4中2011年7月的数据与2011年6月数据的比较就是环比。

定基比增长率将所有的数据都与某个基准线的数据进行对比。通常这个基准线是公司或者产品发展的一个里程碑或者重要数据点,将之后的数据与这个基准线进行比较,从而反映公司在跨越这个重要的基点后的发展状况。如图3-4将2011年7月的数据与基期2010年1月的数据进行比较,可以得到定基比。

既然已经找到了解决决策层对数据抱怨的方法,我们就可以尝试使用这个方法去做些优化,从而彻底满足决策层对数据的需求。决策层最关注的就是公司的销售额,但只显示每个月的销售额显然已经无法满足他们的要求,根据上面的计算方法得到同比和环比的增长率后加入到报表中,见表3-2。

表3-2 2011上半年销售额每月同比、环比数据表

img

如表3-2所示,加入同比和环比的增长率以后,销售额的变化趋势就比较明显了,而且我们可以分析得到2月份的销售额同比和环比增长都要比其他月份稍低,接下来可以进一步分析。如果将表格中的数据画成图表的形式将会更加直观。

如图3-5所示,可以将销售额以柱状图的形式显示,而同比增长率和环比增长率以百分比的形式存在,使用折线图进行展现,因为销售额和增长率之间数据的量级差异过大,因此需要使用双纵坐标轴,左右两侧使用不同的刻度类型和单位。

图3-5 2011上半年销售额每月同比、环比图

在图表中我们可以更容易地区分出哪些月份的增长率相对较高、哪些较低,进而确定公司的整体运营和发展状况。

Tips

如何在图表中使用不同的图表类型和坐标轴?

很多时候我们需要将不同类型的指标同时画在同一个图表中,使图表展现的内容更加丰富。为了区分这些指标我们可以选择使用不同的图表类型,这类图表叫组合图表,最常见的就是柱状图和折线图的组合,我们可以先统一画成柱状图的形式,然后选择需要使用其他图表类型的数据系列,通过“图表工具”的“设计”选项标签中的“更改图表类型”按钮将其改成折线的形式。

同时,我们经常遇到几个指标的数量级相差过大,但我们想把它们放在同一张图表中,这样会使数量级过小的指标不明显,这个时候就需要添加次要纵坐标轴,也就是将一个纵坐标轴扩充到两个,将数量级差异过大的指标用不同的坐标轴刻度进行显示。可以先选中需要使用纵坐标轴的数据系列,然后从右键菜单中选择“设置数据系列格式”,在“系列选项”中选择“次坐标轴”,然后根据需要调整坐标轴的刻度就可以了。

3.2.2 趋势线拟合

使用同比、环比增长率的方法解决了决策层分析数据的抱怨,让他们可以明确地观察关键指标总体的变化趋势,决策层对展示的结果非常满意。同比、环比和定基比都是属于趋势分析的范畴,接下来要介绍的是另外一种趋势分析的方法——趋势线,重点解决产品方的抱怨。

产品方更加关注的是产品用户数量的变化,用户量能够从一定程度上体现产品在设计和用户体验上的优劣,他们观察的数据更多是按天统计的用户数,因为他们需要掌控产品的当前表现,尤其是新发布的产品。但是,每天的用户数因为受到诸多因素的干扰,会存在较大的波动,而数据的频繁波动会对数据分析产生干扰,使数据无法表现出真正的变化趋势,所以我们需要消除或者减少这些频繁波动的干扰。数据的趋势线就是使用拟合技术来表现数据大体的变化趋势的一种技术,常见的趋势线包括 指数趋势线 对数趋势线 线性趋势线 ,根据数据变化的特点可以选择合适的趋势线对数据进行拟合。

添加数据的趋势线并不难,我们不需要自己去套用公式计算绘制,借助Excel可以直接添加各类趋势线,目前Excel 2010中支持的趋势线如图3-6所示。

图3-6 Excel 2010趋势线选项

其中,指数趋势线用于拟合以指数形式增长的数据,即增长速度先慢后快;线性趋势线的增长速度基本是均匀的,也是比较常见的线性拟合方式;对数趋势线的增长速度先快后慢;而多项式适用于变化趋势比较不固定的数据,使用多项式可以拟合趋势比较复杂的曲线;幂趋势线的变化趋势与指数比较相似;而移动平均的方法可以根据数据自身的变化情况做出平滑效果的拟合线,也是较常用的方法,重点在下面介绍。这里以拟合网站每天的用户数变化趋势为例,看一下使用线性趋势线的效果,如图3-7所示。

图3-7 网站用户数线性趋势线

从图3-7中我们可以看到,如果只是简单地将每天的网站用户数以柱状图的形式显示,由于数据每天的上下波动,我们不易直接观察得到数据的变化趋势,所以需要借助趋势线,当添加线性趋势线后,结果就会清晰很多,黄色虚线保持上扬状态,所以网站的用户数“可能”(趋势线是以拟合的方式计算得到的,它只能保证当前数据近似的变化趋势,可能存在偏差)保持上涨的趋势。

3.2.3 移动均值

上面介绍的线性、指数、对数趋势线对于一些变化趋势相对比较规律的数据而言具有很好的拟合度,但其实对于很多网站而言,网站指标的变化趋势在长期来看并不可能一直保持有规律,会受很多内外部因素的影响,所以这个时候使用移动均值来把握数据的趋势会更加准确。

移动均值(Moving Average)是一种简单平滑的预测技术,通过在时间序列上逐项推移取一定项数的均值的方法来表现指标的长期变化和发展趋势。移动均值线应用最多的是在股市,5日、10日、30日均线都是用移动平均法计算得到的,移动均值线也是Excel中的趋势线的一种类型。移动均值一般被用于观察和分析数据的变化趋势,同时也具备预测和比较监控的功能。下面介绍两个最简单常用的移动均值法,即简单移动平均法和加权移动平均法。

简单移动平均(Simple Moving Average, SMA),将时间序列上前n个数值做简单的算术平均。假设用到X 1 到X n 来表示指标在时间序列上前I期中每一期的实际值,那么第n+1期的预测值可以用以下公式来计算得到:

加权移动平均(Weighted Moving Average, WMA),在基于简单移动平均的基础上,对时间序列上前n期的每一期数值赋予相应的权重,即加权平均的结果。基本思想是:提升近期的数据对当前预测值的影响,减弱远期数据对当前预测值的影响,使预测值更贴近最近的变化趋势。我们用W n 来表示每一期的权重,加权移动平均的计算公式如下:

X n+1 =W 1 ×X 1 +W 2 ×X 2 +W 3 ×X 3 +…+W n ×X n

这里需要满足W 1 +W 2 +……+W n =1,对于各权重的确定,可以使用经验法根据需要进行赋权,如果希望预期值受近几期数据的影响逐步加深,则可以赋予递增的权重,如0.1, 0.2, 0.3……;如果希望加深最近期的几个数值的影响,以反映最近的变化,则可以适当加大近1到2期的权重,根据实际情况结合测试来完成赋权。我们比较下简单移动平均和加权移动平均在反映趋势时对数据平滑处理的区别。

如图3-8所示,取1月1日开始的数据,使用简单移动平均线(SMA线),取近5期均值,因此只能显示从1月6日开始的均值线;加权移动平均线(WMA线),同样取近5期加权均值,权重依次为0.1、0.1、0.2、0.3、0.3,逐步变大,使近期数据对趋势的影响更加明显。可以看到无论是简单均值线还是加权均值线都要比实际值的波动小了很多,也就是平滑的效果,更多的是展现一个大体的趋势,而加权平均相较于简单平均的差异就在于加权平均更加注重近期的影响,所以这里的WMA绿线比SMA的红线更贴近前两期的数值趋势。

图3-8 简单移动平均和加权移动平均的比较

假如还是用图3-7中网站每天用户数的数据,来看一下简单移动均值在现实中的应用效果,如图3-9所示。

图3-9 网站用户数移动均值线

如图3-9所示,使用简单移动均值设置的3周期趋势线相比之前的线性趋势线更加贴近数据本身的变化情况,移动均值只是对数据进行了平滑处理,但还是可以体现数据的起伏变化,所以移动均值更加适用于无明显变化规律的指标。

上面主要介绍的数移动均值的其中一项用处,即反映数据变化趋势,其实移动均值在现实中更多地被用来作为预测的方法,而这个方法正好可以解决运营方数据预测的需要。其实有了上面简单移动平均和加权移动平均的公式,用来做预测似乎也很好理解,当n+1期的数值X n+1 是历史数据时,它的作用是对数据做平滑、削减指标的波动,但如果n+1期的数值X n+1 还没被计算得到,是一个未来时间点的数据时,移动均值的方法就可以用来进行预测。假如今天是2012年的12月21日,现在还不知道今天的数据,我们可以根据前几天的历史数据使用移动均值的方法对今天可能达到的数据做出预测,见表3-3。

表3-3 使用移动均值预测商品销售数据

img

表3-3展现了网站中两个商品从12月16日到12月20日每天的销售量,现在需要预测两个商品在12月21日的销售量,以便做出合适的运营准备或调整。对于商品A,请尝试使用简单移动平均的方法;对于商品B,请使用加权移动平均法,权重按照0.1、0.1、0.2、0.3、0.3进行设定,请分别做出预测。

如果你理解了上面的两个公式,那么这道题的计算似乎轻而易举,预测的结果应该是:A商品在12月21日预计可以销售38件;B商品在12月21日预计可以销售87件。

3.2.4 数据监控自动化

运营方还有一个抱怨需要我们解决,就是如何帮助他们有效地监控数据的变化,以便他们根据变化做出调整。其实通过上面介绍的移动均值,我们已经找到了答案,使用移动均值法就可以完成数据变化的监控,不过使用移动均值来监控的指标需要满足以下两个条件:

★ 指标没有明显的快速增长或下降的趋势

★ 指标不具备周期性波动的特征

用移动平均法可以计算得到一个本期的预测值,可以将这个预测值作为本期预期实现的量,并用这个预期量与实际量进行比较,分析实际量与预期量之间的差距。还是基于销售额,不过销售额可能存在明显的递增或递减趋势,于是我们除以消费用户数,就得到了所谓的ARPU值(Average Revenue Per User),这是电子商务乃至任何消费型网站的关键指标之一,还是使用简单移动平均来比较实际值和预期值的差异。

从图3-10中表格的数据展现已经可以一目了然地看到实际ARPU值与预期的差异、差异的大小等,用Excel 2010的“条件格式”功能下的“色阶”和“数据条”就能实现图中的效果。

图3-10 移动均值监控ARPU值Excel表

下面用Excel里面的折线图结合“涨/跌柱线”(与趋势线一样,位于“图表工具”选项的“布局”标签下),来看一下图表的效果。如图3-11所示,两条比较的折线结合绿涨红跌的柱图,能够对指标的变化情况了如指掌。结合上面的表和图的数据和效果,对于数据的监控似乎变得简单很多,即使直接观察也能快速发现数据的异常,这些方法对于网站的一些关键指标,诸如转化率、人均消费、活跃度等的日常监控分析非常实用且有效。

图3-11 移动均值监控ARPU值Excel图

上面介绍的移动均值的数据监控方法是有前提的,就是指标的变化相对恒定,不能有明显上升下降趋势,不能有频繁的周期性波动。但其实对于很多网站分析的指标而言,这些条件难以满足,而网站的很多目标指标,如电子商务网站的订单数、销售额,应用型网站的注册用户数、活跃用户数等,它们对网站也非常重要,同样需要有监控体系来掌控它们的变化趋势,但是这些指标可能有明显的周期性波动,周中的数据和周末的数据有较大差异,或者说工作日的数据与节假日的数据有明显差异。我们需要使用其他方法来监控这些指标,其实3.2.1节中的同比和环比的方法已经为我们提供了基础思路,我们可以使用 同比环比监控法 来监控数据。

如图3-12所示的是某电子商务网站每天的订单量数据,订单量明显有周期性波动,周末的数值要比周中高出不少,用户喜欢在周末的时候在这个网站进行消费,同时订单量保持一个增长的趋势。表中同时给出了订单量的周同比和环比的增长率,借助Excel的“条件格式”功能,同比和环比增长率高于15%的数据被标绿,低于-15%的数据被标红,你能从这个表格中发现哪几天的数据出现了异常吗?

图3-12 订单量同比、环比监控

这里使用颜色突显出波动的异常,着色的规则可以使用阈值进行设定,也就是这里的15% 和-15%。我们一般把某个范围的临界称为“阈”,相应的临界值就是“阈值”。数据监控的时候就把阈值当成判断数据是否异常的临界点,当数据超过某个阈值的时候,就认为可能存在异常,就要展开进一步的分析。

正常情况下,即使指标的数值保持一定的增长或下降的速率,但在此速率下,数值的上下波动一定是在一个相对固定的区间内的,因此可以为这个区间定义合理的上下临界点,也就是阈值,在数值波动超出这个区间的时候进行预警。需要注意的是,因为每个指标的定义规则和数量级别的差异,阈值的设定需要结合指标的变化特征,有必要为每个指标定义特定的阈值,而不是采用统一的阈值,阈值设定目标就是有利于及时监控并发现指标波动的异常。

因为订单量保持增长,从周的同比增长率来看大概在8%上下,其中周一和周六的环比增长都被着色了,因为周一环比周日的数据会有较大下降,周六环比周五的数据会有较大提升,这并非异常,可以排除。其实只要注意观察就能发现异常,即同比和环比增长两个同时被标红或标绿的日期,第1周的周二和第2周的周三,而第1周的周三和第2周的周二是由于第一周的周二的数据异常引发的后续反应。通过同比和环比的组合监控来发现数据的问题,可以排除数据增长和周期性波动的干扰,是比较有效的方法,借助条件格式可以让结果更加直观。

同比环比组合监控注意点!

按照自然周计算同比数据可以排除数据以自然周为周期的波动,但是无法排除其他节假日的干扰,如黄金周、春节假期等,当遇到这些特殊日期时,需要根据特殊问题特殊分析,并且这些特殊时间段的影响不仅局限于当期的同比、环比数据,可能影响到之后一期的数据,需要格外注意。

基于上面介绍的几种数据监控的方法,可以建立一套自动的预警(Alert)系统,就像Google Analytics上面的Intelligence一样,如果指标的降幅或者涨幅超过正常范围(可以设定一个合理的阈值),就向你的邮箱发送报警邮件(Google Analytics支持邮件和短信预警,其中短信仅限于美国),这对于敏感数据的监控异常有效。 /tzNG8nask+op/Vdjgxd4N/dmN4Ubh4zfXH/OSvLG9EFEtkqC8jqO9EVZbRDL+bj

点击中间区域
呼出菜单
上一章
目录
下一章
×