通常数据分析师在做数据分析时会依赖一些特定的方法去分析一组数据,而不是“随心所欲”,采用这些方法能带来清晰的思路和相对准确的结果。常用的方法包括5W1H分析法、逻辑树分析法、对比分析法、群组分析法等。
5W1H,即为什么(Why)、什么事(What)、谁来做(Who)、什么时候(When)、什么地方(Where)、如何做(How)。5W1H分析法广泛应用于企业管理、生产活动、教学科研等方面,这种思维方法极大地方便了人们的工作、生活。5W1H分析法如图1.2所示。
图1.2 5W1H分析法
以商品的出售为例,5W1H分析内容如下。
售卖什么商品?(What)
在哪里售卖这些商品?(Where)
什么时候售卖这些商品?(When)
哪些人员负责售卖这些商品?(Who)
为什么要售卖这些商品?(Why)
如何售卖这些商品?(How)
逻辑树,又称为麦肯锡逻辑树、问题树、演绎树或分解树,其最大的优势在于将繁杂的数据分析工作细分为多个关系密切的部分,不断地分解问题,帮助人们在纷繁复杂的现象中找出关键点,推动问题的解决。
逻辑树分析法的形式就像是一棵树,如图1.3所示,需要把问题比作树干,然后考虑与已知问题有关的子问题和任务,把这些子问题比作树枝,所以逻辑树分析法就是由一个大问题不断延伸出一个又一个的小问题,逐步对问题的分析思路产生一个清晰明了的认知。
图1.3 逻辑树分析法
在运用逻辑树分析法时,可从上至下、从左至右地先画出主干,简要分析其内容,然后依次画出主要分支,再画出细节分支。原则上,其可以划分出任意层级,但一般情况下不要超过3层。超过3层的逻辑树,一般来说需要从中间断开,单独分析。
逻辑树最经典的案例就是费米问题。费米问题因美国科学家恩利克·费米(Enrica Fermi)而得名,通常会被用来检验一个人是否具备理科思维,或是否具有问题拆解的能力。有人曾经问科学家费米:“芝加哥有多少钢琴调音师?”为了保证琴音的准确性,需要定期由专业人员检查,调整不准确的音,从事这类工作的人被称为钢琴调音师。通过逻辑树分析法进行问题的拆解, 可将“芝加哥有多少钢琴调音师”这个问题拆解为2个子问题 ,如图1.4所示。
图1.4 第一次拆解
第一个子问题“全部钢琴调音师一年的总工作时长”可拆解为3个子问题,如图1.5所示。
其中,“芝加哥有多少架钢琴”又可拆解成2个子问题,如图1.6所示。
通过查询,芝加哥人口大约有250万,由于钢琴不是普通家庭能够添置的物件,因此,钢琴的人均拥有比例是较低的,再考量学校等机构拥有的钢琴数量,估算其为2%。
图1.5 第二次拆解
图1.6 第三次拆解
钢琴平均每年调音的次数估算为一次,调一次音需要的时间估算为2小时,如图1.7所示。
图1.7 解决子问题
由此可以推算出第一个子问题的答案:全部钢琴调音师一年的总工作时长=250万×2%×2小时=10万小时。接下来回到第二个子问题“一位钢琴调音师每年的工作时间”,如图1.8所示。一个人每天工作时长约为8小时,一年约50个星期,一星期工作5天,8×5×50=2000,减去路程上损耗的20%的时间,一位钢琴调音师每年工作的实际时间是1600小时。
图1.8 第四次拆解
芝加哥有多少钢琴调音师?最终的结果为100000÷1600≈63(人)。
在后来的调查中,费米找到了一份芝加哥的钢琴调音师名录,上面记录了83名调音师,但是有不少名字是重复的,可见费米估计的人数是十分接近事实的。
对比分析法就是将两个或者两个以上的数据进行比较,进而发现数据之间差异和规律的方法。对比包括绝对对比和相对对比。绝对对比是指绝对数据之间的比较,如用户数、访问量、下单量、注册量等。相对对比是指相对数据之间的比较,如转化率、留存率、沉默率、下单率、注册率等。
从不同的对比视角,可以归纳出如下常见的对比场景:时间对比,包括同比、环比、变化趋势等;空间对比,包括不同城市的对比、不同类别的对比、不同渠道的对比等;用户对比,包括新用户与老用户对比、登录用户与未登录用户对比、高黏性用户与低黏性用户对比、活跃用户与不活跃用户对比等;转化对比,包括不同渠道转化对比、不同类别转化对比、不同活动转化对比等。在实际分析过程中需要针对不同情况采用不同的对比场景。
群组分析法就是按某个特征对数据进行分组,通过分组比较得出结论的方法。群组分析法通常有3个步骤:数据分组、假设检验和相关性分析。
以日常生活中的某品牌共享单车用户为例进行群组分析。首先对该品牌共享单车的用户进行分组整合,将用户分为注册用户和未注册用户;然后将注册用户按照注册时间、年龄段等分为相应的组;最后对不同组的用户做对应的数据分析,产生可视化图表。