购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

1.2 数据分析的定义及步骤

1.2.1 什么是数据分析

顾名思义,数据分析就是通过对数据的分析形成更易于理解的知识。专业的说法,是指根据“业务理解”,采用“适当的统计方法”对收集的数据进行清洗,提取有用的信息和规律,以简明易懂的方式“呈现”给使用人员,发挥数据的作用。

1.2.2 数据分析的6个步骤

数据分析的过程主要包括 6 个既相对独立又互相有联系的阶段:明确需求、数据收集、数据处理、数据分析、数据展现、报告撰写(见图1-1)。

国1-1

明确需求

了解分析需求的目的、分析范围、分析时间。确定需要分析的内容。

数据收集

收集需求中所要用到的数据。对于游戏数据分析,根据数据来源可以分为以下两个部分。

(1)企业内部数据:又可分为游戏行为数据和问卷调查数据,其中游戏行为数据主要来源于游戏数据库,问卷调查数据来源于问卷后台数据库。在条件允许的情况下,将这两类数据定期同步至数据仓库,提高数据收集的效率,数据同步工作主要由BI部门实现。

(2)企业外部数据:当需要做舆情监控、竞品分析时,需从新闻、论坛、贴吧、QQ群等渠道收集数据,可以通过爬虫工具爬取至本地,或者手工导出至本地。

数据处理

根据分析需求,我们需要对收集到的数据进行处理,例如将明细数据聚合为统计数据,基于统计数据计算分析指标,以及利用预测模型计算预测数据等。

在数据处理过程中常用的技术/工具包括SQL、Excel、文本处理、R等,由于数据来源不一、格式各异,因此数据处理一般会占用我们较多的时间。如果在数据收集阶段提前做好数据需求,和研发、BI等相关部门做好沟通,那么在数据处理阶段就能大大提高工作效率。

数据分析

数据分析即用适当的数据分析方法及工具,对处理过的数据进行分析,提取有价值的数据,形成有效结论的过程。常用的分析方法有对比分析法、分组分析法、结构分析法、交叉分析法、漏斗图分析法、矩阵分析法、综合评价分析法、5W1H 分析法、相关分析法、回归分析法、聚类分析法、判别分析法、主成分分析法、因子分析法、时间序列、方差分析等。

数据展现

数据展现主要通过图表来实现,常用的图表制作工具有 Excel、SPSS、SAS 和 R。常见的图表有饼图、折线图、柱形图/条形图、散点图、雷达图、金字塔图、矩阵图、漏斗图、帕累托图等。

图表的作用是表达形象化、突出重点、体现专业化。

制作图表时需要注意:明确所要表达的主题或目的;选择最适合主题的图表;检查是否真实地展现数据;检查是否准确地表达了你的观点。

报告撰写

撰写分析报告,要熟悉分析报告的结构特点。一般来说,游戏分析报告采用总分结构,其内容分为标题、导语、结论和详细分析四大部分。

(1)标题:分析报告的标题即为主题,是整个报告的主旨,标题不宜太长,要求主题明确、简练。

(2)导语:也称前言、总述、开头。分析报告一般都要写一段导语,以此来说明这次情况分析的目的、对象、范围、经过、收获、基本经验等,这些方面应有侧重点,不必面面俱到,一般用一句话概述。

(3)结论:分析结论是基于严谨的数据分析推导而来的。在做总结分析时,若能提供建议并对数据进行预测,则能为数据分析带来更多的价值。之所以把结论放在分析过程的前面,是因为它非常重要,起到了开门见山的作用。邮件收件人收到邮件后,能直接看到结论而不需要一页页往后翻,假如结论放到详细分析之后,则有可能被部分人忽视,因为不是每个人都有充足的时间把每个数据看完。

(4)详细分析:详细分析是分析结论的推导过程,为分析结论提供有力的数据支持,一般由图表和文字相结合而成,需要注意不是图表越多越好,和结论相关性不强的图表可以舍去。

1.2.3 常用的数据分析方法

常用的数据分析方法有对比分析法、分组分析法、结构分析法、交叉分析法、漏斗图分析法、矩阵分析法、综合评价分析法、5W1H 分析法、相关分析法、回归分析法、聚类分析法、判别分析法、主成分分析法、因子分析法、时间序列、方差分析等。

对比分析

对比分析法,也叫比较分析法,是将两个或者两个以上的数据进行比较,分析它们的差异,从而揭示数据代表的事物的发展变化和规律性。

对比分析可分为静态比较和动态比较两大类。静态比较也叫横向对比,是同一时间下对不同指标的对比;动态比较也叫纵向对比,是同一总体条件对不同时期指标数值的比较。

分组分析

分组分析法是为了对比,把总体中不同性质的对象分开,以便进一步了解内在的数据关系,因此分组法必须和对比法结合运用。

结构分析

结构分析法指分析总体内的各部分与总体之间进行对比的分析方法,即总体内各部分占总体的比例,属于相对指标。一般某部分的比例越大,说明其重要程度越高,对总体的影响越大。

平均分析

平均分析法是运用计算平均数的方法来反映总体在一定时间、地点条件下某一数量特征的一般水平。

交叉分析

交叉分析法又称立体分析法,是在纵向分析法和横向分析法的基础上,从交叉、立体的角度出发,由浅入深、由低级到高级的一种分析方法。通常用于分析两个变量(字段)之间的关系,即同时将两个有一定联系的变量及其值交叉排列在一张表格内,使各变量值成为不同变量的交叉结点,形成交叉表,从而分析交叉表中变量之间的关系,也叫交叉表分析法。

漏斗分析

漏斗分析法是结合对比分析法、分组分析,比较同一环节优化前后、不同用户群、同行类似的转化率。通过漏斗各环节业务数据的比较,能够直观地发现和说明问题所在。

矩阵分析

矩阵分析法是比较重量级的分析方法,根据事物的两个指标作为分析的依据,进行分类关联分析,找出解决问题的方法。比如,以属性A为横轴,属性B为纵轴,构建一个坐标系,在两坐标轴上分别按某一标准进行刻度划分,构成四象限,将要分析的每个事物对应投射至这四个象限内,进行交叉分类分析,直观地将两个属性的关联性表现出来,进而分析每个事物在这两个属性上的表现。

综合评价分析

综合评价分析法是将多个指标转化为一个能够反映综合情况的指标进行评价,用于解决复杂的分析对象。

5W1H

5W1H 分析法也叫六何分析法,是一种思考方法,是对选定的项目、工序或操作都要从原因(何因Why)、对象(何事What)、地点(何地Where)、时间(何时When)、人员(何人Who)、方法(何法How)这6个方面提出问题进行思考。

相关分析

相关分析是对客观现象具有的相关关系进行的研究分析。其目的在于帮助我们对关系的密切程度和变化的规律性有一个具体的数量上的认识,做出判断,并且用于推算和预测。其主要内容包括:(1)确定现象之间有无关系;(2)确定现象之间关系的密切程度;(3)测定两个变量之间的一般关系值;(4)测定因变量估计值和实际值之间的差异。

回归分析

研究变量之间存在但又不确定的相互关系以及密切程度的分析叫作相关分析,如果把其中的一些因素作为自变量,而另外一些随自变量变化而变化的变量作为因变量,研究它们之间的非确定因果关系,就是回归分析。

聚类分析

聚类分析(Cluster Analysis)属于探索性的数据分析方法,是根据事物本身的特性研究个体分类的方法,其原则是同一类中的个体有较大的相似性,不同类的个体差别比较大。根据分类对象的不同分为样品聚类和变量聚类。通常,我们利用聚类分析将看似无序的对象进行分组、归类,以达到更好地理解研究对象的目的。

判别分析

判别分析是根据表明事物特点的变量值和它们所属的类求出判别函数,根据判别函数对未知所属类别的事物进行分类的一种分析方法。与聚类分析不同,它需要已知一系列反映事物特性的数值变量值,并且已知各个体的分类。

主成分分析

主成分分析法也称主分量分析法、主成分回归分析法,是利用降维思想,把多指标转化为少数几个综合指标的方法。

因子分析

因子分析是将多个实测变量转换为少数几个综合指标(或称潜变量),它也反映了降维的思想。通过将相关性高的变量聚在一起,达到减少需要分析的变量的数量,从而减少问题分析的复杂性。

时间序列分析

时间序列分析(Time Series Analysis)是一种动态数据处理的统计方法。该方法基于随机过程理论和数理统计学方法,研究随机数据序列所遵从的统计规律,以用于解决实际问题。

方差分析

方差分析又称变异数分析,用于两个及两个以上样本均数差别的显著性检验。 31ncP2fnxdMl2MMPUPZsZuz4WgId79IfDkt1yX8hZRyxBWCFh6sowfNDzamRt+3h

点击中间区域
呼出菜单
上一章
目录
下一章
×