笔者从实际工作中总结出了数据分析流程的五大步骤,虽然不敢说是“铁律”,但可以说是一个比较合理、高效的流程,这里抛砖引玉,供大家参考。
有的人喜欢在领到任务以后马上就去收集数据,紧接着就进行分析。其实这是一种不够成熟的做法。正确的做法是,先确定需要分析的问题,然后针对这些问题去收集数据,这样才不会浪费精力与时间。要学会先思考,先构思,再动手。
做数据分析时,先要对数据进行分类,如果没有分类,用行话来说就会“万条数据万个类,分析起来两行泪”。分析类别一般包括地区、日期、规模(量、额)、档次、价值等。此外,一些重要元素,如数量、价格、金额等,也通常是分析的对象。
确定了数据类型与分析元素,接下来就是数据采集阶段的工作了。数据采集的最终目的是获得有价值的数据,需要从大量的,可能杂乱无章、难以理解的数据中抽取并推导出对解决问题有价值、有意义的数据。这就需要在采集数据时采取一些方法来确保数据的价值,尽量减少后面数据整理阶段的工作量。
例如,有时候会委托第三方进行数据采集,那么可以事先设计一个规范化的数据输入模板表格,在表格中设置好各种输入条件。例如,当电话号码位数输入不规范时,弹出提示对话框提示输入者;当需要选择输入男、女的时候,为了避免手动输入错误,利用数据验证功能制作下拉列表等。使用这样的规范化表格采集数据,数据的规范性和有效性就会大大提高,对后面的分析工作十分有利。
采集到的原始数据一般来说要经过整理才能使用。整理数据主要有以下两个目的。
(1)让数据规范化。不规范的数据不仅阅读起来比较困难,而且会影响计算。例如,有的单元格应该输入数字型数据,结果输入了字符型数据,这样在计算时就会出错。
(2)消除错误数据。错误数据会带来错误的统计和计算结果,这是不言自明的。因此,整理数据的一大要务就是消除错误数据,以保证结果的正确性。
数据整理完毕后,就可以进行数据分析了。分析的过程一般分为选择分析方法、统计计算、数据呈现和得出结论4个步骤。
(1)选择分析方法:分析方法包括比较法、阶梯法、象限法、趋势法、雷达法等,对于不同的分析诉求,要选择不同的分析方法,均以目的为导向。
(2)统计计算:选择适用的方法进行统计计算,如函数、透视表、VBA等。
(3)数据呈现:用表格形式或图表形式呈现数据。
(4)得出结论:分析主要问题在哪里、未来会怎样、哪个解决方案更优等,得出结论。
经过以上步骤以后,基本就可以得出一个比较有说服力的结论了,下面要考虑的就是如何将结论撰写为一个有说服力的报告。
数据分析过程是对各个数据模块进行分析,体现的是数据分析人员的分析技术;而数据报告是整个数据分析的成果展示,如果这个环节做得不好,前面的工作效果就会大打折扣。因此数据报告应具有数据翔实、条理清晰、分析到位等特点,以增强报告的说服力。数据报告一般分为例行报告和临时报告两种,这两种报告各有其特点。
(1)例行报告。
例行报告需要体现逻辑性和完整性,因此采用总分式结构,最后给出结论和建议。
① 总体概述:整体情况描述,整体的结论。
② 板块分析:分板块细说,用表格或图表呈现。
③ 分析结论:对数据分析结果进行定论。
④ 相关建议:包括解决方案(project)、预定目标(target)、实施对象(object)、实施时间(time)等。
(2)临时报告。
撰写临时报告时,由于受众对分析结果比较关注,因此要结论先行,然后给出建议。
① 结论先行:用图表、文字说明结论。
② 问题建议:包括解决方案、预定目标、实施对象、实施时间等。