大多数人对数据都不陌生,如手机每月的流量消耗、学生各科的考试成绩、职工的工资明细等,这些都是常见的数据。但是,许多人对数据的认识不够全面和深刻,认为数据就是简简单单的数字,作用也并非那么重要。我们只有在真正认识“数据”的概念后,才能对数据有更加全面和深刻的理解。
1.数据的定义
数据是指描述事件或事物的属性、过程及其关系的符号序列,是对客观事物的性质、状态及相互关系等进行记载的物理符号或物理符号的组合。数据可以是直观的数字、文字、符号;可以是富有意义的图形、图像、视频、音频;也可以是客观事物的属性、数量、位置及其相互关系的抽象表示,如“晴、阴、雨、雪”“20℃、21℃、22℃、23℃”等。
2.数据的价值
现代社会,越来越多的企业和个人看重和依赖数据,这是因为数据具有特有的价值。
(1)数据能够告诉我们过去发生了什么。例如,企业在运营过程中产生的销售数据、采购数据等,能够反映企业过去一段时间内的运营表现是好是坏,各项业务的发展和变化是否符合预期目标等。
(2)数据能够告诉我们为什么会发生这些情况。例如,如果近期销售数据与往期相比显著下降,就可以分析影响销售数据的指标,如实体店铺所在商圈的客流量、进店的客户数量、购买商品的客户数量等。如果购买商品的客户数量下降明显,其他指标变化不大,就能推断出导致销售数据下降的主要原因是购买商品的客户数量减少,那么就应当考虑如何提高该指标,如优化商品、提高服务、降低价格等,使店铺能够找准改善运营效果的方向。
(3)数据能够告诉我们未来可能会发生什么。例如,将过去若干年的销售数据以月份为单位进行统计分析,可以清楚知晓哪个时间段是销售旺季,哪个时间段是销售淡季。在销售旺季来临前,企业可以做好库存、宣传、配送等工作;在销售淡季来临前,企业应该提前做好清仓、促销等准备。
3.数据的分类
数据主要可以分为4种类型,即定类数据、定序数据、定距数据和定比数据,不同类型的数据适合不同的处理与分析情形。
(1)定类数据。这类数据只能对事物进行分类和分组,数据表现为“类别”,各类数据之间无法进行比较。例如,某店铺将客户青睐的商品颜色分为红色、蓝色和黄色,红色、蓝色、黄色即定类数据,这类数据之间的关系是平等或并列的,没有等级之分。为了方便处理和分析数据,大多数情况下会为各类别数据指定相应的数字,如“1”表示红色、“2”表示蓝色、“3”表示黄色等,但这些数字只是符号,不能进行运算。统计各数字的数量,可以了解不同颜色商品的库存数量、销售数量。
(2)定序数据。这类数据可以在对事物分类的同时反映各数据类别的顺序,虽然数据表现仍为类别,但各类别之间是有序的,可以进行比较。例如,“1”表示小学,“2”表示初中,“3”表示高中,“4”表示大学,这些可以反映出各对象的受教育程度差异,尽管这种差异不能准确度量,但是仍可以判断其顺序的高低。
(3)定距数据。这类数据不仅能比较各类事物的优劣,还能计算事物之间的差异大小,数据表现为“数值”。例如,李某的英语成绩为80分,孙某的英语成绩为85分,可知孙某的英语成绩比李某的英语成绩高5分。不同于定类数据和定序数据,定距数据可以进行加、减运算,以比较数据之间的差距。
(4)定比数据。这类数据的表现也是“数值”,不仅可以进行加、减运算,还可以进行乘、除运算,如销售增长率=(本年销售额-上年销售额)÷上年销售额,便对销售额做了减法和除法运算。与定距数据相比,定比数据有一个显著特点,即存在绝对零点。例如,温度就是典型的定距数据,因为在摄氏温度中,0℃一般表示水结冰的温度,但并不是绝对零度。但对于销量而言,“0”就表示没有销量,属于“绝对零度”,所以销量属于定比数据。在实际生活中,“0”经常用来表示某种事物的缺失,如利润、薪酬、产值等。在商务数据分析领域,人们接触的数据类型大多为定比数据。
数据处理与分析一般是指对已有数据进行处理和分析,这里为了更好地展现整个数据分析的流程,加入了采集数据的环节,整个流程如图0-1所示。
图0-1
(1)明确需求。处理与分析数据之前,首先要明确处理与分析任务的最终需求是什么,进而确定目标,这样才能确保后续环节不会偏离方向。
(2)采集数据。明确需求后,就可以根据目标需求采集相关的数据。在这个环节,相关人员需要注意数据来源,一方面确保数据的权威性、专业性和准确性,另一方面便于追本溯源,这能在很大程度上避免因采集错误数据而导致分析结果没有价值的情况。
(3)处理数据。数据处理针对的是执行采集操作后得到的数据不满足分析要求的情况。因为许多情况下采集到的数据往往是散乱、残缺的,甚至还可能存在错误的数据,此时就需要通过清洗、加工等操作,将这些数据整理成符合数据分析环节所需要的对象。
(4)分析数据。数据分析环节是整个流程的核心环节之一,相关人员需要合理利用多种方法和工具,分析处理后的数据,提取有价值的信息。
(5)展现数据。展现数据是指将数据以图表、图形等可视化方式进行呈现,使分析结果更加生动直观。在这一环节,需要审慎选择可视化工具,确保其能够真实有效地反映数据的特性和结果,同时需要保证图表的专业性和美观性,强化数据的展现效果。
(6)撰写报告。完成前面各个环节的工作后,应当根据实际需要撰写数据分析报告,将数据分析的思路、过程、结果和结论等内容通过报告的方式呈现,供报告使用者使用。
指标是用于衡量、评估和比较事物的量化度量标准。无论是市场营销、金融、教育,还是医疗、交通等行业,在处理与分析数据时候都会使用相应的指标来追踪和评估特定目标的达成情况。不同行业因其特性和需求的不同,所使用的指标也各有侧重。下面以网店为例,介绍几类常见的数据分析指标,具体如表0-1所示。
表0-1 数据处理与分析的常见指标