由于数据的来源多种多样,因此,不同来源的数据会以不同的格式存储在表中。然而,并非所有格式的数据都适合在Tableau中进行分析。适合分析的数据至少需要符合以下格式要求:
表中的数据不能存储为像数据透视表那样的二维表,而应该像数据库中的表结构一样,即所谓的一维表,它是指每一列只存储同一类数据,表中不能存在包含同类内容的多个列。
如图2-1所示是一个二维表的示例,表中的最后3列虽然名称不同,但是它们都同属于商品,它们都是商品中的其中一种。为了使表中的数据适合分析,需要将最后3列转换为两列,其中一列存储商品的名称,另一列存储商品的销量,合并后的表如图2-2所示。
图2-1 以二维表结构存储的数据
图2-2 将二维表转换为一维表
表中的数据应该尽可能细化,而不是聚合后的数据。如图2-3所示的最后一行对每种商品的销量进行求和,求和运算是聚合的一种,聚合还包括求平均值、计数、求最大值、求最小值等。在Tableau中分析数据之前,应该删除表中的聚合数据。
另一种情况是表中的数据应尽可能详细。例如,表中包含按天记录的数据要好于按月记录的数据,数据级别越详细,在Tableau中就可以进行更多的分析。
应确保表中的每一列都有列标题,以便在将这些数据导入Tableau Desktop时能够显示正确的字段名称。
表中的所有数据之间不能有空行,以便使所有数据位于一个连续的范围之内。更重要的是,表中不能有空单元格。如图2-4(a)所示,即使几种商品具有相同的分类名称,但是在“类别”列中也不能使单元格为空,而必须重复填入相同的类别名称,如图2-4(b)所示。
图2-3 表中不应该包含聚合数据
图2-4 表中不能有空单元格