通过5.1节的介绍,我们已经知道了如何对某个变量进行排序。接下来,我们要介绍的是:
(1)如何对某些变量创建一个分层结构,以利于向下钻取;
(2)如何将某些变量值归到一个组或数集里,这些变量值,或具有某种相同的特点或是人为强制归类。
某些情况下,我们需要对几个变量创建一个分层结构,以便在制图或数据分析时随时向下钻取数据。
以某公司销售数据分析为例,连接到数据后出现如图5-2-1所示界面。然后在【维度】列表中,我们就可以对相应的字段创建分层结构了。
图5-2-1 选择分组字段
在图5-2-1中,在【维度】列表里有变量“产品子类别”、“产品类别”、“产品名称”,我们可以对这三个变量创建一个分层结构,以实现从“产品类别”→“产品子类别”→“产品名称”的钻取。方法步骤如下。
方法一:按住【Ctrl】键,同时选中“产品子类别”、“产品类别”、“产品名称”三个变量;单击右键,选择【分层结构】—【创建分层结构】,Tableau 默认将该三个变量名作为层级的名称,这里我们把名字改成“销售产品”,单击【确定】按钮即可。然后拖动把该三个变量的顺序调整为“产品类别”、“产品子类别”、“产品名称”,最后结果如图5-2-2所示。
图5-2-2 分组
方法二:选中“产品子类别”,直接拖放到“产品类别”上,Tableau 自动创建该两个变量的分层,单击【确定】按钮。然后,再将“产品名称”拖放到“产品子类别”下方即可。最后,选中“产品类别”、“产品子类别”,单击右键,选择【重命名】,将名字改为“销售产品”。
创建好分层结构后,我们就可以方便地对数据进行钻取。例如,将【产品类别】、【销售额】如图5-2-3所示放置后,可以看到在“产品类别”左侧有一个【+】,该【+】号即表示可以往下继续钻取,单击【+】即出现如图5-2-4所示的向下钻取后的各产品的销售额情况。
图5-2-3 下钻标示
图5-2-4 下钻操作
在Tableau中,我们可以迅速地对原有维度中的字段创建分层结构,以实现钻取。在图5-2-4中,我们注意到在【产品子类别】左方仍有一个“+”,表示仍可向下钻去。另外,Tableau 对日期的向下钻取是自动创建的(前提是日期详细到相应的级别),有许多种选项选择。如图5-2-5所示,在“订单日期”左方有一个【+】表明可以向下钻取,可以直接单击它,也可以选中后单击右键,在弹出的下拉列表中,我们发现Tableau有很多种“时间”供我们选择,以实现钻取。如选择“月”,结果如图5-2-6所示。
图5-2-5 随日期变化视图
图5-2-6 日期精度选择
当然,Tableau的钻取功能并不局限于层级的钻取。在任意一个视图中,当我们把鼠标放到某个点上或选择某片区域后,即会出现一个“工具提示栏”,如图5-2-7所示,单击【 】(查看数据)即可看到原始的详细数据。
图5-2-7 选中视图某点进行查看数据
当我们已经做好了一个图之后,某些情况下可能存在着某些数值很小,而且对分析也无重要影响的变量值,为避免分散注意力,我们可以将这些数值很小的变量值归到一个组里,以便更好地分析。
在做好一个图之后,我们发现有几个值是负利润的,为了让相关业务人员特别注意这些值,我们也可以将这些值归到一个数集里。与上文提到的归组稍有不同的是,这里Tableau将建议我们创建一个数集。当双击这个“集”时,视图中将只出现“集”里的数据。
在图5-2-8中,我们可以看到,圈中的产品销售额都非常小,为了视图更方便分析,我们可以将这些小额产品归到一个组里,以便显示此小额产品对于每一个子类别的对比。按【Ctrl】键,选中这些变量值,单击右键,选择【组】—【产品子类别】,在【维度】栏中就会生成一个新的变量“产品子类别(组)”,将此字段拖至【行】上,结果如图5-2-9所示。
图5-2-8 选中数据
图5-2-9 创建分组
在图5-2-9中,我们可以将“利润额”也放到视图中来,以分析各类产品的盈利情况。如图5-2-10所示,我们可以看到,细的红圈所选中的产品利润都较好,而粗的黑圈所选中的产品是负利润的。为了方便相关人员对负利润产品进行重点分析,我们可以创建一个数集,以包含该负利润产品数据。按住【Ctrl】键,选中黑圈所框住的红条,单击鼠标右键选择【创建集】,并命名为“负利润产品”,单击【确定】按钮即可。这时,我们发现在左边【度量】下方多了一个列表框【集】,之后创建的其他数集都将在此列表框中出现。双击刚才创建的数集“负利润产品”,则出现如图5-2-11所示的负利润产品的子集。
图5-2-10 选中数据
图5-2-11 负利润产品的子集
在这一节中,我们主要讲了如何对维度中相关的字段创建一个分层结构,以便在做分析时快速地钻取到所想要的数据。同时,对于日期这一维度,Tableau是自动创建分层结构的,我们有许多种“时间”格式钻取的选择。另外,还讲了Tableau对于任意一个视图,只要选择某个点或某些点,通过单击图标【 】,即可钻取到底层详细数据。最后,介绍了如何对相关变量值创建一个组或一个“集”,以便利于后续的数据分析。