连接数据后,Tableau会把数据源的字段进行自动分类和处理,分别分配到“维度”和“度量”两个小窗格中,如图2-68所示。
图2-68 维度窗格和度量窗格
具体哪些字段被处理为维度,哪些字段被处理为度量,视字段数据类型而定。
当布局图表时,不同的字段胶囊(字段按钮被形象地比喻为字段胶囊)颜色也是不同的,有的是绿色,有的是蓝色,如图2-69所示。
图2-69 不同颜色的字段按钮胶囊(见彩插)
维度是对数据进行分类处理的字段,例如城市、商品、销售人员、日期等分类属性,一般文本字符字段会被自动归类为维度。
度量是对数据进行计量的字段,并反映其大小、高低、胖瘦等定量属性。一般数值型字段会被自动处理为度量,例如年龄、工龄、单价、销量、销售额等。度量可以进行聚合计算,例如求和、计算最大值、最小值、平均值等。
可以把数值型字段设置为维度,例如可以把本来是度量的员工年龄转换为维度,这样可以对年龄进行分组分析;把销售量处理为维度,以便进行不同销量区间的订单分布分析。
将度量转换为维度的方法是,单击要转换字段右侧的下拉箭头,展开命令列表,选择“转换为维度”选项,如图2-70所示。
当然,也可以把维度转换为度量,方法是,单击要转换字段右侧的下拉箭头,展开命令列表,选择“转换为度量”选项,如图2-71所示。
图2-70 将度量转换为维度
图2-71 将维度转换为度量
一般把维度和度量拖放到视图区后,维度字段胶囊颜色是蓝色的,度量字段胶囊颜色是绿色的,如图2-69所示。
不过,这也不全面,因为字段胶囊颜色是跟字段的离散角色和连续角色相关的。
此外,Tableau连接数据后,还会自动生成一个新字段“记录数”,这个字段用于统计数据源的行数,在统计分析中就是计数,例如员工人数、订单数等,所以在数据源中,一行数据就是一个记录。
Tableau可以对字段的数据类型进行自动判断并分配类型外,还自动对数据的角色进行设置,这就是字段的离散角色和连续角色。
离散,就是数据各自分离且不同,例如字段“城市”“产品”“销售人员”“部门”“学历”等,就是离散角色,因为字段下的项目彼此无关。一般文本字符串字段会被自动处理为离散角色。
连续,就是构成一个不间断的整体,没有中断,例如字段“日期”就是连续角色,因为日期下的每一天都是连续的。一般数值字段会被自动处理为连续角色。
连续角色的字段胶囊颜色在软件中是绿色的,离散角色的字段胶囊颜色在软件中是蓝色的。
不论是维度字段,还是度量字段,其既可以是连续角色,也可以是离散角色。
离散和连续之间的转换,是单击字段按钮右侧的下拉箭头,展开命令列表,选择“转换为离散”选项或者“转换为连续”选项,如图2-72和图2-73所示。
图2-72 将连续转换为离散
图2-73 将离散转换为连续
对于表示国家、省份、城市、街道之类的字段,可以将其设置为地理角色,这样可以用来制作地理地图分析。
这种设置是重要的,在销售分析中会经常分析在多个国家、多个省份、多个城市的销售情况,此时,需要将相关字段设置为地理角色。
例如,把字段“城市”设置为“地理角色”下的“城市”,就选择该字段,单击字段右侧的下拉箭头,展开命令列表,执行“地理角色”→“城市”命令,如图2-74所示。
图2-74 设置字段的地理角色
下面举例说明维度和度量、连续和离散的关系。
如图2-75所示是一个示例表格,现在要分析净利润与销售额的关系,以便分析店铺的盈亏分布(说明:这个示例不在提供的素材中,请大家自己模拟数据练习)。
建立数据连接,新建仪表板,可以看到销售额和净利润都是度量,而且都是连续的,如图2-76所示。
图2-75 示例表格
图2-76 销售额和净利润都是度量
如果要绘制以销售额为分类轴(X轴),以净利润为数值轴(Y轴)的散点图,如图2-77所示,显然这并不是我们需要的图表,因为这仅仅是一个数据点,代表了销售额合计数和净利润合计数。
图2-77 不正确的图表
在“列”区域内直接将字段“销售额”设置为维度,并保持其连续角色,如图2-78所示。
图2-78 设置字段“销售额”为维度和连续
这样就得到了如图2-79所示的图表,这个图表,正确反映了净利润与销售额的关系。注意,数据源中有两个销售额12000,分别对应两个净利润,7395和-1302,因为图中的点被绘制成了两个数据点。
图2-79 字段“销售额”设置为维度后的图表
此时,由于字段“销售额”是连续角色,因此坐标轴的刻度值是连续的,所以并没有特别指明某个净利润点对应的销售额。
如果将字段“销售额”设置为离散角色,那么图表的轴就变为图2-80所示的情形,此时的图表,将销售额作为了分类标题,而同一个标题下的数据被进行了合并计算。例如,两个销售额12000所对应的两个净利润7395和-1302,被做了合并计算,这样的图表显然是不对的。
图2-80 销售额被处理为离散的度量,图表错误
这种度量、维度、连续和离散的设置,是需要认真对待的,尽管在大多数情况下,不会对分析报告造成影响,但是在某些情况下,则会出现错误的结果。
下面图2-81所示是一个关于门店盈亏分布分析的例子,供用户参考,图中对数据点的颜色进行了设置,以醒目标识那些亏损数据。
图2-81 门店经营分析报告