购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

1.2 Tableau中的重要概念和术语

在开始真正接触Tableau之前,首先需要了解Tableau中的几个重要概念和术语,它们将为继续学习并与其他用户进行交流提供帮助。这些概念在Tableau中的实现方法和具体操作,将在本书后续章节中进行介绍。

1.2.1 数据源

简单来说,数据源是指数据的来源。数据可以来自于一个文本文件或Excel文件,也可以来自于一个数据库,甚至是云端数据,它们是要在Tableau中进行分析的源数据。

将“数据源”一词放到Tableau环境中,其含义将变得有所不同。Tableau中的数据源是指用户的源数据与Tableau之间的链接,其内容包括以实时连接或数据提取方式连接到的源数据、连接信息(例如数据的本地位置或网络位置、数据库服务器的登录信息等)、包含数据的表或工作表的名称,以及在Tableau中对数据进行的自定义设置(例如重命名字段、创建计算字段等)。

在第2章实际操作数据源时,会对上述概念有更深刻的理解。

1.2.2 字段、维度和度量

字段是指表中的列,一个表有几列数据,在Tableau中就会有几个字段,列和字段本质上是可以互换的术语,在Tableau中通常使用“字段”描述列数据。由同一行中各个字段组成的数据称为记录,每一行数据都是一条记录。

用户使用的字段是由连接到Tableau中的数据源自动提供的。然而,Tableau默认会创建以下几个字段:度量名称、度量值、记录数或表名称(计数)。如果数据源包含地理字段,则还会创建“纬度(生成)”和“经度(生成)”两个字段。

列中的数据称为字段的值或成员,不同列中的数据可以是文本、数值、日期等不同的数据类型。数值类型的数据可以是正值或负值,这取决于字段本身的含义。例如,“销售利润”字段的值可以为正也可以为负,“销售额”字段的值只能为正值。

由于可以对数值类型的数据进行计算,例如求和或计数,而通常不会对文本类型的数据进行计算,因此,可以将字段分为度量和维度两类。维度主要用于描述事物而非计算,名称、类别、颜色、日期等字段都是维度;度量主要用于对数值进行计算,销量、销售额、浏览量、人数等字段都是度量。

除了维度和度量之外,字段还分为离散和连续两种。离散是指各自分离且不同,范围是有限的;连续是指一个不间断的整体,范围是无限的。维度通常是离散的,度量通常是连续的,但也并非必须如此,这意味着维度可以是连续的,度量可以是离散的。在Tableau Desktop中,离散的维度和度量显示为蓝色,连续的维度和度量显示为绿色。

在Tableau Desktop中,离散字段在图表中以标题的形式出现,连续字段在图表中以轴的形式出现。标题意味着信息是分段不连续的,轴意味着刻度从0开始的一系列连续的值。

在图1-1(a)中,由于“数量”是一个离散的维度字段,并且位于“列”功能区中,因此将该字段创建为水平标题,并使用柱形图分段对比不同数量的利润。在图1-1(b)中,由于“数量”是一个连续的维度字段,并且位于“列”功能区中,因此将该字段创建为水平轴,并使用折线图表示一个连续的趋势。

图1-1 离散字段和连续字段

提示 :在Tableau Desktop中,将图表和其他可视化对象统称为视图。

1.2.3 聚合和粒度

聚合是指将多个值经过计算组合为单一值,例如计算多个数值之和或求它们的平均值。Tableau自动对度量字段中的值进行聚合,默认的聚合方式是求和。可以根据需要,将聚合方式更改为平均值、计数、最大值、最小值等。也可以对维度字段进行聚合,但是聚合方式只有计数、最大值、最小值几种。

粒度是指数据的详细程度,它由维度定义。一个表中的维度字段越多,表中数据所表达的信息越详细。比较图1-2所示的两张表,图1-2(a)显示每个月的数量,图1-2(b)显示每一天的数量,图1-2(b)中的数据显然更详细。

图1-2 不同粒度的数据

1.2.4 数据类型

数据源中的每一个字段都具有一种数据类型。数据类型表示字段中存储的数据种类,并为Tableau提供有关如何格式化、解释数据以及可以对该数据执行哪些操作的信息。例如,可以对数值字段执行数学运算,为地理字段创建地图。表1-1列出了Tableau中用于标识数据类型的图标及其对应的数据类型。

表1-1 Tableau中的数据类型

1.2.5 数据模型

“数据模型”是数据分析领域最常出现的术语之一,它是指通过关系使数据相互关联在一起的一组表。数据模型中表的数量可以有两个或多个,它们之间两两相关,最后形成一张关系网。实际上,单张表也是一个数据模型,只要其中的数据结构符合规范并有利于分析,就可以认为它是一个数据模型。 JZo7c+6tznU28iaq3X36YmLAgEGta4X3WqSVAmm8lbmf2INWehRUmhUHBVTpSnML

点击中间区域
呼出菜单
上一章
目录
下一章
×