探索性(Exploratory)分析表示在整体数据集中寻找价值数据点的分析过程。解释性(Expository)分析则表示对价值数据点进行解释的分析过程。《用数据讲故事》一书中这样提到二者的关系:
探索性分析是指理解数据并找出其中值得关注或分享给他人的精华。这就像在牡蛎中寻找珍珠,可能打开一百个牡蛎(尝试上百种不同的假设或者从上百种不同的角度审视数据)才碰巧找到两颗珍珠。而在向受众进行分析的时候,我们迫切希望能够言之有物,例如解释某一件事或者讲述某一个故事——或许正是关于那两颗珍珠的。
人们往往在应该进行解释性分析的时候(花时间将数据抽象为受众能够消化的信息:两颗珍珠)错误地进行了探索性分析(简单地展示全部数据:一百个牡蛎)。这种错误是可以理解的。在进行了完整的分析后,向受众展示一切是非常诱人的,因为可以以此来证明你所做的工作以及分析的可靠性。但请你抑制住这样的冲动,因为那会让受众重复打开所有的牡蛎!把注意力集中在珍珠上,这才是你的受众需要了解的信息。
在绝大多数情况下,探索在先,探索发现机会;解释在后,解释阐述价值。因此二者存在依存的关系,正如前文所述的那样,解释性可视化的重点要在珍珠上。
让我们通过以下可视化分析来解释探索性分析与解释性分析的区别。图1.4.1中为2010—2013年M公司的销售趋势。探索性分析的第一步是提出一个假设问题,例如“比较2012年和2013年的增长点在哪里”。
图1.4.1
接下来,通过对数据集的细化分析,我们发现其中很大一部分增长来自产品5125和“CustomerSegment(客户分组)”为“Consumer(消费者)”的交集,图1.4.2为数据细分可视化过程。
图1.4.2
最终,我们获取了相关的数据子集合,并对此做出了总结:产品5125是2013销售增长的重要原因之一,有四位客户为此做出了购买贡献,他们的订单优先度都是High(高)和Critical(紧急),销售有必要进一步研究如何创作更多关于产品5125的增长机会,见图1.4.3。
综上所述,从探索性可视化过渡到解释性可视化需要如图1.4.4所示的步骤。我们将在第2章为读者展示以上示例的详细实现步骤。
图1.4.3
图1.4.4