作为第1章的最后一节,本节有必要谈一谈个人在数据可视化学习之路上所应掌握的技、术与道。
Power BI和Tableau都在数据可视化方面投入了大量的研发力量和精力。为什么可视化对于商业分析如此重要?
邱南森(Nathan Yau)在《数据之美:一本书学会可视化设计》这本书中对数据可视化进行了精辟的解释:
数据是对世界的简化和抽象表达。当你可视化数据的时候,其实是在将对现实世界的抽象表达可视化,或至少是将它的一些细微方面可视化表达,所以,最后你得到的是一个抽象的抽象。
图1.5.1中描述了抽象事实的过程。举一个现实中的例子,比如在一家大型超市中,每天都有大量的商品卖出,这就是现实世界所发生的情况。这些商品都将经过前端的扫描器POS(Point Of Sale)完成交易,形成数据,最终被存储在终端后台中。经过数据分析后,成千上万条的数据可能是按时间顺序被导入BI系统中的,再进行汇总及分析。这些数据在初始阶段可能是以表或者交叉表的形式呈现的,表中详实地展示了多个数据点,如某日期下某个商品在某个店铺的销售金额,这是第一次抽象过程。至此,实现了由现实到数据的过渡。这些表的确也有助于分析人员对局部现实的理解。但是,企业的中高层决策人员更需要洞察数据背后的规律,更进一步支持企业的战略决策。通过将数据生成有意义的柱形图、线图、散点图等可视化图形的手段,可以实现对数据进行再一次的抽象化。最终,让人们完全理解和把握现实世界,这就是可视化分析的价值所在。
图1.5.1
虽然数据可视化能为决策者提供有价值的数据洞察,但这不等于说所有的数据可视化都是有价值的。设计者需要在图形选用、颜色搭配、空间布局、主题设定等方面花更多的工夫,从而令决策人员更容易理解数据可视化所传递的洞察,以便于采取实际行动。数据可视化设计与数据建模是两个不同的知识领域,数据可视化设计也并非本书的主题。对数据可视化设计有进一步提高要求的读者可以参考《数据之美:一本书学会可视化设计》等书籍来提高数据可视化设计水平。
数据可视化的能力修炼不是一蹴而就的事情,需要系统地学习与实践才能有长足的进步。一般人的数据可视化学习之路分为以下3个阶段。
1.技法
在此阶段,分析师能通过数据和图形准确地呈现数据分析结果,并发现数据背后的规律;熟知Tableau和Power BI的各项操作及对应的函数语言,例如,Tableau的各种函数、LOD、表计算等常识,Power BI的DAX函数、Power Query常规操作;可以利用工具派生新的分析维度;同时,能很好地理解各种图形的使用场景和特点,能帮助分析师在技法层面最大程度地发挥可视化的特性与优点。图1.5.2为在Tableau中创建的季节性同比图,此图表达的内容非常直观易懂,而分析师仅仅需要掌握基础的工具操作就能完成。
图1.5.2
2.术法
尽管Power BI和Tableau在构图方面有着完全不同的方式和逻辑,但二者又殊途同归。这两个既有内涵,又有“颜值”的工具,让人爱不释手。
在此阶段,分析师除要熟练掌握工具的使用技巧外,还需要对数据可视化有更加深入的理解,能够通过最终所呈现的视觉效果使读者产生情感共鸣。
图1.5.3展示的是伊拉克人员伤亡人数的可视化作品(引用《南华早报》2015年的作品),尽管左右两张图背后的数据完全相同,使用的主要图形皆为柱形图,但构图风格、颜色选择的差别,给人带来了完全不同的感知:红色主题形象地传达了作者要表达的信息:血腥与暴力;相比之下,蓝色主题给人带来的是乐观与和平,形象地表达死亡人数正在减少的观点(具体效果图可在作者公众号里查看)。
图1.5.3
3.道法
本质上,所有的数据分析都是围绕解决一个问题而展开的分析:数值和维度的关系。
在此阶段,数据分析不再停留在视觉享受的层面,反而进入了一种返璞归真的状态。分析师舍弃了一切绚丽浮华的非重点修饰之后,将精力投入在解决关键问题上,用最简单的方式解决最重要的问题。图1.5.4所示的为篮子分析,此图表在效果方面虽然不如图1.5.3那般惊艳,但结果中体现了非常有含金量的商业洞察。
图1.5.4
当然,学习数据可视化是一个循序渐进的过程,没有扎实的“技”的积累,就不会有 “术”的升华,更不会达到最后“道”的境界。不积跬步,无以至千里。分析师修炼之路要从夯实基础开始,然后精益求精,最后向着数据可视化的最高层级前进!