购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

1.1 数据可视化的价值

你是否认同这样的观点:人类历史也是一部数据分析的历史。自有文字记载以来,我们的祖先已懂得数据分析的重要性,并利用数据做决策分析。

齐使者如梁,孙膑以刑徒阴见,说齐使。齐使以为奇,窃载与之齐。齐将田忌善而客待之。

忌数与齐诸公子驰逐重射。孙子见其马足不甚相远,马有上、中、下辈。于是孙子谓田忌曰:“君弟重射,臣能令君胜。”田忌信然之,与王及诸公子逐射千金。及临质,孙子曰:“今以君之下驷与彼上驷,取君上驷与彼中驷,取君中驷与彼下驷。”既驰三辈毕,而田忌一不胜而再胜,卒得王千金。于是忌进孙子于威王。威王问兵法,遂以为师。

摘自《史记·孙子吴起列传》

在这则小故事中,孙膑通过分析上、中、下三者的关系,得出了比赛可能性的最优选择,战胜了对手,所以古人善用数据分析的能力可见一斑。但同样是数据分析,结果也可能是欺骗性的。例如:

后十三岁,魏与赵攻韩,韩告急于齐。齐使田忌将而往,直走大梁。魏将庞涓闻之,去韩而归,齐军既已过而西矣。孙子谓田忌曰:“彼三晋之兵素悍勇而轻齐,齐号为怯,善战者因其势而利导之。兵法,百里而趣利者蹶上将,五十里而趣利者军半至。使齐军入魏地为十万灶,明日为五万灶,又明日为三万灶。”庞涓行三日,大喜,曰:“我固知齐军怯,入吾地三日,士卒亡者过半矣。”乃弃其步军,与其轻锐倍日并行逐之。

摘自《史记·孙子吴起列传》

由此可见,在同一本书中,我们领教了数据分析的另一面。孙膑巧妙利用灶与人口的正比关系,迷惑对手得出一个错误的决策判断,而结果是让魏军付出了惨重的代价,庞涓也命丧于此。你也许觉得庞涓太傻了,如果真的死了那么多士兵,那么尸体都去哪里了?的确,在分析的逻辑上,庞涓应该做得更加谨慎,但举这个例子的目的是告诉我们数据分析不但能寻找“真相”也能“说谎”,因此我们应该学会用审慎的态度对待分析结果。另外,无论从正反两方面看,孙膑真的是一位数据高人,如果活在当今,也许就是一位数据分析大师了。

今天,我们大多数人都会认为我们迈进了DT(数据技术)时代。现代人继承了古人智慧的同时,人们不禁要问:最新的数据技术改变了什么?也许今天,我们所面对的问题不是对比几匹马、清点几个灶台,而是面对更为复杂的数据问题。因此,我们需要一种更有效的方式分析与理解数据,而数据可视化则是以可视化承载数据分析结果的一种方式。在《数据之美》一书中,作者Nathan Yau将可视化描述为对现实客观世界的一种简化和抽象表达。可视化数据,其实是在对现实世界的抽象表达可视化,或至少是将它的一些细微方面可视化。由于可视化是对数据的一种抽象表达,所以你得到的是一个抽象的抽象,见图1.1.1。

图1.1.1

笔者对Yau的观点深以为然,即:可视化也是连接数据与人的最后一公里接口。优秀的可视化表达方式可加深人们对现实世界的正确理解。对比图1.1.2中的两种呈现方式,哪个更利于理解分析结果呢?

图1.1.2

值得一提的是,即使作品是相同的数据集与可视化对象,表达效果也可以完全相反。如图1.1.3展示的是伊拉克人员伤亡人数的可视化作品(引用南华早报2015年的图注),尽管两幅图的数据集完全相同,主要可视化对象的图型皆为柱图,但构图的坐标正反之差,却颜色主题之差,却给人带来完全不同的感知信息:红色主题形象地传达了作者要表达的信息——血腥与暴力;相比之下,蓝色主题给人带来的是乐观与和平,形象地表达死亡人数正在减少的观点。

图1.1.3

综上所述,数据可视化是一种抽象呈现客观世界的方法和手段。对于越复杂的数据问题、数据可视化的价值就越发重要。数据可视化能力将直接影响所要传达的信息的效果。因此,我们在数据分析中必须重视可视化的制作水平,否则,即使拥有丰富的数据,也会因缺乏优秀的可视化能力,而影响整体数据分析表达的效果,可谓功亏一篑。 M1WtfnIz786mQbRydKH0+TIXYEve/sJxKL50R7FkI8Sz5fqpEYAtHhu0iup1vLHN

点击中间区域
呼出菜单
上一章
目录
下一章
×