图表的种类有很多,如常见的饼状图、条形图、柱形图、散点图等。分类的规则和角度向来都不是固定不变的,我们可以从不同角度对图表进行分类。
根据图表的使用目的,可以将图表分为科学图表和商业图表,它们都有非常独特的风格,下面举例说明。
商业图表范例如图2-1所示,这4张图表均来自世界级商业类杂志《经济学人》和《彭博商业周刊》;科学图表范例如图2-2所示,这4张图表来自世界级科学类杂志《自然》和《科学》。通过对比,可以很直观地发现商业图表和科学图表分别具有不同的特性。
图2-1 商业图表范例
1.颜色选取差异
商业图表在色彩的选取上更加灵活、大胆,因为其服务目的是增强图表的视觉表现力。而科学图表的颜色选取会更遵循实用主义原则,整体颜色比较素,通常使用少量颜色处理重点数据,甚至采用黑白图表。如果要大批量运用彩色,那么其选取颜色的原则是,与论文内容有关的颜色优先,对比强烈、更突显数据的颜色优先。
图2-2 科学图表范例
2.精确度差异
商业图表和科学图表中的数据精确度存在明显差异。毫无疑问,科学图表对精确度的要求更加严格,因此其保留的有效数字位数通常更多。在科研领域,有很多对精度要求很高的特殊指标,或者数据差异很小,需要呈现很高精度的数据才可以区分。因此,科学图表对数据精确度的要求远远高于商业图表对数据精确度的要求。
3.内容差异
商业图表和科学图表在内容上存在差异,不过这并非选题不同,这里的内容差异是指两类图表呈现的内容在方向性上存在很大差异。科学图表涉及的学科数量非常多,每个学科的科学图表呈现的内容都具有各自的特色。例如,生物学图表通常会配合细胞及其他微观结构出现在图表中,流体力学图表通常会搭配流体模型进行呈现。商业图表通常采用较为纯粹的数据呈现方法,没有较强烈的主题元素。
4.复杂度差异
复杂度差异可能不那么明显,但在多看几个图表后会发现,科学图表的复杂度要高于商业图表的复杂度。这里的复杂度其实就是阅读图表的难度。因为科学图表要描述的问题通常较为复杂,图表中呈现的数据综合程度较高,所以会有一些特别的图表设计,这些设计会加大图表的阅读难度。有趣的是,这种情况在科学图表中是合理且被接受的。为什么呢?这需要考虑图表的读者差异,科研人员因其从业特性,天然对高复杂度的内容有更高的耐受度,所以牺牲复杂度换取更多的数据呈现是可以被接受的。但在商业图表的制作过程中,需要控制图表的复杂度,尽量保证所有读者都可以轻松理解。
综上所述,商业图表和科学图表的差异通常是因图表的使用场景不同导致的。因此,我们在制作图表时,应当根据图表的使用场景进行适配。
根据图表的互动性,可以将图表分为静态图表、动态图表和互动可视化作品。没有任何交互功能的图表称为静态图表,通过简单地改变条件可以动态改变数据呈现的图表称为动态图表,可以与读者形成更复杂交互关系的图表称为互动可视化作品。
1.静态图表
静态图表是最基础、最常见的图表形式。日常生活与工作中看到的大部分图表都属于静态图表,如杂志、调研报告等文件中的图表。静态图表最大的特征是“不会动”。在制作完成后,静态图表中的所有内容都是固定的,虽然不灵活,信息量相对较少,但是便于在传统媒介中传播。
说明: 本书后续章节的教学部分,内容主要为不同类型静态图表的制作。
2.动态图表
动态图表是静态图表的延伸,可以理解为在静态图表的基础上添加了时间维度。用户可以通过控制筛选条件控制在不同的时间显示不同的数据集,通常应用于数据软件(如Excel、Power BI、Tableau)中。Excel中的数据透视表及数据透视图就属于动态图表,通过改变筛选条件,可以改变显示的数据集,进而改变显示的结果,范例如图2-3所示。
图2-3中的是使用相同数据集创建的两个数据透视表及相应的数据透视图,我们可以通过控制筛选条件为图表提供不同的数据源,从而实现图表的动态化。例如,左上部分图表显示了完整的各城市产品销售额,右下部分图表通过筛选只显示华北大区的城市及销售额。
图2-3 数据透视表和数据透视图范例
说明: 常规的动态图表带有简单的条件控制,但在动态图表中有一种自动动态显示的图表,其原理是通过修改预设条件,自动播放可视化图表,实现类似视频或动画的效果。例如,可以随时间变化逐帧显示销售额的变化,可以随时间变化显示各国人口数量的变化,等等。一幅比较典型且广为人知的作品《全球人口增长》便来自汉斯·罗斯琳(Hans Rosling)在2010年的TED演讲,该作品就采用了这种动态图表形式,如图2-4所示。
3.互动可视化作品
互动可视化作品是对实现技术要求更高的一类图表,在日常生活和工作中比较少见,但是你可能曾与它们相遇过,如某些重大的新闻报道或展览活动中。
《移民去远方》是财新数据可视化实验室的往期作品之一,是典型的互动可视化作品,如图2-5所示(如果需要了解该作品详情,则可以在互联网上搜索并查看完整作品)。读者在阅读互动可视化作品时,可以与其产生一定的互动效果。例如,通过移动图表中的地球模型,直观地查看人口移动的变化。因为互动可视化作品通常是以一幅完整的作品呈现的,所以与静态图表相比,它拥有更大的展示空间,可以容纳更多的数据集。在互动可视化作品《移民去远方》中,在左上角呈现了近20年来中国人口的移入和移出变化情况,同时使用列表的方式给出了各个移民目的地的明细数值;在左下角给出了对应年份移民政策的松紧演变可视化图表;在作品右侧使用新闻稿辅助说明。
图2-4 汉斯·罗斯琳(Hans Rosling)的TED演讲《全球人口增长》
图2-5 财新数据可视化实验室出品的《移民去远方》
《爆款新春歌曲调配指南》是由澎湃新闻的《美数课》栏目出品的互动可视化作品,如图2-6所示(如果需要了解该作品详情,则可以访问澎湃新闻官方主页搜索查看)。该作品将传统新春音乐拆解并逐步呈现在读者面前,并且在末尾统一呈现它们的特点。
图2-6 澎湃新闻的《美数课》栏目出品的《爆款新春歌曲调配指南》
在图2-6中,右下部分图表中的每朵花都代表一首传统新春音乐,花瓣的数量代表使用传统民乐的种类数,中心的花蕊代表是否使用了传统“宫商角徵羽”的五声音阶,四散的花丝代表相同歌词的重复次数,花朵的大小代表歌曲的速率。通过这幅简洁的互动可视化作品,读者可以很轻松地了解新春音乐自身的特点及新春音乐之间的共性。此外,因为该作品是基于网页的互动可视化作品,所以我们可以通过单击不同的花朵实现对应歌曲的试听,在试听的同时与可视化信息进行对比,在大脑中形成一个立体的认知。该作品还准备了自制环节,我们可以利用了解到的新春歌曲的特性自行调配歌曲。
通过上述两个范例,我们简单地了解了数据可视化作品是什么。顺带一说,第1章中的可视化作品《科学之路》也是一幅互动可视化作品。结合这几个范例,大家可以感受到互动性带来的全新功能是非常强大的,这也是未来可视化逐步发展的方向。
功能的提升通常建立在更复杂的技术之上,如网页设计技术及编程语言(HTML、JavaScript、Java、Python等)。更准确地说,功能的提升一般都离不开编程语言的辅助,因为常规的软件目前还无法承载如此高自由度且精细的设计。虽然互动可视化作品的功能非常强大,但不表示可以用它代替静态图表。在制作图表时,要根据实际情况选择合适的图表类型。
在看完前面两种图表分类后,本节主要介绍传统的图表类型划分方法。下面将Andrew Abela归纳总结的图表类型选择器作为基础进行拓展讲解,如图2-7所示。
图2-7 Andrew Abela归纳总结的图表类型选择器
在Andrew Abela总结归纳的图表类型选择器的中心有一个问题:你想展示什么?这很考验你对数据的理解。我们的需求通常可以分为五大类:分布、趋势、对比、关系、构成,即图2-7中围绕中心的五个一级子项目。举个例子,要呈现不同大区门店的销售额情况,这种需求被认为是“分布”,因为该需求是呈现销售额在空间上的分布情况;要呈现过去20年中国移民人口数量变迁的情况,这种需求被认为是“趋势”,因为该需求是呈现移民人口数量在时间上的变化趋势。以此类推,在剩余的三大类需求中,“对比”表示对多组结构相似的数据进行对比,突出差异的需求,如不同国家人口结构的对比;“关系”表示多个维度之间相关关系的呈现需求,如喝牛奶和身高之间的关系;“构成”表示数据整体和局部之间关系的呈现需求,常见的是占比数据的表达,如各年龄段拥有房屋数量的占比情况。
在五大类的基础上深入拓展,即可看到我们熟悉的折线图、散点图、柱形图、条形图等。在图2-7中,我们还可以看到不常见的漏斗图、金字塔图、雷达图等。图表种类非常丰富,大家参考图2-7简单了解即可,无须记忆,因为具体的图表类型数量远超图2-7中所涵盖的范围,后续章节中制作的很多图表都不在图2-7中。
注意: 麦克斯希望大家明确的只有一点,那就是图表呈现需求的五大类:分布、趋势、对比、关系、构成。在第3篇的案例实战中,我们也是按照这样的分类进行讲解的。在实际操作中,大家可以根据自己的数据表达需求,选择合适的图表类型进行参考和使用。