图表是可直观展示统计信息的图形结构,是一种可将数据形象直观展示的可视化手段。图表可以让使用者快速地理解数据报告,一份严谨专业的图表还可以提升报告的可信度。
除用于管理和处理数据外,Excel还可以用于制作专业的数据图表。Excel是制作数据图表性价比最高的办公软件,可通过便捷的设置完成图表内所有元素的修饰,且全部通过可视化按钮操作,无须输入任何代码。
如图1-75所示,在Excel页面单击功能区的“插入”选项卡,可以看到“图表”组中不同类型的图表按钮,单击对应的图表按钮就可选择需要的图表。
图1-75 在功能区插入图表
要了解如何建立图表,首先我们需要了解一套完整的图表制作过程包括哪些步骤。图表是数据报告中的重要组成,图表的制作过程实际上也是一个数据分析过程。具体步骤如下:
(1)检查数据明细:这一步需要保证数据完整性和准确性。
(2)数据处理:对数据进行清洗、筛选、合并、计算以及转换,使其符合数据分析的需求。
(3)数据分析:明确分析目的,采用适合的模型和正确分析方法,提取有价值信息。(4)选择图表:明确数据关系,选择合适的图表。
(5)制作图表:准备图表数据,插入图表,设计图表,核对图表数据准确性。
数据报告中,明细数据是没有分析意义的,我们不会将“部门都有哪些人”或“上月销售了哪些商品”放入报告中,而是将明细数据转化为统计汇总数据,如“商品销售额分布”“各部门平均年龄”“子公司人均成本”等展示到报告中。如图1-76所示,是将区域销售量汇总通过柱形图展示。实际上明细转为汇总数据的过程就是将我们认为重要的有价值的数据指标汇总起来,一般将数据指标分为两大类,分别是用于聚合统计的度量值和用于体现特征属性的维度。
· 度量值 :指可以被聚合汇总的统计值,是聚合运算(计数、求和、平均值、最大值等)的结果。度量值的数据类型一定是数值,例如区域销售量就是度量值。另外度量值也可单独作为某个指标的度量,例如总的销售量也是度量值。
· 维度 :指某一对象的描述性属性或特征,可以理解成分类标签。维度是解释事物或现象的角度。维度数据类型一般是字符串和日期,例如区域就是维度。
汇总数据就是由维度和度量值组成的,汇总数据可以解释为针对数据按照某个维度进行度量汇总成度量值。例如销售量这个指标,可以按照产品(产品1销量、产品2销量)进行汇总分析,也可以按照时间序列(年月日销量)以及按照区域(华南销售量、华北销售量)等。这些汇总数据中,销量是度量值,产品、时间序列和区域是维度。图表的作用就是将汇总数据直观地展示出来,在Excel中选中图表右键单击,在快捷菜单中选择“选择数据”在“选择数据源”对话框中就可以查看图表是如何引用图表数据的,在左侧的“图例项(系列)”框中引用的是汇总数据中的度量值,右侧的“水平(分类)轴标签”框中引用了维度数据,单击“编辑”按钮还可以重新选择数据源区域,如图1-77所示。
图1-76 区域销量汇总数据
图1-77 在功能区插入图表
Excel对图表数据源引用的数据也有分类,用于标识系列图形的是“系列值”,对应汇总数据的度量值。用于展示不同分类的是“轴标签”,对应汇总数据的维度。
图表数据中有一个系列值和一个轴标签是最为常见的格式,根据系列值和轴标签数量的不同,还可以有不同的格式组合,如表1-8所示。度量值和维度的数量也会影响分析意义,只有一个度量值,是对某个指标总的度量,例如汇总公司总人数,而只有一个维度是没有分析意义的。如果维度太多或者度量值太多的汇总数据跟明细数据(明细数据可以理解为包含所有维度和度量值的数据)更接近,分析价值也降低很多。
表1-8 系列值和轴标签的格式组合
区分图表数据的系列值和轴标签并不是看数据类型,而是看这个指标是否用于度量图表中图形的尺寸,用于体现图形大小的是系列值,至于轴位置或图例的是轴标签。例如用于展示各区域销量的柱形图,销量是系列值,它决定了柱形(系列图形)的高度,区域是轴标签,它应用于横坐标轴;用于展示性别占比的圆饼图,占比是系列值,它决定了圆饼的角度大小,性别是轴标签,用于图例。
散点图和气泡图用于表示变量之间是否存在数量关联趋势,所以轴标签要求为连续性数值,如图1-78所示。
图1-78 散点图使用数值类型数据作为轴标签
图表的作用是展示数据,传递信息,但数据图表的类型众多,需要认真选择。如图1-79所示,Excel提供了7大类图表供选择。
尽管图表类型众多,但基本图表主要只有以下几种,其他图表都是由这些基础图表衍生出来的。
· 柱形图 :用于展示各项目、类别间的比较,也可以用于展示少数周期的趋势关系。
· 条形图 :用于展示各项目、类别间的比较。
· 饼图 :用于展示部分与整体之间的构成关系。
· 折线图 :用于展示随时间的变化趋势。
· 散点图 :用于展示相关性和分布关系。
图1-79 Excel插入图表类型
选择合适的图表是制作图表过程中关键的步骤,只有选择合适的图表才能有效地展示我们的观点并突出重点。图表的选择是有序可循的,那就是图表数据间的关系。一般是指轴标签数据间的关系,大部分数据间关系可以归为如下五种类型:
(1)比较
比较指类目之间差异对比的关系,例如统计商品销售量情况时比较不同商品的销售量。如果数据中只有一个维度指标,使用柱形图、条形图都可用于展示比较关系,轴标签展示维度。如数据中有两个及以上维度指标属于多重对比,可使用簇状柱形或条形图,轴标签和图例分别展示一个维度,也可以使用雷达图。
(2)分布
分布用于展示频次的比较关系,例如展示公司年龄人数分布。展示分布主要有直方图和折线图,如果数据点较少一般使用直方图,数据点较多时使用折线图(如经典的正态分布)。展示两个维度的分布使用散点图和气泡图。
(3)构成
构成指成分与整体的关系,展示每个成分占比在整体中的比例大小,占比越大比例越大,如行政费用构成。构成关系的图表一般是一个完整的形状,是一个整体,使用图例颜色来表示不同的成分,例如构成最常用的圆饼图,是一个完整的圆,通过图例颜色区分不同的扇形成分。如果图表数据中只有一个维度指标可使用圆饼图、圆环图、树状图以及瀑布图。如果图表数据中存在两个及以上的维度,需要展示多重构成关系可使用旭日图,其中一个维度展示比较关系使用数据堆积柱形或条形图,另一个维度展示趋势关系使用堆积面积图或堆积百分比面积图。
(4)趋势
趋势是指事物随着时间发展的动向关系,趋势一般用于展示时间序列的变化,时间序列中的时间可以是年份、季度、月份或其他任何时间形式,例如一年内整体月销量走势。折线图和面积图都可以用于展示时间序列,时间序列类目较少时(例如展示一年内四个季度销售额趋势)也可使用柱形图。
(5)相关性
相关性是用于表示一个项目随着另一个项目发生变化的关系,例如判断工龄与工资存在相关关系。反映相关性可使用散点图和气泡图。
在Excel中,图表是通过一个容器将众多对象汇总到一起组成的图形组合,插入图表就是插入固定的对象组合。Excel将这个容器命名为图表区,在图表区内各种对象称为图表元素,它们也都有相应的名称,如图表标题、坐标轴等,它们实际上就是由不同的Excel形状制作的,例如图表标题是文本框,网格线是形状中的直线,图例是形状和文本框组合而成的。
图1-80是Excel图表中常见的图表元素。Excel默认插入的图表中根据图表类型不同自带一些图表元素,也可以在插入图表后再单独添加。Excel支持两种添加图表元素的方法,如图1-81所示。单击选中图表,再单击图表右上角出现的加号,在弹出的菜单中选中需要添加的图表元素。另外一个方式是选中图表后,在功能区中单击“图表设计”菜单下的“添加图表元素”按钮也会弹出类似的选择菜单。
图1-80 常见图表元素
图1-81 添加图表元素两种方式
· 图表区 :包含所有图表元素的容器,添加的图表元素都是在图表区内。
· 绘图区 :为图表必备元素,是数据图形(Excel中称为数据系列)所在区域。绘图区和图表区很容易混淆,绘图区是包含在图表区的,绘图区可以根据需要调整大小和调整位置。
· 数据系列 :根据图表数据绘制出的图形,位于绘图区中,是图表的主要对象。
· 数据标签 :显示数据系列对应的数据源中的系列值。
· 图表标题 :图表标题是对图表的文字说明,是图表必备元素,Excel中默认使用数据源标题作为图表标题。在图表修饰中可以删除图表默认添加的图表标题而使用文本框代替,将标题分为主标题和图表说明,主标题对图表的作用和功能进行说明,图表说明对图表内数据进行简要分析。
· 图例 :指示图形代表的数据系列。
· 坐标轴 :包括横坐标轴和纵坐标轴,在组合图中有时需要次坐标轴用于体现不同数据量级的数据。
· 网格线 :分为水平和垂直网格线,网格线一般用于图表辅助功能,如不添加数据标签时可使用横线作为数值大小参考线。
· 坐标轴标题 :坐标轴标题位于坐标轴区域,用于标识坐标轴名称,一般散点图和气泡图需要添加。
· 数据表 :可以在X轴下方新增图表数据表格,因为与数据标签和纵坐标轴信息重叠且占用空间大,一般不添加。
统计类图表元素一般不会出现在默认图表中,如需展示须单独添加。
· 误差线 :反映与数据系列中每个数据标记相关的可能误差量的线条。第三章对比条形图使用误差线制作辅助线条。
· 线条 :在折线图和面积图中,可制作数据点和横坐标轴的垂直线或数据点之间的垂直线。第三章使用线条制作菱形走势图。
· 趋势线 :是根据图表数据进行数据拟合,按照回归分析的方法添加一条预测线条。常用于统计类分析,可应用于时间序列展示趋势的图表。
· 涨/跌柱线 :在折线图中,连接两个系列同一轴标签下数据点的柱形,常用于展示股票信息。
自定义图表元素是插入更容易修饰的文本框和形状等其他Excel对象,它们的作用是辅助前面介绍的图表元素实现一些特性功能。如果单击图表区再插入形状或文本框等对象,可直接插入至图表,插入的对象也会随着图表移动而移动。将制作好的对象复制至图表区也可以将对象插入至图表区。
· 形状 :形状主要作用于绘图区,例如作为柱形填充实现圆角矩形功能。
· 文本框 :文本框主要用于图表文字说明,相比标题可以更灵活地调节。
Excel默认插入的图表已经一定程度上能够满足呈现数据的需求,那么为什么还要对图表美化和修饰呢?首先,图表的主要目的是传递数据包含的信息,默认的图表很难突出重点,其次一个美化后的图表也是对数据的重视和对受众的尊重,这样受众也会更加相信图表的准确性和价值。
图表的美化和设计过程可以称为“设计”,Excel图表是一个将各种类型的元素汇集到一起的对象组合。制作一个完美的数据图表需要一整套完整的设计流程,具体包括五个步骤。
图表是由图表元素组成的,就如我们听到的声音一样,并不是每个声音都是有用的,有一些默认添加的图表元素是没有必要展示的,称为非必要图表元素,在修饰过程中需要将它们从图表区删除。一般使用“信噪比”形容图表是否简约,比值越大越好,简约的前提是满足数据展示效果需求,比值越大越好并不表示图表元素越少越好。
产生非必要图表元素的原因之一是不同的图表元素的功能有可能重叠,例如数据标签和纵坐标轴都用于展示数值大小,所以一般不推荐两者同时展示,这时就需要根据具体需求确认保留哪类图表元素。另外一种情况是图表元素根据在当前情况下无展示意义,例如删除纵坐标轴后,水平网格线也没有任何的参考意义。
图1-82用于展示各区域季度销售额和利润额情况,左侧是Excel默认图表,通过坐标轴展示数值范围,横线用于参考,这种展示方式常见于一些杂志的商业图表中,因为一般用于展示GDP等指标,精确展示每个数据点的数据标签意义不大。而如果图表的受众是每个区域的总监,他们需要通过数据图表了解本区域销售额和利润额,而不是一个大致范围,显然右侧的图表更满足这样的需求。
图1-82 增删图表元素
图表元素的增删取决于元素是否满足当前需求,图表元素的作用可以概括为展示数据和辅助修饰,展示数据是保证图表展示信息的功能,辅助修饰是让图表看起来更加专业,更加直观,如图1-83所示。
图1-83 图表元素作用
有时默认的图表元素并不能完全满足展示需求,例如为了使观众快速了解数据,除了添加图表标题外还需要添加“数据说明”图表元素(插入文本框)以及备注展示数据来源和数据统计时间保证严谨性,如图1-84所示。
图1-84 添加图表说明和备注
一个专业的数据图表最重要的是满足传递信息的需求,突出重点,其次是简约和美观。
对于保留的图表元素,为达到最佳展示效果也需要一定的修饰。如果按照组成对象区分,图表元素可以分为形状、文本和组合三种类型,如表1-9所示。
除了图例和坐标轴外其他图表元素都是由文本或形状组成的,其中形状又可分为线条和非线条,线条的修饰方式包括线条填充(渐变/实线/颜色/透明度/宽度)、短画线类型以及首尾箭头类型。非线条形状包括矩形、扇形和折线等,修饰方式主要是填充色和填充形状。文本的修饰主要是字体、颜色、字号、加粗以及倾斜。
表1-9 图表元素分类
由于图例的形状是由数据系列形状决定的,所以图例的修饰与文本组成的元素修饰方式一样。坐标轴的形状是线条,一般起辅助作用,可适当设置透明度。
如图1-85所示,修改簇状柱形图图表元素,其中将数据标签、图例、标题、说明和备注字体、字号以及颜色修改为一致;数据系列修改填充色;图表区修改填充色和设置无边框。
图1-85 修饰图表元素
图表布局一般在完成图表元素修饰后进行,是对图表区内图表元素进行大小调整和位置排布的过程。
(1)调整大小
调整大小是指对每个图表元素大小进行调节,形状组成的图表元素通过拖动调节大小,文本组成的图表元素通过调节字号调节大小。
图表区作为所有图表元素的容器,它的大小决定整个图表的大小,一般设置长宽比为常用的4:3或16:9。图1-86设置图表区长宽比为4:3。
图1-86 图表区长宽比4:3
这里涉及两个技巧,第一个是大部分截图软件都会在左上角显示截图的尺寸,可以圈定Excel表格区域,设置长宽比为4:3的图表,例如在图1-86中圈定B2:H20单元格,确定这个区域长宽比为4:3或接近4:3,将图表区域设置与B2:H20区域一样大。第二个技巧是锚定,是Excel的一个小功能,即当选中一个对象(这里的图表)同时按Ctrl键,可以让对象的边缘与最接近的单元格完全契合。掌握了这两个技巧,只要记住符合长宽比例单元格区域就可以快速调整图表区大小。当然也可以直接设置图表大小。
也可以调整图表区内的图表元素大小和位置,以绘图区为例,单击选中绘图区,在绘图区四周出现八个白色圆点,鼠标按住绘图区可以调整绘图区位置,鼠标放置在白点位置拉动可以调整绘图区大小,如图1-87所示,调整绘图区。
图1-87 调整绘图区
对于文本类图表元素调节大小方式主要是调节字号大小,文本大小需依据重要性决定,一般分成三类字号大小组合,其中图表标题最大,数据标签、图表说明次之,坐标轴、图例以及备注等其他图表元素字号最小。
(2)位置排布
为保证图表可以将完整信息展示给观众,图表内有几类图表元素是必须添加的,包括图表标题、图表说明、数据系列、备注,以及可选择的元素——图例如图1-88所示。不同类型图表的必须图表元素也不太一致。
· 堆叠图形和圆饼图中图例是必须的。
· 条形图中纵坐标轴也是必须的,数据标签和横坐标轴保留一项。
· 折线图和柱形图中,横坐标轴是必须的,数据标签和纵坐标轴保留一项。
如图1-89所示,必备图表元素采用竖向分布方式,同时每个图表元素左对齐,这样可以让观众从上至下阅读图表。
图1-88 图表元素分布
图1-89 竖向构图的簇状柱形图
图表配色包括字体颜色和图形颜色。字体颜色要求较为简单,主要避免颜色过于突兀,例如深色背景可采用浅灰色(242,242,242)字体,同时尽量保证图表内字体颜色都是一致的,需要突出显示的文本除外。
图形配色主要是图表区背景填充色和绘图区形状的填充色。在一些商业杂志中一般采用纯白色作为背景,一是可以减少观众对图表背景的关注,二是印刷资料整体都是白色,更适合使用白色背景。相比而言,我们在制作数据报告时很少使用纯白色的背景,所以我们在修改图表区填充色时首先参考数据报告中整体的颜色,也可以设置在图表区背景无填充,完全采用数据报告中的背景,保持整体性,例如,如果数据报告使用浅色背景图表区可以使用浅灰色作为背景。
绘图区数据系列的图形配色是整个图表配色的关键,也决定了图表能否“一眼吸引”观众。首先确定图表的色系,选深色调还是浅色调,选择蓝色还是橙色,保证图表整体的协调。如果需要展示对比关系,优先使用位置关系体现,其次通过对比色体现,但一般建议颜色不超过3个,例如圆饼图中分类多时要求颜色也多,此时的显示效果较差。
有些公司有固定的配色标准,直接采用配色标准是最为高效的方法。也可以在日常中将配色较好的案例截图下来,通过前面介绍的获取RGB的方法将颜色保存。
字体一般可分为衬线字体和无衬线字体两大类,衬线字体的笔画在首尾有额外的装饰元素且笔画粗细不同。相反,无衬线字体所有笔画粗细一致,文字笔画首尾也无修饰元素,如图1-90所示。
图1-90 无衬线字体和衬线字体
常见的衬线字体的名称中带有“宋”字,如宋体、仿宋、思源宋体等。常见的无衬线字体名称中含有“黑”字,如黑体、思源黑体、微软雅黑等。
字体的选择影响由文本对象组成的图表元素,为使图表元素展示更加清晰,一般选用无衬线字体,还有一些字体相关的注意事项如下:
· 优先使用公司统一字体,或数据报告内主字体。
· 不要混搭,一个图表内尽量只使用一种字体。
· 字体版权问题不容忽视。
了解Excel图表的基本组成结构可以更好地认识图表,多加练习和尝试是学习图表的最佳方式。首先图表种类是有限的,其次图表修饰主要集中在图表元素的优化,而图表元素也是有限的,并且每个图表元素可以修饰的内容也是有限的。因此只要在学习和工作中反复尝试和练习,很快就会熟悉每个类型图适合的修饰方式,一旦累计足够经验,可以快速地制作一个专业直观的数据图表。接下来笔者抛砖引玉依据图表设计流程完成30个常见图表的制作与设计。