前文介绍了Power BI是微软公司的产品,除了Power BI之外,微软公司还有很多以Power开头的工具,如PowerPoint(简称PPT,可以翻译为超级演示)。在数据分析领域以Power开头的工具还包括Power Query(简称PQ,可以翻译为超级查询)、Power Pivot(简称PP,可以翻译为超级透视)等。下面对Power Query和Power Pivot的应用进行简单介绍。
Power Query与Power Pivot是Excel中的插件,其中,Power Query也是Power BI的重要组件,下面先来认识一下这两个工具。
(1)Power Query
Power Query的主要作用是数据的整理和清洗,适合处理各种数据转换和清理工作。作为Excel的插件,能够弥补其处理大数据时的不足。
(2)Power Pivot
Power Pivot的主要用于执行强大的数据分析和创建复杂的数据模型。Excel借助Power Pivot汇总各种来源的大量数据,快速分析信息并轻松共享见解。
Excel 2010和Excel 2013版本需要手动加载Power Query插件才能使用相关功能,Excel 2016之后的版本则直接嵌入了Power Query功能。
下面以Excel 2016为例,介绍如何启动Power Query编辑器。
Step 01 打开“数据”选项卡,在“获取和转换”组中单击“新建查询”下拉按钮,在下拉列表中选择“合并查询”选项,在其下级列表中选择“启动Power Query编辑器”选项,如图1-6所示。
Step 02 系统随即打开“Power Query编辑器”,如图1-7所示。用户可以向该编辑器中导入数据,并对数据进行整理和清洗。
图1-6
图1-7
启动Power Query编辑器后可以向编辑器中导入数据源,下面以导入Access数据库中的数据为例进行介绍。
Step 01 打开“数据”选项卡,在“获取和转换”组中单击“新建查询”下拉按钮,在下拉列表中选择“合并查询”选项,在其下级列表中选择“启动Power Query编辑器”选项,如图1-8所示。
Step 02 系统随即自动打开“Power Query编辑器”,在“主页”选项卡中单击“新建源”下拉按钮,在下拉列表中选择“数据库”选项,在其下级列表中选择Access选项,如图1-9所示。
Step 03 在弹出的“导入数据”对话框中找到要使用的Access文件,单击“导入”按钮,如图1-10所示。
图1-8
图1-9
图1-10
Step 04 弹出“导航器”对话框。选择要导入其中数据的表格,对话框右侧会显示该表格中的数据预览,单击“确定”按钮,开始导入数据,如图1-11所示。
图1-11
Step 05 数据被导入成功后会在“Power Query编辑器”窗口中自动显示,如图1-12所示。
图1-12
在“Power Query编辑器”中处理完数据,可以单击“主页”选项卡中的“关闭并上载”按钮,将该编辑器中的数据导入当前Excel工作表中,如图1-13所示。
图1-13
不管是在Excel中还是在Power BI中,Power Query都能够快速完成百万级别数据的处理和分析,并且工作界面和操作方式保持高度一致。Power BI中的Power Query编辑界面如图1-14所示。本书第5章将对Power Query编辑器的使用方法进行详细介绍,此处不做赘述。
图1-14
Power Pivot在Excel 2010以及Excel 2013中以插件的形式存在,而Excel 2016及之后的版本中内置了这项功能。下面以Excel 2016专业增强版为例,介绍如何向功能区中添加Power Pivot选项卡。
Step 01 打开“文件”菜单,单击“选项”按钮,如图1-15所示。
图1-15
Step 02 弹出“Excel选项”对话框,切换到“自定义功能区”界面,在右侧列表框中勾选“Power Pivot”复选框,随后单击“确定”按钮,如图1-16所示。
图1-16
Step 03 功能区中随即增加Power Pivot选项卡,通过该选项卡中提供的命名按钮可以打开Power Pivot for Excel窗口、将当前工作表中的数据添加到数据模型并进行数据分析等,如图1-17所示。
图1-17
用户可以将当前工作表中的数据添加到Power Pivot数据模型,其操作方法非常简单,具体操作步骤如下。
Step 01 在功能区中添加Power Pivot选项卡,然后打开该选项卡,选中数据表中的任意一个单元格,单击“添加到数据模型”按钮,如图1-18所示。
Step 02 弹出“创建表”对话框,此时文本框中已经自动引用了整个数据源区域,单击“确定”按钮,如图1-19所示。
图1-18
图1-19
Step 03 当前工作表中的数据随即被添加到Power Pivot数据模型,如图1-20所示。
图1-20
创建Power Pivot数据模型后,可以在Power Pivot for Excel窗口对已加载的数据进行处理。
Step 01 打开Power Pivot选项卡,单击“管理”按钮,如图1-21所示。
图1-21
Step 02 打开Power Pivot for Excel窗口,选中“统计日期”列中的任意一个单元格,在“主页”选项卡的“格式设置”组中可以看到当前列的数据类型为“日期”,单击该选项下方的“格式”下拉按钮,在下拉列表中选择“2001年3月14日”选项,如图1-22所示。
图1-22
Step 03 选中“库存金额”列中的任意一个单元格,在“格式设置”组中单击“格式”下拉按钮,在下拉列表中选择“货币”选项,如图1-23所示。
图1-23
Step 04 此时统计日期和库存金额两列中的数据类型便得到了更改,效果如图1-24所示。
图1-24
Step 05 选中“库存金额”列中的任意一个单元格,在“主页”选项卡的“排序和筛选”组中单击“从小到大排序”按钮,如图1-25所示。将该列中的值按照从小到大的顺序进行重新排列。
图1-25
Step 06 选中“库存金额”列中的任意一个单元格,在“主页”选项卡的“计算”组中单击“自动汇总”下拉按钮,在下拉列表中选择“总和”选项,如图1-26所示。
图1-26
Step 07 “库存金额”列下方随即显示库存金额的求和结果,但是由于受到列宽的限制,单元格中的内容无法完整显示,用户还需要适当调整该列的列宽,将光标移动到“库存金额”列标题的右侧,光标变成水平的双向箭头时按住鼠标左键向右侧拖动,如图1-27所示。
图1-27
Step 08 松开鼠标后,列宽得到了调整,同时库存金额的总和计算结果便可以完整地显示出来,如图1-28所示。
图1-28