购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

任务三
数据整理初体验

从数据源中获取的数据通常是不规范的,其中存在重复值、错误值、空值等;导入过程中也会造成列名、数据类型等发生改变,因此需要对数据进行整理。在Power BI中,数据整理工作是在Power Query编辑器中完成的。

一、更改数据类型

Power BI在从Excel中读取数据的过程中,会自动识别并转换某些数据类型。因此导入完成后,用户需要检查各个表中的数据类型是否正确。

【实训2-2】接【实训2-1】,更改数据类型。将产品表中的“产品ID”,门店 的“门店ID”,销售数据表中的“订单编号”“产品ID”“门店ID”“会员ID”列设置为文本类型。将“日期表”中的“日期”和“销售数据表”中的“订单日期”设置为日期类型。

实训2-2

① 执行“主页”|“转换数据”命令,进入Power Query编辑器,如图2-5所示。

图2-5 Power Query编辑器

② 单击左侧查询列表中的“产品表”,可以看到“产品 ID”列左端显示 ,即 Power BI自动将该列的数据类型识别为“整型”。单击“产品ID”列左端的 ,在展开的列表中选择 ,如图2-6所示。

③ 系统弹出“更改列类型”信息提示框,如图2-7所示。单击“替换当前转换”按钮,将该列数据类型更改为“文本”。

图2-6 更改“产品ID”列数据类型

图2-7 更改列类型信息提示框

④ 同理,修改“门店表”中的“门店 ID”,销售数据表中“订单编号”“产品 ID”“会员ID”“门店ID”列的数据类型为文本。修改“日期表”中的“日期”和“销售数据表”中的“订单日期”为日期型。

二、删除空行和错误值

当导入的数据表中数据过多时,记录中可能存在空值或错误值。用户在数据可视化之前需要删除空行和错误值。

【实训2-3】接【实训2-2】,删除“门店表”中的空行。

实训2-3

① 在Power Query编辑器左侧的查询列表中选中“门店表”,状态栏显示门店表中有38行记录。浏览门店表内容,只有22个门店,其余记录均显示“null”。

② 执行“主页”|“删除行”|“删除空行”命令,删除门店表中的空行,如图2-8所示。

图2-8 删除空行

③ 删除完成后,状态栏显示门店表中还有22条记录。

三、返回Power BI Desktop

在 Power Query 编辑器中完成数据整理工作后,需要返回 Power BI Desktop。

【实训2-4】接【实训2-3】,返回Power BI Desktop并将文件名保存为“苏苏奶茶”。

实训2-4

① 执行“文件”|“关闭并应用”命令,保存编辑结果并返回Power BI Desktop。

提示

● 关闭并应用:关闭Power Query编辑器窗口,并应用所有挂起的更改。

● 应用:不关闭Power Query编辑器窗口,只应用所有挂起的更改。

● 关闭:关闭Power Query编辑器窗口,不应用所有挂起的更改。

② 单击左上角“保存”按钮 或执行“文件”|“保存”命令,打开“另存为”对话框。选择保存该文件的路径,将文件名设置为“苏苏奶茶”,保存类型为“Power BI文件(*.pbix)”,单击“保存”按钮。

提示

● 如果没有保存Power BI文件,则第一次关闭Power BI Desktop界面时,系统也会自动提醒是否保存文件。

● 使用Power Query编辑器整理数据后,结果就被存储在Power Query编辑器中,在Power BI Desktop中构建数据模型,使用DAX语言新建度量值、新建列,以及可视化设计等各种操作不会影响Power Query编辑器中整理后的基础数据。 mn42z+OUjHLbQrzKy9fEYUzkl8njXDE+mlEGECWKCd4VCcshSyRpReQdacZd0J3N

点击中间区域
呼出菜单
上一章
目录
下一章
×