



如何快速删除重复值呢?让我们来看一个示例。如图2-10所示,某公司的会议签到表中可能包含重复签到记录(“姓名”和“部门”同时重复),工作人员希望批量清除这些包含重复值的记录行。这种需求可以利用Power Query的数据清洗功能轻松实现。
图2-10 某公司的会议签到表中包含重复值
利用Power Query快速删除数据源中重复值的具体操作步骤如下。
1)将“会议签到表”导入到Power Query编辑器,按住Shift键不松开,分别单击“姓名”列标和“部门”列标,以同时选中这两列字段;在Power Query的菜单功能区中。单击“删除行”命令下的“删除重复项”按钮,即可批量删除“姓名”和“部门”同时重复的记录行,如图2-11所示。
图2-11 在Power Query编辑器中删除包含重复值的记录行
2)经过检查可以发现,Power Query编辑器中“签到时间”的格式变为小数了,所以需要将该值设置为时间格式,操作步骤如下:单击“签到时间”字段左侧的扩展按钮,在展开的下拉菜单中单击“时间”选项,将“签到时间”的数据格式调整为时间格式,如图2-12所示。
图2-12 设置“签到时间”列为时间格式
3)在Power Query编辑器中检查结果无误后,单击“关闭并上载”按钮,将结果上载回Excel工作表,如图2-13所示。
图2-13 检查结果无误后上载回Excel工作表
4)上载回Excel工作表的“表1”中已经清除了重复签到记录,显示效果如图2-14所示。
图2-14 上载回Excel工作表中的数据不含重复记录
Power Query的数据清洗功能不仅适用于当前数据源,还能在数据源更新时通过一键刷新Excel报表来保持数据同步。例如,如果“会议签到表”中增加了新的签到记录,只需在“表1”中刷新数据,Power Query就会自动对“会议签到表”进行数据清洗,并返回删除重复记录后的结果。这也是我们在实际工作中应该优先采用的报表模式,因为它可以让Power Query一次性解决问题,避免重复的无效工作。