购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

Chapter 2
第2章
删除重复值

在工作中,我们常常需要处理各种类型的数据,这些数据可能并不完全规范,其中重复值就是重要问题之一。数据中存在的重复值可能会给数据分析造成很多困扰,例如导致数据不准确和分析结果出现错误。

Excel中的删除重复值工具可以很好地解决这类问题,它在“数据”选项卡下的“数据工具”组中,如图2-1所示。

图2-1 调用删除重复值工具

Excel中的删除重复值工具可以帮助用户对指定范围内的重复值进行批量删除,其执行过程可以分为以下3个操作步骤。

1) 选定数据范围: 选中包含重复值的数据范围。对于拥有连续行列的表格(即没有空行和空列),可以选中其中任意单元格,Excel会自动扩展至表格的整个区域。

2) 设置删除选项: 根据具体情况勾选包含重复值的列字段。如果表格包含标题行,则应勾选“数据包含标题”选项;如果需要基于多列判断重复性,则一并勾选相关列。

3) 执行删除操作: 单击“确定”按钮,Excel会自动检查选定的数据范围,从上向下保留第一次出现的数据,并删除下方的重复数据。执行完毕后,Excel会显示一个对话框,告知用户已删除的重复项数量及保留的数据的概况。

下面结合3个实例进行具体讲解,帮助读者更深入地理解并掌握其用法。

2.1 按单条件删除重复值

在表格中如何按单条删除重复值呢?让我们来看一个示例。图2-2是某企业的会议签到表,其中B列的姓名中可能会包含重复值。

图2-2 包含重复值的会议签到表

利用Excel中的删除重复值工具可以快速删除会议签到表中多余的重复姓名,既方便又快捷。

按单条件删除重复值的操作步骤如下:选中会议签到表中任意单元格(如A1),单击“数据”→“数据工具”→“删除重复值”选项;在弹出的对话框中仅勾选“姓名”字段,然后单击“确定”按钮,如图2-3所示。

图2-3 删除会议签到表中的重复姓名

执行完毕后,Excel会弹出提示,告知用户找到并删除了3个重复值,保留5个唯一值,如图2-4所示。可以看到,会议签到表中第一次出现的姓名保留不变,多余的重复值已被批量删除。

图2-4 删除重复值后的会议签到表

2.2 按多条件删除重复值

某企业的会议签到表如图2-5所示,其中包含重复签到记录。

图2-5 姓名和部门同时重复的会议签到表

虽然姓名中有很多重复值,但需要同时判断这些重复姓名所对应的部门是否也重复。如果部门不同,即使姓名相同也不算重复(如最后两行的李锐6);仅当姓名和部门同时重复时,才是需要删除的多余重复值。

捋清业务逻辑后,按多条件删除重复值的具体操作步骤如下:选中会议签到表中任意单元格(如A1),单击“数据”→“数据工具”→“删除重复值”选项;在弹出的对话框中同时勾选“姓名”和“部门”字段,然后单击“确定”按钮,如图2-6所示。

执行完毕后,Excel会弹出提示,告知用户找到并删除了2个重复值,保留了6个唯一值。如图2-7所示。可以看到,会议签到表中姓名和部门同时重复的多余记录已被批量删除。

在这两个案例中,当在数据中发现重复值时,Excel的删除重复值工具默认是保留上方首次出现的数据,删除下方的多余数据,这是基于此工具从上向下的扫描方向而定的。

图2-6 按照姓名和部门删除重复值

图2-7 多条件删除重复值后的会议签到表

2.3 从下向上删除重复值

1.实现方法

工作中有时候需要从反方向删除重复值,在什么情况下会遇到这种需求以及如何实现从下向上删除重复值呢?来看下面这个示例。某企业生产所用的原材料价格跟随市场供需关系而变化,业务人员在采购前需要获取各种原材料的最新市场报价。现有一张记录了不同日期的原材料报价表,如图2-8所示。

图2-8 原材料报价表

通过观察可以发现,表格中的报价日期是按照从远到近的顺序排列的。在这个数据基础上,如果直接使用Excel的删除重复值工具,会默认从上向下扫描重复值,保留最早期的原材料报价并删除最新报价。这种效果显然不是我们想要的。所以在这种情况下的解决方案是:先将日期从近到远降序排列,使原材料的最新报价保持在最上方;然后调用Excel的删除重复值工具,即可保留最上方的最新报价,删除下方多余的早期报价数据了。

捋顺思路后,从下向上删除重复值的操作步骤如下。

1)选中报价日期列中的任意单元格(如A1),单击“数据”选项卡下“排序”组中的“降序”按钮,即可将日期从近到远降序排列,如图2-9所示。

图2-9 将原材料报价表按日期降序排列

2)经过上一步操作,各种原材料的最新报价已经保持在最上方了,可以利用Excel的删除重复值工具删除下方多余的早期报价记录了。具体操作步骤与之前案例相同,此处不再赘述,如图2-10所示。

执行完毕后,原材料报价表中只保留了各种原材料的最新报价,如图2-11所示。

图2-10 从下向上删除重复值

图2-11 只保留最新报价的原材料报价表

2.创建辅助列

这里有必要对这种解决方案进行一些说明。在这个案例中,原材料报价表中已有“报价日期”字段可供降序排列,从而顺利反转了原表格记录的顺序。在处理数据时,如果原始表格中没有可用的降序排列字段,但又需要保留最下方数据并删除上方重复值,用户可以创建一个辅助列,从1开始编号到 N 。选择这个辅助列并降序排列后,原始表格中的记录行会自动反转,原本在最下方的记录会移动到最上方。此时,使用Excel的删除重复值工具,就可以实现保留最下方数据并删除上方重复值的目的。 8K2v625ZUi2vsgHTjXzbd4P2cus9PvBmSeKySGjzIj2n/EnJgQKHjsfwf69nnAjs

点击中间区域
呼出菜单
上一章
目录
下一章
×