在实际工作中,有可能会多次重复录入数据,这些重复数据会对数据分析造成极大的影响,因此需要根据实际情况对这些重复数据进行处理。
有时也需要从一列数据中获取不重复的项目名称,以便快速设计统计报表的结构。
如何快速找出重复数据?如何快速删除重复数据?如何查找两个表格中都有的数据?这些问题看起来很麻烦,其实只要掌握了相关技能就很容易解决。
如果要在一列中把重复数据标注出来,最简单的方法是使用条件格式。下面举例说明。
使用条件格式的具体方法:选择“开始”→“条件格式”→“突出显示单元格规则”→“重复值”命令,如图2-108所示。
打开“重复值”对话框,设置重复数据的标识格式即可,如图2-109所示,单击“确定”按钮,即可得到如图2-110所示的效果。
图2-108 查找重复值
图2-109 设置重复值的格式
图2-110 标注重复值
使用条件格式的这种标注效果是模糊的,尤其是在重复数据较多的场合。如果需要了解每个数据的重复次数,以及是第几次重复,则需要使用COUNTIF函数。
对于如图2-110所示的示例数据,要标出每个数据的重复次数,以及是第几次重复,统计公式如下:
单元格B2:=COUNTIF($A$2:$A$13,A2) 单元格C2:=COUNTIF($A$2:A2,A2)
注意两个公式的相对引用和绝对引用的设置情况,一个是固定的统计区域,一个是不断扩展的统计区域,结果如图2-111所示。
图2-111 统计每个数据的重复次数以及是第几次重复
如果要快速删除数据清单中的重复值,保留唯一值,可以使用“删除重复值”命令,如图2-112所示。
图2-112 删除数据清单中的重复值
这种删除重复值的方法不仅适用于单列数据的处理,也适用于多列数据的处理。
如图2-113所示,数据表中有几行数据是重复的,将这些重复行删除的具体操作步骤如下。
图2-113 有重复数据行的表格
步骤1 选择数据区域。
步骤2 选择“数据”→“删除重复值”命令,打开“删除重复值”对话框,单击“全选”按钮,如图2-114所示。
图2-114 “删除重复值”对话框
步骤3 单击“确定”按钮,即可弹出一个提示框,提示发现了几个重复值,已经将其删除,保留了几个唯一值,如图2-115所示。
图2-115 删除重复值的提示框
步骤4 单击“确定”按钮,即可得到不含重复值的表格,如图2-116所示。
图2-116 不含重复值的表格
“删除重复值”这个技能非常有用,在实际工作中会经常用到。
如图2-117所示的工资表,现在要从C列中获取部门名称不重复的列表。可以先复制“部门”列的数据,再删除重复值即可。具体操作方法请观看案例视频。
图2-117 工资表