数据质量管理(Data Quality Management)是指对从计划、获取、存储、共享、维护、应用、消亡这些生命周期的所有阶段中可能引发的各类数据质量问题,进行识别、度量、监控、预警等一系列管理活动,并通过改善和提高组织的管理水平进一步提升数据质量。
数据质量检核负责对系统中的新增数据和存量数据进行标准满足度的考核评估,同时从完整性、唯一性、有效性、一致性、准确性和及时性六大维度对数据进行全方面考量。每一个维度向下又分解为具体的检核规则,对数据进行深入、细致的检核。一个常见的数据质量体系如图2-1所示。
图2-1 常见的数据质量体系
每一个规则维度可能需要不同的度量方法、时机和流程,这就导致完成检核评估所需要的时间、金钱和人力资源会存在差异。数据质量的提升不是一蹴而就的,可以在清楚地了解评估每一个维度所需工作的情况下,选择当前较为迫切的检核维度和规则,从易到难、由浅入深地逐步推动数据质量的全面管理与提升。规则维度的初步评估结果是确定基线,其余评估则作为继续检测和信息改进的一部分,作为业务操作流程的一部分。