购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

1.2 实体消解的作用

在日常生活中,每个个体都被分配了很多编号。医院给每个人分配医疗编号,公司分配工号,政府分配社保编号,等等。当人们进行注册时,银行、商店、网站也会给人们分配编号,有时甚至不止一个。为什么会有这么多编号呢?在以前,当服务只限于本地社区时,店主和客户互相认识,交易是面对面进行的,人们清楚是在和谁打交道。交易通常是独立的,无须参考之前的任何业务,也无须保留与客户有关的记录。

随着远程服务的日益普及,公司的经营范围扩大至全国范围,这使得进行用户群体细分越来越重要。但仅靠姓名进行划分显然不够,因此在实践中通常将姓名与地点结合起来,创造出复合标识符。例如,Jones夫人变为来自Bromley的Jones夫人,以和来自Harrow的Jones夫人区分开来。进入新时代,随着数据从纸质形式转变为电子形式,人们开始使用唯一的机器可读编号,出现了数字标识符和字母数字标识符。

在特定领域内,使用标识符通常都可以有效识别。比如用身份证号进行识别,就能判别谁是谁。标识符能在双方之间迅速建立共同背景,减少出现误解的可能性。但是,在不同领域,标识符彼此之间通常没有任何共同点,长度和格式各不相同,而且是根据不同规则分配的。标识符之间也缺少相互转换的机制,难以判断一组标识符是否都指向同一个人。

然而,当业务面向大众时,我不认识与我打交道的人,他们也不认识我,如果我多次注册同一服务(也许是忘了自己的唯一识别编号,也许是提交了新申请),会怎样呢?那么,我将会创建出同样能标识我的第二个编号。这种重复操作使得服务提供商难以提供个性化服务,因为服务提供商必须将两个不同的记录合并,以完全了解我是谁以及我的需求可能是什么。

在大型组织内,匹配客户记录的问题变得更加具有挑战性。不同功能或业务线可能会维护各自的特定记录,以实现具体目的,但这些记录是独立设计的。一个常见的问题是如何构建对客户的全面了解。可能在多年间,客户与组织的不同部门都进行过互动。客户可能以不同的身份与组织进行互动,有时作为个人,有时作为家庭,也可能以组织名义或其他法律实体相关的名义。在不同的互动过程中,各种系统可能为同一个人分配了多个标识符。

多个标识符通常是由(历史性的)合并和收购引起的,需要将重叠的客户群体合并为单一群体,以进行一致性处理。如何将一个领域的客户与另一个领域的客户匹配起来呢?

当合并不同组织提供的数据集时,关联记录是非常大的挑战。由于组织间通常没有普遍适用的标准或公共键,特别是个人数据没有公共键,数据合并非常琐碎,经常出现问题。 Cf7uCR7QmMpqEYznH5frZaTlcABYf8whCSCJdhnQnfSP1RQMAs0rFfY1xCg3CTw3

点击中间区域
呼出菜单
上一章
目录
下一章
×

打开