购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

第2章
共享数据,新知识经济的支柱

人们普遍认为数据有助于创造价值。 1 人们把数据称为“新石油”,而“大数据”的概念也得到广泛传播。这一理念适用于现代生活的诸多领域,在金融领域尤为突出。因为在这一领域,基于数据的洞察力对于做出正确的决策和充分驾驭不确定性至关重要。在金融领域,交易员通过分析数据来培养洞察力,获得知识,并最终做出更好的投资决策。研究人员通过分析金融和消费者相关数据,获得关于经济和社会的知识。公司通过分析数据来预测其行业的发展,预测市场对新产品的需求,从而能够在冲击到来前采取行动。 这些应用将数据转化为一种生产要素,一旦对数据进行分析,就会产生知识和价值。

然而,数据既没有被完全当作一种生产要素,又没有被充分利用。数据尚未被完全当作生产要素的核心原因是,它与资本、劳动力和石油等其他传统生产要素截然不同。数据没有被充分利用的原因是,数据的特性使其本身很难在数据市场上进行交易,当然也不是完全不可能进行交易。尽管数据具有数字化特性,但它被限制在封闭的孤岛中,这就阻止了组织最大限度地发挥数据的潜在价值。

区块链和人工智能等新技术,以及数据如何发挥作用(更重要的是数据能发挥什么作用)等新概念正在改变这一局面,人们正从大数据向共享数据过渡。在这种情况下,从数据中提炼的知识开始在社会中安全地流动。所有这些都要归功于数据交易机制的设计与实现。数据交易所是从许多不同的来源收集数据并允许第三方在这些数据的基础上执行算法的平台,这些第三方可以利用数据产生洞察力(知识)。因此,可以说是数据交易催生了共享数据的概念,这也是大数据未来的发展方向。

数据交易将深刻地改变知识产生的方式,它将打开“基于数据产生价值”的深层视野。 具体来说,它将激励公民和组织记录和分享新的数据,这些数据将在不侵犯任何公民和组织隐私的情况下产生价值,组织能够通过分析这些新的数据源来产生新的知识。这种转变的创新之处在于,任何组织或个人的敏感数据都不会越过当前已经限定的安全边界。新一轮价值浪潮即将到来。

本章将引导读者理解数据作为生产要素的特别之处,并思考数据交易将如何改变知识的产生方式。此外,我们还将针对“数据交易如何提高美国联邦储备委员会消费者财务调查对企业、政策制定者和研究人员的价值”提出建议。

本章作者:何塞·帕拉-莫亚诺(José Parra-Moyano)
卡尔·施梅德斯(Karl Schmedders)
阿莱克斯·彭特兰

数据,不可替代的生产要素

作为一种不可替代的生产要素,数据的概念非常宽泛:1个单位(如1MB)的数据可以包含几乎所有可记录的数据。其中的某些数据可能对组织有用,而另一些数据则可能无用。让我们举例说明:某个投资基金在某个晚上收到1个单位(如1美元)的投资,对该基金来说,这一投资来自正在流通的大量货币中的哪1美元并不重要,重要的是当一天结束时,有人投资了1美元,并希望在一段时间后获得回报。这使资本成为一个可替代的生产要素,因为某张1美元的钞票可以被任何一张其他1美元钞票所替代,而这种替代并不会影响基金的业绩。

然而,如果同一个基金接收1个单位(如1MB)的数据用于研发一种新的交易算法,那么并不是所有数据都会平等地为这一目的服务。数据可分为健康数据、财务数据、地理位置数据、天气数据、公共数据、私有数据、精选数据、噪声数据等,其中一些数据将服务于该基金以训练其算法,而另一些数据则不会。这使数据成为一种不可替代的生产要素。

只要数据量足够庞大,就会创造价值。 虽然少量数据在非常特殊的环境中也可能很有价值,但它们对于业务分析、算法训练或趋势识别毫无用处。因此,在大多数情况下,只有先将数据聚集起来,形成大量数据,它们才会产生价值。

此外,与资本和劳动力不同,数据的使用具有非排他性,这意味着同样的数据可以同时被多人使用。例如,许多基金可以同时使用同样的数据 2 。这与资本和劳动力的情况不同,因为一美元一次只能投资一只股票,而一名工人也不可能在同一时间出现在多家公司。随着时间的推移,数据会发生变化。每天,甚至每小时,数据都在发生变化,这意味着数据会过时,因此数据越新越有价值。举个例子,想想股票的价格,预先知道一只股票的价格是非常有价值的,而知道已经完成的交易价格则没什么价值。

与主体有关的数据属于该主体本身,与一个组织有关的数据属于该组织本身。这意味着,未经数据所有者知情并同意,出售、共享、交换私有数据是不恰当的,甚至可能是非法的。

在许多情况下,数据并非由某一方单独创建,而是由双方或多方交互创建的。还是以股票交易为例,股票的交易价格由买家和卖家共同决定,只有买家和卖家之间的互动才能产生交易及相关数据。

无法公开交易的数据

与资本和劳动力不同,数据目前并未在市场上公开交易。因此,如公司、基金、协会、投资者、银行、交易员、政策制定者、研究人员等各个组织往往只使用公开的数据或组织内部生成的数据 3

目前还未出现用于个人数据交易(个人将其数据单独出售给第三方)的透明数据市场,这是由数据的性质决定的。首先,数据是不可伪造的。因此,个人、公司或组织无法将其数据直接出售给第三方,原因很简单:潜在的购买组织需要在购买数据之前对数据(可能是非结构化数据)进行审计,以评估将要购买的数据是否合格。这样做尽管在技术上是可行的,但实现过程十分烦琐,而且成本很高。其次,为了训练算法,组织只对大量数据感兴趣,因为在大多数情况下,只有大量数据才能产生价值。再次,在未事先告知特定个体并征得对方同意的情况下,向第三方提供能识别个体身份的特定数据是非法的。最后,某些组织的数据可能非常敏感,组织可能不想让第三方直接访问这些数据。

“数据无法安全透明地进行交易”这一事实代表了市场摩擦,因为资本、劳动力和石油可以在公开市场上自由流动到那些回报率高的公司(资本和石油是以利息的形式计算回报率,劳动力则是以工资的形式计算),而数据却不行。如果只有不透明的交易发生,那么组织参与数据市场中的活动的行为就会受阻。因此,不是所有组织都能进入数据市场。购买数据方面也没有标准,从而无法促进各种组织资源的有效分配。

数据交易所,透明、高效和安全的数据共享

作为上述问题的一种解决方案,为实现合规、高效、安全的数据共享和交易,数据交易所应运而生。 数据交易所是一类平台,它有权从公司、大学、基金、银行、个人等许多不同来源收集、整理和汇总数据,从而使第三方能够从这些数据中获得价值(知识)。 数据交易所是拥有数据的个人或组织与第三方之间的平台。考虑到数据作为生产要素的特殊性,数据交易使结构化、安全和合法生成基于聚合数据的见解成为可能,从而得以创造价值。此外,考虑到数据交易所汇集了许多代理人的数据,这些人也被告知数据具有的价值,他们因此能以适当的价格出售基于数据的见解,并能在对这些见解有贡献的个体之间分配获得的收益。

具体来说,数据交易所允许第三方在交易所的平台上运行经过隐私审查的计算机代码,以分析属于个人的数据。这样一来,数据交易所减轻了数据不可替代的问题,因为它们可以将代码应用于每个与第三方相关的具体数据。

此外,由于数据交易所聚集了许多来源不同的数据,因此可以提供算法所需的数据量以产生价值。此外,由于数据交易所汇总了许多数据所有者的利益,因此在进行价格评估和谈判时处于更有利的地位。使用数据交易所提供的见解无法追溯到任何单个的公司、主体或组织,这解决了隐私和许可的问题。 数据交易所的终极目标是在所有组织都能平等访问的聚合数据所产生的见解基础上实现透明、高效和持续的交易。

关于如何建立数据交易所的建议可能众说纷纭,但这些建议有一些共同的特点。首先,它们直接或间接地假设数据是不可替代的,因此有必要对数据进行定制化分析。其次,它们假设平台用户和公司用户有权拥有数据的数字化副本,并且副本可以由第三方(数据交易所)托管。

麻省理工学院媒体实验室、英国帝国理工学院、Orange 、世界经济论坛和大数据-人本联盟 共同发起了“OPAL倡议” 4 ,来约定数据交易的标准。“OPAL倡议”的目标是以不侵犯个人数据隐私的方式,提供大量数据以供分析。该倡议通过使用三个概念来实现这一目标:第一,算法进入数据所在的环境,其目的是使数据在其原始存储库中始终保持安全,数据库所有者能够控制数据库的访问权;第二,只返回综合答案或“安全答案”,执行的算法是公开的,所以它们可以被专家研究并审定为“安全的”;第三,数据始终处于加密状态。

当要分析的数据因其敏感性而需要保密时,加密就特别有用。在使用数据创造价值的同时,隐私可以受到保护,同时又能为在其上执行的算法生成答案。

社会将拥有一种新的、开放的数据来源,用于执行算法以产生知识,这是建立数据交易所的经济后果。各组织将能够利用它们没有的数据来获得自己需要的结果。这使数据突破了产生数据的组织界限,成为医院、大学、基金、投资者、交易员、银行和所有组织的生产力。这意味着数据将摆脱存储的孤岛,并能够产生可以在经济中自由流动的价值。这将解决前面提到的市场摩擦,进而带来更快速的经济增长。

参考其他生产要素,实施数据交易对经济的积极作用不亚于拥有一支受过良好教育的劳动力队伍,或发现新的石油或黄金储备。(它们的不同之处在于,劳动力、石油和黄金一次只能被一家公司使用,而数据可以在许多公司之间共享。)这将解决市场摩擦问题。被视为生成要素的数据可以同时被许多公司使用,这将使这些公司产生的基于数据的知识成倍增加。

建立数据交易所的一个结果是金融部门的现有组织,如信用社、银行和基金,可以通过将自己纳入数据交易所来转变业务战略,并将这些数据货币化。虽然数据所有者尚不清楚通过出售数据可能产生的具体收入,但这可能是对当前收入的重要补充。这些组织可以继续将产生的价值传递给供应链的较低部分,即传递给对产生这些数据有贡献的个人。

建立数据交易所的另一个结果是,现有企业将不得不面对新的竞争对手。如今,一支拥有聪明的想法、训练有素的团队(劳动力)和一家有大笔投资(资本)的小公司可能很难与成熟的行业巨头竞争,因为数据的缺乏将阻止小公司竞争和开发有用的算法,或者无法对用户有足够的了解。随着数据交易所的建立,规模较小的公司也可以在数据交易所存储的数据上执行它们的算法,它们因此可以获得与现有企业相同的生产要素(数据)。

从美国联邦储备委员会三年一度的消费者财务调查中,就可以看出数据交易所对知识生成可能产生的影响。该调查收集了关于家庭收入、净资产、资产负债表组成、信贷使用和其他财务结果的信息 5 ,它是美国经济中确定家庭金融福利的重要数据来源。

研究人员利用调查提供的数据进行分析,并进一步提出经济政策建议,这使得消费者的财务调查数据非常有价值。然而,由于收集和构建数据的难度很大(该调查涉及接近7 000个家庭),该调查每三年才进行一次。更频繁地收集来自更多家庭的数据可能会对投资者、私营公司、政策制定者和研究人员非常有帮助,通过家庭财务数据交易来升级该调查将是一种更高频地获得更广泛数据的方式。由于使用这种稀缺而有价值的数据的组织可能有兴趣为升级后的数据付费,因此公众将有动力经常更新他们的数据。这将建立起一个更广泛的数据基础设施,所有组织都可以使用它来产生新的知识,而向这些数据基础设施提供个人数据的公民有望从中获得切实的经济回报。

章末总结 数据要素化,超越“数据即新石油”的洞见

人们理解了数据作为生产要素所具有的特性(超越了“数据是新石油”这一肤浅的想法)以后,才能够理解数据究竟是如何运作的,以及应该如何与数据交易所进行恰如其分的交互 。理解“数据是不可替代的、非排他性的生产要素”对此至关重要。认识到数据的特点,以及如何通过分析数据产生知识和价值,人们(作为个人或组织)就能够自发形成有效的组织,与数据交易所进行数据交互,以实现他们的最佳利益。对那些向数据交易所提供数据的人来说,这将为他们提供一种新的收入来源。对那些在数据上执行算法的人来说,这意味着更多的知识,最终也会带来更多价值。

建立数据交易所将为个人和组织创造新的机遇。正确理解数据是一种生产要素,可以帮助整个社会更好地抓住“数据要素化”所带来的机会。 snsNJpSRFoQudtkmHlPk78hw3pycWQYQ5yhLtKI1p7pouPzP6RjQm4ceizQ1D5wQ

点击中间区域
呼出菜单
上一章
目录
下一章
×