



受新的交付机制(如数字音乐流媒体)的出现、年轻一代听音乐习惯的改变、消费者对音乐所有权观念的转变,以及与音乐版权相关的复杂法律等多重因素影响,代表复杂商业生态系统的美国音乐产业,目前正面临着重重挑战,并进而影响音乐供应链中的所有参与者 1 。
如今,艺术家和音乐家已成为零工经济的重要组成部分,其处境也和零工工作者越来越相似 2 ,即作为纯粹的艺术创作者,他们想要维持基本的生活已经愈发困难。有些人将此归因于他们无法及时了解自己作品的许可证发放情况,因而无法对未来的收入情况进行合理的预判。事实上,一方面,对许多的作词者和音乐家而言,他们通常要等上好几个月才能拿到版权费;另一方面,在许多情况下,特定音乐作品的实际作词者或艺术家的身份无法确定,这导致世界各地的托管账户中存在很多应付款项到期仍无人认领的情况 3 。
在过去20年里,音乐行业因为自身在技术进步方面(如数字交付、云服务、数字身份)的投资不足,所以错过了多个与数字音乐相关的发展机遇(如20世纪90年代末的Napster案
4
)
。如今的音乐生态系统仍在使用过时的会计核算体系(如交换Excel电子表格),这也导致了行业总体效率低下、版税报表混乱、延迟支付,以及由于音乐标签错误而引发的错误支付等诸多问题
5
。
本章将把艺术家和音乐家作为零工工作者来看待,并在此背景下探讨数据合作社的概念,以及研究如何在共享平台上进行有关音乐的权利与许可管理,以降低运营成本和操作复杂性。我们还将以麻省理工学院和伯克利音乐学院的RAIDAR项目 6 为例,讨论未来该如何在强化音乐版权问题的原则下,进行IT基础架构的设计与开发。
本章作者:托马斯·哈德乔诺
阿莱克斯·彭特兰
过去10年,在个人数据的处理与合理使用方面,人们的信任度持续下降 7 。随着大数据与高级分析、人工智能相结合的力量日益为公众所接受,现在的人们已经越来越深刻地意识到社交媒体平台对他们日常生活的巨大影响,包括影响他们在网站和其他媒体上看到的广告,以及他们在网上购买的商品和享受的服务类型等诸多方面。皮尤研究中心的报告显示:91%的美国人认同或高度认同消费者已经无法阻止个人数据的被收集和被使用;80%的社交网站用户表示他们对第三方获取自己的共享数据深感担忧 8 。
世界经济论坛在其2014年关于个人数据的报告 9 中指出了个人数据管理和使用信任度下降的问题,并提出了改善建议。这些建议包括以下三个方面:一是通过提升个人洞察力及为他们提供有意义的控制手段来提高透明度;二是明确个人在整个价值链上(从前端到后端)的定位并更公平地分摊风险,以改善问责制度;三是赋予个人对其数据如何使用的决定权,并赋予他们能将数据用于个人目的的权利。
在对管理和合理使用个人数据的信任度持续下降的大背景下,零工经济的出现,以其非传统、独立、短期工作关系等典型特征,让许多人的就业模式悄然改变。在某种程度上,一方面,新的技术平台为以前无法施行的零工就业铺平了道路,并使得新的零工就业形式得以崭露头角,如拼车服务;另一方面,技术的进步也使得零工就业者成为不得不依托于零工平台而生存的“俘虏”。
基于2014年世界经济论坛报告的相关建议,本书提出了“数据合作社”的概念。在第1章中,我们将数据合作社定义为一个归其成员所有的组织,该组织对其成员个人数据的访问、管理和使用负有法律信托责任 10 。简而言之, 数据合作社是一个由一群有着共同目标的人自发聚集在一起形成的组织,该组织成员间可以共享其个人数据、数字资产和其他权利。
图3-1展示了一个基于麻省理工学院开放算法原理建立的数据合作社模型。
图3-1 基于麻省理工学院开放算法原理建立的数据合作社模型
数据合作社成员间可以共享的内容繁多,这些内容被统称为“个人数据”。个人数据不仅包括个人使用各类电子设备生成的数据(如位置数据)、使用第三方服务产生的数据(如通话记录数据)、个人独有的生物医学数据(如DNA序列),而且包括某些特定类型的工作所形成的结果(如医院护士的工作时间表),或因履行本职工作所产生的数据(如作曲家的作品在社交媒体上的播放次数)。至于具体共享哪些数据,取决于合作社的性质和目的,而且必须由合作社的成员决定。此外,合作社还可能为其成员提供数字身份管理服务 11 。
合作社成员可以将其个人数据和数字资产存储在数据合作社中(如存储在其云基础设施中),也可以将其存储在其他地方(如个人数据存储库中),并允许合作社其他成员远程访问其副本 12 。数据合作社是一个为成员所有的自发性组织,因此成员可以随时离开,也可以随时删除其个人数据和其他资产,并始终享有其个人数据和数字资产的合法所有权。
对音乐产业的全面讨论超出了本书的研究范围,且相关论述也已存在 13 , 14 。为便于讨论,本书对音乐许可供应链中常见参与者的角色和任务进行了高度提炼,数字音乐授权供应链示意图如图3-2所示。当创作者(作曲家或作词者)进行音乐创作(如音乐作品或乐谱)时,作品一旦完成(如记录在一张纸上),他们就拥有该作品的版权。为便于进行版权交易,创作者通常会委托音乐出版公司代表自己进行业务关系的管理(如管理合同)。当唱片公司想要找一位录音艺术家录制一首歌时,它必须从音乐出版公司(或直接从创作者)那里获得机械许可(Mechanical License)。这里的“机械”一词源于使用物理设备(如磁带卷)或物理媒体(如黑胶唱片或光碟)获得声音记录的时代。
图3-2 数字音乐授权供应链示意图
类似地,当声田、潘多拉等音乐流媒体服务商(它们通常被更正式地称为数字服务提供商)在向消费者提供流媒体服务时,它们必须首先从拥有合法录音版权的唱片公司那里获得相应的演出许可。为了收取和支付数字表演(如流媒体)产生的版税,美国国会在2003年成立了一个名为SoundExchange的非营利性集体版权管理组织。SoundExchange的主要作用之一就是为数字表演设定版税率。在音乐出版方面,成立于1927年的哈里·福克斯代理公司负责代表美国的音乐出版公司管理、收取和支付机械许可的费用。
移动设备的崛起,给消费者的听歌习惯带来了革命性的改变。越来越多的消费者希望,即使在无法连接互联网的情况下,他们的移动设备也能够提供音乐点播服务。同时,随着互联网接入服务提供商服务质量的提高,音乐发行机制也发生了巨大的变化。消费者不再需要通过广播或电视等传统媒体收听音乐,他们可以直接通过互联网获得数字(或数字化后的)音乐。因此,许多数字服务提供商(如声田)已经放弃了传统唱片公司用于实体发行(如黑胶唱片或光碟)的许可模式。这些颠覆性的改变直接导致唱片艺术家和音乐家的收入减少,这一点我们从大量由艺术家发起的针对声田的诉讼中可见一斑。 由于大多数艺术家和音乐家从现场表演(演唱会)中获得的收入已经超过从数字流媒体中获得的收入,因此他们正日益成为真正意义上的零工工作者。
伯克利音乐学院和麻省理工学院牵头开展了一项名为“开放音乐”的活动,并希望通过探索新的技术手段和激励机制,促进开放音乐新生态的发展。在各方的共同努力下,2017年,各成员达成了开放音乐倡议 15 ,并通过论坛的形式就全球未来音乐产业的技术、商业和就业模式等各个方面进行了深入探讨。
我们相信,作为零工工作者的艺术家和音乐家,将基于数据合作的理念,成功地构建数据合作的组织,后文也将就数据合作社的某些方面进行讨论。
目前,音乐供应链存在的一个重要问题是,特定音乐作品(如单个作品或录音带)的创作过程缺乏一致、完整、权威的信息或元数据。音乐供应链中的许多实体往往通过手动重复输入相同信息,或通过从其他站点抓取数据的方式,来创建音乐作品不同版本的元数据
16
。在这种情况下,同步或纠正信息的工作就变得非常费力,且容易出错
。此外,关于音乐作品合法所有权的机密信息通常混杂在同一元数据中,这样会使整个数据库因成为专有数据库而被拒绝访问。目前,音乐行业已经创建了元数据文件格式的标准(如基于XML格式的DDEX格式),但还没有全行业普遍采用的标准用来定义收集、显示和验证创作元数据
的工作流程。然而,正如G.霍华德(G. Howard)
17
和N.梅西特(N. Messite)
18
所说,元数据工作流程标准的缺失仅仅是困扰整个行业的众多问题之一。
我们认为,音乐行业需要参照图书出版、图书馆系统和汽车零部件供应链等行业的开放访问范式,构建一种可选择的针对创作元数据的模型。创作元数据需要独立于所有权元数据,也要独立于许可元数据。同时,创作元数据不得包含实际的音乐作品本身(如录音MP3文件),也不能携带音乐作品的合法所有权或版权信息。
在帮助艺术家和音乐家管理其音乐作品方面,数据合作社展现了极大的吸引力。因为数据合作社不仅可以帮助艺术家和音乐家在共享IT基础设施的前提下创建权威的元数据,还可以让他们在掌握元数据文件和音乐作品(如MP3主文件和歌曲合成文件)控制权的前提下,实现对这些宝贵资源的低成本管理。数据合作社通过分布式账本进行元数据管理的流程如图3-3所示。
图3-3 数据合作社管理元数据的流程示意图
在过去几年里,作为一种潜在的新范式,分布式账本和区块链系统 19 已经赢得了艺术家和音乐家的广泛关注。基于这种新范式,当艺术家和音乐家的作品被消费者采用时,他们可以及时获取作品被采用情况的准确信息,并可以通过更直接的交易行为和付款方式,维持一种可持续的谋生方式 20 。
数据合作社通过为艺术家和音乐家提供分布式账本,来强化与音乐版权和许可相关的任务或功能,并使得这些任务和功能得以自动完成。例如,合作社可以建立元数据注册表分类账
,合作社成员将其创作元数据记录在该账本上。分类账的条目中包括一个全球唯一的可解析标识符,通过它,互联网上的任何人都可以访问完整的创作元数据文件副本。
这种方式的好处非常明显。首先,将音乐作品的带签名的注册表元数据文件“发布”到注册表分类账中,可以为创作者的版权主张提供法律支持。分布式账本整体上起着“公证”服务的作用,只有合作社的成员才有向账本中添加新条目的权限,而其他人只可以读取元数据和通过分类账交易条目验证数字签名。这种基于分布式账本的公证,为音乐作品提供了不可篡改、不可否认且带有时间戳的公共证据。其次,元数据注册表分类账与元数据存储库一起,为特定音乐作品提供了出处信息的权威证明。作为音乐作品元数据可开放读取的注册表,注册表分类账已成为元数据的可信来源,并可被其他类型的基于分类账的交易以链接的形式引用,如处理许可证发放和权属交换的智能合约。因此,即使现有系统是老旧数据库,也可以实现对注册表分类账中相关条目(如交易ID)的引用。
艺术家和音乐家认为,作为一种更直接的交易参与模式,分布式账本和智能合约的发展前景极为广阔。作为点对点(Peer-To-Peer,P2P)网络节点上可用的存储过程或函数(代码),智能合约为提高业务流的工作效率提供了诸多颇具前景的功能。在音乐合约供应链管理的背景下,在实现与合约供应链不同阶段相关的不同业务逻辑方面,智能合约有着多个潜在的应用领域。例如,对于受版权保护的音乐作品,智能合约可用于实现其许可逻辑(如表演许可和机械许可)、追踪授权支付情况、向正确的权利人支付特许权使用费,以及撤销已授予许可证或自动过期的授权等多种用途。
数据合作社可以帮助艺术家和音乐家拟定基于特定分类账系统的智能合约,通过将与许可证相关的法律条款进行标准化
,让艺术家和音乐家只需要考虑作品的定价问题。这种共享智能合约通用模板的方式,有效地为艺术家和音乐家节省了法律费用。此外,数据合作社还可以为其成员,甚至可以为其他数据合作社建立分布式账本,从而使世界各地不同的数据合作社可以共同分担分类账的运营成本。
数据合作社版权许可管理分类账和智能合约流程示意图如图3-4所示。在这种模式下,作曲家或作词者通过智能合约,将其音乐作品的使用许可授予其他参与者,比如音乐出版商和其他艺术家。为便于智能合约可以准确地引用(指向)被许可的音乐作品,作曲家或作词者必须提前将元数据记录到元数据注册表分类账上。当音乐作品存在多个版本,比如不同长度的录音版本时,这种做法将有效提升授权许可的精准性(见图3-4的步骤①到步骤③)。在最简单的情形下,智能合约代码可以包含许可协议的法律条款,这种智能合约被称为李嘉图智能合约(Ricardian Smart Contracts) 21 ,且代码仅需调用被许可方(如音乐出版商)的数字签名。
图3-4 数据合作社版权许可管理分类账和智能合约流程示意图
当被许可方寻求获得某项作品的版权许可时,被许可人需要在许可管理分类账上选择正确的智能合约。根据智能合约的具体执行要求,被许可方可能需要提前付款(如使用单独的付款机制),并向智能合约提供付款凭证(见图3-4中的步骤④到步骤⑦)。如果使用了付款凭证分类账,则可能需要“拆分”智能合约(见图3-4中的步骤⑨),即在版权由多人共同持有的情况下,比如由多个作词者共同创作的作品,自动将费用按正确的比例支付给所有相关的权利人。
目前,音乐供应链存在的一个重要问题是,对于特定音乐作品的创作过程,缺乏一致、完整和权威的元数据。类似于其他供应链(如运输中的集装箱货物),音乐供应链也需要关于项目的准确信息,以便于跨供应链的参与者可以同步其业务流程。为此,麻省理工学院连接科学实验室和伯克利音乐学院正在牵头开发技术解决方案,从而将开放访问音乐元数据层的各种架构标准化 22 。该项目意在探索与创建互联互通元数据存储库相关的技术问题,以及弄清楚在基于分布式账本或区块链系统下,新的开放访问音乐元数据层如何才能成为未来音乐相关交易的基础。本书使用“创作元数据”或“元数据”表示给定音乐作品(如作曲、录音)的事实信息,而不包括音乐作品本身(如录音文件)。
目前,音乐行业已经创建了元数据文件格式的标准(如基于XML格式的DDEX格式),但还没有全行业普遍采用的标准用来定义收集、显示和验证创作元数据的工作流程。元数据的不同部分或“片段”,通常由音乐供应链上的不同参与者保存在不同的位置 23 。基于先进的分布式数据库和紧密同步交易系统(如纳斯达克、纽约证券交易所和其他证券交易所),其他行业(如金融业)的数据准确性问题已基本得到解决。我们相信,音乐元数据问题应该是当前音乐产业需要解决的首要问题。然而,正如G.霍华德 24 和N.梅西特 25 所言,缺乏元数据工作流程标准,仅仅是困扰整个行业诸多问题中的一个。
在本节中,我们使用了“音乐作品”来表示单独的歌曲、作品或曲目,并将歌曲作品和录制的歌曲视为两个独立的音乐作品,即使这首歌曲的作词者(或作曲家)和录音艺术家(或表演者)是同一个人。我们使用了“创作元数据”来指代给定音乐作品的事实信息,创作元数据不包含实际音乐作品本身(如录音MP3文件或WAV文件),也不得携带音乐作品的合法所有权或版权信息。这好比存储在美国国会图书馆和其他图书馆里的一本书的书目描述,并不包括这本书本身,也不包括关于该书版权的所有者信息。我们使用了“权利元数据”来表示与音乐作品法定所有权有关的信息。通常,权利元数据可能会被视作涉密信息,因此不宜对外公开。我们使用了“分布式账本”(或简单的分类账)来表示广义的区块链系统和网络概念。综上所述,本章将要描述的架构可以通过各种分类账,如以太坊(Ethereum) 26 、R3或Corda 27 和超级账本 28 来实现。
因此,对给定的音乐作品(如一首歌或曲目)而言,其元数据信息的每个基本单元都应该刚好有一个权威的创作元数据文件与之对应。创作元数据文件带有数字签名,并可从世界各地多个元数据存储库中公开读取,其作用主要是检测文件是否被未授权者修改。如果某个音乐作品有多个版本(如原始发行版、混音版),则必须为每个版本生成一个单独的创作元数据文件,并为其签名。
每个音乐作品都有一个权威的创作元数据文件,这使计算过程和系统可以基于明确的元数据进行操作。当通过计算机程序(如传统软件或智能合约)进行音乐作品的授权许可时,被许可方(个人或企业)可以通过智能合约“指向”其感兴趣的、确切的创作元数据文件。如果一个音乐作品有多个版本,如不同版本的录音,且被许可方想要获得所有这些版本的许可,则许可文件可以直接指向每个版本对应的创作元数据文件。因此,这种开放访问的音乐元数据层,对于降低业务交易的复杂性和音乐作品的识别错误率,以及降低整个音乐供应链的运营成本都至关重要。
音乐元数据层的技术架构需遵循以下设计原则。
第一,在上游作品创作端收集数据。 艺术家、音乐家和相关制作方(如工作室工程师、制作人、经理)需要获得正确和简便的工具(如软件)授权,以便将创作信息捕获到元数据文件中,并添加数字签名(本地化),以作为确认元数据出处的“权威”手段。在现有系统中,数字音频工作站可能是在供应链中捕获创作事件事实信息的合适切入点。
第二,创作元数据与版权音乐作品分离。 出于隐私和版权保护的考虑,音乐作品(如歌曲和录音)必须与创作元数据文件分开。目前,市场上有多种访问控制模型、机制和解决方案,如OAuth 2.0 29 、OpenID Connect 30 、UMA 31 ,可以为这些宝贵的资源提供受保护的访问。
第三,所有权信息与实际的创作元数据分离。 作品的所有权信息与创作元数据应该是分离的。因为所有权信息可能是保密的,而且随着时间的推移,音乐作品的所有权通常会被出售或被购买。但无论作品的所有权如何变更,其创作元数据都始终保持不变。
第四,创作元数据可以开放访问。 目前,开放访问的理念在其他行业和部门已约定俗成,音乐元数据层也应采用开放访问原则。
为促进全人类的知识进步,如今,许多出版物,如书籍、报纸、期刊等都已实现了开放访问 32 。私人合同和机密信息不应放在这些开放访问的元数据存储库中。同样,实际的音乐作品(如录音主文件)也不应放在开放访问的空间中。音乐元数据的开放访问原则,将有利于更精准地确定音乐作品是归属于艺术家、音乐家,还是其他相关个人或实体。
此外,开放访问的音乐元数据层,使粉丝能获得更多关于音乐作品创作的细节信息(如音乐家使用的是什么类型的键盘)。元数据文件与关键词和短语之间的链接关系,使得在音乐元数据层上进一步开发智能搜索功能成为可能。音乐元数据的开放访问原则如下:
·
音乐作品要进行哈希加密。
为表现音乐作品的引用关系,每个创作元数据文件都必须包含一个加密的哈希值
(如MP3录音文件的哈希值)。因此,元数据文件和对应音乐作品之间,有着精确的一对一映射。
· 元数据格式和编码的标准化描述。 由于创作者所在社区编码规则的不同(如Unicode、中文GB),未来元数据的格式也会五花八门(如DDEX-XML 33 、JSON)。因此,为便于读者(即客户端软件使用者)获取和解析这些元数据文件,每个元数据文件的标题都必须使用标准格式。
· 元数据单元带数字签名且可移植。 元数据的基本单元(如歌曲、曲目或作品)必须由权威实体添加数字签名,如由艺术家、作词者、作曲者或其他获得授权的人来签名,从而使元数据单元是可追溯的,并能成为一个可移植和可复制的单元。同时,每个元数据文件必须携带一个全球唯一的数字标识符,以使其区别于其他元数据单元。
图3-5(a)对具有唯一数字标识符的创作元数据文件进行了说明,最后一部分显示了发行人的签名(如X.509 34 或XML-DSig 35 )和公钥。
· 元数据单元副本可访问。 签过名的元数据文件必须在互联网上的多个位置向公众开放。用户可以通过标准化的应用程序接口(Application Program Interface,API),并基于元数据文件使用的数字对象唯一标识符(Digital Object Unique Identifer,DOI),在互联网上的多个元数据文件副本中找到并访问需要的文件。
图3-5为创作元数据和注册表元数据示意图。其中,图3-5(a)表示完整的创作元数据存储于去中心化的存储库中,图3-5(b)表示记录在分类账上的较短的注册表元数据,通过链接(或哈希值)指向完整的创作元数据,以证明创作元数据的真实性。
图3-5 创作元数据和注册表元数据示意图
· 文件标识符全局唯一且可解析。 在注册的命名空间里,每个元数据文件都会被分配一个唯一的标识符,该标识符将帮助用户从世界各地众多的存储库中找到所需的文件副本。
数字对象唯一标识符 36 及其附带的句柄解析系统 37 作为数字标识符方案,已成功地大规模部署了十余年。与域名系统(DNS)基础架构的协议行为类似,通过DOI和句柄,可以高效查找存储在全网开放存储库中的数据文件(如图书馆书目)副本。
· 对签名元数据基于分类账的公证。 分布式账本可用于对每个签名元数据单元或其简短摘要进行公证。为方便起见,这里将较短的元数据称为注册表元数据。注册表元数据要存储在分布式账本上,创作元数据和注册表元数据必须使用同样的数字标识符(如DOI),以表明它们都指向同样的音乐作品。对注册表元数据的公证,为音乐作品提供了进行篡改检测的时间戳。
图3-5(b)说明了通过元数据注册表分类账进行公证的概念,并显示了要记录在分类账上的较短的注册表元数据。对于想要获取元数据文件版本的用户,系统必须通过检查分类账,以确保其拥有的是最新的版本,如基于已确认交易的时间戳。
· 支持多版本的音乐作品。 很多时候,对于同一音乐作品,艺术家和音乐家可能会创作出多个不同的版本。例如,对于给定的录音,艺术家可能录制了短版(如2分钟)、长版(如3分钟)和扩展版(如6分钟)。由于元数据文件中包含了音乐作品(如MP3文件)的加密哈希值,这就意味着必须为每个版本创建一个单独的元数据文件。此外,这也意味着每个元数据文件都必须拥有唯一的标识符,这对被许可人快速且精准地找出其所需的授权录音版本有着极大的帮助。
· 支持元数据的多个修订版本。 即使是在供应链的上游创作端(如在DAW软件中)收集数据,也不可避免地会存在元数据信息错误。当需要对元数据文件进行修订时,被修订(旧)的元数据文件仍需继续保留。在编写新的修订版本时,需要给新版本的元数据文件重新分配一个文件标识符,且必须与上一个版本建立链接关系(如通过哈希值),以向用户(客户端软件使用者)表明存在版本更迭。这个原则类似于软件工程开发中的源代码版本控制,且相关技术目前已非常成熟,如应用于SVN或GitHub的版本控制技术。
因此,当要通过注册表分类账对修订版进行公证时,新的注册表元数据必须精准指向(如通过哈希值)先前确认的注册表元数据(如先前确认的注册表元数据交易的ID)。
· 支持元数据的归档和修订。 被修订(旧)的元数据文件绝不能被删除,而必须使用前文提及的相同的复制存储库架构进行归档。存档的元数据文件必须开放访问权限,以便对元数据信息的出处和修订过程进行追踪。
这种将开放访问元数据与通过注册表分类账进行公证相结合的方法,至少有以下三个好处。
一是支持版权主张。通过将带签名的音乐作品的注册表元数据文件“发布”到注册表分类账上,可以为创作者的版权主张提供法律支持。同时,通过使用分布式账本进行公证(带有交易签名行为),为音乐作品的存在提供了相对不可篡改、不可否认且带有时间戳的公开证据。
二是作为其他分类账和系统的音乐元数据的事实基础。作为音乐作品元数据的开放注册表,注册表分类账实际上就是元数据的真实记录。元数据可被其他类型的基于分类账的交易(如许可证申请智能合约和许可证授权智能合约)直接引用。因此,不论是现有的系统(如老旧数据库)或未来的系统(如集中的机械授权或曲目数据交换系统),都可以对注册表分类账中的相关条目(如交易ID)进行引用。
三是实现数字身份和公钥之间紧密绑定的重要契机。如果需要对创作元数据进行数字签名,以及对提交到注册表分类账的交易进行签名,就必须对签名者的公私密钥对进行管理。业界基于人员身份强识别的数字证书创建标准已经存在了20余年 38 。目前正在努力尝试通过区块链系统,以去中心化的方式保持这种绑定 39 。
此外,开放访问元数据与通过注册表分类账进行公证相结合的方法,也为解决当前音乐行业版权费所有人(个人或法律实体)的识别问题,提供了可靠的实现路径 40 。
为提升创作元数据的可用性和可靠性,特定音乐作品的创作元数据应该是可以被复制的。要实现元数据存储库的可复制性,有以下几个基本要求:
· 复制技术的独立性。 随着时间的推移,数据库和复制技术也将不断发展,因此作为基本单元的创作元数据,必须可以从一个存储库“移动”(复制)到另一个存储库。
·
元数据存储库的标准化API服务。
客户端应用程序所使用的、用于读取和写入元数据存储库的RESTful API
必须进行标准化。对API的定义必须独立于API后端存储库的技术实现。同样,调用API服务的客户端应用程序也不需要了解服务的后端实现方式。
· 保留标准化的签名数据导入和导出格式。 当从元数据存储库导出(读取)元数据文件时,该文件必须使用标准化的数据格式,并且原始元数据文件的数字签名部分(最初由其创建者提交)必须保持有效。
链接关键词和检索标签的复制元数据存储库示意图如图3-6所示。
图3-6 链接关键词和检索标签的复制元数据存储库示意图
②此处的伯克利是一个开源的文件数据库。——译者注
例如,有这样一种情况:艺术家使用客户端应用程序(如DAW),以给定格式(如JSON)编写一个新的创作元数据文件,并根据相应的公钥和签名标准(如JSON Web signature)对该文件进行签名。当艺术家通过客户端应用程序将该文件提交到本地元数据存储库时,该存储库可以根据其内部数据存储架构,在存储库中对元数据文件进行解析存储。但是,当其他用户稍后从该开放访问存储库导出(读取)元数据的副本时,存储库必须能够将该副本重新还原成原始创作元数据,以便其他用户可以验证其原始签名。
图3-7所示为创作元数据和注册表元数据示意图,图3-7(a)展示了创作元数据文件各组成部分的核心部分。
第一部分:元数据文件数字标识符①。第一部分是创作元数据文件的数字标识符,用DOI来表示 41 。长期以来,这种方式已在世界各地成功应用。
第二部分:音乐作品元数据②。第二部分是实际的音乐作品元数据,该部分可以使用现有的音乐元数据格式(如基于XML格式的DDEX RIN、JSON格式)或其他格式。该部分的标题必须标明元数据的格式和编码。需要注意的是,元数据文件不得包含音乐录音文件或法定所有权信息。
第三部分:录音文件的加密哈希值③。创作元数据文件的第三部分是录音文件的加密哈希值。例如,可以是录音文件的母版文件(如MP3、MPEG-4文件)的哈希值,也可以是其注释文件(如PDF、Sibelius、Finale文件)的哈希值。通过录音文件的加密哈希值,元数据文件和录音文件之间得以建立正确的一对一映射。当给定的音乐作品有多个版本(如录音的长版、短版或混音版)时,这种精准匹配在业务处理中就变得非常重要。
第四部分:发行人的签名和公钥④。第四部分是发行人的签名和公钥,创作元数据的权威发行人必须对元数据的组成部分(即前三个部分)进行数字签名。
数字签名使用公钥数字签名和时间戳的现有标准技术来执行,且必须包含用户验证文件所需的标准信息(如签名算法ID 42 )。
因此,对创作元数据文件各组成部分的任何数据进行任何修改的尝试,都将导致签名验证失败——向用户表明创作元数据文件不再可信(它已被篡改)。
图3-7(b)为注册表元数据文件的组成部分,图3-7(c)为单独的关键词/索引数据库的创建过程,图3-7(d)为将实际的录音文件放入受保护的文件存储库中的过程。
图3-7 创作元数据和注册表元数据示意图
音乐元数据层使用一个或多个分布式账本网络,来创建基于简单共识的、经过公证的注册表分类账。由于创作元数据文件可能很大,并且大多数基于分类账的交易系统都不会存储太大的文件,因此在注册表分类账中只会记录元数据的简短摘要,即注册表元数据结构。
较短的注册表元数据将被记录在注册表分类账上,其产生的交易ID稍后可以用作在其他系统和分类账上实现业务逻辑和多方交易的参考。注册表元数据必须始终携带与创作元数据相同的数字标识符(如DOI),以表明这两种数据结构指向的是同一个音乐作品。
采用注册表分类账主要有两个目的。
第一个目的是支持多副本注册表元数据文件的获取和查找。 通过点对点网络节点,注册表分类账为注册表元数据提供了多个副本。每个节点独立保存一整套已确认的交易块,且每个交易块都是注册表元数据结构。注册表元数据文件数字标识符部分与创作元数据文件数字标识符部分有着相同的数字标识符(如DOI)。因此,通过使用在简短注册元数据(在公共的注册表分类账上)中找到的DOI,任何实体都可以在互联网上的一个或多个存储库中获取创作元数据文件的完整副本。
包含元数据注册表的区块中的交易示意图如图3-8所示,图中有灰底的字段为创作元数据文件的副本。
图3-8 包含元数据注册表的区块中的交易示意图
第二个目的是支持引用其他基础架构上持久的链上记录。 元数据注册表分类账为其他基础架构和系统提供了可信赖(即可以“指向”)的持久证据。因此,作为授权许可智能合约的一部分,在不同分类账或区块链系统上实施的音乐许可方案,都可以“指向”注册表分类账上的注册表元数据。同样,在业务逻辑处理软件中,老旧系统和数据库也可以直接引用注册表元数据的交易ID(在分类账上)。
图3-7(b)为注册表元数据的各组成部分(图中未显示封装分类账交易结构)。
第一部分:元数据文件数字标识符⑤。第一部分是元数据文件数字标识符,它的取值必须与完整的创作元数据中的值保持一致。
第二部分:音乐作品标识符⑥。第二部分携带可能在元数据文件中使用的音乐作品标识符。通常情况下,这个标识符在音乐行业中非常通用,且易于理解,如国际标准音像制品编码(International Standard Recording Code,ISRC)或国际标准音乐作品编码(International Standard Musical Work Code,ISWC)。
第三部分:创作元数据文件的加密哈希值⑦。第三部分携带创作元数据文件的加密哈希值,以确保注册表元数据和完整的创作元数据文件之间一一对应。
第四部分:发行人的签名和公钥⑧。第四部分包含权威发行人的数字签名,该发行人与完整的创作元数据文件的发行人相同。尽管该数字签名没有明确显示,但在通常情况下,在该数据结构中会包含数字签名的时间戳。
权威发行人(如艺术家)获取音乐作品元数据后,将创建一个更简短的注册表元数据,然后将其封装在交易结构中,并传输到分布式账本上。交易的接收人(或接收地址)要么是发行者本身(如发行者的公钥),要么是零值(这取决于所讨论的特定分类账实现方式)。这种自动寻址的交易方式隐性地表明了这是一项公证交易。
与音乐元数据层密切相关的另一个问题,是关于在各种元数据存储库中,用户(如家庭用户、其他创作艺术家)使用关键词和短语来搜索音乐的能力。基于此,开发一个独立的、同时又与各种元数据存储库并行且相互连接的搜索基础架构非常必要。
基于图3-6和图3-7所示的一组相互连接的关键词数据库,本节提出了以下这些关于该搜索基础架构的有趣设想:
· 创作元数据与搜索内容的分离。 关键词、标签和短语信息(统称搜索内容)必须与创作元数据文件分开存储和管理。这是因为尽管创作元数据在签名后可能会呈静态(不发生改变),但由单词和短语的排列组合所组成的搜索内容可能会随着时间的推移而增长和变化。
· 创作者侧关键词和短语的关联。 艺术家和音乐家必须将他们自己的搜索内容与特定的音乐元数据相互关联起来,并将这些搜索内容存储在本地,同时实现全球范围内的可读取。
·
用户侧关键词和短语的关联。
同样,任何用户或个人(或人工智能和机器学习系统)都可以为特定的音乐元数据创建属于自己的搜索内容之间的关联
,并将此搜索内容存储在本地。这与当前用户在设备和流媒体账户上创建音乐播放列表的做法类似。
图3-9所示的搜索和查找元数据示例对该搜索过程进行了说明:第①步,用户通过搜索应用程序,在本地及全球的关键词索引数据库中进行搜索;第②步,搜索应用程序将搜索返回的一组链接或DOI值解析为完整的元数据;第③步,在搜索应用程序的结果中,用户通过选择某些特定的DOI值(如在客户端搜索应用程序中进行筛选),来获取完整的创作元数据文件;第④步,用户通过搜索应用程序,选择是否在元数据注册表分类账上验证更新版本的创作元数据文件;第⑤步,用户通过在创作元数据中找到的音乐作品的哈希值(如MP3主文件的哈希值),并使用受保护的API,从创作元数据文件的存储位置获取音乐作品(如MP3主文件)完整元数据的副本,这一步将要求用户通过身份验证,并获得音乐作品当前所有者的授权。
图3-9 搜索和查找元数据示例
目前,业界正在开发替代性的去中心化内容管理系统(如开放索引协议
43
),以允许通过单独的本地缓存的搜索词来实现内容文件的分布式存储(如使用IPFS
44
)。搜索词的本地缓存(如缓存在用户的计算机上),避免了大型搜索引擎服务提供商集中收集搜索词,从而避免了用户过于依赖大型搜索引擎服务提供商。这一点非常重要,因为通过对用户使用的搜索词和关键词进行社交分析,可以挖掘用户及其朋友(如在社交网络中频繁互动的人
45
)对音乐类型的偏好等高价值信息
。
前面已经对音乐元数据层进行了讨论。作为未来全球音乐生态系统的基础层,音乐元数据层之于数字音乐生态系统,犹如域名系统之于当今的互联网服务,有着举足轻重的作用。但要实现新的服务的可持续增长与蓬勃发展,并帮助数字音乐产业真正挖掘其全球市场发展潜力,还需要另外两个层级。
图3-10所示为未来数字音乐生态系统的三层架构。
图3-10 未来数字音乐生态系统的三层架构
整个生态系统的最底层是音乐元数据层,除了已经在前面讨论过的组件外,这一层中还有一些其他组件,如数字身份管理、加密密钥管理、音乐作品(如录音文件)的受保护访问等。在这一层,人工智能和机器学习技术在解决音乐搜索问题方面发挥着关键作用。
整个生态系统的中间层是音乐版权、许可和版税管理层,其目的是实现音乐版权归属、音乐版权交易(买卖)、许可证发放与跟踪,以及版税收集与分配等的分布式管理。我们认为,想要将业务逻辑作为更广泛的音乐许可供应链管理的一部分,使用智能合约技术有着突出的优势。
我们必须深刻地认识到,音乐版权、许可和版税管理层强烈依赖最底层的音乐元数据层。如果创作元数据信息不完整,或音乐供应链中存在多个不准确的非授权版本,则无法通过智能合约发放数字许可证(也无法获得版税),因此先明确设计原则非常重要。
音乐版权、许可与版税管理层面临的第一个重要问题,是在使用本层分布式账本时,与权限相关交易的保密性问题。持续研究和开发加密方案(如零知识证明方案
)为在公共区块链网络上进行交易的实体提供了一定程度的私密性。本层的第二个重要问题,是目前亟待解决的分布式账本和区块链系统间的互操作性问题
46
。
整个生态系统的第三层是音乐虚拟资产层,该层允许将音乐作品和音乐权利作为数字代币意义上的虚拟资产予以确认 47 。
为实现以数字可替代代币(如ERC-20 48 )或不可替代代币(如ERC-721 49 )的形式交换(如购买和出售)权利,我们需要设计新的数字基础架构。数字代币可用于表示音乐作品的全部或部分所有权,因此可作为从被许可方获得的版税的分配基础。
我们的终极愿景是,这一层将包含多个在全球范围内运作的分布式音乐权利交易网络。就像由多个互联网服务提供商和网络组成的互联网一样,跨交易网络(即分布式账本和区块链)的互操作性仍然是未来科技产业研究和开发的主要方向。
正如互联网不属于任何单一实体、组织或国家一样,未来数字音乐生态系统的三层架构的功能和组件将有多种实现方式和应用案例。20世纪80年代,局域网的发展史 50 告诉我们,任何单一实体试图拥有或控制全部层级的努力都是徒劳的,甚至是适得其反的。因此,需要通过建立技术和操作标准,确保在通用的标准化API下,服务具有高度互操作性,进而确保市场上提供的服务之间存在良性竞争。
如今,个人数据资产(个人数据)正被广泛使用,但个人没有得到足够的价值补偿。这与19世纪末20世纪初,信用社和工会等集体组织创立前的情形极为相似。因此,创建代表个人数据权利的集体机构的时机似乎已经成熟。我们认为,对成员有信托义务的数据合作社找到了可靠的实施路径,通过集中在一起使用个人数据来赋予个人相关的权益。 数据合作社不仅可以就如何管理、策划和保护对个人数据的访问等问题为个人提供专家级的建议,还可以进行内部分析,使数据合作社的成员受益。 这样的集体洞察力,为数据合作社成员通过谈判争取更好的服务和更优惠的折扣提供了强大的助力。目前在美国,联邦特许信用合作社已成为一种非常有用的数据合作模式,并已得到法律的认可。我们深信,未来还会诞生许多其他类似的可以提供数据合作的服务机构。因此,本章基于得到音乐家充分授权的前提,对音乐产业的数据合作社模式进行了深入探讨。
在音乐家共同组建数据合作社的背景下,缺乏关于特定音乐作品创作的一致、完整和权威的信息或元数据,已成为当前音乐供应链的一个核心问题。前文已经描述了开放访问音乐元数据层的概念,这将是未来在分布式账本或区块链系统上完成音乐相关交易的重要基础。音乐元数据层由去中心化、可复制且可开放访问的元数据存储库组成。创作元数据就放在这些存储库中,它既没有版权和所有权信息,也不包含受版权保护的音乐作品本身(如作曲素材和录音文件)。音乐元数据层与注册表分类账相结合,便可以进行公证服务,并允许世界上的任何人,在互联网上将注册表元数据文件中的数字标识符解析为一个或多个版本的完整创作元数据。前文已经就音乐元数据层的一些设计原则进行了论述。
我们认为,数据合作社有责任运营并管理相关IT服务,这些IT服务使合作社成员得以在音乐元数据层和注册表分类账进行相关操作。同时,这些服务也让音乐家能更好地管理他们的资产(他们的作品),更清楚地了解他们作品的授权情况(如谁被授权了什么作品)。通过智能合约技术,被许可方可以在区块链上,直接从音乐家那里获得版权许可(如表演许可和机械许可)。
我们期待着,未来能基于数字音乐生态系统的三层架构,打造全球化的音乐产业。除了音乐元数据层,我们认为还需要一个许可和版税管理层,从而使许可证发放、许可证跟踪和记账、所有权交易(购买和销售),以及版税的收集和分发等业务能进行自动化处理。我们相信,在表达这一层的各种类型的业务逻辑方面,智能合约技术将有着广阔的应用前景。第三层也是“最上层”,在这一层,音乐作品和音乐版权可以被认定为数字代币意义上的虚拟资产。这种代币化处理,为实现虚拟音乐资产的全球在线交易,提供了切实可行的实现路径。