数据的权属问题是讨论数据要素市场合规运转的法律依据之一,但是数据权属的确定仍困难重重。在探讨数据的权属难点之前,本节将先通过对物质权属现状的简单介绍,使读者大致了解权属相关的法律知识。随后,通过介绍数据权属确认中的困难、数据确权的理论探索和数据确权的产业实践,向读者介绍数据权属确认的实践。
根据《中华人民共和国民法典》中对物权的描述,物权是大陆法系民法所采纳的概念,它是指公民、法人依法享有的直接支配特定物的财产权利。所谓直接支配,是指权利人无须借助于他人的帮助,就能够依据自己的意志依法直接占有、使用、或采取其他的支配方式支配其物。通俗地说,一头牛属于你,你可以用它来耕田、拉车,可以租给他人使用,也可以杀掉卖牛肉。这种支配的权利是排他的,任何人都不能干涉。
物权的分类如图2-1所示。物权一般包含三个大类,即所有权、用益物权和担保物权,所有权是指所有人依法对其财产享有的占有、使用、收益、处分的权利。用益物权是指以物的使用、收益为目的的物权,例如国有土地使用权、宅基地使用权等。担保物权是指以担保债权为目的,即以担保债务的履行为目的的物权;担保物权包括抵押权、质权、留置权等。
图2-1 物权的分类
担保物权与用益物权制度共同构成物权体系,如果没有担保物权,则不仅整个物权法的体系是残缺的,而且很难确定《中华人民共和国担保法》中规定的抵押、质押、留置是否为担保物权。
1.所有权
所有权是物权法中的重要内容,所有权是指所有人依法可以对自己的物进行占有、使用、收益和处分的权利。它是物权中最完整、最充分的权利。通俗地说,你拥有一件物品,你可以自己使用;可以出租给别人,收取租金;也可以转手卖给他人。这就是你对这件物品的所有权,是一种绝对的权利。所有权通常包括国家所有权、集体所有权和个人所有权。此外,还有共有的概念,特别是在建筑物区分所有权方面。相邻关系制度用于规范相邻不动产权利人之间的关系。
(1)国家所有权是指由全民所有。法律规定属于国家所有的财产,由国务院代表国家行使所有权,法律另有规定的,依照法律行使。国家所有财产的范围主要有矿藏、水流、海域、无居民海岛、城市的土地、森林、山岭、草原、荒地、滩涂等自然资源,野生动植物资源,无线电频谱,文物,国防资产,基础设施等。
(2)集体所有权是指由集体所有。法律规定属于集体所有的财产,主要包括属于集体的土地、森林、山岭、草原、荒地、滩涂,集体所有的建筑物、生产设施、农田水利设施,集体所有的教育、科学、文化、卫生、体育等设施,以及其他的不动产和动产。
(3)个人所有权是指法律规定属于私人所有的财产所享有的权益。这些私人财产主要包括但不限于合法的收入、房屋、生活用品、生产工具、原材料等不动产和动产。
(4)共有是指数人共同享有一物的所有权,共有不是一种独立种类的所有权,而是同种或不同种所有权间的联合。通常可以分为按份共有和共同共有。按份共有人按照其份额对共有的不动产或者动产享有占有、使用、收益和处分的权利。通俗地说,甲、乙、丙共有一套房屋,其应有部分各为1/3,为提高房屋的价值,甲主张将此房的地面铺上木地板,乙表示赞同,但丙反对。因甲乙的应有部分合计已过半数,故甲乙可以铺木地板。而共同共有则是,共同共有人对共有的不动产或者动产共同享有占有、使用、收益和处分的权利。通俗地说,共同共有关系通常发生在互有特殊身份关系的当事人之间,如夫妻之间的夫妻共同财产关系、个人合伙和企业之间的联营等。
(5)此外,在所有权制度中,还存在相邻关系制度。相邻的两个业主之间会形成相邻关系,这是一种比较复杂的权利状态,既不能完全用普通所有权规则,也不能完全用共有权规则来解决。如在一栋大楼内,相邻业主之间可能互相造成噪声污染;建筑物也可能对周围邻居的通风采光造成负面影响,这些都在相邻关系制度的范畴内。物权法中的相邻关系的主要目的是促进和睦的人与人之间的关系的建立,维护社会秩序的安定。在我国的司法实践中,出现了不少业主与开发商之间、业主与业主之间的产权纠纷,这些问题处理不好,会影响社会安定,因此我国设立了相邻关系制度来加以解决。
2.用益物权
用益物权是指非所有人所享有的对物的使用和收益的权利;是用益物权人在法律规定的范围内,对他人所有的不动产,享有占有、使用、收益的权利;它着眼于财产的使用价值。通俗地说,某餐饮企业租用别人的房屋进行经营,它依法享有对租用房屋的占有、使用、收益的权利,但是它没有处分房屋的权利。也就是说餐饮企业拥有的是房屋的用益物权。我国物权法在用益物权方面,主要规定了土地承包经营权、建设用地使用权、宅基地使用权、地役权、居住权等权利。
(1)土地承包经营权,是指承包农户以从事农业生产为目的,对集体所有或国家所有的,由农民集体使用的土地进行占有、使用和收益的权利。在土地利用过程中,土地承包经营权人应当维持土地的农业用途,不得用于非农建设,禁止占用耕地建窑、建坟或者擅自在耕地上建房、挖砂、采石、采矿、取土等,禁止占用基本农田发展林果业和挖塘养鱼。
(2)建设用地使用权,是指自然人、法人或非法人组织依法对国家所有的土地享有的建造并保有建筑物、构筑物及其附属设施的用益物权。建设用地使用权人对国家所有的土地依法享有占有、使用和收益的权利,有权自主利用该土地建造并经营建筑物、构筑物及其附属设施。
(3)宅基地使用权,宅基地是农村村民用于建造住宅及其附属设施的集体建设用地,包括住房、附属用房和庭院等用地,在地类管理上属于(集体)建设用地。宅基地使用权是指农村居民对集体所有的土地占有和使用,自主利用该土地建造住房及其附属设施,以供居住的用益物权。宅基地使用权人依法享有对集体所有的土地占有和使用的权利,有权依法利用该土地建造住房及其附属设施。
(4)地役权,是按照合同约定利用他人的不动产,以提高自己不动产效益的权利。在行使权利的过程中,将自己的不动产提供给他人使用的一方当事人称为供役地人;因使用他人不动产而获得便利的不动产为需役地;为他人不动产的便利而供使用的不动产为供役地,即他人的不动产为供役地,自己的不动产为需役地。地役权的基本内容是,地役人有权按照合同约定,利用供役地人的土地或者建筑物,以提高自己需役地的效益。地役权自地役权合同生效时设立。当事人要求登记的,可以向登记机关申请地役权登记。不登记,不得对抗善意第三人。通俗地说,甲为了能在自己的房子里欣赏远处的风景,便与相邻的乙约定:乙不在自己的土地上从事高层建筑;作为补偿,甲每年支付给乙4000元。两年后,乙将该土地使用权转让给丙。丙在该土地上建了一座高楼,与甲发生了纠纷。对此纠纷,甲对乙的土地不享有地役权。
(5)居住权,是指权利人为了满足生活居住的需要,按照合同约定或遗嘱,在他人享有所有权的住宅之上设立的占有、使用该住宅的权利。居住权作为用益物权具有特殊性,即居住权人对于权利客体(即住宅)只享有占有和使用的权利,不享有收益的权利,不能以此进行出租等营利活动。
3.担保物权
担保物权,是指债权人所享有的,为确保债权实现,在债务人或者第三人所有的物或者权利之上设定的,就债务人不履行到期债务或者发生当事人约定的实现担保物权的情形,优先受偿的他物权。担保不单有物的担保,也有人的担保;债务人自己提供物的担保的,债权人应当先就该物的担保实现债权,也可以要求保证人承担保证责任。例如,甲向乙借款20万元,以其价值10万元的房屋、5万元的汽车作为抵押担保,以1万元的音响设备作质押担保,同时由丙为其提供保证担保。其间汽车遇车祸损毁,获保险赔偿金3万元。如果上述担保均有效,丙应对借款本金在6万元数额内承担保证责任。丙承担的是物的担保以外的担保责任。担保物权主要包括抵押权、质押权、留置权。
(1)抵押权是为担保债务的履行,债务人或者第三人不转移财产的占有,将该财产抵押给债权人,债务人未履行债务时,债权人有权就该财产优先受偿。例如,甲公司为获得贷款,将其厂房抵押给银行,如不能按期归还贷款,银行有权将该厂房拍卖,从拍卖所得的价款中优先受偿,这就是所谓的抵押权。
(2)质权是为担保债务的履行,债务人或者第三人将其动产出质给债权人占有,债务人未履行债务时,债权人有权就该动产优先受偿。例如,公民甲向公民乙借款,将其摩托车设定质押,双方签订质押合同以后,还必须将摩托车存放在乙处,这就是质押。质权与抵押权的不同在于,前者是转移动产的占有,而后者则是不转移动产的占有。通俗地说,抵押和质押的区别在于抵押一般需要登记,而质押一般不需要登记。抵押的对象主要是不动产,而质押的对象包括动产和权利(如有价证券、公司的股份及知识产权中的财产权等)。
(3)留置权是债务人未履行债务时,债权人可以留置已经合法占有的债务人的动产,并有权就该动产优先受偿。例如,农民甲到期没有履行对农民乙的债务,农民乙就留置了农民甲与债务有关的农用车一辆,但是农民甲还在这辆车上设立了抵押权或者质权,如果各个权利人均对此车行使自己的权利,谁应该首先得到补偿呢?那就应该是设立了留置权的农民乙。
1.数据权属界定面临的困境
物权可归纳为所有权、用益物权及担保物权三大类,但在实践操作过程中,会根据物的不同衍生出不同的细分权利。例如,由于楼房房产的特殊性,衍生出了业主的建筑物区分所有权;由于土地的属性不同,衍生出了建设用地使用权、宅基地使用权等。自从数据被定义为生产要素后,数据的权属问题也在产学研各界开始被广泛讨论。
数据的权属界定过程中面临的问题可以分成理论与实践两个维度。数据权属界定的理论困境主要由法律界对数据的法律属性认知的差异性而导致。数据权属界定的实践困境主要是在数据确权的实践中产生的。由于数据产权的法律关系不明确,会导致个人、企业及国家在数据上的权利内容及分配规则不清,进而影响数字经济的发展。数据权属困境如图2-2所示。
图2-2 数据权属困境
1)理论困境
数据的法律属性是界定数据产权的重要因素,由于传统法学理论体系难以解决数据产权问题,国内外学术界对数据的法律属性问题也产生了极大的争议。
部分观点认为不应该针对数据单独提出数据权属及数据权利的概念,主要有以下方面的原因:一是数据不能作为民事权利的客体。数据没有特定性、独立性,也不属于无形物,因此不能归入表彰民事权利的客体。二是数据不能独立视作财产。数据无独立经济价值,其交易性受制于信息的内容,且其价值实现依赖于数据安全和自我控制保护,因此不宜将其独立视作财产。三是数据权利化难以实现。基于数据主体不确定、外部性问题和垄断性等问题,数据权利化也难以实现。
此外,还有学者从经济学和法学的角度阐述了不建议为数据设置专有权的理由。从经济学的角度,数据专有权会对经济学中的经营自由和竞争自由带来负面干扰,进而会提高市场准入门槛、影响市场的公平性。从法学的角度,在现有的法律框架中,不存在将数据分配给特定法律主体的强制性要求;例如,为了促进数据的流通,哪怕是个人隐私数据,在明确得到个人授权的前提下,也是可以通过权属转移实现流通的;再如,通过传感器生成的数据的专有权也不只属于传感器的所有者。
另外,有部分学者正在尝试根据不同的理论梳理数据的法律属性,以辅助明确数据权属。关于数据的法律属性,学术界基于人格权、财产权、知识产权、新型财产权等多个理论产生了以下几种不同的观点。
第一种观点,认为个人信息应当是人格权的范畴。从《中华人民共和国民法典》总则编的规范设置来看,个人信息在性质上应当属于人格权益的范畴,个人信息权利以主体对其个人信息所享有的人格权益为客体。
第二种观点,认为数据具有财产权。部分学者认为,用户数据具有财产属性已经成为数据时代的社会共识,在市场实践中,用户数据商品化现象充分说明了其具有财产性质。也有学者从数据所有权和用益权的角度提出了二元权利结构模式的理论,认为可以借助“自物权—他物权”和“著作权—邻接权”的权利分割思想,根据不同主体对数据形成的贡献来源和程度,设定数据所有者拥有数据所有权和数据处理者拥有数据用益权的二元权利结构,以实现数据财产权益分配的均衡。
第三种观点,认为数据是知识产权的一种。作为一种知识产权,数据存储和成果可通过著作权法中的专利、商标等知识产权手段进行保护;也有学者将数据与著作进行了类比,认为由于数据被公开后应禁止他人公开传播的特性与著作类似,故可参考知识产权法完善对数据的相关立法。
第四种观点,认为数据属于新型财产权。由于数据在流通过程中会流经多个主体,涉及复杂的利益关系,因此需要根据该特性确立复杂的数据新型财产权体系,以达到数据的初始主体与数据流通主体间的利益平衡。例如,可以通过为初始数据的主体配置基于个人数据的人格权和财产权,为数据流通主体配置排他性的数据经营权和数据资产权的方式构建新型数据权属体系。
2)实践困境
在数字经济体系建设的实践活动中,数据权责不明导致个人、企业、国家在数据权利与责任的划分上不清晰,降低了数据所有方对数据共享的意愿、增加了数据共享后的法律风险,成为促进数据价值释放、打造数字经济过程中的核心障碍之一。随着数字化转型全面推进,数据权属制度的制定对于整个经济发展具有举足轻重的作用。在数据权属界定的实践过程中,遇到的问题可以按照确权过程的前、中、后三个阶段展开讨论。
(1)在界定数据权属过程前,需要对数据进行预处理,以便于确权工作的展开。当前被广泛认可的预处理手段是数据的分类分级。数据是一个抽象的概念,实践应用中数据包含很多种类,例如个人数据、企业数据、政务公共数据、原生数据、衍生数据等,不同种类的数据在权属界定的实践上存在差别。相同数据可以使用的场景也千差万别,例如政务、金融、国安、互联网、医疗等,相同的数据在不同场景下的权属界定也不尽相同。相比欧美许多国家已经构建完成了对个人数据和非个人数据进行区分管理的自由流通框架,我国目前尚未建立数据分级分类的管理制度,尤其对非个人数据和个人数据的统一监管,严重制约了数据要素价值的发挥。
(2)在界定数据权属过程中,需要依赖法律对数据权属的界定提供尺度。目前,国内外立法层面尚未对数据权属问题给出明确答案。在国际社会中,欧盟的GDPR、美国的数据安全与数据隐私相关法律,均在规定个人和企业对于数据权利的同时,规避了数据权属界定的问题。
在法律层面权属界定难点之一是数据所有权归于单方主体的局限性与归于多方主体的困难程度。若将数据所有权简单地归于数据收集人(如企业),则难以产生整体上的产权意义。因为,数据存在“一数多权”的现象,如果多个主体都对同一数据进行采集,均享有数据所有权;但是所有权的排他性否定了“一数多权”的可能性。另外,若将数据所有权归于被收集人(如用户),由于个人权利行使与企业积极性激发的难度,则不利于个人权利的行使和数据产业的发展。
(3)在数据权属界定之后,需要积极发挥行政监管作用,保证数据按照权属界定的结论依法流通。其一是企业对数据使用与处理过程中的法律意识有待培养,多数企业数据处理尚不透明,要提高企业处理数据的透明度,要求企业对个人数据在处理与共享过程中的行为对用户进行公开与确认。其二是政府与社会对数据安全的监管能力有待加强,当前的监管尚处于“局部监管、突出问题”阶段,需要向“全流程、全链条、全主体”的监管模式转变。
2.数据确权的探索
对比已有的物权法,数据也应该包含所有权、用益物权及担保物权。2022年之前,在实践生产活动中,为了方便数据的流通与管理,通常将数据的用益物权拆分为使用权、收益权、管理权等。同时,对数据的用益物权进行了分离。分离之前,所有权、使用权、收益权、管理权实际表达的全是所有者的权利;分离之后,除上述四项所有权仍然存在之外,所有权增加了一类数据使用者的所有权,即使用权增加了一类数据使用者的使用权,收益权增加了一类数据使用者的收益权,管理权增加了一类数据使用者的管理权。这时的两权分离,实质是在拥有者与非拥有者之间的权利的分割分配。
在《中共中央 国务院关于构建数据基础制度更好发挥数据要素作用的意见》中,明确提出了“数据资源持有权、数据加工使用权、数据产品经营权等分置的产权运行机制。”
(1)数据资源持有权。物权中的所有权是具有排他特性的权利,而数据的可复制、易共享的特性与排他性背道而驰。数据资源持有权概念的提出,旨在搁置对数据所有权的争议,推动数据要素的进一步流通。相较于所有权,“持有”的概念指的是不依赖于所有权源的、对有形或无形的物通过一定的方式或手段有意识地控制或支配。
数据资源持有权中对数据资源的控制或支配能力是通过对数据的管理权及衍生出的私益性实现的。在法律层面,“持有”一词分别在刑法与民商法中得以使用;刑法中的“持有”更多的是规制持有行为,民商法中的“持有”更多强调的是权益归属。在实践层面,根据国家相关文件,建议数据持有者可以对依法持有的数据进行自主管理,并防止干扰或侵犯数据处理者合法权利的行为。因而,数据持有者可以根据持有权赋予的排他性享有相应的益处。
(2)数据加工使用权。数据加工使用权是指企业自我使用、加工处理指定数据的权利。数据具有低成本复制的特性,可以在使用过程中,在不造成数据损耗和质量下降的前提下,将数据复制成无限份。数据的低成本复制性增加了使用权转移的方便程度,利于实现多方共赢,在新经济价值创造的过程中具有积极的意义。但是同时,为防止对数据低成本复制特性的滥用行为,数据持有者将指定数据的使用权授予使用者后,数据的使用者不能将数据转手倒卖获利。数据的加工使用权只可以从数据中获取信息并加工生成相应的数据产品与数据服务。
另一个角度,数据加工使用权可以提升数据的排他性,增加企业对数据在会计意义上的控制权。公共公开的数据,由于所有人都具有对他的加工使用权,没有排他性。如公共公开的数据能给每个企业带来经济收益,则该数据就不具有排他性,企业对该数据不具备控制权。而通过加工使用之后,就生成了全新的具有排他性的企业独占的数据,这些数据就享有了会计意义上的数字经济利益,因而也具有了会计意义上的控制权。
(3)数据产品经营权。数据产品经营权是指政府授予法人机构数据产品的经营权利,例如授予数据交易机构开展数据交易活动的权利。数据产品经营权的展开有三项前提。首先,享有数据产品经营权的数据必须是合法收集、生成或其他合法来源的数据,非法获得的数据不享有经营权。其次,企业对数据必须依法经营。最后,数据产品经营权涵盖的数据对象不能违反其他法律法规,例如《中华人民共和国个人信息保护法》。
数据的产品经营权需要基于数据分类分级的结果开展。数据产品经营权的行使与数据的类型及场景的属性息息相关。例如,个人属性数据、行为数据比产品规格数据具有更高的隐私及敏感程度;又如企业持有用户的身份证号码等最高隐私级别的数据时,必须遵循《中华人民共和国个人信息保护法》中明确的“告知—同意”原则,且用户享有数据的撤回权;针对如手机号等一般隐私级别的数据,企业可在合规操作的前提下控制这类数据。
3.数据确权的实践
(1)中国。
中国还未在法律法规层面对数据产权结构进行明确的定义。出于促进数字经济市场体系建立的考虑,我国在多地开展了数据产权试点计划。例如,2021年9月全国首个数据知识产权质押案例落地浙江杭州高新区(滨江),通过杭州高新融资担保公司增信,将数据资产进行质押,获得上海银行滨江支行授信人民币100万元。2021年10月,全国首张公共数据资产凭证(企业用电数据)在广东发布,公共数据资产凭证以数据资产凭证作为数据流通的专用载体,实现资产主体、资产本体、资产权利三位一体的绑定关系,以此声明数据主体、数据提供方和数据使用方。公共数据资产凭证作为政府认可的可信数据载体,具备可验证、可溯源等特点,可实现跨域互信互认、互联互通,受到主管部门的监管与保护。数据资源持有权、数据加工使用权、数据产品经营权分置运行。
(2)欧盟。
欧盟是全球范围内最早进行数据产权体系构建的地区,通过《通用数据保护条例》(GDPR)和《非个人数据在欧盟境内自由流动框架条例》,确立了“个人数据”和“非个人数据”的二元架构。GDPR明确任何已识别或可识别的自然人相关的个人数据,其权利归属于该自然人,该自然人享有包括知情同意权、修改权、删除权、拒绝和限制处理权、遗忘权、可携权等一系列广泛且绝对的权利。针对个人数据以外的非个人数据,企业享有数据生产者权,不过其权利并非是绝对的。
(3)美国。
美国将个人数据置于传统隐私权的架构之下,利用“信息隐私权”来化解互联网对私人信息的威胁。通过《公平信用报告法》(Fair Credit Reporting Act,FCRA)、《金融隐私权法》(Right to Financial Privacy Act,RFPA)、《电子通信隐私法》(Electronic Communications Privacy Act,ECPA)等法律,在金融、通信等领域制定行业隐私法,辅以网络隐私认证、建议性行业指引等行业自律机制,形成了“部门立法+行业自律”的体制。
(4)其他部分国家。
日本并不主张对数据本身另行设定新的排他性私权。经过学界、产业界及政府部门的多方探讨,目前日本对数据权属问题的处理规则已经比较明确。概括来说,对数据权属以自由流通为原则,特殊保护为例外。具体而言,就是以构建开放型数据流通体系为目标,不突破现有法律规定和法律解释,不对数据另行设置私权限制,以尊重数据交易契约自由为原则,促进数据自由流通。
俄罗斯规定的数据主体的权利与其他国家落脚点不同,其更多的是针对处理人开展的。所谓处理人,是指独立或与其他单位合作处理个人数据,并能确定个人数据处理的目的、范围的国家机关、主管机关、法人或个人。
印度《个人数据保护法》将数据视为“信托”问题,将每个决定处理个人数据目的和方法的实体定义为“数据受托人”,并要求其承担主要责任。数据受托人是指单独或者与其他人一起决定处理个人数据的目的和方式的任何人,包括邦、公司、法律实体或个人。
数据产品定价的问题是数据要素市场构建的重要问题之一。随着数据使用方法的改进及数据价值的提高,数据产品定价的问题也被学界和业界不断探索,更先进的数据定价方法与模型也被不断提出。近些年来,数据产品在流通过程中出现了一些关键的趋势,对数据定价问题产生了以下影响。
(1)个人数据价值的提升。个人数据包括有关个人特征、行为、偏好和态度的信息,可以从包括社交媒体、搜索引擎和硬件设备在内的各种来源收集。随着数字营销需求的增长,个人数据已成为一种宝贵的商品。专门从事购买、销售个人数据的数据经纪人和其他中介机构也应运而生。许多公司愿意为获得高质量的个人数据支付访问费用,以便更好地了解和定位客户。因此,蕴含个人数据的数据产品的价值也随之水涨船高。
(2)数据正用于创建新产品和服务。许多公司通过购买和使用数据来创建新的产品和服务,例如个性化建议、个性化新闻提要及其他数据驱动的应用程序。这催生了Data-as-a-Service(DaaS)业务模型,在该模型中,为了创造和改善产品和服务,公司产生了对数据产品的需求,并且愿意支付费用以获得数据的使用权力。例如,一家出售定制化营养计划的公司可能会购买有关个人饮食习惯、锻炼计划、健康目标相关数据的使用权限,以更精准地创建定制化的营养计划。金融技术公司为了定制更精确的客户投资计划,也会需要使用与个人的支出习惯和财务目标相关的数据。
(3)通过许可和订阅获利。许多公司正在通过许可和订阅模型从数据中获利。对于拥有大量高质量数据的公司来说,这可能是非常可观的收入来源。对于该模型涉及的双方,数据许可和订阅通常是双赢的。提供数据的公司能够将其数据产品出售并获利以产生收入,而访问数据的公司能够使用这些数据来构建和改善自己的产品和服务。例如,一家收集和处理消费者购买习惯相关数据的公司,可能会将这些数据的使用权许可给营销机构或其他想要使用它开发新产品的公司。
(4)数据隐私和法规变得越来越重要。随着数据变得越来越有价值,数据的使用频率也骤然升高。随之而来的是对数据隐私及个人数据滥用问题的担忧。正是由于看到了这些问题,全球各个国家相继出台了与数据隐私保护相关的法律法规。例如,欧盟的GDPR对公司如何收集、使用和销售个人数据给予限制。
在传统经济学中,有很多不同的模型和方法可以支持对商品的定价操作。但是,没有一种模型或者方法可以解决所有商品的定价问题;企业可能需要根据具体商品的应用场景对这些方法进行选择与组合,以得到合适的定价模型。
相较传统商品的定价,数据产品的定价问题尚未形成行业共识,产生行业标准。因此,数据交易平台的交易定价辅助模块的目的是基于已有的定价模型,给数据提供方、数据需求方及数据加工方提供数据定价的支持,以辅助交易参与方能就数据产品价格一事达成共识。
数据要素市场是多样的,在不同市场中,数据价值释放的主导因素不尽相同,数据产品定价方式五花八门;数据产品定价的模式也多种多样。本节通过对数据产品定价问题现状的梳理,希望可以帮助快速地完成数据定价辅助模块的构建。具体而言,本节将首先介绍数据产品定价问题的难点,其次分析影响数据产品定价的因素,再次对数据产品定价的方法进行阐述,最后介绍数据产品定价的模型。
数据产品相较传统商品有着很多特性。有些特性在给用户提供更多便利、创造更多价值的同时,对数据产品的定价造成了一定的障碍。国内外众多学者对数据产品定价问题的根本难点进行了研究。有学者认为数据来源的多样、数据管理的复杂、数据自身结构的多样是造成数据产品定价困难的根本原因。也有学者认为,数据产品交易定价的困难是由于数据产品的分类困难。此外,数据产品价值的不确定性、稀缺性、多样性,以及交易过程中数据流通的困难也造成数据产品价格难以统一。数据产品的产权问题,也在一定程度上对数据产品定价问题造成了负面的影响。要从经济价值角度衡量数据产品的价值可能需要先解决数据产品交易中的数据所有权归属问题。具体来说,在对数据产品进行定价的时候,可能会遇到以下一些困难。
(1)难以确定数据产品对数据需求方的价值。数据产品的价格与供需关系密切相关,而数据产品能向数据需求方提供价值的量化是一项挑战。为了确定数据产品对数据需求方的价值,需要进行市场研究并且收集客户反馈,以更好地了解产品的使用方式,以及产品对客户业务的影响。如果将数据产品的价格设定得过高,则难以吸引客户;如果将价格设定得太低,则无法获利。
(2)难以确定数据产品的质量。数据产品的质量对数据产品价格具有重大影响。数据产品质量越好,数据产品价格就会越高。数据的质量通常由数据的规范性、一致性、完整性、时效性、准确性、稀缺性、多维性、有效性及安全性九个维度决定。但是,数据产品的质量也是一个难以量化的指标。
(3)难以确定数据产品的成本。数据产品定价时需要考虑的另一个因素是数据产品的成本。数据产品的成本包括但不限于从外部来源获取数据的成本,以及存储、处理、保护数据的成本。准确计算收集数据、治理数据、托管和维护数据等的成本对于数据产品定价十分重要。
(4)难以确定不断变化的市场状况。当市场条件发生变化时,会对数据产品的需求、数据产品的竞争、数据产品的质量、数据产品许可协议的条款、数据提供方的声誉等造成影响;这些影响会进一步影响数据产品的价格。例如,如果市场增加了对特定类型数据产品的需求时,该类数据产品的价格就可能会随之提高。经济环境的变化、行业趋势的变化等外部市场因素也会影响数据产品的价格。这些市场状况的变化都会给确定数据产品的价格增加挑战。
(5)难以确定数据产品的权属。数据产品的权属是确定数据产品价格的重要因素,因为它会影响获取数据产品的成本和数据产品的使用条款。如果公司或组织不拥有出售的数据,则可能需要从第三方购买,这时数据产品的价格就会受到从第三方获取数据产品的成本影响。如果公司或组织拥有正在销售的数据,则价格可能更多基于数据产品提供给数据需求方的价值,而不是获取数据的成本。此外,数据的权属还会影响数据的使用条款。如果公司拥有数据,则能够设置约束力更强的使用条款,例如限制使用数据的方式,这些约束也会影响数据产品的整体价格。但是,实际情况是,法律层面数据权属尚未清晰,大多数公司无法明确自己拥有的数据的权属。
数据产品的价值可以从成本、数据质量、应用价值三个维度进行评估。数据产品价值评估指标如图2-3所示。
图2-3 数据产品价值评估指标
1.成本
产品的价格受到产品生产成本的影响,数据产品也不例外。对数据产品成本的一种定义是:企业对数据产品的获取、传递、表达、存储、搜索、处理等直接或间接支出的费用。数据产品的成本主要由开发成本、运维成本及管理成本构成。
相较传统产品的开发成本,由于生产技术的不同,数据产品的开发成本有显著的降低。这种成本抑减现象主要是由数据产品的信息检索成本、生产成本、复制成本、传输成本及个性化定制成本导致的。
(1)信息检索成本。指的是搜索构成数据产品的信息所发生的开销;这类开销包括人力开销、信息搜索及存储的软硬件开销、机密或隐私数据购买的开销等。
(2)生产成本。指的是通过对海量数据进行处理,得到具有价值的数据产品的开销。相较于传统产品,数据产品的生产成本也有所降低。首先,数据产品的生产原料、半成品采购及传输成本相对较低;其次,一个数据产品的边际成本几乎为零;最后,数据产品的定制化成本相较于传统产品也显著降低。
(3)复制成本。数据产品是非竞争性的,即一个用户获得了数据产品以后,并不会降低其他用户获得该产品的数量和质量。由于数据产品的非竞争性及零边际成本特性,数据产品的复制成本也接近零。零复制成本在降低数据产品开发成本的同时,也给知识产权及数据隐私保护带来了隐患。
(4)传输成本。传统产品通常需要依赖物流业将产品在全球范围内进行流转,流转过程中由时间、人力、油费、路费等构成了传输成本。数据产品,由于互联网的存在,由上述几个维度构成的传输成本趋近于零。
(5)个性化定制成本。传统产品个性化定制的成本通常是十分高昂的。以定制一张桌子为例,工厂需要根据个性化需求进行设计,需要对个性化材料进行采购,还需要对桌子进行建模并生产。哪怕是对桌子的某个部位(如桌腿)进行个性化定制,也需要重复上述步骤。相较而言,数据产品就可以通过少量的修改,快速便捷地生产出很多不同的版本。
运维成本是指在维护数据产品生产的环节,为确保数据产品质量的过程中所带来的开销。运维成本可以包含负责运维数据产品的数据科学家、工程师和其他专业人员的劳动成本;用于存储、处理和分析数据的硬件和软件费用,包括升级或更换设备的任何费用;收集和处理其他数据以保持数据产品时效性和准确性的开销等。
管理成本是指行政管理部门为组织和管理生产经营活动而发生的各项费用支出,数据产品成本中的管理成本与传统产品的管理成本是一致的。
2.数据质量
数据质量是评价数据价值的基础。数据采集过程中难免出现错误、缺失、冗余等情况,导致原始数据质量参差不齐。通过对收集的原始数据进行清洗和治理,可以提升数据的准确性、完整性,并解决数据的重复性、出错率高等问题,实现数据质量的提升,为后续数据的开发利用奠定基础。参考全国信息技术标准化技术委员会提出的数据质量评价指标,可以设定规范性、一致性、完整性、时效性、准确性等数据质量评估指标。同时,由于数据质量对数据价值实现层面具有特定影响,可以增加稀缺性、多维性、有效性、安全性四类评估指标。
(1)数据规范性是指数据记载的形式符合要求的程度。不规范的数据往往不能准确反映被测现象的性质和程度,造成描述和理解误差,造成统计分析困难。所以需要对数据规范性进行检验。
(2)数据一致性是确保多个用户对同一个数据的访问获得的信息是一致的。当多个用户试图同时访问一个相同的数据时,可能会发生以下情况:丢失更新、未确定的相关性、不一致的分析和误读。数据一致性要求避免这些情况的发生。
(3)数据完整性是要求所有数据值均正确的状态,没有被未授权篡改。
(4)数据时效性是指在不同需求场景下,数据的及时性和有效性。
(5)数据准确性是指数据记录的信息不存在异常或者错误。例如,一个人的生日是2022年1月10日,中国习惯的格式是2022/1/10,美国习惯的格式是1/10/2022,英国习惯的格式是10/1/2022,在此示例中,日期在数据的内容上是正确的,但其表达形式容易导致数据准确性降低。
(6)数据稀缺性是指在特定目的或主题下缺乏相似数据的情况。数据稀缺性可能由多种原因导致,例如缺乏收集和存储数据的资源或基础架构,缺乏数据收集的计划,出于行业规定或法律道德限制不能收集数据等。
(7)数据多维性是指在特定目的或主题下,从多个角度对该主题信息的记录。通常数据产品的维度越多,蕴含的信息就越多,数据产品的价值就越高。
(8)数据有效性指的是数据的准确性和正确性。这是使用数据产品时要考虑的一个重要特性,因为无效的数据可能导致结论不正确及结果不准确。
(9)数据安全性是指保护数据免受未经许可传送、泄露、破坏、修改的能力指标,是标志数据安全程度的重要指标。
3.应用价值
数据产品的应用价值是指通过各种方式使用数据(如决策、计划、解决问题等)而获得的价值收益。数据的应用价值可以通过多种方式得以体现。例如,可以通过对数据的分析得到更好的决策;可以通过分析数据,识别并优化“瓶颈”以提高效率;可以利用个性化数据给用户提供更符合用户偏好和特点的产品与服务、从而获得更好的用户体验;可以将数据用于识别和减轻风险(如金融风控、设备故障预警)等。通过分析历史交易数据,量化评估数据产品在不同应用场景下的效用和价值,可以将上述能力综合为数据产品的关联度、实用度、复用度、受众广度、受众深度五类指标。
(1)数据产品的关联度是指数据产品提供的信息与应用场景之间的相关性程度。当数据产品与应用场景相关联时,就意味着数据产品中至少有某一个变量与应用场景的某一个维度相关,该变量的变化与维度的更改是相关联的。但是,相关不一定意味着因果关系,仅仅因为变量和维度的相关性,并不一定意味着因为应用场景中某个维度的变化而导致了数据产品变量的更改。了解数据产品与场景的关联度对提升预测、识别等任务的结果能起到显著的作用。
(2)数据产品的实用度指的是数据产品能被使用并产生价值的程度。在评估数据产品的应用价值时,数据产品实用性是需要着重考虑的因素。无论数据产品的质量、潜在价值如何,如果数据产品无法以有意义的方式产生价值,该数据产品的实用度也是很低的。数据产品实用度会受到许多因素的影响,例如数据产品质量、数据产品的应用关联度、数据产品的格式、数据产品的可访问性等。
(3)数据产品的复用度指的是数据产品对应用场景的兼容性,一个能在更多场景中复用的数据产品具有更高的数据产品复用度。通常来说,复用度高的数据产品具有更高的应用价值。因为,复用度更高的数据产品能够节省大量收集新数据产品所需的时间和资源,提高了效率;对已经被证明是准确和可靠的数据产品重复使用,易于进一步提高数据产品的准确性;复用度高的数据产品可以用于多种场景,提供更大的灵活性和适应性。要提升数据产品的复用度,需要提供充分的文献记录,使用正确的数据产品格式,并使其易于访问和使用。
(4)数据产品的受众广度指的是能够访问并使用数据产品的人群数量。数据产品的受众群体可以包括各种各样的人群,例如研究人员、分析师、决策者、普通公众等。通常,拥有广泛受众的数据产品比具有狭窄受众的数据产品更有价值,因为它可以被更多的人或组织使用,能够产生更大的总体效应。
(5)数据产品的受众深度指的是个人或组织对数据产品理解的程度。具有更高受众深度的数据产品是指被更多拥有专业知识的人或者组织使用的数据产品,而具有较低受众深度的数据产品则是被较不专业的人或组织使用的数据产品。通常,具有更高受众深度的数据产品能拥有更高的应用价值,因为数据产品的使用者能从其中挖掘出更多数据价值。例如,行业专家使用一份数据产品可能会总结出具有较少专业知识的人看不到的新模式或者新见解,这些新模式和新见解可以帮助人们更好地理解该数据产品,并实现更多的应用价值。
终端用户通过对数据产品的使用最终实现数据价值的释放。因此,在数据产品市场中,数据产品的应用价值是影响该阶段数据产品价值的主要因素之一。数据产品提供方在充分调研市场需求的基础上,开发具有较高场景关联度的数据产品,并及时优化、迭代数据产品,提升数据产品的实用度,通过不断拓宽产品的使用范围,提高数据产品的复用度和受众广度,提升数据产品的使用频率;最后通过将数据产品交由高受众深度的专家进行分析,从而实现数据要素价值的全面释放。
数据作为一种生产要素,现已成为重要资产。其与无形资产有许多相似的特性,如无实物形态、价值不确定性、时效性、非竞争性等。因此,一种对数据产品进行定价的方法是将成本法、收益法、市场法等无形资产评估的方法沿用到数据产品之中。
1.成本法
成本法是从数据产品价值的成本维度出发完成定价的方法。在无形资产的评估中,成本法是反映企业经济效益的最基本方法。该方法以生产费用价值论为理论基础,将数据资产的重置成本作为其价值计量基础,适用于市场不活跃的情况。刘玉等学者对数据产品的无形资产属性进行了确认,认为对于企业外购和主动获取的数据产品,应将成本法作为会计计量。
成本法虽然简单易操作,但存在许多局限。首先,数据产品趋近于零的边际成本,以及较高的固定成本,使单位产品均摊难以实现,数据产品成本量化困难。其次,数据成本与价值之间的对应关系弱,仅靠成本并不能衡量其获益能力,成本法估值偏低。最后,由于数据独特的生产过程,数据产品不存在平均化的社会必要劳动时间,衡量数据产品的价值不能仅考虑成本而忽视具体使用情境。此外,也有研究指出,数据产品难以计量的功能性贬值也是成本法的应用障碍之一。
2.收益法
由于数据产品不具有物理功能,其价值可以由其带来的收益决定。收益法是评估数据产品价值的首要方法。该方法以效用价值论为理论基础,将待估数据产品的预期收益值作为价值计量。此方法的前提是已知数据产品的预期收益、折现率和效益期限,这也是该方法实际落地的障碍所在。首先,由于数据产品价值的不确定性,数据产品的效益依赖于数据处理技术等具体条件,预期收益难以量化。其次,信息不对称导致数据产品难以得到不同主体都认可的合理价值,评估主观性较大。最后,数据产品折现率的确定难度大。鉴于此,目前多数企业将数据产品使用热度作为收益的计量维度,具体指标有数据产品的使用次数、调用频率等。
3.市场法
市场法从市场获取指标,考虑了市场供求,更具客观性和公平性。该方法以均衡价格论为理论基础,参照市场上类似数据产品交易案例的价格,利用技术水平、价值密度、评估日期、数据容量等可比因素进行修正,得到待估数据产品的价格。随着数据市场的日趋活跃,市场法更具适用性。但目前市场法仍然存在诸多挑战。首先,我国的数据产品交易尚处于初期实践中,市场不成熟,交易案例少,且案例多为协议定价,主观性强,参考性低。其次,数据产品的个性化程度高,难以寻找到具有相似特性的交易案例。最后,修正系数确定困难,某些修正项(如数据质量)难以量化,且难以确保数据产品差异修正全面。
数据产品的定价方法是方法论,需要有具体的定价策略对数据产品的价值进行量化。常见的数据产品定价策略有静态定价、动态定价、免费增值定价和基于博弈论的定价策略。
1.静态定价
采用静态定价的数据产品,价格一般是固定的,并且不会随着时间的变化而变化。数据提供方根据自身的市场定位,自主地调整确定数据产品的价格,以达到数据提供方盈利等的目的。这意味着所有的数据需求方需要为数据产品支付相同的价格,无论他们使用多少或使用多长时间。静态定价主要包括固定定价、分层定价及打包定价三种方式。
(1)固定定价是指数据提供方根据数据产品的成本和效用,结合市场供需情况,设定一个固定价格的定价方式。固定定价的优势在于价格固定,节省了撮合协调的时间成本和沟通成本;其局限在于适用范围狭窄,仅限于批量廉价的数据产品交易。基于使用量的定价方式就是一种固定定价方式,根据数据产品的时效和需求确定固定价格,然后根据数据需求方的数据使用程度(如API调用次数、订阅方式等)进行收费,主要适用于一般性的批量数据。
(2)分层定价是指将数据产品分成不同的价格层次,每个层次设置具有不同特性的数据产品。数据需求方可以根据自己的需求及预算,选取相应的数据产品。分层定价在给数据需求方提供更多选择性、增加数据需求方购买可能的同时,还能激励数据需求方向更高层级的数据产品升级。
(3)打包定价是指将多种数据产品捆绑在一起作为一个套餐,并以折扣价出售的定价模型。打包定价的目的是通过将多种具有关联性的数据产品打包在一起折扣出售,为数据需求方提供优惠与便利,为数据提供方创造更多的收益。
静态定价的优点是,数据需求方可以更容易地理解数据产品的价格,并完成预算。因为无须根据用量或其他因素不断调整价格,数据需求方也可以简单地完成价格管理。但是,在绝大多数情况下,静态定价并不是最佳的选择。例如,如果数据产品的生产成本是随时间不断变化的,静态定价就无法达到利润最大化的目的。
2.动态定价
动态定价是一种响应式定价策略,其中数据产品的价格会根据数据要素市场的需求、供应、趋势和竞争情况实时变化。例如,航空公司可能会使用动态定价,根据一年中的时间、路线及提前购票情况,对航班价格进行调整;酒店可能会根据房间占用率、该地区房间的需求来调整房间价格。动态定价的目的是通过动态地设定对客户有吸引力的价格来优化收入,同时考虑了生产、存储和销售数据产品的成本。但是,动态定价策略的实施和管理相对复杂,不适合所有数据产品。在数据要素流通体系尚未健全,数据要素市场机制尚在建立过程中的当下,数据产品的动态定价模式的应用环境尚未成熟。常见的动态定价方法包括自动定价、协商定价及拍卖式定价。
(1)自动定价是指根据供需情况,通过算法和软件自动调整价格的方式。自动定价通常是使用定价引擎来完成的,该引擎通过分析竞争对手的价格、数据产品的可用性、数据需求方的需求等因素,动态地计算出最佳价格。自动定价允许数据提供方快速、准确地调整价格,以响应不断变化的市场状况,从而帮助企业最大化利润并保持竞争力。具体而言,自动定价可以由具有权威性和公信力的机构对数据产品的价值作出初步评估,以供数据产品交易的参与方参考,提高数据定价的效率。
自动定价是一种为数据交易所、交易中心、交易平台等数据交易场所通过选定的数据产品价值评估指标为数据产品提供第三方定价的手段。例如,贵州大数据交易所会先使用数据质量评价指标初步评估数据产品的价值,然后根据评估结果、数据产品的历史成交价格得出一个合理的数据产品价格区间,供数据产品交易的参与方参考。
(2)协商定价是一种数据产品交易的参与方通过协商、轮流出价等方式,直至达成所有参与方都能接受的合理价格的定价策略。这可以是手动过程,参与方进行直接讨论以达成价格协议;也可以通过促进谈判过程的软件或其他工具自动化完成协商过程。各方对数据产品价值的认可是协商定价的基础。进行协商的根本原因是不同参与方之间信息的不对称,对数据产品的价值存在不同的认知。因此,需要通过协商减小不同参与方之间的信息差,进而使所有参与方可以对数据产品的价值达成一致。
协商定价在实践中最为常见,其优点在于定价的自由度及交易的成交率较高。由于参与方之间可以进行充分的沟通,在定价的过程和模型的选择上自由度较高。通过协商能够最大限度地满足所有参与方的需求,因此通过协商定价的数据产品交易成交率也较高。在实践中,数据提供方、数据需求方及数据加工方在开展数据产品交易时,往往采用协商定价的数据产品定价模式,由所有参与方协商具体的价格,达成合意后数据需求方与数据加工方即可调用相关数据产品。
(3)拍卖式定价是指将数据产品通过拍卖方式确定价格的定价策略。拍卖定价通常针对优质的数据产品,属于需求导向定价,适用于一个数据提供方和多个数据需求方交易的场景,以最高竞拍价为数据产品的成交价格。拍卖的方式有物理拍卖和在线拍卖两种形式。在物理拍卖过程中,投标人聚集在一个地点竞标相关的数据产品;在在线拍卖的方式下,数据需求方通过网站或平台远程参与拍卖过程。
拍卖定价的优点在于充分依靠市场来确定数据产品价格,由市场上的数据需求方根据数据产品效用的预期决定数据产品价格,无须设置繁杂的数据产品价值评估标准。贵阳大数据交易所将拍卖定价作为其数据定价的模式之一,对部分数据产品采取拍卖定价模式。荷兰学生曾通过竞拍的方式以350欧元出售了包括其个人隐私信息在内的数据产品,相关个人隐私信息包括个人简历、医疗信息、位置信息、电子邮箱、行程信息等。但是,由于数据产品的非竞争性(边际成本和复制成本趋近于零),拍卖式定价能否在实际场景中得到广泛应用,还有待市场的反馈。
3.免费增值定价
免费增值定价是指通过向数据需求方提供免费的数据产品或者补贴价格的方式提升用户黏性,进而促使其中一部分数据需求方购买其他具备增强功能的数据产品,或者向第三方销售数据需求方数据的交易模式。通常,免费增值定价可以分为两个阶段,免费付费阶段及增值付费阶段。免费付费阶段会首先向数据需求方提供免费的基本数据产品,以提高顾客满意度和用户黏性。进而在增值付费阶段,吸引数据需求方为更高级的数据产品付费,或者向第三方销售数据需求方的相关数据。例如软件、游戏,或应用程序常会向用户免费提供基本版本,并提供收费的高级版本。又如,在健身房会员或在线约会网站,用户可以免费尝试部分产品或服务,但必须付费以访问更多功能。免费增值模型可以成为数据提供方产生收入的有效方法,同时利于建立客户群,提高品牌知名度。
4.基于博弈论的定价策略
博弈论是数学中研究战略决策的分支。在博弈论体系中,博弈是由两个或多个参与方参与,根据其他参与方的行动与输出作出决策的情形。博弈论常被用来分析不同参与方之间的战略互动,并且可以应用到包括数据产品定价在内的多种现实场景中。
在数据产品定价的场景中,博弈论是基于对参与方行为的决策互动关系描述而发展起来的理论体系。纯粹的博弈论定价模型主要是描绘数据产品在一个具体场景中最终达到均衡状态的过程。博弈论在产品定价场景中已经得到了广泛应用。例如,在双寡头竞争下,数据驱动的博弈论模型可以预测竞争对手的价格反应和参考价格演变。在美国中型汽车市场中,存在使用博弈论对销售数据和价格数据进行分析完成需求预测的实例。有专家将博弈论与基于使用量的定价策略结合,完成了数据产品的广义定价模型。还有学者将博弈论应用于物联网数据定价领域,实现了云计算辅助、区块链增强的数据产品市场中的数据提供方与需求方各自的利益最大化。
博弈论是一个广义的理论名词,在这个理论体系之下,包含了很多不同的模型,常见的博弈论模型包括纳什均衡模型、伯特兰德模型、领导者—追随者模型、价格歧视模型。
(1)纳什均衡模型。该模型是以著名数学家约翰·纳什(John Nash)的名字命名的。这是一个用于研究两个或多个参与方竞争的场景,在该场景中每个参与方的竞争策略与其他参与方的策略都具有很强的相关性。纳什均衡代表多个参与方的竞争策略最终形成的稳定的状态。在纳什均衡之下,所有参与方均能达到最优,所有参与方均不期望对自己的策略进行更改。
(2)伯特兰德模型。该模型是以经济学家约瑟夫·伯特兰德(Joseph Bertrand)的名字命名的。该模型用于分析两个或多个数据提供方通过对相似的数据产品以设定价格的方式形成竞争的场景。在该模型达到均衡状态时,数据产品的价格将被设定为每个数据提供方的边际生产成本。因为,在了解其他数据提供方定价以后,每个数据提供方都会将价格尽可能降低,以获取更多的市场份额并最大化利润。
(3)领导者—追随者模型。该模型用于分析一个数据提供方(领导者)先设定价格,其他数据提供方(追随者)根据领导者的定价设定价格的场景。在该模型下,领导者先根据自身的成本结构及对追随者设计价格的预期设计价格;追随者再根据已知领导者的价格及自身的成本结构完成定价。领导者—追随者模型的目标是,领导者得出一个能最大化利润的定价,追随者的定价能够使其获得尽可能多的市场份额以保持盈利水平。
(4)价格歧视模型。该模型用于分析数据提供方根据不同数据需求方的付款意愿设定价格的场景。对数据需求方的区分可以根据资产情况、地理位置、购买历史等因素完成。在该预测模型下,公司将根据数据产品在不同数据需求者间对需求价格的弹性设计数据产品的定价。例如,为以小企业或个人消费者为主的数据需求方提供较低的价格,同时向较大的公司或者政府机构收取相对高的价格。具体的定价将根据数据需求群体的需求弹性进行调节与优化。
在构建国家数据市场的过程中,“互信难”成为一个显著的障碍。数据的独特属性,即其真实性、共享性与安全性的三者之间存在的固有矛盾,加剧了这一挑战。数据的核心价值依赖于其真实性,而其价值的实现又依赖于有限的共享。然而,由于数据本身的可复制性,不可能像实物一样进行无限制的共享,必须在确保个人隐私和国家安全的前提下进行谨慎管理。因此,建立一个基于可信技术的数据市场,确保数据共享在不侵犯隐私和威胁安全的情况下进行,是促进市场参与者之间互信的关键。
对数据安全性的顾虑成为数据要素市场参与方之间建立互信的核心问题之一,原因在于数据安全性直接关联到个人隐私、商业秘密和国家安全等敏感领域。这些数据的泄露会造成较为严重的影响,且当前的技术手段和机制体系无法精准地实现定位与追责。而在数据流通交易过程中,数据的收集、存储、处理和传输环节都可能成为潜在的安全漏洞,一旦数据被非法访问、泄露或篡改,就可能对数据提供方和使用方造成无法预估的损失,包括财务损失、声誉损害乃至法律责任。因此,未能充分保障数据的安全性,就无法建立起参与方之间的信任,阻碍了数据的有效流通和利用。
对数据有效性的顾虑同样是造成数据要素市场参与方之间互信困难的核心问题。数据有效性关乎数据的准确性和完整性,是数据价值的基础。在数据要素市场中,如果数据质量低下,或被篡改和伪造,将直接影响数据使用方的决策质量,带来错误的商业决策和投资失误。例如,基于不真实数据的市场分析可能导致企业错失商机或投资失败。因此,确保数据的有效性,对于建立市场参与方的信任关系、促进数据交易和利用具有至关重要的意义。
要实现保护数据的安全性与真实性这一目标,关键在于在全面监管的基础上,采用先进的技术手段,从而实现保护。例如,可以采用数据安全技术,从而保护数据在流通过程中的安全;可以采用先进的隐私计算技术,在保护数据持有权的同时,解决使用权的问题,从而保护数据在流通过程中的可信。
数据的共享性指的是数据能够被多方访问、使用和分析的特性,它是数据价值实现和知识传播的重要途径。共享性使得数据不仅能服务于原始收集者的目的,还能为其他个体或组织带来利益,通过共享和再利用促进创新和经济发展。
然而,对数据共享性的顾虑也是造成数据要素市场参与方之间互信难的问题之一。这是因为数据共享时难以确保数据的隐私和安全得到充分保护,数据的原始所有者可能担忧其敏感信息泄露,或数据被滥用而损害其利益。此外,缺乏明确的数据所有权和使用权界定,也增加了共享过程中的法律和商业风险。
解决数据共享性所引发互信难题的方法在于建立健全的数据共享机制和标准,同时引入先进的技术来保障数据的隐私和安全。一方面,需要通过法律法规明确数据共享的权责界限,建立数据共享的标准化协议,确保数据共享过程透明、合法和公正。另一方面,采用隐私计算技术,如可信执行环境、安全多方计算、联邦学习等,确保数据在共享过程中不泄露敏感信息,只交易流通数据的使用权,保障数据所有者的持有权,实现数据的“可用不可见”。此外,建立数据追踪和审计系统,加强对数据使用行为的监管,提高数据共享的安全性和可信度,从而增强市场参与方之间的信任。
数据要素市场的入场交易,从广义上理解即数据在要素市场中流动和共享。因此,入场交易对于当今的数字经济和社会发展具有至关重要的作用。首先,它促进了创新,为企业提供了前所未有的洞察力,使得产品和服务能够更精准地满足市场需求。此外,数据共享能够提高效率,通过优化资源分配和运营流程,降低成本,增加产业链的协同效应。在公共领域,数据流通对于增强政府服务、提升公共安全、改善健康和教育等方面也有着显著影响。更重要的是,数据的集成和分析能够帮助应对全球性挑战,如气候变化、疫情防控等,通过更好的决策支持系统,实现可持续发展目标。因此,数据要素的入场不仅是技术进步的驱动力,也是推动社会整体福祉提升的关键。
数据提供方权益难以得到保障的问题主要源于数据权属界定不清、数据安全和隐私保护风险高、数据交易规则和标准不统一,以及数据提供方议价能力较弱等方面。为了解决这些问题,需要完善相关法律法规,明确数据权属和交易规则;加强数据安全和隐私保护,建立有效的数据保护机制;推动数据交易市场的标准化和规范化,降低交易门槛和不确定性;同时,提升数据提供方的议价能力,保障其在交易中的合法权益。
首先,数据权属界定不清。在当前的法律体系下,数据的所有权、使用权、经营权等权益并没有明确的界定。这导致在数据交易过程中,数据提供方往往难以明确自己的权益范围,难以确保自己的权益不受侵犯。同时,由于缺乏明确的法律指导,数据交易各方在权益纠纷解决上也面临困难,进一步加剧了数据提供方权益保障的难度。
其次,数据安全和隐私保护风险高。数据提供方在参与数据交易时,需要面临数据泄露、滥用等安全风险。一些不法分子可能通过非法手段获取数据,进行非法利用,给数据提供方带来严重的损失。同时,由于缺乏有效的隐私保护机制,数据提供方的个人信息和商业秘密也可能在数据交易过程中被泄露,进一步威胁其权益。
此外,数据交易规则和标准不统一也是导致数据提供方权益难以得到保障的原因之一。目前,数据交易市场尚未形成统一的交易规则和标准,不同交易平台之间的数据格式、质量标准、交易方式等存在差异。这使得数据提供方在参与交易时面临较高的门槛和不确定性,难以保障自己的权益。
最后,数据提供方在数据交易中的议价能力较弱。由于数据交易市场的信息不对称和供需关系不平衡,数据提供方往往处于弱势地位,难以在交易中争取到合理的权益保障。一些大型数据需求方可能利用市场地位优势,对数据提供方施加压力,迫使其接受不合理的交易条件,进一步削弱了数据提供方的权益保障。
数据要素价值的释放依赖于其在高效流通、使用和赋能实体经济过程中的不断聚合和加工,这一过程能够产生显著的乘数效应。为了更好地发挥数据要素的作用,不仅需要政策层面的支持,也离不开法律法规的完善。我国已在这方面作出了不断的尝试,例如,《中共中央 国务院关于构建数据基础制度更好发挥数据要素作用的意见》提出了数据“三权”的概念,为促进数据要素市场的发展作出了积极的探索。
尽管我国已经认识到数据作为关键经济要素的重要性,并开始构建相应的法律框架,但这一体系仍在不断演进之中。许多企业在实际操作中发现,现有的法律法规既缺乏具体的操作指南,也缺少对数据交易、共享及其安全保护等关键问题的明确规定。这种不确定性不仅限制了企业在数据流通和利用上的积极性,也加剧了企业在数字经济活动中面临的法律风险,从而阻碍了数据资源的有效流通和高效利用。
高价值数据往往掌握在各行业领先企业的手中,这些企业利用高价值数据优化产品、支持决策,从而保持其市场领先地位。在企业内部,这些数据使用的风险相对可控。然而,在当前不完善的法律法规框架下,一旦这些数据被引入市场进行流通,就可能使企业面临法律诉讼、违规操作等风险。正因如此,面对潜在的法律和合规风险,许多企业选择不将其高价值数据推向市场交易。这种情况反映了法律法规缺失对数据流通和经济发展潜力释放的制约作用,也凸显了完善数据交易相关法律法规、构建安全可靠的数据流通环境的迫切需要。
为解决这一问题,还需进一步完善和细化数据相关的法律法规体系,明确数据权利归属、使用规则、交易机制,以及安全和隐私保护的标准。特别是,应当着重制定涵盖数据流通全过程的综合性法律政策,既要促进数据的开放和共享,又要确保数据交易的透明公正,同时加强数据安全和个人隐私的保护。此外,建立健全的数据纠纷解决机制和监管框架,对于增强企业的信心、鼓励企业更积极地参与数据流通和经济活动,以及推动中国数字经济的健康发展,都具有重要意义。在“中国数谷”中提出并应用的“数据合规流通数字证书”是其中的一种有效的解决方式,详情请参考第2.4节。
此外,加强对企业数据流通和利用过程中的指导和支持,也是提升企业信心、促进数据资源高效利用的重要措施。通过发布实施细则、操作指南和最佳实践案例,可以帮助企业更好地理解和遵守数据相关的法律法规,降低合规成本,提高数据处理的效率和安全性。同时,建立多方参与的沟通协调机制,鼓励企业、行业协会和监管机构之间的互动交流,共同探讨和解决数据流通过程中遇到的问题和挑战。通过这种合作模式,不仅能够促进法律法规与市场实际需求的紧密结合,也能够提升整个社会对数据安全和隐私保护的认识,共同推动形成公正、开放、透明的数据市场环境,进一步释放数字经济的潜力。
在当今信息化时代,数据被誉为新的石油,对经济社会发展具有极其重要的作用。然而,公共数据与企业数据的开放程度普遍不高,这一现象限制了数据潜力的充分发挥,成为限制创新与发展的瓶颈。
公共数据,指的是政府及其相关机构在履职过程中产生或掌握的数据。按理来说,这些数据的开放有助于提高政府透明度,促进公共服务的优化,以及激发社会创新能力。然而,实际上,公共数据的开放程度还远未达到理想状态。首先,数据开放的标准化和规范化程度不足。不同部门、不同级别政府间在数据格式、更新频率、访问方式等方面存在差异,且缺乏统一的数据资源目录,增加了数据利用的难度。其次,数据开放的数量和质量仍有待提高。尽管近年来已经采取措施推动公共数据的开放,但开放的数据量相对于庞大的政府数据资源仍然较少,且很多数据缺乏实用性和时效性,难以满足社会公众和企业的实际需求。
与公共数据相比,企业数据的开放更加复杂。企业通常出于商业利益的考虑,对数据持有较为保守的态度。企业数据开放程度不高主要表现在以下三个方面。一是企业对数据价值认识不足。尽管越来越多的企业意识到数据对于业务发展的重要性,但如何通过开放数据创造新的商业模式、提升行业整体效率的认识仍然不够。二是担忧数据安全和隐私保护。数据泄露不仅会损害企业声誉,还可能带来法律风险。因此,很多企业对于数据开放持谨慎态度。三是缺乏有效的激励机制。在缺少政策引导和市场激励的情况下,企业开放数据的积极性不高。
数据技术与市场体系的结合,重构了市场中参与主体间的关系结构,也带来新的市场竞争方式和竞争规则。但是当前的市场监管大多是在工业经济时代诞生的,与数字经济的发展还存在诸多不匹配的地方。这主要是因为数字经济市场的竞争增加了线上维度,是一场新的竞争,数字经济市场竞争在赋予企业更强能力的同时,也带来了不规范。比如,针对垄断型平台企业监管手段有待加强。当前,在社交媒体、共享经济、移动支付、电子商务等数字经济重点领域,平台垄断现象日益凸显,一些头部超大型企业掌握的数据资源规模和价值甚至已超过政府监管部门,存在形成数据市场“法外之地”的隐患。
当前,数据要素市场监管中的三个“不适应”问题值得关注。
一是传统监管方式契合度不高。传统监管方式与数据要素市场尚处于发展阶段的特性不具有契合性。一方面,数据要素市场处于发展初期,如果进行严格监管将可能阻碍其“蝶变”,错失发展机遇;另一方面,如不进行监管,那么会出现市场无序扩张等系统性风险。因此,对于数据要素市场的监管是以效率为导向,还是以安全为导向;是以促进产业发展为主,还是以规制风险为主,值得政策制定者或监管者深入分析。
二是传统监管思维适用性不强。传统监管思维对不断变化的数据要素市场不具有适用性。传统的监管政策建立在对风险客观、科学的评价之上,风险解决方案应以明确的风险界定和发生概率作为依据,但在数据要素市场发展中很多潜在风险并不能被社会识别。倘若政府无法了解数据要素市场风险的函数,那就无从获得风险发生的概率,更无法设定监管的“度”。因此,面对数据要素市场,监管部门进行风险规制的利弊很难判断,制定监管规则实属困难。
三是传统监管模式难以形成合力。传统单向度的监管模式在数据要素市场中难以形成监管合力。传统的监管方式强调监管部门凭借其权力自上而下对经济活动进行管制,总是使用“看得见的手”调节“看不见的手”。但是,监管部门的主体相对单一,易产生各自为战、“单打独斗”的现象,难以应对数据要素市场带来的具有高度复杂性和高度不确定性的新经济业态问题,有限的监管资源有可能导致监管失灵,既无法调动其他主体的监管积极性,也难以形成高效的监管系统。