所谓产权,指的是一种通过社会执行而实现的对某种经济物品的多种用途进行选择的权利。与所有权不同,产权不是绝对的、普遍的,而是一种相对的权利,它是不同的所有权主体在交易中形成的权利关系。按照数据产生主体的不同,其产权的基本属性也应有所不同。
划分数据类型以及明确相关属性,是对数据进行确权的前提条件。目前,可将数据划分为个人数据、企业数据和公共数据等类型。个人数据通常体现为私有产权的基本属性,具有“个人弱控制”与“产业强需求”等特征。非个人或对个人信息进行脱敏、脱密和不可识别处理的商业数据主要体现为数据挖掘和控制者的有限产权,公共数据则体现为公共产权的基本属性。
1.个人数据
个人数据是指专属于个人,涉及个人人身、财产或尊严等相关的有价值的信息。个人数据按内容可以分为生物属性信息和社会属性信息,也可以分为用户行为数据、用户消费数据、用户地理位置数据、用户银行数据、互联网金融数据、用户社交等UGC数据和基因组信息等。个人的信息片段经由大数据等新型技术挖掘,能够衍生出特定价值指向的信息。
个人数据或信息主要呈现出“个人弱控制”与“产业强需求”等特征。人们习惯于选择应用智能技术以便利生活,同时也默认了个人信息被收集、被使用与被处理。即便同意收集的格式条款或保密协议使人们有一定的个人信息自主控制能力,但数据一旦被采集,就很难保持提供者的匿名性和隐私性,人的有限理性、信息的天然流动性及可复制性都使个人所谓的同意被沦为形式。这表现出个人数据具有“个人弱控制”的特点。同时,大数据使个人信息成为信息产业的新型生产要素,被数据企业争相抢夺,表现出“产业强需求”。个人信息可以帮助企业实现精准营销以减少资源投入,成为企业实现其事业目的的客观助力因素。这类数据的权利设计主要是出于保护个人隐私权,确保具有财产属性的个人数据不被滥用、个人权利不受侵害。
《中华人民共和国民法典》第一千零三十四条指出,个人信息是指以电子或者其他方式记录的能够单独或者与其他信息结合识别特定自然人的各种信息。主要包括生物属性的信息,如姓名、性别、年龄、血型、健康状况、身高、人种、声音、指纹、虹膜、生日、特征等众多可以直接或间接识别个人的信息。同时,还包括社会属性的信息,如居住地址、通讯方式、电话号码、邮箱地址、家庭成员、职业、婚姻状况、职务、学历学位、户籍、阅历、身份证号、银行账号、信用记录、医疗信息、社保账号等。
2.企业数据
企业数据分为商业数据、集合数据、脱敏化和模型化数据及人工智能化数据等。其中,商业数据有明确的产权归属,当所有者愿意出让时,使用者可以通过付出对价而取得这些数据的产权或使用权。同时,还有一部分企业在生产经营中汇集了大量的用户数据信息,如银行、电信企业、水电煤气企业、交易所、电商交易平台、物流平台、社交网站等。部分企业又把内部业务平台数据、客户数据和管理平台数据进行脱敏、模型化,以云计算为基础,进行数据存储、复制、加工,分析和挖掘这些数据信息。除此之外,还存在以数据中介形式采集或聚合的数据。数据中介主要通过数据产生者、数据加工者和数据整合者等获取各类数据,包括原始数据、加工处理后的数据以及由多份数据整合后形成的新数据,进而向数据需求者直接交付数据产品或服务。数据中介与数据源头共同构成了大数据资源的供给方。这类数据的权利设计理念主要在保障隐私安全的前提下,促进数据自由流动和便捷交易。
3.政府数据(公共数据)
政府数据与其他社会产品相比,带有显著的公共属性特征。公共数据主要包括对自然和宇宙认知的数据、历史遗产和现代知识产权的数据、国家宏观数据、企事业单位数据、自然人数据。公共数据的确权和开放最可能快速催生巨大的经济和社会价值,在不涉及国家秘密、商业秘密和个人秘密信息的情况下,应当进一步明确相关数据的权属,尤其是使用和处置权,以及保障相关主体的权益。政府部门应该在不涉密的前提下,尽可能向社会和市场开放政府数据,不能以任何理由垄断数据的使用,这样才能最大化政府数据的公共价值。这类数据的权利设计理念主要是在不涉密的情况下,保护大众对公共数据的运用,防止政府部门的垄断和隐瞒。
依据经典的新制度经济学理论,产权是一组权利束,主要包括所有权、使用权、收益权和处置权等权利组合,其中排他性的所有权是核心。国内研究者主要根据经典的产权权属进行论述,认为数据产权主要由所有权、占有权、管理权、收益权和让渡权等构成。但是数据作为一种新型无形资产,可以产生价值,具有商品和服务的特征,同时具有准公共产品的特点,极易在未经合理授权的情况下被收集、存储、复制、加工、传播和分享,并且数据汇集和加工伴随着新数据的产生。因此,数据与其他资产的产权结构应有所不同,数据产权的结构应该为所有权和控制权,数据控制权包括谁能使用数据、如何使用数据,以及能否进一步对外分享数据等,主要包括知情同意权、获取权、修改权、拒绝权、删除权等。数据的所有权和控制权可以分离,特别是对个人数据而言。
数据具有一定的公共品属性。从使用环节看,数据具有很强的“非竞争性”,一个人使用了某类数据,并不影响其他人对它的使用;而从生产环节看,数据具有很强的“非排他性”,不同的搜集者可以对同一数据源进行数据搜集,互不干扰。
数据具有很强的规模效应和范围效应。在现有的技术条件下,规模太小或者维度太少的数据对于分析是没有意义的。随着数据规模的增大、维度的增加,可能从数据中挖掘出的价值将会呈现几何级数的上升。
数据具有较强的可再生性和可替代性。不同于石油等传统的生产要素,数据不会因使用而消失,反而可能因使用而不断增加。与此同时,数据也不像石油那样绝对不可或缺。事实上,为了达成相同的分析目标,可以采用完全不同的数据集合。
数据具有特殊的稀缺性。数据存在无形性,且理论上可无限复制,并且复制品与“原物”的价值等同,所以数据的稀缺性与通常所讲的资源稀缺性存在明显区别,数据的稀缺性往往体现在获取及控制使用上,而不是数据本身具有很高的直接价值,单个数据往往不具有直接的经济价值。
数据具有隐私性。有些能够识别特定个人的数据往往具有隐私性,这也是人们觉得数据很敏感的根本原因。