近年来,政务数据资产化逐渐成为一个研究热点问题,国内外学者从不同的视角对政务数据资产化展开研究,试图提出数据资产化的有效途径和创新策略。叶雅珍等(2020)给出了一个数据资产化的基本框架,包括数据资源确权、数据价值确认与质量管控、数据装盒入库、货币计价与评估、数据资产折旧和增值的管理五个步骤;提供了一个解决数据资产化问题的可行方向。通过对国内外数据资产相关领域研究,发现对该问题的探讨主要集中在数据安全化、标准化、价值化等技术性范畴,以及相应的法律法规、制度设计、数据权属和资产属性界定等非技术性范畴。因此,本书以政务数据资产化为研究对象,从技术处理过程和市场化过程两个层面着手,梳理相关研究成果,探讨政务数据资产化的作用机理,为下文实证分析提供理论支撑。
通过对已有文献进行分析,发现关于数据安全化的研究主要基于数据安全管理和数据脱敏等方面。
(1)数据安全管理。
Duncan(1991)和Schouten等(2003)针对政务数据开发应用的安全进行了深入研究,认为在政务数据开发利用的过程中,一定要加强个人隐私的保护,并对此给出了对策和建议。王智慧(2007)以频繁模式为知识的表现形式,研究了数据共享中的敏感模式保护,频繁模式共享中的敏感模式隐藏,以及频繁模式共享中的推理控制等问题。王衍锋等(2013)提出一种面向安全标的的敏感数据识别方法,对商业银行应该重点保护的敏感数据进行分类识别,并采用全生命周期信息风险防范与控制的方法,分析银行金融系统由于在研发过程中设计考虑不充分而导致系统运行过程中可能面临敏感数据信息泄露的风险。
叶润国、陈雪秀(2016)提出政务数据开放共享中的权属关系需明确等安全问题,并从政策法规等方面提出安全保障建议。曹雨佳、黄伟群(2016)针对政务数据的安全,提出了建立数据管理专门机构,负责对数据进行开放安全审查;对政务数据进行分级分类管理;制订个人数据保护法等建议。黄如花、苗淼(2017)从我国政务数据开放的相关法律法规、政策、组织机构设置及标准四个方面对我国数据安全保护进行了调研与分析。袁国杰(2018)应用定量与定性相结合的方法,将政务数据开放的安全影响因素分为表层因素、中层因素和深层因素三个部分,指出影响政务数据开放安全的表层因素为开放流程是否标准。可见,政务数据开放流程标准与否直接影响着政务数据的开放安全,是政务数据开放安全的重要影响因素。
陈丹丹等(2018)对美国、日本和欧盟等发达国家和地区在政务数据开发利用过程中的保密经验进行了归纳总结,并将其经验与我国的实际情况相结合,对我国政务数据开发应用中的数据保密提出了相应的对策和建议。丁红发等(2019)基于技术和管理相结合的视角,完善了法律体系,加强数据安全与隐私管理和技术标准规范约束,提升安全与隐私泄露风险评估和国家商用密码的应用,提高社会数据安全素养,从数据安全治理的角度解决此问题。张佳鑫(2019)从政务数据产生阶段、政务数据保管阶段、政务数据共享阶段进行分析,通过相关指标体系的构建,构建政务数据共享安全保障机制。吉倩雯(2019)针对政务数据开放中个人隐私泄露风险的防范,在法律法规、管理机制、平台建设、保密审查机制、政务数据开发的监管及规范等方面提出了相应的对策和建议。
(2)数据脱敏。
周期律、郭丽雯(2014)介绍了测试数据脱敏方法评价体系中的五个指标含义及分级方法。张璐等(2014)基于二级管理安全模型,用于保护政务数据的安全;同时,采用数据密封机制防止政务数据的二次非法授权访问,对政务数据进行加密,加密密钥与数据授权使用系统的软硬件信息相关联。崔敏龙(2015)设计开发了一种银行业敏感数据脱敏系统,实现了脱敏效果分析等功能。史雅涓等(2018)提出了基于中心点聚类的改进K匿名数据共享方法。
王晓周等(2019)结合基础电信企业大数据安全实践,从鉴权、多租户管理、数据分级分类保护等方面,阐述了一种构建大数据平台安全和敏感数据保护的思路。罗长银、陈学斌(2019)为了保护数据源信息,首先利用加密算法将数据进行加密处理,再对数据进行模糊化和泛化处理。王毛路、华跃(2019)基于对数据使用场景的深入分析和分级分类,提出了一种基于存量和增量数据实现静态脱敏和动态脱敏的方法,且可通过K-匿名和L-多样化方法验证数据脱敏的有效性。
已有文献针对数据标准化的研究主要集中在政策层面和技术层面,其中政策层面主要关注标准化体系的建设,技术层面主要关注元数据方案的建立。
(1)政策层面。
赖洪波(2015)利用数据仓库技术及元数据理论和方法,设计出我国政府信息资源元数据的创建方法,并建立政府信息资源元数据标准体系,实现对标准的管理。张承伟、赖洪波、乌丽娟(2006)认为,为达到对政务数据有效管理的目的,应依靠政务数据元数据标准体系。
张群、吴东亚、赵菁华(2017)系统地分析了我国大数据标准化工作面临的问题,描述了大数据参考架构,提出大数据标准体系框架。洪学海、王志强、杨青海(2017)对IS0 8000数据质量国际标准提出的数据质量框架、主数据质量、事务数据质量和产品数据质量进行了探讨,对面向共享的政务数据质量标准化的方法和测度理论进行了研究。翟军(2017)指出,为克服我国目前政务数据元数据建设在标准化上的不足,应加强法律法规、政策、体系等方面的工作。
(2)技术层面。
进行政务数据标准化的第一步是对数据进行有效的描述,元数据作为对政务数据资产信息的描述在数据资产的组织中起着重要的基础性作用。王媛媛(2008)详细介绍了GILS和DC-Government等元数据标准方案。李辉(2011)通过业务建模、数据元设计和业务文档格式设计等的标准化,解决了信息共享中数据交换和异构数据库互操作的关键问题。
周志峰等(2013)、钱晓红等(2014)均指出,在我国政务数据资产管理平台的建设中,元数据的建设和管理起核心作用;赖洪波(2015)、梅洪(2017)和张会然(2019)等在进行地方政府开放数据管理机制建设中提到将元数据作为标准基准。英国开放数据研究院推出的数据质量评估平台也将机器可识别的、标准的元数据作为重要的考察内容之一。
郑磊等(2015)构建了13个评估维度,用于整体、全面地评估我国的政务数据,元数据就是评估维度之一。赵龙文等(2017)针对当前国内在政务数据开放过程中的资源描述问题,提出四层结构的资源描述方法,在分析政务数据开放特点的基础上,引入国际通用的DC等元数据标准对数据资源进行目录描述、数据集描述、关联描述和访问描述。于梦月(2018)在横向上,根据功能将元数据分为描述型、管理型、保存型、技术型和使用型元数据。在纵向上,单一、完整的元数据体系应该包括语义、结构及语法;在政务数据领域范畴内,元数据正逐渐向标准化、机器可识别的方向发展。
从管理角度而言,元数据管理更是作为数据管理的重要一环在DAMA数据管理体系中被重点提及。从2012年开始,北京、上海、浙江和重庆等地方政府相继建立了元数据信息,但各地方元数据方案存在差异,对数据集的描述也不够全面,距离做到规范标准且可互通操作还相差甚远,且地方政府出台的元数据规范多为政务数据开放服务,针对政务数据资产化的元数据尚未有任何方案提出。
经过对国内外与数据价值化相关的文献进行分析,发现研究的重点集中在对无形资产的评估、数据价值的定性和定量等方面。
(1)对无形资产的评估。
Moody和Walsh(1999)认为,收集信息和管理信息产生的成本,加上信息的质量对公司信息的价值起决定作用,同时对信息资产可以按照有形资产进行评估。然而,何帅、俞勇(2012)认为,数据资产在资产属性上属于无形资产。在对无形资产的评估中,陈久梅(2002)和余氤翔(2003)分别采用了小波神经网络预测方法和基于高新技术企业整体资产价值评估的方法。李争艳(2005)归纳、总结了无形资产的定义、属性,并提出了评估的前提条件,同时提出了运用传统的收益法对无形资产进行价值评估。
窦娟(2010)建议采用二项式期权模型,对专利价值这种无形资产进行价值评估。唐艳(2011)对我国无形资产评估面临的困境进行了深入剖析,并提出了相应的对策。庞淄镡、张煦(2015)基于无形资产价值形成的理论,对公司的无形资产价值进行评估。刘鹤、范莉莉(2016)探讨了基于布莱克-斯科尔斯模型评估企业碳无形资产实物期权价值的可能性和适用性。孙文杰、高兵(2018)就无形资产评估中收益法的应用问题进行了研究。
(2)对数据价值的定性研究。
将数据作为资产,目前还没有权威的定义。Glazer(1993)认为,公司所有的信息符合资产的性质,因此,可以将信息资源称为信息资产。刘玉(2014)指出,数据资产为任何可计量、可数据化的信息,且通过数据挖掘可以给国家、公司和个人带来经济效益和社会效益的信息。张咏梅(2015)认为,金融数据可以采用传统的成本法进行评估,在资产属性上归类于无形资产。
在数据资产概念的界定上,康旗等(2015)和张志刚等(2015)给出了相类似的定义,二者均认为数据资产的所有权归企业及组织所有,是能产生预期收益的数据资源。刘琦等(2016)指出,未来的数据市场必定是完备、有效的交易市场,因此,建议运用市场法对数据资产价值进行评估。王建伯(2016)认为,数据的价值主要体现在数据分析与数据交易。韩娜娜等(2016)将政务数据价值分为知晓性、基础应用及高级应用价值,且运用不同的方法评估不同价值层面的数据资产。王新才(2016)认为,数据资产应运用差别定价理念,同时认为成本、效用和预期利润是影响数据价值的主要因素。
经过对上述文献的研究分析,可知大部分学者均认可数据资产这一概念,并认为数据可以产生预期的经济效益。杨有韦(2016)将政务数据划分为五类:只有政府才有能力获取的数据;仅有政府才有权采集的数据;由政府行动而产生的数据;政府因履行监管职责所获取的数据;政府部门提供服务时产生的消费和留案数据。从属性上可分为四类:自然信息类、城市建设类、城市管理统计监察类、服务与民生消费类。朱丹(2017)将政务数据资产定义为,拥有权或控制权归属于政府各部门,并且这种资产可以产生预期的经济价值。张弛(2018)归纳总结了数据资源转化为数据资产的三个条件:可控制、可量化及给数据的拥有者带来经济效益。
(3)对数据价值的定量研究。
Longstaff F A和Schwartz E S(2001)运用最小二乘蒙特卡洛方法对数据价值进行评估。张志刚(2015)构建了电力公司数据资产价值指标,运用AHP方法对电力公司的数据资产价值进行评估。
魏晓菁、陈峰、董媛媛(2015)分析了在数据资产形成过程中,对数据资产价值产生影响的相关因素;然后,确定各因素之间的相对重要程度;最后,利用层次分析法计算得出数据资产可信度值。周芹(2016)采用AHP方法,运用蒙特卡洛模拟算法,评估电商企业数据资产的价值。梁文、刘夫新和崔梦枭(2016)运用数据质量监测技术和数据资产评估技术,进行量化数据质量指标。李永红和李金骜(2017)以互联网企业为分析对象,并对传统的计算方法进行了相应的改进与优化,目的在于为未来的理论研究与现实应用提供基础。朱丹(2017)完善了数据资产管理框架;发现数据资产价值影响的关键因素,并提出估值模型。黄乐等(2018)借鉴同样作为无形资产的品牌价值评估的三个主流办法:成本法、市场法和收益法,引入数据平台活跃系数等参数,通过实证案例对模型进行验证。王玉兰(2018)指出了传统评估方法的不足,将数据资产作为一种特殊的无形资产,确定采用AHP方法对数据资产进行评估。陶怡然(2019)通过对数据资产评估方法进行比较分析,发现层次分析法具有可行性。
国内外研究人员在政务数据市场化方面也做了大量的研究,主要集中在数据资产属性和数据权属等方面。
(1)对数据资产属性的研究。
对于数据的资产属性,目前尚未形成统一意见。王玉林、高富平(2016)从实践和理论两个方面对大数据的资产属性进行了探讨,认为大数据具有财产属性,是信息财产权的客体,是大数据控制人的数据资产。徐漪(2017)认为,数据资产属于无形资产范畴,应当在《企业会计准则》中及时补充、添加与数据资产有关的条款及其计量方式。穆勇等(2017)认为,不能确定数据的资产属性,就难以有效地对政务数据进行资产化管理,数据资源转化为数据资产应满足所有权明确、稀缺性、经济效益三个条件。同时认为数据资源是不同于固定资产、无形资产和知识产权的另外一种新型资产。唐莉、李省思(2017)认为,数据具有资产属性,同时满足无形资产的一些特点。因此,应将数据资产归类为无形资产。邹照菊(2017)认为,企业数据具备资产特征,因而符合资产定义。朱扬勇、叶雅珍(2018)认为,数据资产是拥有数据权属、有价值、可计量、可读取的网络空间中的数据资源,数据资产兼有各种资产的特征,应将其作为一种新的资产类别。
(2)对数据权属界定的研究。
针对数据权属界定的问题,已有文献尚未达成共识,存在争议。肖冬梅、文禹衡(2015)和齐爱民、盘佳(2015)针对数据权属问题的观点类似,他们均认为应从国家数据主权和个人数据权利两个视角对数据的权属问题进行研究,其中国家数据主权包括数据管理权和控制权;个人数据权利包括人格权和财产权。郭兵(2016)针对数据权属难以界定的问题,提出了“个人数据银行”的概念。他认为应该有专业机构对个人的数据进行收集和分析,在不泄露个人隐私的前提下,分离数据的所有权和使用权。
穆勇等(2017)认为,数据权属界定的关键是要厘清数据的提供者、数据的收集者、第三方大数据平台及数据的消费者之间的关系,通过确定数据的所有权、控制权和使用权等来界定参与方的相关利益,并通过制定相关的法律法规、规章制度和签订合约等对此种利益分配关系进行约束。冯惠玲(2017)认为,由于数据权属界定不清,政府部门信息公开存在法律风险,从而限制了信息公开的范围和内容,影响了政府部门的主动性,导致政府信息公开实质性进展缓慢。
许可(2018)认为,在不同的利益相关者中,数据的财产权应首先依循“捕获规则”,分配给收集、处理数据的数据从业者,继而再依据“关联规则”,将与人格密切相关且界定清晰的“个人敏感数据”权利分配给数据主体,以弥补“捕获规则”之不足。石丹(2018)将数据分为个人数据、企业数据和政务数据,并认为个人数据的所有权和控制权归个人所有;企业数据经过脱敏处理后获得部分所有权,政务数据应当作为公共产品处理。丁晓东(2019)认为,数据具有多重属性,其属性高度依赖场景。对数据进行确权,应当遵循场景化的规则制定方式,以理性规则和个案来自下而上地推动数据规则体系演进,而非寻求数据的统一性规则。