分析型数据、测试型数据是指从生产环境导出的线上数据。这些数据作为独立数据导入分析、开发测试的场景,用作数据分析和测试等。为何要单独对这两类场景进行分析并关注其安全风险呢?因为这两类场景在越来越多的组织中都有着强烈的需求,同时在这两类场景中数据存在较大的安全隐患,容易造成泄密风险。数据分析、开发测试场景如图5-4所示。
图5-4 数据分析、开发测试场景
随着大数据应用的成熟,数据分析的商用价值被日益重视。无论数据拥有者自身或是第三方,都希望通过对线上数据进行分析,从中提炼有效的信息,为商业决策提供可靠支撑;或将数据导入人工智能系统中,训练智能学习算法模型,期望将经过训练的智能系统部署上线,自动化地完成部分决策功能。无论是人工分析或是机器学习分析,均需要将数据从原始数据环境导出到独立的数据库,而用于数据分析的数据库环境可能在实验室,也可能在开发者的个人计算机上,甚至在第三方的系统中。数据分发给第三方的过程已将数据保护的责任一并交到了对方手上,组织的核心敏感数据是否得以保全完全取决于对方的安全意识及安全防护能力。如果分析环境没有任何保护措施,那么敏感数据等同于直接暴露、公开。对组织而言,数据不仅脱离了管控,同时可能因数据泄露而造成巨大损失。
同数据分析场景一样,数据开发测试场景也需要将数据从生产环境导出到独立的数据库上进行后续操作。开发测试人员为确保测试结果更符合真实环境,往往希望使用与真实数据相似的数据,或者直接使用真实数据的备份进行测试和验证。开发测试环境往往不像生产环境那样有严密的安全防护手段,同时因权限管控力度降低,数据获取成本降低,与外界存在更多接触面,这让不法分子能够更轻易地从开发测试库获取敏感数据。另外还有可能因获取门槛较低,让个别内部人员有机会窃取敏感数据。
考虑到数据导出后其安全性已不再受控,故需要针对导出的数据进行处理,尽量减小泄密风险,同时预留事后追溯途径。例如,某大型酒店曾经真实发生的一起数据泄密事件。因该酒店同时与多个第三方咨询公司合作,需要客户入住信息用作统计分析,酒店工作人员在未做任何处理的情况下将数据导出交给了多个咨询公司。后被发现有超过50万条客户隐私信息遭泄露,但因无据可查,最终也无法确定究竟是从哪家咨询公司泄密。若酒店在把数据交给第三方时经过了脱敏处理,则可避免泄密事件的发生;或添加好水印再将数据交出,则至少能在事后进行追查,定位泄密者。
综上所述,对于数据安全而言,不仅要关注实际生产环境下的数据安全,也要做好开发测试库及数据分析库的安全保障。在日益严峻的数据安全大背景下,只有完善的防护体系和可靠的防护策略,才能更有效地提高数据安全防护能力,保障组织的数据安全,防止因开发测试或数据分析等环节出现数据泄露而导致损失。