购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

5.1 数据分类分级

数据分类可以使数据信息中心化、聚类化,从而使数据能够发挥出更大的价值,为数据分析技术提供更精准且有效的基础样本;而数据分级则可以保证不同敏感级别的数据在访问控制、数据保护措施等方面能够“应得其所”,从而确保数据的安全性和完整性,同时也能确保最小权限要求下的数据可用性能力,确保数据在提供价值的同时,不会因为数据泄露而为数据所有者带来额外损失或合规风险。有效的数据分类分级管理需要从多个方面进行建设和提升,本节将基于DSMM充分定义级(3级)视角,从组织建设、人员能力、制度流程和技术工具四个维度对数据分类分级的建设和提升提供实践建议。

5.1.1 建立负责数据分类分级的职能部门

明确岗位职责,是组织在行政层面进行数据分类分级建设的基础。在针对数据分类分级的组织建设上,如果条件允许,组织机构应该设立一个数据分类分级部门,并招募相关工作人员,负责组织机构整体的数据分类分级工作,包括定义组织机构整体的数据分类分级安全原则和操作指南、推动相关原则和指南的执行、建立数据分类分级审批机制、对组织机构中完成数据分类分级的数据进行标识和管理、对识别到的敏感数据进行脱敏处理、对数据分类分级中的重要操作进行审计和记录等,并尽量实现专人专岗专用。

5.1.2 明确数据分类分级岗位的能力要求

组织机构在设立了专门负责数据分类分级管理的岗位之后,应对该岗位的人员能力要求有较为清晰的认识和规划,从而从组织层面确保岗位的有效性、从人员层面确保相关岗位人员的能力可靠性,以便真正发挥该岗位应有的价值。

数据分类分级岗位的相关人员,需要具备良好的数据安全风险意识,熟悉国家网络安全法律法规,以及组织机构所属行业的政策和监管要求,在数据分类分级的过程中,能够严格按照《中华人民共和国网络安全法》《信息安全技术 个人信息安全规范》等相关法律法规和行业规范执行。除此之外,相关人员还需要具备良好的数据分类分级基础,了解公司内部的数据资产范围和组织架构,能够准确识别出哪些数据属于敏感数据等。同时,相关人员还需要熟悉数据分类分级的合规要求,熟练掌握数据安全措施,拥有制定标准化流程或制度的经验,能够根据公司的具体情况,制定出符合公司真实环境的数据分类分级原则、操作指南、管理制度和清单等,并推动相关要求与制度的落实。

5.1.3 数据分类分级岗位的建设及人员能力的评估方法

数据分类分级岗位的组织建设和对应人员实际执行能力的评估,可通过内部审计或外部审计等形式以调研访谈、问卷调查、流程观察、文件调阅、技术检测等多种方式实现。

1. 调研访谈

调研访谈法是社会调查中最经典、最常用的方法之一。具体的调查方法是,调查员通过与调查对象进行交谈来收集口头资料。

访谈通常是在面对面的场合下进行的,由调查人员接触调查对象,调查对象就所要调查的问题作出回答,并由调查人员详细记录下调查对象回答的内容,以及交谈时所观察到的动作行为及由此产生的印象。

数据分类分级阶段的调研访谈,主要包含对数据分类分级部门相关人员的访谈,以及对公司业务部门相关人员的访谈两部分,具体访谈内容如下。

2. 问卷调查

问卷调查法是国内外社会调查方法中使用较为广泛的一种方法。问卷是指为统计和调查所用的、以设问的方式表述问题的表格。问卷法就是研究者用这种控制式的测量问卷对所研究的问题进行度量,从而搜集到可靠的资料的一种方法。

问卷较之访谈表要更详细、完整和易于控制。问卷法的主要优点在于标准化和成本低。因为问卷法是以设计好的问卷工具进行调查,所以问卷的设计应确保规范化并且可计量。问卷调查作为调研访谈的另一种简化形式,被调查的人员一般是公司业务部门的相关人员。

数据分类分级阶段的问卷调查通常是以纸面问卷的形式进行的。内容包括数据分类分级部门是否制定了包括数据分类分级的原则、清单范围、操作方法、审批流程、防护要求等在内的相关制度与方法;该部门所制定的相关制度与方法在公司内部环境中是否有效,覆盖率、误报率、漏报率等是否在可接受的范围之内;该部门是否对检测到的敏感数据采取了有效的安全管理和控制措施等。从而从侧面确认数据分类分级制度的落实和推行情况。

3. 流程观察

流程观察是指评价实施团队成员在企业生产现场观察生产情况,寻找可能的改善点和问题点,并将上述内容记录下来的整个过程。流程观察有助于评价实施团队成员掌握一手材料,既能保证流程资料的真实性,又有助于评价实施团队成员对企业生产现场有更为感性的认知,从而保证流程改善点的正确性。

数据分类分级阶段的流程观察,主要是观察数据分类分级管理团队和业务团队两方的工作流程,并从中寻找可能的问题点和改善点,具体观察内容如下。

以中立的视角观察公司数据分类分级部门相关人员的工作流程,包括在为公司制定整体的数据分类分级原则时,流程是否标准,方案中的各项要求与制度设计是否合理,是否将数据按照重要程度进行了分级,是否按照数据的不同来源进行了分类,是否最大化地覆盖了公司内部的数据资产;在对数据进行分类分级时,是否按照数据分类分级的原则对数据进行了打标签的操作,是否设置了审计分析机制;在完成数据的分类分级操作后,对于不同类别和级别的数据,是否有针对性地制定了数据防护方案,是否建立了相应的管理机制,例如对敏感数据进行数据脱敏,对重要数据进行访问控制,对其他数据进行加解密等;从而确认数据分类分级部门的实际执行情况。

4. 技术检测

技术检测是指根据规定的评价标准规范,对实际数据的输出进行检测,并将测出的特性值与规定值进行比较,并加以判断和评价,以确定对被测对象的实际处理措施和方法是否符合要求。

数据分类分级阶段的技术检测,需要通过技术工具,实际确认现有数据的分类分级是否存在错误,是否与制度设计相符,是否存在暗数据未被正常分类处理的情况等。

5.1.4 明确数据分类分级的目的

大数据应用在不断发展创新的同时,数据违规收集、数据开放与隐私保护的矛盾,以及粗放式“一刀切”的管理方式等,都对大数据应用的发展带来了严峻的安全挑战。大数据资源的过度保护不利于大数据应用的健康发展,数据分类分级的安全管控方式能够避免“一刀切”带来的问题,对数据进行分类分级,可以实现数据资源的精细化管理和保护,确保大数据应用和数据保护的有效平衡。

5.1.5 确立数据分类分级的原则

数据分类分级应结合实际情况,明确需求,以数据的属性为基础,遵循科学性、稳定性、实用性和扩展性的原则,具体说明如下。

5.1.6 制定数据分类分级的方法及细则

数据分类的常用方法:按关系分类,基于业务(来源)、基于内容、基于监管等。

数据分级的常用方法:按特性分级,基于价值(公开、内部、重要核心等)、基于敏感程度(公开、秘密、机密、绝密等)、基于司法影响范围(大陆境内、跨区、跨境等)。

公用数据分类的常用方法:重要数据、个人及企业信息、业务数据。下面就来具体说明这三类公用数据。

根据上述公用数据的分类,重要数据分级、个人及企业信息分级和业务数据分级的方法分别如图5-1、图5-2和图5-3所示。

0

图5-1 重要数据分级方法示意图

0

图5-2 个人及企业信息分级方法示意图

0

图5-3 业务数据分级方法示意图

企业可基于上述公用数据分类分级策略,结合自身业务和合规需求实际情况,规划出适合企业自身的数据分类分级方法,建立适合组织自身的数据分类分级原则和方法,将数据按照重要程度进行分类,然后在数据分类的基础上,根据数据安全在受到破坏后对组织造成的影响和损失进行分级,如果组织层面已经具有相关的分类分级标准,则可酌情进行参考。在实际执行时,如果一次性做不到完全细粒度区分,则可以多步实现,循序渐进,不要设计过度复杂的方案。

企业自主分类分级可参考如图5-4所示的思路,基于非敏感、敏感、涉密三个等级,对应上述重要数据的五个等级进行分级。

0

图5-4 企业自主分类分级参考示意图

5.1.7 制定数据分类分级的安全策略

在完成数据分类分级后,组织机构需要有针对性地制定数据防护要求,设置不同的访问权限、对重要数据进行加密存储和传输、敏感数据进行脱敏处理、重要操作进行审计记录和分析等。

基于上述参考思路,数据分类分级安全策略如下:非敏感数据一级(完全公开)无需进行防护;非敏感数据二级需要确保只在必要时才对外公开,以避免过度公开,同时需要确保仅内部人员才可访问和使用,可采用基于身份的访问控制;敏感数据三级需要确保只有通过审核之后的数据才可公开,并附带未授权公开的惩罚措施等规章制度,针对三级数据的访问,需要设置明确的基于身份的访问控制权限,确保只有确实存在实际需求的特定员工才能使用敏感数据;敏感数据四级则完全禁止公开,同时严格限制内部人员访问,仅以白名单等形式允许特定的极少数人员接触,并制定相关数据防泄露政策,以及具备相应的数据防泄露技术能力;涉密数据不属于数据安全治理范畴,对其的处理和使用需要完全遵守国家相关法律法规的规定。

5.1.8 实施变更审核机制

在数据分类分级工作中,组织机构需要明确相关内容和操作流程的审核和审批机制,保证数据分类分级工作符合组织的分类分级原则和制度要求。原则上已被明确分类分级的数据,其等级只可升级不可降级(以防止泄密),审批需要多人控制,包括数据所有者、数据分类分级管理者和行政管理者等。

5.1.9 使用技术工具

使用数据分类分级技术工具的前提是组织内部已有明确的数据分类分级方法和策略,即分类和分级的规则。从技术层面看,数据分类分级首先涉及的是数据发现。目前,数据类型可以分为两种,一种是结构化的数据,如业务数据、数据库等;另外一种则是非结构化的数据,如商业文件、财务报表、合同等。可使用标签库、关键词、正则表达式、自然语言处理、数据挖掘、机器学习等内容识别技术,对数据进行分类,根据数据分类的结果,依据标签对敏感数据进行划分,最终实现数据分级的目的。

5.1.10 基于元数据类型的分类技术

(1)内容感知分类方法

该方法依赖于对非结构化数据内容的自动分析来确定分类,其中涉及很多技术(正则表达式、完全匹配、部分或完整指纹识别、机器学习等)。

下面列举一个比较好理解的例子,那就是IP地址。IP地址通常的表示方法是点分十进制,其数据特征非常明显:数字+点+数字+点+数字+点+数字。对于像IP地址这样数据特征明显的数据,比如手机号码、身份证号码、银行卡号码等,可以使用正则表达式、关键字提取等数据特征技术进行识别。

(2)情境感知分类方法

该方法依赖于数据分类工具中能够被编码的现成的分类知识库,由于该方法利用的是广泛的情景(上下文)属性,因此这种分类方法适用于静态数据(如基于存储路径或其他文件的元数据)、使用中的数据(如由CAD应用程序创建的数据)和传输中的数据(如基于IP的数据)。例如,在医疗行业中,医院拍摄的X光片承载了病人的重要信息,针对这种场景,我们可以不对X光片的内容进行识别,而只需要结合X光片产生的场景进行分类,简单的分类就可以识别出该X光片的文件格式,如后缀名等,将属于该后缀的文件都作为敏感信息类。

5.1.11 基于实际应用场景的分类技术

基于实际应用场景的数据分类主要包含以下几种手段,其中,实际运用的技术手段可能涵盖内容感知分类方法和情景感知分类方法中的多种方法。

分级指的是在分类的基础上,依据数据的敏感程度、影响范围及自身的价值等对数据进行等级划分,如表5-1所示,依据分类产生的标签结果,可根据标签定义数据的敏感程度,对数据进行进一步分级。

表5-1 数据分类与访问控制

0

5.1.12 技术工具的使用目标和工作流程

数据分类分级的技术工具应能实现以下目标。

基于数据分类分级的技术工具对数据进行分类分级作业的基本流程如图5-5所示。

0

图5-5 数据分类分级作业基本流程图 x5I9z7HrVHK8SEx3aN6C3PgdQDq0Q6W8Sz+NL2q4ipODOTtRNXVlvaGRMMEBLBGi

点击中间区域
呼出菜单
上一章
目录
下一章
×