分类分级管理--大数据研发治理套件-火山引擎

文档中心

导航

分类分级管理

最近更新时间：2025.03.18 14:20:38首次发布时间：2024.01.02 11:58:21

数据分类分级是数据安全精细化管理的重要基础，精准完善的分类分级能够为安全策略做支持。通过对数据的分类分级，识别数据对组织的具体价值，确定以何种适当的策略，保护数据的完整性、保密性和可用性。系统提供了分类分级标签自定义能力，支持用户基于实际情况自定义分类分级，以满足不同安全合规的差异性要求，可灵活响应行业需求，加强数据安全保障。

1 约束限制

仅主账号和安全标签管理员具备分类分级配置权限。配置管理员角色的操作请参见管理员配置。

2 前提条件

在概览页面，已开通湖仓一体、分布式数据自治或 DataOps敏捷研发服务。详细操作说明请参见 DataLeap 服务信息。

3 新建标签

登录DataLeap控制台。
选择概览 > 数据安全 > 安全标签 > 分类分级，进入分类分级页面。
单击新建按钮，进入新建标签页面。
设置标签信息，单击提交按钮，完成创建。
- 若新建标签，则依次设置标签信息和配置识别规则后，单击下一步按钮，进入提交页面。
  说明
  - 识别规则是指用于自动识别该分类的逻辑，通过在扫描任务中选择需识别的分类标签，实现自动基于该标签的规则进行识别。当规则命中数据字段时，系统会推荐资源owner为命中字段打上该标签。
  - 识别规则可直接跳过，暂不配置。
- 若新建标签分类，则设置标签分类信息后，单击下一步按钮，进入提交页面。

新建标签相关参数说明如下表所示。其中名称前带 * 的参数为必填参数，名称前未带 * 的参数为可选参数。

参数	说明
基本信息
*类型	支持标签和标签分类两个类型选项。标签：用于标识数据内容。标签分类：按照标签的种类、等级或性质分别归类。
*上级分类	标签所属的标签分类，下拉可选已创建的分类。支持模糊检索，可选择根目录 root。
*名称	标签的名称，自行设定，不可重复，长度不超过50字符。名称不能以符号开头，且不可仅由数字、符号组成。
英文名称	标签的英文名称自行设定。名称不可全是符号，且不可包含中文字符。
*描述	标签的说明信息，长度不超过200字符。
关联信息
保密级别	标签的保密级别，支持由低到高四个选项L1、L2、L3、L4，下拉可选。说明当类型选择标签时，需设置该参数。
识别规则当类型选择标签时，需设置该项内容。
*识别类型	规则识别类型，包括字段名、字段描述、内容三个设置选项，支持多选。每个选项勾选后，会显示以下相应的填写项，需至少填写其中的一项内容。每个识别类型选项的各填写项（关键词、排除词、正则表达式、匹配接近度）是 and 的关系，若填写多项，则必须要全都满足才算命中。关键词：包含任意一个关键词，则认为关键词检查通过。最多可设置 20 个，之间用英文逗号隔开，总长度不超过500个字符。字段名和字段描述的单个关键词长度分别是 1~100 个字符，内容的是 3~100 个字符。排除词：不包含任何一个排除词，则认为排除词检查通过。最多可设置 20 个，之间用英文逗号隔开，总长度不超过500个字符。字段名和字段描述的单个排除词长度分别是 1~100 个字符，内容的是 3~100 个字符。正则表达式：匹配正则表达式，则检查通过。支持多个正则表达式选项，下拉可选。若没有匹配要求的选项，也可直接输入。匹配接近度：表示正则匹配的内容出现在关键词后的最大范围（字符数），该数值应大于等于正则检测的字符数。设置范围为 1~300 的整数。说明仅内容选项包含填写项匹配接近度，且必须填写关键词和正则表达式后，才会显示该参数。匹配接近度可以用来提高标签识别的准确性，举例说明，数据表中包含了社保号（IDAABB0000）、护照号（E20000888）、员工工号（ID00000000），用户想识别“社保号”，设置的识别规则如下：关键词设置为 ID。正则表达式选择数字和字母组成。匹配接近度设置为 8。根据以下不同组合进行设置并识别，可以看出设置匹配接近度后，识别更精准。若仅配置正则，则社保号、护照号、员工工号均会被识别为“社保号”。若配置正则+关键词，社保号、员工工号会被识别为“社保号”。若配置正则+关键词+匹配接近度，则仅社保号会被识别为“社保号”。说明不是必须以关键词开头，而是内容包含关键词且在某一关键词的某一次出现+匹配接近度范围内的子串可以满足正则，才算匹配上。
*识别类型关系	多个识别类型间的关系，支持 AND、OR 两个选项。说明当识别类型选择多个选项时，需设置该参数。
*命中率阈值	命中率的临界值，可设置为1~100的整数。说明仅当识别类型选择了内容时，需设置该参数。系统只推荐“命中率>=阈值”的字段标注该标签。命中率=符合规则数据行数/抽样数据行数*100%。比如，抽样100行数据，其中有80行匹配上，但命中率阈值设置了100%，则认为内容没匹配上，结论是不打标签。
测试数据	自行填写字段名、字段描述、字段内容等样例数据，测试规则的准确性。刷新测试结果后，会出现以下情况：若无数据或校验数据不满足规则，则提示“规则未命中，可输入新的测试数据后刷新测试结果”。若数据满足规则，则提示“规则命中”。

4 导入标签

本功能用于批量创建分类分级安全标签，步骤如下：

登录DataLeap控制台。
选择概览 > 数据安全 > 安全标签 > 分类分级，进入分类分级页面。
单击导入按钮，弹出导入文件窗口。
单击下载模板按钮，下载分类分级标签模板至本地后，在模板文件中填写标签信息并保存文件。
单击上传框或直接拖拽文件至上传框后，单击提交按钮，将标签批量导入系统。

说明

仅支持上传CSV文件。

5 管理标签

登录DataLeap控制台。
选择概览 > 数据安全 > 安全标签 > 分类分级，进入分类分级页面。
可执行以下管理操作：
- 搜索标签
  - 在标签目录栏的搜索框中，输入标签名称的关键词，按回车键，可快速搜索符合条件的标签。
  - 单击搜索框右侧的展开/折叠图标，可以通过标签类型或分级进行筛选。
- 单击标签目录中的某个标签节点，可以查看该标签的详情信息，并执行以下操作：
  - 单击编辑按钮，进入规则编辑页面，可以编辑该标签的配置规则。
  - 单击清空规则按钮，二次确认后，可以删除该标签的已有规则。
- 鼠标悬停在某标签上，单击显示的更多图标，可执行以下操作：
  - 单击编辑按钮，在弹出的侧拉窗口中，可以编辑该标签的基本信息。
  - 单击注销按钮，二次确认后，可以注销该标签。
    注销后不可再编辑或使用该标签，已使用该标签的字段将自动删除该标签。
  - 单击删除按钮，二次确认后，可以删除该标签。
    删除标签后其内所有数据都将删除，并会影响历史使用过该任务的结果数据显示，请谨慎操作。
  说明
  - 仅标签支持注销操作，注销操作不可逆。
  - 标签注销后才可删除。
  - 仅标签支持编辑或删除规则，且只有已配置规则的标签才可执行删除规则操作。
  - 若标签分类下存在子项，则该标签分类不可删除。

6 导出标签

登录DataLeap控制台。
选择概览 > 数据安全 > 安全标签 > 分类分级，进入分类分级页面。
单击导出按钮，弹出确认导出标签数据对话框。
单击下载按钮，可将已创建的标签信息全部导出至本地。

注意

本功能仅可用于分类分级标签管理等工作，如有数据泄漏发生，下载者需承担相应责任。

7 后续操作

创建分类分级标签后，您可按需配置扫描任务，对指定数据资源进行分类分级识别，相关操作说明可参见扫描管理。