You need to enable JavaScript to run this app.
导航
分类分级管理
最近更新时间:2025.02.20 17:02:10首次发布时间:2024.01.02 11:58:21

数据分类分级是数据安全精细化管理的重要基础,精准完善的分类分级能够为安全策略做支持。通过对数据的分类分级,识别数据对组织的具体价值,确定以何种适当的策略,保护数据的完整性、保密性和可用性。
系统提供了分类分级标签自定义能力,支持用户基于实际情况自定义分类分级,以满足不同安全合规的差异性要求,可灵活响应行业需求,加强数据安全保障。

1 约束限制

仅主账号具备分类分级配置权限。

2 前提条件

概览页面,已开通湖仓一体分布式数据自治DataOps敏捷研发服务。详细操作说明请参见 DataLeap 服务信息

3 新建标签

  1. 登录DataLeap控制台。
  2. 选择概览 > 数据安全 > 安全标签 > 分类分级,进入分类分级页面。
    Image
  3. 单击新建按钮,进入新建标签页面。
    Image
  4. 设置标签信息,单击提交按钮,完成创建。
    • 若新建标签,则依次设置标签信息和配置识别规则后,单击下一步按钮,进入提交页面。

      说明

      • 识别规则是指用于自动识别该分类的逻辑,通过在扫描任务中选择需识别的分类标签,实现自动基于该标签的规则进行识别。当规则命中数据字段时,系统会推荐资源owner为命中字段打上该标签。
      • 识别规则可直接跳过,暂不配置。
    • 若新建标签分类,则设置标签分类信息后,单击下一步按钮,进入提交页面。

新建标签相关参数说明如下表所示。其中名称前带 * 的参数为必填参数,名称前未带 * 的参数为可选参数。

参数

说明

基本信息

*类型

支持标签和标签分类两个类型选项。

  • 标签:用于标识数据内容。
  • 标签分类:按照标签的种类、等级或性质分别归类。

*上级分类

标签所属的标签分类,下拉可选已创建的分类。
支持模糊检索,可选择根目录 root

*名称

标签的名称,自行设定,不可重复,长度不超过50字符。
名称不能以符号开头,且不可仅由数字、符号组成。

英文名称

标签的英文名称自行设定。
名称不可全是符号,且不可包含中文字符。

*描述

标签的说明信息,长度不超过200字符。

关联信息

保密级别

标签的保密级别,支持由低到高四个选项L1、L2、L3、L4,下拉可选。

说明

类型选择标签时,需设置该参数。

识别规则
类型选择标签时,需设置该项内容。

*识别类型

规则识别类型,包括字段名字段描述内容三个设置选项,支持多选。
每个选项勾选后,会显示以下相应的填写项,需至少填写其中的一项内容。每个识别类型选项的各填写项(关键词排除词正则表达式匹配接近度)是 and 的关系,若填写多项,则必须要全都满足才算命中。

  • 关键词:包含任意一个关键词,则认为关键词检查通过。
    • 最多可设置 20 个,之间用英文逗号隔开,总长度不超过500个字符。
    • 字段名字段描述的单个关键词长度分别是 1~100 个字符,内容的是 3~100 个字符。
  • 排除词:不包含任何一个排除词,则认为排除词检查通过。
    • 最多可设置 20 个,之间用英文逗号隔开,总长度不超过500个字符。
    • 字段名字段描述的单个排除词长度分别是 1~100 个字符,内容的是 3~100 个字符。
  • 正则表达式:匹配正则表达式,则检查通过。
    • 支持多个正则表达式选项,下拉可选。若没有匹配要求的选项,也可直接输入。
  • 匹配接近度:表示正则匹配的内容出现在关键词后的最大范围(字符数),该数值应大于等于正则检测的字符数。设置范围为 1~300 的整数。

    说明

    内容选项包含填写项匹配接近度,且必须填写关键词正则表达式后,才会显示该参数。

    匹配接近度可以用来提高标签识别的准确性,举例说明,数据表中包含了社保号(IDAABB0000)、护照号(E20000888)、员工工号(ID00000000),用户想识别“社保号”,设置的识别规则如下:
    • 关键词设置为 ID
    • 正则表达式选择数字和字母组成
    • 匹配接近度设置为 8
      根据以下不同组合进行设置并识别,可以看出设置匹配接近度后,识别更精准。
    • 若仅配置正则,则社保号、护照号、员工工号均会被识别为“社保号”。
    • 若配置正则+关键词,社保号、员工工号会被识别为“社保号”。
    • 若配置正则+关键词+匹配接近度,则仅社保号会被识别为“社保号”。
      Image

      说明

      不是必须以关键词开头,而是内容包含关键词且在某一关键词的某一次出现+匹配接近度范围内的子串可以满足正则,才算匹配上。

*识别类型关系

多个识别类型间的关系,支持 AND、OR 两个选项。

说明

识别类型选择多个选项时,需设置该参数。

*命中率阈值

命中率的临界值。

  • 识别类型选择了内容时,阈值可设置为1~100的数字。
  • 识别类型仅选择字段字段描述时,阈值只能设置为100%。

说明

  • 系统只推荐“命中率>=阈值”的字段标注该标签。
  • 命中率=符合规则数据行数/抽样数据行数*100%。比如,抽样100行数据,其中有80行匹配上,但命中率阈值设置了100%,则认为内容没匹配上,结论是不打标签。

测试数据

自行填写字段名、字段描述、字段内容等样例数据,测试规则的准确性。
刷新测试结果后,会出现以下情况:

  • 若无数据或校验数据不满足规则,则提示“规则未命中,可输入新的测试数据后刷新测试结果”。
  • 若数据满足规则,则提示“规则命中”。

4 导入标签

本功能用于批量创建分类分级安全标签,步骤如下:

  1. 登录DataLeap控制台。
  2. 选择概览 > 数据安全 > 安全标签 > 分类分级,进入分类分级页面。
  3. 单击导入按钮,弹出导入文件窗口。
    Image
  4. 单击下载模板按钮,下载分类分级标签模板至本地后,在模板文件中填写标签信息并保存文件。
  5. 单击上传框或直接拖拽文件至上传框后,单击提交按钮,将标签批量导入系统。

说明

仅支持上传CSV文件。

5 管理标签

  1. 登录DataLeap控制台。
  2. 选择概览 > 数据安全 > 安全标签 > 分类分级,进入分类分级页面。
  3. 可执行以下管理操作:
    • 搜索标签
      • 在标签目录栏的搜索框中,输入标签名称的关键词,按回车键,可快速搜索符合条件的标签。
      • 单击搜索框右侧的展开/折叠图标 ,可以通过标签类型或分级进行筛选。
    • 单击标签目录中的某个标签节点,可以查看该标签的详情信息,并执行以下操作:
      • 单击编辑按钮,进入规则编辑页面,可以编辑该标签的配置规则。
      • 单击清空规则按钮,二次确认后,可以删除该标签的已有规则。
    • 鼠标悬停在某标签上,单击显示的更多图标,可执行以下操作:
      • 单击编辑按钮,在弹出的侧拉窗口中,可以编辑该标签的基本信息。
      • 单击注销按钮,二次确认后,可以注销该标签。
        注销后不可再编辑或使用该标签,已使用该标签的字段将自动删除该标签。
      • 单击删除按钮,二次确认后,可以删除该标签。
        删除标签后其内所有数据都将删除,并会影响历史使用过该任务的结果数据显示,请谨慎操作。

      说明

      • 仅标签支持注销操作,注销操作不可逆。
      • 标签注销后才可删除。
      • 仅标签支持编辑或删除规则,且只有已配置规则的标签才可执行删除规则操作。
      • 若标签分类下存在子项,则该标签分类不可删除。

6 导出标签

  1. 登录DataLeap控制台。
  2. 选择概览 > 数据安全 > 安全标签 > 分类分级,进入分类分级页面。
  3. 单击导出按钮,弹出确认导出标签数据对话框。
  4. 单击下载按钮,可将已创建的标签信息全部导出至本地。

注意

本功能仅可用于分类分级标签管理等工作,如有数据泄漏发生,下载者需承担相应责任。

7 后续操作

创建分类分级标签后,您可按需配置扫描任务,对指定数据资源进行分类分级识别,相关操作说明可参见扫描管理