数据分类分级是数据安全精细化管理的重要基础,精准完善的分类分级能够为安全策略做支持。通过对数据的分类分级,识别数据对组织的具体价值,确定以何种适当的策略,保护数据的完整性、保密性和可用性。
系统提供了分类分级标签自定义能力,支持用户基于实际情况自定义分类分级,以满足不同安全合规的差异性要求,可灵活响应行业需求,加强数据安全保障。
1 约束限制
仅主账号具备分类分级配置权限。
2 前提条件
在概览页面,已开通湖仓一体、分布式数据自治或 DataOps敏捷研发服务。详细操作说明请参见 DataLeap 服务信息。
3 新建标签
- 登录DataLeap控制台。
- 选择概览 > 数据安全 > 安全标签 > 分类分级,进入分类分级页面。

- 单击新建按钮,进入新建标签页面。

- 设置标签信息,单击提交按钮,完成创建。
- 若新建标签,则依次设置标签信息和配置识别规则后,单击下一步按钮,进入提交页面。
说明
- 识别规则是指用于自动识别该分类的逻辑,通过在扫描任务中选择需识别的分类标签,实现自动基于该标签的规则进行识别。当规则命中数据字段时,系统会推荐资源owner为命中字段打上该标签。
- 识别规则可直接跳过,暂不配置。
- 若新建标签分类,则设置标签分类信息后,单击下一步按钮,进入提交页面。
新建标签相关参数说明如下表所示。其中名称前带 * 的参数为必填参数,名称前未带 * 的参数为可选参数。
参数 | 说明 |
---|
基本信息 |
*类型 | 支持标签和标签分类两个类型选项。 - 标签:用于标识数据内容。
- 标签分类:按照标签的种类、等级或性质分别归类。
|
*上级分类 | 标签所属的标签分类,下拉可选已创建的分类。
支持模糊检索,可选择根目录 root。 |
*名称 | 标签的名称,自行设定,不可重复,长度不超过50字符。
名称不能以符号开头,且不可仅由数字、符号组成。 |
英文名称 | 标签的英文名称自行设定。
名称不可全是符号,且不可包含中文字符。 |
*描述 | 标签的说明信息,长度不超过200字符。 |
关联信息 |
保密级别 | 标签的保密级别,支持由低到高四个选项L1、L2、L3、L4,下拉可选。 |
识别规则
当类型选择标签时,需设置该项内容。 |
*识别类型 | 规则识别类型,包括字段名、字段描述、内容三个设置选项,支持多选。
每个选项勾选后,会显示以下相应的填写项,需至少填写其中的一项内容。每个识别类型选项的各填写项(关键词、排除词、正则表达式、匹配接近度)是 and 的关系,若填写多项,则必须要全都满足才算命中。 - 关键词:包含任意一个关键词,则认为关键词检查通过。
- 最多可设置 20 个,之间用英文逗号隔开,总长度不超过500个字符。
- 字段名和字段描述的单个关键词长度分别是 1~100 个字符,内容的是 3~100 个字符。
- 排除词:不包含任何一个排除词,则认为排除词检查通过。
- 最多可设置 20 个,之间用英文逗号隔开,总长度不超过500个字符。
- 字段名和字段描述的单个排除词长度分别是 1~100 个字符,内容的是 3~100 个字符。
- 正则表达式:匹配正则表达式,则检查通过。
- 支持多个正则表达式选项,下拉可选。若没有匹配要求的选项,也可直接输入。
- 匹配接近度:表示正则匹配的内容出现在关键词后的最大范围(字符数),该数值应大于等于正则检测的字符数。设置范围为 1~300 的整数。
说明 仅内容选项包含填写项匹配接近度,且必须填写关键词和正则表达式后,才会显示该参数。
匹配接近度可以用来提高标签识别的准确性,举例说明,数据表中包含了社保号(IDAABB0000)、护照号(E20000888)、员工工号(ID00000000),用户想识别“社保号”,设置的识别规则如下:
- 关键词设置为 ID。
- 正则表达式选择数字和字母组成。
- 匹配接近度设置为 8。
根据以下不同组合进行设置并识别,可以看出设置匹配接近度后,识别更精准。 - 若仅配置正则,则社保号、护照号、员工工号均会被识别为“社保号”。
- 若配置正则+关键词,社保号、员工工号会被识别为“社保号”。
- 若配置正则+关键词+匹配接近度,则仅社保号会被识别为“社保号”。
 说明 不是必须以关键词开头,而是内容包含关键词且在某一关键词的某一次出现+匹配接近度范围内的子串可以满足正则,才算匹配上。
|
*识别类型关系 | 多个识别类型间的关系,支持 AND、OR 两个选项。 |
*命中率阈值 | 命中率的临界值。 - 当识别类型选择了内容时,阈值可设置为1~100的数字。
- 当识别类型仅选择字段或字段描述时,阈值只能设置为100%。
说明 - 系统只推荐“命中率>=阈值”的字段标注该标签。
- 命中率=符合规则数据行数/抽样数据行数*100%。比如,抽样100行数据,其中有80行匹配上,但命中率阈值设置了100%,则认为内容没匹配上,结论是不打标签。
|
测试数据 | 自行填写字段名、字段描述、字段内容等样例数据,测试规则的准确性。
刷新测试结果后,会出现以下情况: - 若无数据或校验数据不满足规则,则提示“规则未命中,可输入新的测试数据后刷新测试结果”。
- 若数据满足规则,则提示“规则命中”。
|
4 导入标签
本功能用于批量创建分类分级安全标签,步骤如下:
- 登录DataLeap控制台。
- 选择概览 > 数据安全 > 安全标签 > 分类分级,进入分类分级页面。
- 单击导入按钮,弹出导入文件窗口。

- 单击下载模板按钮,下载分类分级标签模板至本地后,在模板文件中填写标签信息并保存文件。
- 单击上传框或直接拖拽文件至上传框后,单击提交按钮,将标签批量导入系统。
5 管理标签
- 登录DataLeap控制台。
- 选择概览 > 数据安全 > 安全标签 > 分类分级,进入分类分级页面。
- 可执行以下管理操作:
- 搜索标签
- 在标签目录栏的搜索框中,输入标签名称的关键词,按回车键,可快速搜索符合条件的标签。
- 单击搜索框右侧的展开/折叠图标 ,可以通过标签类型或分级进行筛选。
- 单击标签目录中的某个标签节点,可以查看该标签的详情信息,并执行以下操作:
- 单击编辑按钮,进入规则编辑页面,可以编辑该标签的配置规则。
- 单击清空规则按钮,二次确认后,可以删除该标签的已有规则。
- 鼠标悬停在某标签上,单击显示的更多图标,可执行以下操作:
- 单击编辑按钮,在弹出的侧拉窗口中,可以编辑该标签的基本信息。
- 单击注销按钮,二次确认后,可以注销该标签。
注销后不可再编辑或使用该标签,已使用该标签的字段将自动删除该标签。 - 单击删除按钮,二次确认后,可以删除该标签。
删除标签后其内所有数据都将删除,并会影响历史使用过该任务的结果数据显示,请谨慎操作。
说明
- 仅标签支持注销操作,注销操作不可逆。
- 标签注销后才可删除。
- 仅标签支持编辑或删除规则,且只有已配置规则的标签才可执行删除规则操作。
- 若标签分类下存在子项,则该标签分类不可删除。
6 导出标签
- 登录DataLeap控制台。
- 选择概览 > 数据安全 > 安全标签 > 分类分级,进入分类分级页面。
- 单击导出按钮,弹出确认导出标签数据对话框。
- 单击下载按钮,可将已创建的标签信息全部导出至本地。
注意
本功能仅可用于分类分级标签管理等工作,如有数据泄漏发生,下载者需承担相应责任。
7 后续操作
创建分类分级标签后,您可按需配置扫描任务,对指定数据资源进行分类分级识别,相关操作说明可参见扫描管理。