大模型应用防火墙内置词库,用于匹配输入和输出内容中的敏感信息或者不合规内容。此外,大模型应用防火墙还支持自定义词库,以适配更符合您业务实际场景的内容检测需要。
如果您暂未配置自定词库,大模型应用防火墙会按照预置词库检测输入和输出内容。
登录大模型应用防火墙控制台。
在顶栏选择实例所属地域。
在左侧导航选择防护>大模型防护>自定义词库。
单击添加词库,配置词库信息。
参数 | 说明 | 示例值 |
---|---|---|
规则名称 | 输入词库的名称。 说明
| 词库1 |
检测分类 | 将该词库关联到对应的检测分类下,当配置的提示词防护策略使用该检测分类时,大模型应用防火墙才会匹配该词库。 | 涉敏1 |
词库类型 |
| 负向 |
匹配方式 |
| 完全匹配 |
提示词 | 输入需要加入到该词库中的提示词内容。如需输入多条提示词,直接换行即可。 |
|
测试状态 | 测试状态开关可用于测试提示词库的效果。如果您担心匹配词库会影响正常请求,或者希望观察一段时间再正式启用词库,您可以开启测试状态。
| 开启 |
词库开关 | 根据需要设置是否启用该词库。 | 开启 |
单击确定。
配置完成后,自定义词库列表会生成与提示词数目相等的词库规则。例如输入了 2 行提示词,则生成 2 条词库规则。规则 ID 可用于日志检索和攻击详情判断。
例如,按上述示例值配置了 ID 为Z000000000007
和Z000000000008
两条词库规则,且提示词防护策略中关联了涉敏1
和欺诈
两个检测分类,执行动作为拦截
。
现有一条提示词为测试1
的请求,匹配到该提示词防护策略。由于开启了”测试状态“,该提示词不会被直接拦截,但访问日志会记录在日志详情中,您可以通过日志详情页面规则 ID 查询对应日志信息。