配置自定义词库--大模型应用防火墙-火山引擎

文档中心

立即注册

导航

配置自定义词库

最近更新时间：2025.03.28 19:07:11首次发布时间：2025.03.28 19:07:11

大模型应用防火墙内置词库，用于匹配输入和输出内容中的敏感信息或者不合规内容。此外，大模型应用防火墙还支持自定义词库，以适配更符合您业务实际场景的内容检测需要。

背景信息

正向词库：指允许出现的提示词。如果您将某提示词加入到正向词库中，则该提示词被大模型应用防火墙视为”正常输入“。这种情况下，即便您配置的提示词防护策略关联了该词库所属的检测分类，在命中对应提示词内容后，大模型应用防火墙也不会将其判定为攻击行为，直接放行。
负向词库：指禁止出现的提示词。如果您将某提示词加入到负向词库中，则该提示词被大模型应用防火墙视为”恶意输入“。如果您配置的提示词防护策略关联了该词库所属的检测分类，在命中对应提示词内容后，大模型应用防火墙会判定该请求中包含攻击词汇，按照设定的防护策略执行相关动作，包括观察、放行或优化回答。

注意事项

如果您暂未配置自定词库，大模型应用防火墙会按照预置词库检测输入和输出内容。

操作步骤

登录大模型应用防火墙控制台。
在顶栏选择实例所属地域。
在左侧导航选择防护>大模型防护>自定义词库。

单击添加词库，配置词库信息。

参数	说明	示例值
规则名称	输入词库的名称。说明以中文、字母、数字开头。允许字母、数字、中文、点“.”、下划线“_”和中划线“-”。长度为1-128个字符。	词库1
检测分类	将该词库关联到对应的检测分类下，当配置的提示词防护策略使用该检测分类时，大模型应用防火墙才会匹配该词库。	涉敏1 欺诈
词库类型	正向：该词库用于添加正常输出的内容，即词库内的提示词允许出现，不会触发防护动作，直接放行。负向：该词库用于添加恶意输入的内容，即词库内的提示词禁止出现，会触发相应的防护动作。	负向
匹配方式	完全匹配：用户输入的提示词与此处配置的单条内容完全一致才算命中，对内容匹配度要求较高。关键词匹配：用户输入的提示词只要匹配到单条提示词中的关键词，即为命中，对内容匹配度要求较低。	完全匹配
提示词	输入需要加入到该词库中的提示词内容。如需输入多条提示词，直接换行即可。	测试1 测试2
测试状态	测试状态开关可用于测试提示词库的效果。如果您担心匹配词库会影响正常请求，或者希望观察一段时间再正式启用词库，您可以开启测试状态。开启后，大模型应用防火墙不会直接对命中的提示词执行对应动作，仅记录请求日志。如果该开关关闭，则表示大模型应用防火墙对命中的提示词直接执行配置的防护动作。	开启
词库开关	根据需要设置是否启用该词库。	开启

单击确定。
配置完成后，自定义词库列表会生成与提示词数目相等的词库规则。例如输入了 2 行提示词，则生成 2 条词库规则。规则 ID 可用于日志检索和攻击详情判断。

配置效果说明

例如，按上述示例值配置了 ID 为Z000000000007和Z000000000008两条词库规则，且提示词防护策略中关联了涉敏1和欺诈两个检测分类，执行动作为拦截。
现有一条提示词为测试1的请求，匹配到该提示词防护策略。由于开启了”测试状态“，该提示词不会被直接拦截，但访问日志会记录在日志详情中，您可以通过日志详情页面规则 ID 查询对应日志信息。