You need to enable JavaScript to run this app.
导航
配置自定义词库
最近更新时间:2025.03.28 19:07:11首次发布时间:2025.03.28 19:07:11
我的收藏
有用
有用
无用
无用

大模型应用防火墙内置词库,用于匹配输入和输出内容中的敏感信息或者不合规内容。此外,大模型应用防火墙还支持自定义词库,以适配更符合您业务实际场景的内容检测需要。

背景信息

  • 正向词库:指允许出现的提示词。如果您将某提示词加入到正向词库中,则该提示词被大模型应用防火墙视为”正常输入“。这种情况下,即便您配置的提示词防护策略关联了该词库所属的检测分类,在命中对应提示词内容后,大模型应用防火墙也不会将其判定为攻击行为,直接放行。
  • 负向词库:指禁止出现的提示词。如果您将某提示词加入到负向词库中,则该提示词被大模型应用防火墙视为”恶意输入“。如果您配置的提示词防护策略关联了该词库所属的检测分类,在命中对应提示词内容后,大模型应用防火墙会判定该请求中包含攻击词汇,按照设定的防护策略执行相关动作,包括观察、放行或优化回答。

注意事项

如果您暂未配置自定词库,大模型应用防火墙会按照预置词库检测输入和输出内容。

操作步骤

  1. 登录大模型应用防火墙控制台

  2. 在顶栏选择实例所属地域。

  3. 在左侧导航选择防护>大模型防护>自定义词库

  4. 单击添加词库,配置词库信息。
    Image

    参数

    说明

    示例值

    规则名称

    输入词库的名称。

    说明

    • 以中文、字母、数字开头。
    • 允许字母、数字、中文、点“.”、下划线“_”和中划线“-”。
    • 长度为1-128个字符。

    词库1

    检测分类

    将该词库关联到对应的检测分类下,当配置的提示词防护策略使用该检测分类时,大模型应用防火墙才会匹配该词库。

    涉敏1
    欺诈

    词库类型

    • 正向:该词库用于添加正常输出的内容,即词库内的提示词允许出现,不会触发防护动作,直接放行。
    • 负向:该词库用于添加恶意输入的内容,即词库内的提示词禁止出现,会触发相应的防护动作。

    负向

    匹配方式

    • 完全匹配:用户输入的提示词与此处配置的单条内容完全一致才算命中,对内容匹配度要求较高。
    • 关键词匹配:用户输入的提示词只要匹配到单条提示词中的关键词,即为命中,对内容匹配度要求较低。

    完全匹配

    提示词

    输入需要加入到该词库中的提示词内容。如需输入多条提示词,直接换行即可。

    1. 测试1
    2. 测试2

    测试状态

    测试状态开关可用于测试提示词库的效果。如果您担心匹配词库会影响正常请求,或者希望观察一段时间再正式启用词库,您可以开启测试状态。

    • 开启后,大模型应用防火墙不会直接对命中的提示词执行对应动作,仅记录请求日志。
    • 如果该开关关闭,则表示大模型应用防火墙对命中的提示词直接执行配置的防护动作。

    开启

    词库开关

    根据需要设置是否启用该词库。

    开启

  5. 单击确定
    配置完成后,自定义词库列表会生成与提示词数目相等的词库规则。例如输入了 2 行提示词,则生成 2 条词库规则。规则 ID 可用于日志检索和攻击详情判断。
    Image

配置效果说明

例如,按上述示例值配置了 ID 为Z000000000007Z000000000008两条词库规则,且提示词防护策略中关联了涉敏1欺诈两个检测分类,执行动作为拦截
现有一条提示词为测试1的请求,匹配到该提示词防护策略。由于开启了”测试状态“,该提示词不会被直接拦截,但访问日志会记录在日志详情中,您可以通过日志详情页面规则 ID 查询对应日志信息。
Image