提示词看似无法产生危害和攻击,但可能会大量消耗大模型算力,导致您的服务异常。例如,非法用户向大模型输入过多内容、或要求其输出过多内容,或者让大模型长时间高频高速运行某个任务。这些场景下,您的大模型服务可能会无法响应正常请求。大模型应用防火墙会评估提示词对大模型算力的消耗程度,以高、中、低三个档位提供不同防护策略,以缓解大量请求导致的算力不足问题。
您已将需要防护的网站接入大模型应用防火墙。接入相关操作,请参见域名接入说明。
登录大模型应用防火墙控制台。
在顶栏选择实例所属地域。
在左侧导航选择防护>大模型防护>算力消耗防护。
启用策略。
单击添加规则,配置规则信息。
参数 | 说明 | 示例值 |
---|---|---|
规则名称 | 输入算力消耗防护策略的名称。 说明
| 算力消耗防护1 |
访问路径 | 选择需要匹配的域名或路径。 说明 SDK 方式接入的防护域名,暂不支持匹配到路径。 | www.volcwaf001.com |
消耗量 | 大模型的算力消耗量,分为高、中、低三个档位。 | 高 |
执行动作 | 识别到算力消耗量达到档位时,执行的处置动作。
| 观察 |
规则开关 | 根据需要设置是否启用该规则。 | 开启 |
单击确定。
配置完成后,算力消耗防护规则列表会生成对应规则,规则 ID 可用于日志检索和攻击详情判断。
例如,按上述示例值配置了 ID 为W000000000288
的防护规则。某用户向大模型发起请求,提示词篇幅过长,且大模型返回的内容过多,导致您的服务器算力消耗过大。此时,大模型应用防火墙将拦截该请求。相关访问日志会记录在日志详情中,您可以通过日志详情页面规则 ID 查询对应日志信息。