可用性优先调度策略指多云CDN利用拨测手段监测云服务商 CNAME 的可用状态,在发现某个云服务商在特定调度区域不可用时将触发告警,并可以自动调整流量分配规则,实现故障转移。本文介绍了为接入域名配置可用性优先调度策略的方法。
背景信息
可用性优先策略是在静态策略的基础上实现的。静态策略定义了多云CDN如何将来自特定“调度区域”的终端用户请求分配给不同云服务商 CNAME。其中,“调度区域”可以是中国内地、全球(不含中国内地),也可以是中国内地的特定省份+运营商、全球(不含中国内地)的特定国家或地区。详细介绍,请参见配置静态策略。
可用性优先策略指多云CDN在进行流量分配时,会优先考虑云服务商 CNAME 在特定“调度区域”下是否能够正常提供服务。
工作原理
多云CDN通过拨测手段来监测云服务商 CNAME 的可用状态。
多云CDN通过指定的 IDC 机房,以固定的时间间隔(最快每分钟一次)向云服务商 CNAME 发送 HTTP/HTTPS 测试请求;根据云服务商 CNAME 是否可以正常响应测试请求,来判断它是否可以正常提供服务。由于 IDC 机房位于不同的地理位置,通过 IDC 机房发起的测试请求可以模拟不同调度区域终端用户的请求。
在发现某个云服务商在特定调度区域不可用时,多云CDN会向您发送告警。您也可以开启 流量自动切换,使多云CDN自动调整流量分配规则,以暂停向服务异常的云服务商 CNAME 分配流量,实现故障转移。关于流量自动切换的具体方式,请参见流量自动切换规则说明。
多云CDN持续监测云服务商 CNAME 的可用状态,当云服务商 CNAME 恢复可用时,多云CDN会自动解除告警。如果开启了 流量自动切换,则流量分配规则也将恢复到故障转移前的配置。
注意
多云CDN会在告警条件满足后的 2~3 分钟进行告警通知和流量自动切换。解除告警时同样有约 2~3 分钟的延迟。
可用性优先策略的优先级
可用性优先策略的优先级在所有调度策略中是最高的。如果您启用了可用性优先的调度策略,那么当该策略生效时,其他类型的调度策略是不生效的。更多信息,请参见流量调度策略。
拨测任务与类型
一个拨测任务表示从一个拨测点(IDC)向一个云服务商 CNAME 发送拨测请求。拨测任务运行期间,拨测请求将按照固定时间间隔持续发送;当任务自动结束或被手动关闭时,拨测请求将会停止发送。
说明
在多云CDN中,拨测请求数是一种计费资源。多云CDN订阅套餐默认包含拨测请求数配额。如果实际产生的拨测请求数超出套餐配额,将会产生后付费。更多信息,请参见套餐外用量计费。
拨测分为边缘拨测和全链路拨测。
边缘拨测:表示监测终端用户向云服务商 CNAME 请求缓存内容的过程(不包含云服务商节点从源站获取内容)是否正常。
边缘拨测会导致您在目标云服务商平台上的边缘流量有所增加。
- 您配置的拨测任务越多,拨测产生的边缘流量也会越多。
- 您配置的测试文件越大,拨测产生的边缘流量也会越多。
全链路拨测:表示监测向云服务商节点请求未被缓存的资源的过程(包含云服务商节点向源站获取内容)是否正常。
注意
要使用全链路拨测,您必须提供一个云服务商不会去缓存的文件作为测试文件。为此,您需要在云服务商产品中配置不缓存规则。在不同云服务商产品中的具体配置方法不同。更多信息,请参见配置不缓存规则。
全链路拨测会导致您的源站的服务压力有所增加。
- 您配置的拨测任务越多,拨测对源站带来的压力越大。
- 您配置的测试文件越大,拨测对源站带来的压力越大。
前提条件
您已经为接入域名开启了多云流量调度。相关操作,请参见开启多云流量调度。
操作步骤
登录多云CDN控制台。
- 在左侧导航栏,单击 域名管理。
- 在接入域名列表,找到您的域名,单击域名名称。
- 在域名详情页面,单击 流量调度 页签。
- 在 调度策略 区域,单击 可用性优先策略 卡片。
- 在 可用性优先策略 配置区域,单击 创建策略。
- 在 创建可用性优先策略 面板,根据配置说明完成参数配置,然后单击 确定。
创建可用性优先策略后,您可以在 告警通知 页面,查询相关的告警记录和处置过程。更多信息,请参见查看告警通知。
配置说明
基本信息
配置项 | 说明 |
---|
拨测点位置 | 选择拨测点的所在地。可选项: - 中国内地:您可以从位于中国内地特定城市下的中国联通、中国移动、中国电信 IDC 机房选择拨测任务所使用的拨测点。
- 全球(不含中国内地):您可以从位于全球(不含中国内地)特定城市下的当地运营商 IDC 机房中选择拨测任务所使用的拨测点。
注意 - 该选项仅在接入域名的 调度范围 为 全球 或 全球(不含中国内地) 时支持选择。
- 选择该选项后,不支持启用 流量自动切换。
|
云服务商 | 自动展示了拨测任务将会监测的云服务商。 - 此处展示的 云服务商 包含当前全部静态策略中所引用的云服务商。
- 云服务商 数量越多,对应的拨测任务越多。
- 云服务商 不支持在此处修改。如果需要移除或增加云服务商,请修改对应的静态策略。更多信息,请参见配置静态策略。
|
通知对象 | 选择通知接收方的类型。在触发和解除可用性告警时,多云CDN向您指定的通知接收方发送通知。可选项: - 联系组:表示通过联系人组接收通知。
- 通知机器人:表示通过群聊机器人接收通知。
至少勾选一项。 |
联系组 | 选择一个或多个联系人组作为通知接收方,然后选择一个或多个通知渠道。 - 如果没有可用的联系人组,您必须先在 运维监控 页面的 通知管理 标签页创建联系人组。具体操作,请参见创建联系人组。
- 通知渠道支持以下选项:邮件、短信、电话。
说明 短信 和 电话 通知功能目前处于免费试用阶段,有以下限制: - 单个电话号码每天最多收到 10 次电话通知。超过该数量后,告警将不再通过电话形式发送到对应电话号码。
免费试用阶段结束后,短信和电话通知将按通知次数开始收费。 |
通知机器人 | 选择一个或多个群聊机器人(支持飞书机器人、钉钉机器人、企业微信机器人)作为通知接收方。
如果没有可用的群聊机器人,您必须先在 运维监控 模块的 通知管理 标签页创建 webhook。具体操作,请参见创建 webhook。 说明 多云CDN向单个钉钉或企业微信机器人发送通知的频率不超过 20 次/分钟。 |
流量自动切换 | 当云服务商在某个调度区域不可用时,是否自动执行流量切换。
关于流量自动切换的具体规则,请参见流量自动切换规则说明。 |
拨测类别 | 选择一种拨测的方式。可选项: - 边缘拨测:表示监测用户向云服务商节点请求缓存内容的过程(不包含云服务商节点从源站获取内容)是否正常。选择该方式后,您需要完成边缘拨测配置。
- 全链路拨测:表示监测用户向云服务商节点请求不缓存内容的过程(包含云服务商节点向源站获取内容)是否正常。选择该方式后,您需要完成全链路拨测配置。
|
边缘拨测配置
边缘拨测配置 仅在 拨测类别 是 边缘拨测 时才会出现。
配置项 | 说明 |
---|
测试文件URL | 填写拨测的目标 URL。仅支持 HTTP/HTTPS 拨测。目标 URL 必须以http:// 或https:// 开头。 - 该 URL 指向的内容必须在云服务商节点中缓存,即您没有在云服务商平台针对该 URL 配置不缓存规则。
- 边缘拨测会产生边缘流量,建议您提供一个小文件 URL。
- 为了保证拨测结果准确,请确保所提供的 URL 长期可访问。
您填写 URL 后,多云CDN会立即检测该 URL 是否可用。 如果在输入框下出现以下提示,说明该 URL 不可访问: 资源监测失败,状态码404 这种情况下,请重新提供可访问的 URL。
|
Range开关 | 您填写 测试文件URL,并且多云CDN检测该 URL 可用后,界面上将会显示 测试文件大小 和 Range开关。
您可以开启 Range开关,使多云CDN的拨测请求头中携带 range 信息。携带 range 信息的拨测请求只向云服务商节点请求测试文件的前 0~19 字节分片,使拨测带来的使用量降低。 注意 如果您提供的测试文件大于 2KB,建议您开启 Range开关 |
拨测频率 | 指定每隔多久发起一轮拨测请求。支持两种模式:固定频率、动态频率。
间隔越大,拨测产生的流量消费越小,但云服务商不可用故障被发现的延时会增加。建议您根据实际需要进行配置。 |
拨测请求成功的条件 | 设置判断拨测请求是否成功的条件。可选项:默认 或 自定义。 - 默认:多云CDN向一个服务节点发送一次拨测请求。如果返回的状态码在 200 至 399 范围内,则认为该拨测请求成功。否则,该请求失败。
- 自定义:您可以设置状态码的范围,作为判定拨测请求是否成功的条件。当您选择 自定义,需要设置具体条件。您可以设置最多 7 个条件,这些条件有以下类型:
- 区间:如果返回的状态码在指定的区间内,表示拨测请求成功。这种类型的条件最多可设置 5 个。
- 包含:如果返回的状态码属于特定值,则表示拨测请求成功。这种类型的条件最多只能设置一个。一个条件中最多可指定 10 个状态码。
- 不包含:如果返回的状态码不属于特定值,表示拨测请求成功。这种类型的条件最多只能设置一个。一个条件中最多可指定 10 个状态码。
如果您设置多个条件,则这些条件必须同时满足,才表示拨测请求成功。 |
CDN 不可用的条件 | 一个调度区域(省份+运营商)下有多个拨测点(市+运营商)。您选择的拨测点同时向云服务商发起拨测。如果拨测成功的拨测点的比例低于预设比例,则云服务商在该调度区域不可用。
您可以设置预设比例。默认值:50%。 |
触发可用性告警的条件 | 设置一个次数,假设为 N。当云服务商在一个调度区域下连续 N 次被判定为不可用时,则触发针对该云服务商的可用性告警。N 的取值范围:2~10。默认值:5。
如果您开启了 流量自动切换,则多云CDN会在告警的同时,触发容灾切换。 |
解除可用性告警的条件 | 设定一个时间段。告警触发后,如果在该时间段内云服务商始终可用,则在该时间段结束时解除告警。
如果您开启了 流量自动切换,则多云CDN会在解除告警的同时,触发容灾回退。
该参数的取值与您设置的 拨测频率 有关(对于 动态频率,拨测频率 指您设置的 初始 值)。默认值:拨测频率*5。取值范围:拨测频率*2 ~ 拨测频率*15。假设您设置的拨测频率是 1 分钟,则该参数默认值是 5 分钟,取值范围是 2~15 分钟。 |
拨测点 | 选择发起拨测请求的 IDC 机房。可选择的 IDC 为特定城市下的中国联通、中国移动、中国电信 IDC。
您可以直接选择所有 推荐节点,或者从 全部节点 下选择节点。如需从 全部节点 下选择节点,可参考以下说明: - 建议您选择与大多数真实用户的 IP 线路接近的 IDC。
示例:如果您的业务用户多数为上海联通用户,则建议您选择“上海 上海市 中国联通 IDC”。这样多云CDN将通过上海联通 IDC 向云服务商的节点发起拨测。 - 拨测点的默认样本数默认为 3 个,表示每次都从选择的拨测点发起 3 个拨测请求,得到 3 份结果样本。您可以针对每个选择的节点指定 样本配置,也可以 设置统一样本数。
- 建议您至少选择 2 个不同城市的 IDC,确保拨测结果可靠。
- 您选择的 IDC 数量越多,产生的拨测请求越多。多云CDN订阅套餐默认包含拨测请求数配额。超出配额的用量将产生后付费。更多信息,请参见快捷拨测请求计费。
|
全链路拨测配置
全链路拨测配置 仅在 拨测类别 是 全链路拨测 时才会出现。
配置项 | 说明 |
---|
测试文件URL | 填写拨测的目标 URL。仅支持 HTTP/HTTPS 拨测。目标 URL 必须以http:// 或https:// 开头。 - 该 URL 指向的内容必须在云服务商中不缓存,即您必须在云服务商处针对该 URL 配置不缓存规则。关于在不同云服务商处配置不缓存规则的方法,请参见配置不缓存规则。
- 全链路拨测请求会回源到源站。为避免对源站带来过大压力,请尽量选择小文件并控制拨测点的数量。拨测点数量越多,源站受到的拨测请求压力越大。
- 为了保证拨测结果准确,请确保所提供的 URL 长期可访问。
您填写 URL 后,多云CDN会立即检测该 URL 是否可用,并通过弹窗向您返回检测结果。不同检测结果的说明如下: - 检测通过(无感叹号图标):表示拨测请求通过源站获取了测试文件。
- 检测通过(有感叹号图标):表示拨测请求通过云服务商的缓存获取了测试文件。这种情况下,您需要配置不缓存规则。
- 检测失败:表示拨测请求未能获取测试文件。这种情况下,您需要重新提供一个可用的 URL。
|
拨测频率 | 指定每隔多久发起一轮拨测请求。支持两种模式:固定频率、动态频率。
间隔越大,拨测产生的流量消费越小,但云服务商不可用故障被发现的延时会增加。建议您根据实际需要进行配置。 |
拨测请求成功的条件 | 设置判断拨测请求是否成功的条件。可选项:默认 或 自定义。 - 默认:多云CDN向一个服务节点发送一次拨测请求。如果返回的状态码在 200 至 399 范围内,则认为该拨测请求成功。否则,该请求失败。
- 自定义:您可以设置状态码的范围,作为判定拨测请求是否成功的条件。当您选择 自定义,需要设置具体条件。您可以设置最多 7 个条件,这些条件有以下类型:
- 区间:如果返回的状态码在指定的区间内,表示拨测请求成功。这种类型的条件最多可设置 5 个。
- 包含:如果返回的状态码属于特定值,则表示拨测请求成功。这种类型的条件最多只能设置一个。一个条件中最多可指定 10 个状态码。
- 不包含:如果返回的状态码不属于特定值,表示拨测请求成功。这种类型的条件最多只能设置一个。一个条件中最多可指定 10 个状态码。
如果您设置多个条件,则这些条件必须同时满足,才表示拨测请求成功。 |
CDN 不可用的条件 | 一个调度区域(省份+运营商)下有多个拨测点(市+运营商)。您选择的拨测点同时向云服务商发起拨测。如果拨测成功的拨测点的比例低于预设比例,则云服务商在该调度区域不可用。
您可以设置预设比例。默认值:50%。 |
触发可用性告警的条件 | 设置一个次数,假设为 N。当云服务商在一个调度区域下连续 N 次被判定为不可用时,则触发针对该云服务商的可用性告警。N 的取值范围:2~10。默认值:5。
如果您开启了 流量自动切换,则多云CDN会在告警的同时,触发容灾切换。 |
解除可用性告警的条件 | 设定一个时间段。告警触发后,如果在该时间段内云服务商始终可用,则在该时间段结束时解除告警。
如果您开启了 流量自动切换,则多云CDN会在解除告警的同时,触发容灾回退。
该参数的取值与您设置的 拨测频率 有关(对于 动态频率,拨测频率 指您设置的 初始 值)。默认值:拨测频率*5。取值范围:拨测频率*2 ~ 拨测频率*15。假设您设置的拨测频率是 1 分钟,则该参数默认值是 5 分钟,取值范围是 2~15 分钟。 |
拨测点 | 选择发起拨测请求的 IDC 机房。可选择的 IDC 为特定城市下的中国联通、中国移动、中国电信 IDC。
您可以直接选择所有 推荐节点,或者从 全部节点 下选择节点。如需从 全部节点 下选择节点,可参考以下说明: - 建议您选择与大多数真实用户的 IP 线路接近的 IDC。
示例:如果您的业务用户多数为上海联通用户,则建议您选择“上海 上海市 中国联通 IDC”。这样多云CDN将通过上海联通 IDC 向云服务商的节点发起拨测。 - 拨测点的默认样本数默认为 3 个,表示每次都从选择的拨测点发起 3 个拨测请求,得到 3 份结果样本。您可以针对每个选择的节点指定 样本配置,也可以 设置统一样本数。
- 建议您至少选择 2 个不同城市的 IDC,确保拨测结果可靠。
- 您选择的 IDC 数量越多,产生的拨测请求越多。多云CDN订阅套餐默认包含拨测请求数配额。超出配额的用量将产生后付费。更多信息,请参见快捷拨测请求计费。
注意 请勿选择过多拨测点,否则拨测会给源站带来请求压力,造成服务风险。 |
更多信息
流量自动切换规则说明
在一个调度区域下,如果某个云服务商 CNAME 触发了可用性告警,多云CDN可以自动将原计划分配给该云服务商 CNAME 的流量份额分配给其他云服务商 CNAME。您可以根据需要,选择是否启用流量自动切换。
流量自动切换的规则如下:根据静态策略中定义的流量分配比例,在其他云服务商间重新分配流量。
示例:
假设在某个调度区域下有 3 个云服务商 A、B、C,它们的流量分配比例分别为:20%、30%、50%。
如果云服务商 C 在该调度区域下触发告警,则多云CDN会将 C 的份额按原始的流量分配比例重新分配给 A 和 B。流量自动切换后,A、B、C 的流量分配比例分别为:40%、60%、0%。