You need to enable JavaScript to run this app.
导航
API 运维
最近更新时间:2025.02.18 17:03:44首次发布时间:2022.07.26 11:41:17
我的收藏
有用
有用
无用
无用

数据服务支持对发布的 API 进行一系列的运维操作,如 API 调用监控、报警配置、限流等操作。
本文将为您介绍数据服务 API 运维相关操作。

1 使用前期

  1. 已完成相应的 API 配置开发,详见 API 开发

2 限流

  1. 登录 DataLeap租户控制台
  2. 概览界面顶部服务窗口,单击数据服务按钮,可快速进入到数据服务 > API 界面。
  3. 在左侧目录树中,单击已发布的 API 名称信息,便会在右侧展现出 API 的配置界面。
  4. 单击右侧导航栏中的基本信息按钮,进入基本信息配置界面。
    Image
  5. 在“最大 QPS”参数处,选择开启 QPS 限流,并自定义输入 QPS 值。

    说明

    1. 选择不限制时,则不开启 QPS 限流操作,需谨慎操作设置。
    2. 若在项目配置时,开启了“API 调大 QPS 限流审批”按钮,则在 API 基本信息中调大 QPS 限流值时,便会触发审批操作。详见项目管理
    3. 新 API 发布时,假如 API 设置的 QPS 值超过了数据源的限流值,会触发项目管理员审批;API 发布后,编辑 API 的 QPS 值时,假如新设定的 QPS 值超过了超过了数据源的限流值,也会触发项目管理员审批。

3 授权管理

已发布的 API,您可通过授权管理功能,将 API 对项目中已创建的应用进行授权操作,方便企业内部或外部业务应用进行调用时的权限管理操作。
API 授权操作详见“2.1 请求参数说明”中的“新增授权说明”。
新增授权完成后,您可在授权的应用列表界面中,执行以下操作:

  • 编辑:单击操作列中的编辑按钮,对已授权的应用再次进行编辑操作,可调整其授权有效期、最大QPS等授权信息。
  • 回收权限:若应用已不再需要调用该API时,您可单击操作列中的回收权限按钮,并在二次确认弹窗中单击确定按钮,将调用权限回收。

4 血缘关系

数据服务血缘关系贯穿了数据服务 API 开发的全流程。从创建数据源信息开始,经过创建物理表、逻辑表,直至到 API 开发,最后将 API 授权给所属应用(PSM)后以供调用,上下游之间的关联关系,可借由数据服务血缘关系实现信息追溯。
例如,您可以通过血缘关系确定以下关联情况:

  • 某张逻辑表被哪些 API 使用;
  • 或是某逻辑表、API 被哪些 PSM 调用了;
  • 您也可以通过血缘关系,清楚知晓 API 所使用的具体底层存储和物理表信息等。

数据服务血缘关系为数据开发与 API 开发过程中的资源关联分析、下线决策及信息追溯提供有力支撑。
更多血缘关系的入口及操作,详见血缘关系

5 报警配置

已发布的 API,您可对其进行相关的报警配置。

5.1 新增报警

  1. 在 API 配置界面右侧导航栏处,单击 API 详情按钮,进入查看 API 详情。

  2. 在 API 详情页单击报警配置页签,展现当前 API 配置的报警列表。

  3. 单击新增报警按钮,进入新增界面,并完成以下配置:
    其中参数名称前带 * 的为必填参数,名称前未带 * 的为可选填参数。

    参数

    说明

    *规则名称

    输入报警的规则名称信息。

    *授权应用

    您可按需将当前报警规则,绑定至所有已授权应用或指定某个应用中。

    *报警等级

    您可根据实际场景,设置不同的报警等级,目前支持以下几种报警等级:

    • Notice:报警10分钟/次,此等级无报警升级策略。
    • P2:报警5分钟/次,开启报警升级选项后,若超过30分钟未处理报警,则将升级到P1报警等级。
    • P1:报警5分钟/次,开启报警升级选项后,若超过30分钟未处理报警,则将升级到P0报警等级。
    • P0:报警3分钟/次。

    *监控周期

    设置每次监控的时间周期,不同报警等级,支持60s、120s、300s的监控周期。

    *监控指标

    下拉选择报警对应的监控指标类型,支持QPS,失败请求次数,请求失败率,PCT99,QPS/限流值几种类型。不同监控指标,可为其设置不同的报警阈值。

    *报警接收人

    在下拉框中选择每次报警的接收人,仅展现当前项目的成员。

    Webhook

    支持 Webhook 方式接收报警消息,需配置能够正常请求的 post 接口, 接口请求参数会在 body 中携带以下内容:

    {
      "query_id": "12345",
      "alarm_id": "67890",
      "alarm_time_unix": 1617981372,
      "title": "系统警告",
      "content": "CPU使用率超过90%",
      "url": "http://example.com/alert/67890"
    }
    

    默认支持飞书回调地址: open.larkoffice.com/open-apis/bot/v2/hook
    地址填写完成后,您也可单击右侧测试按钮,测试报警消息是否能正常发送。

    *接受短信

    报警接收人需要在其用户信息中添加对应的手机电话信息方可接收短信告警。

    *报警状态

    此报警规则开关,您可根据实际情况,进行开启或关闭操作。

  4. 报警配置完成后,单击确定按钮,完成报警配置。

5.2 导入报警模版

数据服务平台,还为您提供了几种报警模版,在报警配置页签,单击导入报警模版按钮,根据实际场景,您可勾选相应的报警模版规则,导入到当前 API 的报警配置中。

说明

请求失败率大于20%的为系统默认添加的报警规则,在 API 创建时就已经生效,报警接收人为 API 负责人,该规则通用但对高敏业务较弱,建议修改。

5.3 报警管理

对已添加的报警规则,您可在操作列中,对其进行编辑、删除等操作。

6 调用监控

已发布的API,您可查看其具体的调用监控情况。

  1. 在 API 详情页单击调用监控页签,展现当前 API 的调用监控详情。
  2. 您可在界面授权应用处,下拉选择API已授权的应用,可根据不同应用,区分监控详情。
  3. 目前为您展现以下几种监控指标信息,您可以根据右上角的时间范围选择进行查看:
    • QPS:每秒的请求次数
    • 请求成功率:该时间段的请求成功率
    • PCT99: 99%请求所消耗时间(ms)的范围
    • 99%请求所消耗的时间(ms)范围
  4. 您可根据实际情况,查看测试线上环境中的调用监控情况,自定义选择查看的时间范围和时区等信息。

    说明

    各监控指标的可查看时间范围为近 7 天,当前仅支持查看此时间段内的调用监控详情。