You need to enable JavaScript to run this app.
导航
数据运维配置
最近更新时间:2024.08.27 11:43:55首次发布时间:2024.07.05 11:27:09

1.概述

在系统管理中,提供了数据运维配置模块。管理员可对任务管理、数据连接、队列配置、存储管理、同步配置等多个环节进行系统化操作管理:

  • **任务管理:**在任务管理中,管理员可通过建立HTTP API的方式实现对三方平台任务执行状态的依赖关系,保障适时地产出有效业务数据。
  • **数据连接:**在数据连接中,管理员可对不同项目的数据连接的类型做差异化的配置。比如,在不同项目中,用户可选择的数据连接类型可以是不同的;管理员与非管理员可选择的数据类型也可以是不同的。
  • **队列配置:**对定时任务和数据回溯任务配置不同队列执行,减少数据回溯对例行任务的影响。
  • **储存管理:**查看资源概览信息,配置存储策略,包含开启资源管控的开关,项目资源限制配置,资源超出限制配置。
  • **同步配置:**设置生命周期和回溯时间的上限。

2.常用使用场景
  • 企业希望采用三方 API 配置依赖关系,通过节点的依赖关系有序调度任务运行上下游节点,即当上游节点运行成功后,下游节点才会启动运行。
  • 在部分项目中,支持项目管理员使用全部数据连接类型,其他用户不开放部分数据连接类型。
  • 公司内的管理者经常要看长周期数据,或者策划/运营人员经常查看不同阶段的对比数据,需要比较高频的做数据集回溯。
  • 希望通过改变生命周期和回溯时间的上限避免运行资源的阻塞和不必要的开销。

3.功能介绍

3.1 任务管理

本产品为用户提供灵活的任务调度依赖配置功能。调度依赖通常是指数据同步、数据开发过程中周期调度节点间的上下游依赖关系。通过节点的依赖关系有序调度任务运行上下游节点,即当上游节点运行成功后,下游节点才会启动运行,保障适时的产出有效业务数据。本产品的依赖配置提供了自动检测上游数据有无产出和自定义配置依赖两大类方式。
如果企业内已经存在相关的数据开发或数据处理任务的调度平台,且能够满足按照本产品的 API 规范进行配置,那么可以与本产品实现对接与联动,完成构建该调度平台的任务状态依赖关系。如果企业选择采用三方 API 配置依赖关系,那么用户需要先在系统管理的任务管理模块, 进行 API 配置即本章节为您介绍的内容,然后在可视化建模和数据集的依赖配置模块完成任务调度的依赖配置。
图片

具体操作流程如下:
(1) 完成API配置
点击新建 API 任务依赖,进入 API 配置表单。根据数据源的不同接口,可以配置多个 API 依赖。
第一步:前置操作
请您完成以下必填信息:

  • 数据源类型:控制 API 依赖生效的数据源,即使用所选数据源时可以调用该依赖接口。
  • 依赖名称:用于理解系统集成的依赖名称。
  • 生效范围:控制 API 依赖的项目空间,可下拉选择全部项目或单个项目。
  • 依赖描述:用于理解或填写依赖配置的描述性信息。

第二步:API配置

配置一:URL
Params 中的 Key 和 Value 会自动拼接到自定义 URL 中。说明栏中包含样例 URL。
配置二:Params

  • 请求参数说明:

Params 中的 Key 和 Value 会自动拼接到自定义 URL 中,其中 Key 的名称可以自定义,Value 参数格式不变。系统可以根据参数内容自动传入特定任务参数,您可根据需求选择使用。

  • 系统参数Params:

参数

备注

${dataSourceType}

数据源类型,如Hive-jdbc、Maxcompute

${dbName}

任务中数据源的库名称

${tableName}

任务中数据源的表名称

${taskTime}

业务日期,即具体任务执行的日期,通常情况业务业务日期与分区日期保持一致。

${partition}

任务中数据源的分区值

${batchNum}

任务批次号,根据业务日期tasktime及执行频率共同定义,天粒度更新批次号绝对等于1,如小时粒度执行,则根据执行顺序依次产生1-24个批次号。

  • 自定义参数

注:如新增自定义参数,请您配置依赖时输入该参数。
如果用户的数据调度平台无法根据本产品提供的系统字段定位到具体实例,可以选择新增自定义参数字段,如定义任务ID。请您配置依赖时填写具体的任务ID 或名称,以便依赖接口可定位到目标参数字段。
第三步:接口成功返回结构
API 接口调用成功时,请定义成功返回的结构:JSON结构返回{"status":"success"}或{'status":0}。
(2)测试与保存

测试按钮
注: 点击测试,测试联通后方可保存 API 依赖。该测试按钮只是测试接口调用,不会对内容检测,可输入任意内容进行测试。

  • 点击先判断配置项是否配置完整,若不完整,则高亮表单提示配置完整。
  • 测试按钮高亮时可用,点击测试弹窗进行测试。
  • 根据依赖方式显示不同的测试弹窗和输入方式,测试日期的传参格式固定。
  • 测试通过后显示成功 Icon,如果变更信息需要重新点击测试。

保存按钮

  • 未点击测试或测试不通过,保存按钮不可用。
  • 通过测试:保存按钮生效,保存后页面变回显页面。

取消按钮
点击取消,二次弹窗确认:取消后,配置或更改信息将不被保存,确认取消。
(3)后续操作
当您完成了自有调度系统的API 配置,那么就可以在可视化建模、数据集等模块的依赖配置中选择已配置好的依赖接口了。具体操作如下:

  • 在可视化建模进行数据输出时,可以进行依赖配置。 详情参考

(操作入口:数据准备—可视化建模—编辑—输出—依赖配置)

  • 在数据集的同步设置里面,可以进行依赖配置。详情参考

(操作入口:数据准备—数据集—编辑—同步设置—依赖配置)

3.2 数据连接

3.2.1 类型配置

为了提升企业数据安全保障,实现严谨灵活的数据管理,产品支持对数据连接的类型做差异化的配置。比如:支持项目管理员使用全部数据连接类型,其他用户都不开放部分数据连接类型。
操作步骤:
第一步,左侧操作栏选择数据连接,点击编辑。
图片
第二步,选择生效范围为所有项目、区分项目。若为区分项目,可新建自定义规则,选择具体的项目。
第三步,勾选“差异化规则”为“是”,选择规则类型,点击编辑图标。

图片
第四步,勾选需要展示的数据连接类型,点击确定,完成配置。

3.2.2 系统配置-Meego数据连接配置

Meego 数据连接需要统一配置插件凭证,验证通过后当前环境才支持Meego数据连接类型。在进行Meego数据源连接前,请先在系统设置中进行配置。
图片
操作步骤:打开数据连接-系统配置,点击编辑,输入插件ID与插件密码,点击测试连接。测试成功后,点击保存,即可连接Meego数据源。
图片

3.2.2.1 如何获取插件ID与密码:

用户需要在DataWind中开启飞书办公平台后,在Meego中创建插件并发布,在插件信息页获取ID与密码。
(1)开启飞书办公平台

  • 进入 系统配置 页面,开启飞书办公平台。
  • 操作用户需要绑定飞书账号。
  • 添加发件渠道

(2)创建Meego插件

  • 进入Meego,点击空间配置 -> 插件管理 -> 添加插件,进入页面后再点击右上角 创建插件。
  • 点击页面中的 添加插件,输入插件名称,点击确定。
  • 创建完成后进入插件配置页面,先填写基础配置信息。
  • 进入权限管理,获取如下列表的权限。

(3)发布插件

  • 插件使用范围选择企业内使用,可安装空间范围选择全部空间。
  • 回到 空间配置 -> 插件管理,添加刚刚创建的插件。
  • 发布成功后,回到插件基本信息页,复制Plugin ID和Plugin Secret,即可获得插件ID与密码。

图片

3.3 队列配置

在系统管理中,点击系统配置按钮,在左侧边栏中选择队列配置模块,可进行队列管理。完整介绍请您查看《队列配置》。

3.4 存储管理

系统管理员在新建项目时,可以按照设定给每个项目分配指定的存储资源。在存储管理界面,可以查看资源概览信息,配置存储策略,包含开启资源管控的开关,项目资源限制配置,资源超出限制配置。此外还可以查看并搜索使用明细等。存储资源总量在部署或升级时产生或变化,如需调整请联系系统运维。
图片
管理员可设置项目资源默认上限。管理员可在储存策略-开启资源管控中对所有项目进行统一项目资源限制,也可以在使用明细中对某一项目进行设置。当项目资源超出限制后,将禁止新建抽取任务。

3.5 同步配置

系统管理员可在同步配置中设置数据生命周期和回溯时间的上限,提前约束用户行为,减少人为导致的资源浪费,避免运行资源的阻塞和不必要的开销。
图片