接口说明
本接口可以创建数据集,数据集可以用于任务的输出节点。
请求地址
POST https://{domain}/aeolus/prep/userOpenAPI/v1/dataset
请求参数
参数名称 | 类型 | 默认值 | 必填 | 说明 |
---|---|---|---|---|
name | string | 是 | ||
appId | int | 是 | 项目ID | |
ownerEmailPrefix | string | 是 | 用户名 | |
dataSetSourceId | int | 0 | 否 | 数据集来源id, 默认0 |
clusterName | string | 是 | 集群名 | |
dbName | string | 是 | 库名 | |
tableName | string | 是 | 表名 | |
dataSourceType | string | 是 | hive | |
dataSetSource | int | 否 | 0:prep, 1: abi, 2: cdp | |
type | string | 否 | 1:实时,0:离线 | |
dataSetConf | object | 否 |
请求参数示例
{ "name": "dataset_from_post_mann", "appId": 555327, "ownerEmailPrefix": "guohaishuai", "dataSetSourceId": 183029, "clusterName": "cn", "dbName": "dw_aeolus", "tableName": "tb_282b9e7e3b5b8877489811f2fa8f6fe3", "dataSourceType": "hive", "dataSetSource": 1, "type": 0 }
返回结果示例
{ "code": "prep/ok", "message": "成功", "extraMsg": null, "advice": null, "data": { "id": 21, "name": "dataset_from_post", "descr": "", "appId": 1, "ownerEmailPrefix": "admin", "dataSetSource": 2, "dataSetSourceId": 2, "abiDataSetId": 0, "dataSourceType": "hive", "resourceGroup": 0, "region": "cn", "clusterName": "cn", "dbName": "dw_aeolus", // 数据集底表的库名 "tableName": "bank_churners", // 数据集底表的表名 "tableSize": 0, "tableLineNum": 0, "dataSetLabelType": 0, "dataSetTaskType": 0, "confidentiality": "L3", "ttl": null, "lineOfBusiness": [], "regionType": [], "productName": "", "generalTagSourceIds": [], "authKey": "prep_data_set_21", "status": 0, "extraAppIds": null, "ctime": null, "mtime": null, "dataSetConf": null, "isPersonalDataRelated": false, "dataRegion": null } }
接口说明
本接口可以获取数据集的详细信息。
请求地址
GET https://{domain}/aeolus/prep/userOpenAPI/v1/dataset
请求参数
参数名称 | 类型 | 默认值 | 必填 | 说明 | 示例 |
---|---|---|---|---|---|
dataSetId | int | 是 | 17830 |
返回结果示例
{ "code": "prep/ok", "message": "成功", "extraMsg": null, "advice": "", // 错误建议,可空 "data": { "id": 21, "name": "dataset_from_post", "descr": "", "appId": 1, "ownerEmailPrefix": "admin", "dataSetSource": 2, "dataSetSourceId": 2, "abiDataSetId": 0, "dataSourceType": "hive", "resourceGroup": 0, "region": "cn", "clusterName": "cn", "dbName": "dw_aeolus", // 数据集底表的库名 "tableName": "bank_churners", // 数据集底表的表名 "tableSize": 0, "tableLineNum": 0, "dataSetLabelType": 0, "dataSetTaskType": 0, "confidentiality": "L3", "ttl": 1, // 底表的ttl,单位为天,null/0 表示没有ttl "lineOfBusiness": [], "regionType": [], "productName": "", "generalTagSourceIds": [], "authKey": "prep_data_set_21", "status": 0, "extraAppIds": [], // List<Long> 镜像数据集app集合 "ctime": 1, // 创建时间,毫秒时间戳 "mtime": 1, // 修改时间,毫秒时间戳 "dataSetConf": {}, // 主要存kafka信息或cdw实时导入任务id等信息 "isPersonalDataRelated": false, // 资源是否包含用户信息 "dataRegion": [] // List<String> 用户信息所属地区 } }
接口说明
本接口可以获取数据集的Schema信息。
请求地址
GET https://{domain}/aeolus/prep/userOpenAPI/v1/dataset/dataSetSchema
请求参数
参数名称 | 类型 | 默认值 | 必填 | 说明 | 示例 |
---|---|---|---|---|---|
dataSetId | int | 是 | 17830 |
返回结果示例
{ "code": "prep/ok", "message": "成功", "extraMsg": null, "advice": null, "data": null }
接口说明
本接口可以获取Prep中不同数据源的数据类型列表。
请求地址
GET https://{domain}/aeolus/prep/userOpenAPI/v1/dataset/getDataSetListByTb
请求参数
参数名称 | 类型 | 默认值 | 必填 | 说明 | 示例 |
---|---|---|---|---|---|
dbName | string | 是 | dw_aeolus | ||
tableName | string | 是 | tb_282b9e7e3b5b8877489811f2fa8f6fe3 | ||
dataSourceType | string | 是 | hive |
返回结果示例
{ "code": "prep/ok", "message": "成功", "extraMsg": null, "advice": null, "data": [ "string", "int", "double", "date", "timestamp", "long", "short", "float", "decimal", "binary", "boolean", "byte" ] }
接口说明
本接口可以获取Prep中数据集列表(未分类)。
请求地址
GET https://{domain}/aeolus/prep/userOpenAPI/v1/dataset/dataSetListWithoutClassification
请求参数
参数名称 | 类型 | 默认值 | 必填 | 说明 | 示例 |
---|---|---|---|---|---|
appId | int | 是 | 项目ID | 555327 | |
ownerEmailPrefix | string | 是 | 用户名 | guohaishuai | |
kw | string | 否 | test_712_ |
返回结果示例
{ "code": "prep/ok", "message": "成功", "extraMsg": null, "advice": null, "data": [ { "id": 17835, "name": "test_712_4_抖店订单列表结构化数据_1", "descr": "", "appId": 555327, "ownerEmailPrefix": "zhouliang.niko", "dataSourceType": "click_house", "dataSetSource": 0, "region": "cn", "clusterName": "multi_disk_test", "dbName": "aeolus_data_db_multi_disk_test_202207_dev", "tableName": "tb_3ec48387c95e78e24bfe35b8f8e07fbb", "ctime": "2022-07-12T23:06:31.000+0800", "mtime": "2022-07-12T23:07:02.000+0800", "roleList": [ { "roleName": "管理", "action": "admin" }, { "roleName": "编辑", "action": "write_role" }, { "roleName": "查看", "action": "read_role" } ], "taskOwnerRoleList": [], "authKey": "prep_data_set_17835", "abiDataSetId": 183032 } ] }