支持接入 EMR Serverless Spark 去创建数据集。
(该功能目前仅支持私有化部署v2.75.0及以上版本产品使用,如需购买,请您联系商务人员进行咨询。)
在连接数据之前,请收集以下信息:
下面介绍两种方式创建数据连接。
(1)进入火山引擎,点击进入到某个具体项目下,点击数据准备,在下拉列表找到数据连接,新建数据连接。
(2)在页面中选择 EMR Serverless Spark 。
(3)填写所需的基本信息,并进行测试连接,连接成功后点击保存。
(4)确认数据连接的基本信息无误后即完成数据连接。
(5)可使用该连接创建数据集:点击数据准备-->数据集,选择左上角「新建」按钮进行数据集的新建。
(6)输入关键词搜索,选择之前新建好的数据连接。
(1)进入火山引擎,点击数据准备-->数据集,选择左上角「新建」按钮,新建数据集。
(2)选择数据连接的时候,点击其他按钮。
之后的步骤与上述 2.1 的(2)、(3)步一致,在完成配置之后会停在数据集选择数据连接的弹出框中,即可直接进行下一步的数据集创建。
数据连接过程需关注的基本信息描述如下。
名称 | 描述 |
---|---|
数据连接名称 | 新建数据连接的名称,用于在系统中区分不同数据库的连接。例如 EMR。 |
连接方式 | IP/Port 和 JDBC 连接字符串两种。 |
服务器 | 连接EMR Serverless Spark 的地址,每个 region 不一样。 |
端口 | EMR 的实例端口,公有云一般是10009。 |
用户名 | 租户的 AccessKey。 |
密码 | 租户的 SecretKey。 |
队列 | 连接使用的队列名称,目前只支持使用独占队列,不支持公共队列。 |
计算组 | 计算组名称,不填默认使用 Default 计算组。 |
填写示例如下图所示: