文档中心
文档
备案
控制台
登录
立即注册
导航
E-MapReduce
搜索目录或文档标题
搜索目录或文档标题
产品动态与公告
产品公告
【公告】EMR on VKE 商业化公告
【调价】开源大数据平台 E-MapReduce 刊例价与退订规则调整
【调价】开源大数据平台E-MapReduce部分地域刊例价调整
【调价】开源大数据平台E-MapReduce部分地域刊例价调整
【调价】开源大数据平台E-MapReduce刊例价调整
产品动态
EMR on ECS功能发布记录
EMR on VKE 功能发布记录
Serverless Spark功能发布记录
Serverless Presto功能发布记录
产品简介
产品概述
产品优势
产品架构
应用场景
EMR on ECS 应用场景
EMR on VKE 应用场景
EMR Serverless 应用场景
基本概念
使用限制
EMR使用限制
开源组件使用限制
发行版本
EMR on ECS
发行版本
版本概述
版本说明
EMR 3.x版本
EMR-3.12.0发布说明
EMR-3.11.0发布说明
EMR-3.10.0版本说明
EMR-3.9.0版本说明
EMR-3.8.0 版本说明
EMR-3.7.0 版本说明
EMR-3.6.X 版本说明
EMR-3.6.2 版本说明
EMR-3.6.1 版本说明
EMR-3.6.0 版本说明
EMR-3.5.X 版本说明
EMR-3.5.4 版本说明
EMR-3.5.3 版本说明
EMR-3.5.2 版本说明
EMR-3.5.1 版本说明
EMR-3.5.0 版本说明
EMR-3.4.X 版本
EMR 3.4.11 版本说明
EMR 3.4.10 版本说明
EMR-3.4.9 版本说明
EMR-3.4.8 版本说明
EMR-3.4.7 版本说明
EMR-3.4.6 版本说明
EMR-3.4.4 版本说明
EMR-3.4.3 版本说明
ERM-3.4.2 版本说明
EMR-3.4.0 版本说明
EMR-3.3.0 版本说明
EMR-3.2.1 版本说明
EMR-3.1.1 版本说明
EMR-3.1.0版本说明
EMR-3.0.1版本说明
EMR-3.0.0版本说明
EMR 2.x版本
EMR-2.5.0 版本说明
EMR-2.4.0 版本说明
EMR-2.3.X 版本
EMR-2.3.2 版本说明
EMR-2.3.1 版本说明
EMR-2.3.0 版本说明
EMR-2.2.0 版本说明
EMR-2.1.1 版本说明
EMR-2.1.0版本说明
EMR-2.0.1版本说明
EMR-2.0.0版本说明
EMR 1.x版本
EMR 1.3.x版本
EMR 1.3.1版本说明
EMR 1.3.0版本说明
EMR 1.2.x版本
EMR 1.2.x版本中的应用程序版本
EMR 1.2.1版本说明
EMR 1.2.0版本说明
EMR 1.1.x版本
EMR 1.1.x版本中的应用程序版本
EMR 1.1.1版本说明
EMR 1.1.0版本说明
EMR 1.0.0版本说明
EMR on VKE
版本概述
版本说明
EMR-VKE-1.7.0发布说明
EMR-VKE-1.6.0发布说明
EMR-VKE-1.5.0发布说明
EMR-VKE-1.4.0发布说明
产品计费
EMR on ECS
计费概述
计费项
计费方式
按量付费
包年包月
按量付费转包年包月
欠费说明
退订和续费说明
到期说明
退订集群
EMR on VKE
计费概述
计费项
按量付费
欠费说明
查看账单
EMR Serverless
Serverless Spark产品计费
计费概述
计费项
计费方式
标准计算资源
续费和退订说明
升配&降配
欠费停服&恢复
Serverless Presto产品计费
计费说明
计费方式
按量付费
包年包月
Serverless Olap产品计费
计费概述
计费项
计费方式
按量计费
包年包月
按量计费转包年包月
续费说明
快速入门
E-MapReduce 快速入门
准备工作
创建集群
创建并运行作业
DataLeap on EMR 快速入门
EMR on VKE快速入门
EMR on VKE 服务关联角色
EMR Serverless Spark快速入门
准备工作
创建资源队列
创建并提交作业
EMR Serverless Presto快速入门
准备工作
创建资源队列
创建并提交作业
EMR on ECS操作指南
集群管理
集群类型
支持ECS实例
集群配置
创建集群
创建集群概述
管理安全组
查看集群列表及详情
集群状态
引导操作
集群脚本
弹性伸缩
节点组管理
访问链接
用户管理
权限管理
权限管理
角色授权
角色与权限
EMR服务角色
集群组件端口说明
配置中心
集群模版
元数据连接
克隆集群
标签配置
项目配置
History 服务使用文档
集群运维
常用文件路径
登录集群
扩容集群
域名规则
缩容集群
扩容磁盘
释放集群
集群操作日志
日志中心
告警中心
EMR 内置Mysql使用情况说明
集群监控
监控指标
概述
节点TopN监控指标
HDFS 监控指标
Yarn 监控指标
Hive 监控指标
ZooKeeper 监控指标
HBase 监控指标
OpenSearch 监控指标
Doris 监控指标
StarRocks 监控指标
Impala 监控指标
Kudu 服务监控
ClickHouse 集群监控
Presto 监控指标
Trino 监控指标
Celeborn 监控指标
Kyuubi 监控指标
告警管理
监控指标导出实践手册
集群事件中心
集群管理常见问题
服务管理
查看服务列表
服务概述
添加/重启服务
服务启停
管理服务配置参数
组件拓扑管理
EMR on VKE操作指南
集群管理
创建虚拟集群
释放集群
节点管理
操作日志
查看集群列表及详情
服务管理
配置管理
作业管理
查看作业列表
镜像管理
使用自定义 Docker 镜像运行作业
Ray镜像列表
Spark镜像列表
EMR Serverless操作指南
EMR Serverless Spark
队列管理
队列管理
队列监控
队列权限
对接LAS
Spark SQL作业开发指南
Spark Jar作业开发指南
PySpark作业开发指南
SQL专用资源预热能力
权限管理
自定义策略
EMR Serverless Presto
队列管理
开通 LAS
作业开发指南
EMR Serverless OLAP
操作指南
权限管理
EMR Serverless OLAP服务关联角色
为 IAM 用户授权
实例管理
创建实例
查看实例列表与详情
实例状态表
用户管理
实例扩容
磁盘扩容
实例升配
连接实例
版本升级说明
StarRocks存算分离集群配置建议
数据导入
导入概述
Stream Load
Broker Load
Routine Load
Insert方式 导入
数据湖查询(StarRocks)
Catalog
Catalog概述
Default Catalog
External Catalog
外部表
读取Hadoop集群中的数据
更新元数据缓存
读取LAS数据
性能调优
SQL诊断使用说明
最佳实践
存算分离最佳实践
Serverless StarRocks TPC-H 基准测试说明
Serverless StarRocks表模型设计
Serverless StarRocks集群资源规划
使用Serveless Flink实现MySQL到StarRocks数据集成
Serverless StarRocks使用火山引擎智能数据洞察进行分析
Serverless StarRocks高可用最佳实践
StarRocks实例备份与恢复最佳实践
组件操作指南
HDFS
使用说明
基础使用
高阶使用
快速开始
开发指南
最佳实践
常见问题
YARN
使用说明
基础使用
进阶使用
YARN 队列管理
常见问题
最佳实践
YARN Node Label介绍与最佳实践
MapReduce2
使用说明
Hive
概述
基础使用
Hive 基础操作
Hive 连接方式
确定 HiveServer2 地址
Hive3 使用注意事项
高阶使用
管理 LDAP 认证
Hive 作业调优
HiveServer2 负载均衡
开发指南
自定义函数 (UDF)
最佳实践
Hive 访问 Hudi 数据
在EMR集群运行TPC-DS Benchmark
常见问题
Spark
使用说明
快速开始
基础使用
基础使用
DDL语句
DML 语句
SELECT 语句
PySpark 基础使用
Spark RDD 基础使用
最佳实践
Spark on GPU 最佳实践
Ksana for SparkSQL
MaxCompute Buildin Function Plugin
Spark 调优指南
常见问题
Spark(仅适用于EMR on VKE形态)
使用 kubectl管理作业
新建 HiveMetaStore 集群并运行 SparkSQL 作业
使用弹性容器实例(VCI)调度 Spark 作业
Spark 集群手动关联 RSS 集群
如何解决 Ray 集群的压力负载及内存溢出问题
Spark(仅适用于EMR Serverless Spark形态)
引擎介绍
基础使用
数据Shuffle
JDBC使用
Spark Native使用说明
Serverless Spark读写StarRocks(存算分离)操作手册
最佳实践
Dataleap联合开通及使用
Flink
概述
Flink 基础使用
Flink SQL Client 使用参考
常见问题
Presto
使用说明
基础使用
高阶使用
常见问题
Hue
使用说明
最佳实践
通过hue进行数据查询
Hue 高可用访问集群内其他服务
Knox
使用说明
OpenLDAP
概述
基础使用
最佳实践
手动配置LDAP认证
Ranger
概述
组件集成
HDFS 集成
YARN 集成
Hive 集成
Spark集成
Presto集成
Trino 集成
HBase 集成
高阶功能
Ranger User Sync 集成LDAP
查看Ranger审计日志信息
配置DataLeap数据开发权限
快速开始
常见问题
Sqoop
使用说明
常见问题
ZooKeeper
概述
基本使用
进阶使用
Kafka
Kafka 概述
基础使用
高阶使用
快速开始
开发指南
常见问题
Airflow
概述
快速开始
基础使用
代码示例
关键配置
高阶使用
常见问题和注意事项
最佳实践
HBase
使用说明
HBase Shell
高阶使用
HBase内存调优
Phoenix
使用说明
TensorFlow
使用说明
快速开始
基础使用
高阶使用
Tez
使用说明
Hudi
使用说明
基础使用
高阶使用
Iceberg
使用说明
基础使用
Iceberg 基础使用
Iceberg 基础使用(适用于EMR2.x版本)
高阶使用
Iceberg 参数配置
Spark流式读写 Iceberg
Spark流式读写 Iceberg(适用于EMR 2.x版本)
Spark批式读写Iceberg
Iceberg与Trino/Presto集成
Iceberg与Flink集成
Hive 中操作 Iceberg 数据
TOS 中操作 Iceberg 表
TOS 中操作 Iceberg 表(适用于 EMR 2.x 版本)
Trino
使用说明
基础使用
高阶使用
常见问题
Doris
Doris 概述
基础使用
快速开始
高阶使用
高阶使用
最佳实践
Doris连接Tableau
常见问题
Pulsar
使用说明
快速开始
常见问题
Impala
Impala 概述
基础使用
Impala 基础操作
Impala 连接方式
Impala-shell 工具
高阶使用
管理 LDAP 认证
最佳实践
使用 Impala 访问 Kudu
Kudu
Kudu 概述
基础使用
Kudu 基础操作
高阶使用
Impala 集成 Kudu
使用 Flume 同步数据到 Kudu
Delta Lake
使用说明
基础使用
进阶使用
StarRocks
概述
规划 StarRocks 集群
快速开始
运维管理
StarRocksUI使用
StarRocks参数配置
使用CLB实现负载均衡
用户和权限管理
基础使用
高阶使用
StarRocks 分区表使用
StarRocks 访问 TOS
数据导出
StarRocks Spark Connector
StarRocks Flink Connector
慢SQL分析
数据湖分析
Catalog
Default Catalog
External Catalog
最佳实践
StarRocks高可用最佳实践
使用Serveless Flink实现MySQL到StarRocks数据集成
使用智能数据洞察对StarRocks数据进行分析
StarRocks集群资源规划
StarRocks表模型设计
使用DataSail实现MySQL到StarRocks数据集成
Starrocks跨大版本升级
常见问题
ClickHouse
概述
快速开始
基础使用
高阶使用
Proton
Proton 概述
发行版本
Proton 发行版本
JobCommitter版本
基础使用
Hadoop 使用 Proton
Spark 使用 Proton
Flink 使用 Proton
Hive 使用 Proton
Impala 使用 Proton
快速上手
Proton 缓存模式
Proton 无缓存模式
高阶使用
Proton Cli
Proton 确定缓存大小
Proton元数据同步
Distcp拷贝数据到TOS
Proton 参数配置
Proton按需缓存使用手册
Distcp从OSS拷贝数据到TOS
使用 FUSE 挂载 Proton
最佳实践
EMR 存算分离JobCommitter最佳实践
Proton SDK调优指南
Proton加速模式快速入门
PyProton
TOSFS 介绍与使用
DolphinScheduler
概述
快速开始
集成示例
配置指引
常见问题
Kerberos
使用 Kerberos 认证集群
配置 Kerberos 集群间跨域互信
EMR 使用外部KDC
Apache Livy
Apache Livy 使用说明
Kyuubi
Kyuubi 概述
Kyuubi 快速开始
Kyuubi 高级特性
Celeborn
Celeborn概述
基础使用
高阶使用
Celeborn(仅适用于EMR on VKE形态)
Celeborn Master pod节点不允许移除
最佳实践
Celeborn超大分区使用参数说明
Presto(仅适用于Serverless形态)
基础使用
JDBC 程序连接 Presto
客户端工具连接 Presto
Datawind
DBeaver
Tableau
最佳实践
EMR on ECS最佳实践
数据集成最佳实践
基于 StarRocks 的准实时数据分析
EMR Flink 数据写入 Bytehouse
火山引擎 EMR 迁移指南
迁移指南说明
成本评估优化
数据迁移
元数据迁移
权限迁移
迁移作业至火山引擎 EMR
DataLeap Shell 结合 EMR 系列实践
Shell 执行 EMR Doris SQL 任务
Shell 触发 Airflow 工作流执行
组件最佳实践
EMR 集群客户端最佳实践
在自定义DNS的VPC下创建EMR集群
EMR本地盘实例故障运维
弹性伸缩最佳实践
在Docker中使用EMR CLI
EMR on VKE最佳实践
使用PriorityClass调度大作业避免资源碎片
Serverless最佳实践
Serverless Ray 开发指南
Serverless PySpark 开发指南
开发参考
API参考
EMR on ECS API参考
使用前必读
EMR API概览
调用方法
请求结构
公共参数
签名方法
响应结果
公共错误码
操作管理
ListOperations - 操作列表
集群管理
UpdateClusterAttribute - 更新集群属性
ReleaseCluster - 释放或退订集群
ListClusters - 集群列表
GetCluster - 获取集群
CreateCluster - 创建集群
订单管理
ListOrders - 订单列表
节点组管理
ScaleOutNodeGroup - 扩容节点组
CreateNodeGroup - 创建节点组
UpdateNodeGroupChargeType - 更新节点组付费类型
ScaleInNodeGroup - 缩容节点组
UpdateNodeGroupEcsSpec - 更新节点组ECS规格
ScaleUpNodeGroupDisk - 扩容节点组磁盘
ListNodeGroups - 节点组列表
DeleteNodeGroup - 删除节点组
UpdateNodeGroupAttribute - 更新节点组属性
ListNodes - 节点列表
用户管理
GetClusterUsers - 获取EMR管控用户详情
UpdateClusterUserPassword - 更新集群用户密码
ListClusterUsers - 获取集群用户列表
DeleteClusterUser - 删除集群用户
UpdateClusterUser - 修改已创建用户信息
CheckUserCredentials - 校验集群用户
CreateClusterUser - 创建集群用户
用户组管理
GetClusterUserGroups - 集群用户组详情
ListClusterUserGroups - 获取集群用户组列表
CreateClusterUserGroup - 创建集群用户组
DeleteClusterUserGroup - 删除集群用户组
UpdateClusterUserGroup - 更新集群用户组
应用管理
ListApplicationConfigs - 配置项列表
GetApplicationConfigFile - 获取集群配置文件信息
RunApplicationAction - 执行应用操作
ListApplicationConfigFiles - 集群配置文件列表
UpdateApplicationConfig - 更新配置项
ListApplicationConfigHistories - 配置项修改历史列表
GetApplicationPacket - 获取应用安装包信息
ListApplications - 集群列表
ListComponentInstances - 组件实例列表
ListComponents - 组件列表
API参考(旧)
使用前必读
如何调用API
API说明
CreateCluster(创建集群)
ResizeCluster(集群扩容)
DescribeCluster(集群详情)
ListInstances(查询节点)
ListClusters(集群列表)
ListInstanceGroups(查询节点组)
ReleaseCluster(释放集群)
AddTags(添加Tags)
RemoveTags(删除Tags)
API 版本说明
EMR on VKE API参考
使用前必读
API概览
集群管理
CreateVirtualCluster - 创建集群
GetVirtualCluster - 查看集群详情
DeleteVirtualCluster - 删除集群
ListVirtualClusters - 集群列表
操作管理
GetOperation - 查看操作日志信息
应用管理
UndeployApplications - 卸载应用
DeployApplications - 部署应用
RunApplicationAction - 运行应用Action
ListApplications - 应用列表
EMR Serverless Spark API参考
Open API
SDK参考
EMR on ECS SDK参考
SDK 概述
Python SDK
EMR Serverless Spark SDK参考
Spark-submit工具使用说明
Java Query SDK
Python Query SDK
常见问题
常见问题
常见问题
技术服务与支持
技术支持
大数据专家服务计费说明
相关协议
数据中台产品和服务专用条款
E-MapReduce服务等级协议
EMR Serverless OLAP 服务等级协议
文档首页
/
E-MapReduce
/
组件操作指南
/
StarRocks
/
最佳实践
最佳实践
StarRocks高可用最佳实践
使用Serveless Flink实现MySQL到StarRocks数据集成
使用智能数据洞察对StarRocks数据进行分析
StarRocks集群资源规划
StarRocks表模型设计
使用DataSail实现MySQL到StarRocks数据集成
Starrocks跨大版本升级