We're sorry but react app doesn't work properly without JavaScript enabled. Please enable it to continue.
最新活动
大模型
产品
解决方案
定价
生态与合作
支持与服务
开发者
了解我们
文档
备案
控制台
登录
立即注册
E-MapReduce
AI 时代开源大数据平台,提供丰富的增强型大数据组件,100% 兼容开源,具备极致弹性资源、存算分离架构,覆盖迁移上云、湖仓分析、多模数据处理、AI 应用等场景,加速 AI 业务落地,激发数据价值。
AI时代开源大数据平台,具备极致弹性资源、存算分离架构,覆盖迁移上云、湖仓分析、多模数据处理、AI应用等场景,加速AI业务落地。
10
EB级别
生产实践
1000
万核
集群规模
200
万
日均作业量
立即咨询
立即购买
进入控制台
LLM客户案例
携手月之暗面,集群降本30%
热门
帮助文档
快速了解产品使用方法
产品定价
最低仅需0.05元/核/小时
数据飞轮
“数据驱动”的新范式
产品形态
产品功能
产品优势
产品架构
应用场景
客户案例
产品动态
使用指南
产品形态
EMR Serverless
火山引擎EMR提供Spark、Presto、StarRocks、Doris、Catalog、RSS等全托管服务,完全兼容开源,性能增强3~5倍,具备开箱即用、秒级弹性、免运维、自定义镜像的特性,让用户更专注于业务。
了解更多
EMR on ECS
火山引擎EMR基于ECS的半托管模式,提供更全面的Hadoop、Spark等36+个大数据生态组件,计算存储资源归属用户,可登陆ECS进行自定义操作,具备存算分离、分钟级弹性、灵活自运维的特性。
了解更多
EMR on VKE
火山引擎EMR基于VKE(K8S)的半托管模式,资源引擎从YARN升级为K8S统一调度,满足用户离线、在线、AI等不同Workload的潮汐混部运行,最大程度提升资源利用率,同时具备半托管的灵活性。
点击申请
产品特性
开源生态组件
集成Hadoop、Flink、Hive、Kafka、Hudi、Iceberg、StarRocks、Doris等大数据全栈组件,完全兼容开源,并基于字节跳动内部实践持续优化,Spark优化2.5倍+,Presto优化4.8倍+。
存算分离架构
存储与计算解耦,可按需独立扩展与优化,资源灵活配比,提高资源利用率和系统性能;统一数据湖,支持多种计算引擎,自研湖加速引擎Proton,性能超过存算一体,成本降低30%+。
弹性伸缩能力
基于时间规则、集群负载、混合规则的弹性伸缩策略,支持节点级、容器级、作业级弹性,提供丰富的弹性资源,如:抢占式实例、预约实例等,灵活满足业务波峰波谷资源需求,极致降本。
湖 · 仓 · AI 一体化
LAS Catalog提供湖、仓、AI一体化的元数据管理,数据统一存储、透明访问,多产品形态、多负载类型可联邦分析,支持湖仓分析、大模型数据预处理统一K8S资源池调度,提升资源利用率。
超大规模生产实践
单集群支持10万核以上(可跨AZ部署),可单次扩容1000节点,完备的容灾能力。EMR Spark达到10EB级处理量,日均Shuffle量超过400PB,EMR Presto日均百万次查询,秒级查询响应。
云原生运维
一站式云托管,提供集群管理、服务管理、用户管理、监控告警、日志查询等能力;支持服务监控指标体系,企业级诊断能力,感知集群组件及任务的运行异常状况,降低运维门槛。
企业级数据安全
支持Kerberos和lAM双认证模式、RBAC模式、审计日志等,具备数据加密、数据隔离、细颗粒度访问控制等能力,协同火山引擎安全体系,提供高可用、全方位的安全管控服务。
云上生态融合
无缝对接火山引擎各类云上产品,如:大数据研发治理套件DataLeap、对象存储TOS、智能数据洞察DataWind等,为客户提供专业高效、安全可靠的一站式产品体验,全链路支撑多样业务场景。
开源生态组件
集成Hadoop、Flink、Hive、Kafka、Hudi、Iceberg、StarRocks、Doris等大数据全栈组件,完全兼容开源,并基于字节跳动内部实践持续优化,Spark优化2.5倍+,Presto优化4.8倍+。
存算分离架构
存储与计算解耦,可按需独立扩展与优化,资源灵活配比,提高资源利用率和系统性能;统一数据湖,支持多种计算引擎,自研湖加速引擎Proton,性能超过存算一体,成本降低30%+。
弹性伸缩能力
基于时间规则、集群负载、混合规则的弹性伸缩策略,支持节点级、容器级、作业级弹性,提供丰富的弹性资源,如:抢占式实例、预约实例等,灵活满足业务波峰波谷资源需求,极致降本。
湖 · 仓 · AI 一体化
LAS Catalog提供湖、仓、AI一体化的元数据管理,数据统一存储、透明访问,多产品形态、多负载类型可联邦分析,支持湖仓分析、大模型数据预处理统一K8S资源池调度,提升资源利用率。
超大规模生产实践
单集群支持10万核以上(可跨AZ部署),可单次扩容1000节点,完备的容灾能力。EMR Spark达到10EB级处理量,日均Shuffle量超过400PB,EMR Presto日均百万次查询,秒级查询响应。
云原生运维
一站式云托管,提供集群管理、服务管理、用户管理、监控告警、日志查询等能力;支持服务监控指标体系,企业级诊断能力,感知集群组件及任务的运行异常状况,降低运维门槛。
企业级数据安全
支持Kerberos和lAM双认证模式、RBAC模式、审计日志等,具备数据加密、数据隔离、细颗粒度访问控制等能力,协同火山引擎安全体系,提供高可用、全方位的安全管控服务。
云上生态融合
无缝对接火山引擎各类云上产品,如:大数据研发治理套件DataLeap、对象存储TOS、智能数据洞察DataWind等,为客户提供专业高效、安全可靠的一站式产品体验,全链路支撑多样业务场景。
展开查看更多
核心优势
大幅降低成本
40
%+
火山引擎独有的内外潮汐资源机房
存算分离架构,冷热分层存储
弹性伸缩能力,多负载混用资源
组件性能优化
3~5
倍
行业超大数据体量深度实践
兼容开源,内外持续反哺增强
自研向量化执行引擎Bolt加速
全面Serverless
开放透明
全托管模式,100%兼容开源
开放架构,自定义镜像,自由创新
默认透明对象存储,不绑数据
专业迁移方案
丝滑快速
为客户定制化整套搬站方案
提供丰富自动化迁移工具和产品
过程可视化监控,确保迁移丝滑
运维极致提效
极简高效
高效的集群管理、运维工具
可视化、自定义的监控告警能力
企业级诊断、快速排障解决
大幅降低成本
40
%+
火山引擎独有的内外潮汐资源机房
存算分离架构,冷热分层存储
弹性伸缩能力,多负载混用资源
组件性能优化
3~5
倍
行业超大数据体量深度实践
兼容开源,内外持续反哺增强
自研向量化执行引擎Bolt加速
全面Serverless
开放透明
全托管模式,100%兼容开源
开放架构,自定义镜像,自由创新
默认透明对象存储,不绑数据
专业迁移方案
丝滑快速
为客户定制化整套搬站方案
提供丰富自动化迁移工具和产品
过程可视化监控,确保迁移丝滑
运维极致提效
极简高效
高效的集群管理、运维工具
可视化、自定义的监控告警能力
企业级诊断、快速排障解决
产品架构
应用场景
大数据迁移上云
云原生数据湖仓
离线数据分析
交互式分析
实时数据分析
大数据迁移上云
EMR具备平迁能力,提供自动化迁移和监控工具,提高效率、降低复杂度,解决开源组件版本滞后、技术栈复杂等问题,快速构建高性能低成本大数据平台。
架构优势
迁移简单快速
多种方案、丰富工具,业务无中断,快速丝滑迁移
完全兼容开源
100%兼容开源生态,组件能力企业级增强、版本常新
技术架构升级
云原生架构升级,实现存算分离、灵活弹性伸缩
立即咨询
推荐产品
大数据研发治理套件 DataLeap
全域数据集成 DataSail
对象存储 TOS
架构优势
迁移简单快速
完全兼容开源
技术架构升级
推荐产品
大数据研发治理套件 DataLeap
全域数据集成 DataSail
对象存储 TOS
云原生数据湖仓
随着企业发展,数据规模庞大、结构复杂、引擎众多、分析复杂,传统架构难以支撑,EMR湖仓方案满足低成本、统一存储&管理、多样分析场景等需求。
架构优势
存算分离&冷热分层
存储与计算解耦,数据分层定价,极致提效与降本
对接多种引擎
支持实时、离线、交互查询等计算引擎,数据一致
元数据管理
统一元数据视图,跨源查询分析,数据自动发现
立即咨询
推荐产品
对象存储 TOS
湖仓一体分析服务 LAS
大数据研发治理套件 DataLeap
架构优势
存算分离&冷热分层
对接多种引擎
元数据管理
推荐产品
对象存储 TOS
湖仓一体分析服务 LAS
大数据研发治理套件 DataLeap
离线数据分析
构建以Hadoop为核心的企业级离线数仓,对多种类型数据做采集、清洗、转化,一个平台支持多种计算引擎,满足复杂分析需求,支撑企业智能高效决策。
架构优势
灵活的云上架构
云原生架构,资源弹性伸缩,灵活满足业务需求
增强版开源组件
容开源深度优化,确保高可用、高稳定、高性能
丰富的高阶运维
提供丰富多样的运维工具,自动告警,可视化界面
立即咨询
推荐产品
大数据研发治理套件 DataLeap
全域数据集成 DataSail
智能数据洞察 DataWind
架构优势
灵活的云上架构
增强版开源组件
丰富的高阶运维
推荐产品
大数据研发治理套件 DataLeap
全域数据集成 DataSail
智能数据洞察 DataWind
交互式分析
通过对各类业务系统的结构化/非结构化数据进行加工和查询,支撑上层业务灵活且快速地进行数据分析、探索、预测,提高业务决策效率、组织响应速度。
架构优势
极速查询
物化视图加速数据查询,极速调用数据、分析数据
灵活查询
支持SQL语句,灵活支持各类逻辑分析、复杂分析
高效开发
提供集群管理、监控、扩容等能力,专注业务发展
立即咨询
推荐产品
全域数据集成 DataSail
大数据研发治理套件 DataLeap
智能数据洞察 DataWind
架构优势
极速查询
灵活查询
高效开发
推荐产品
全域数据集成 DataSail
大数据研发治理套件 DataLeap
智能数据洞察 DataWind
实时数据分析
支持数据实时采集和流式处理分析、支撑10万级QPS在线查询分析,达到实时数据展示和动作触发,满足实时性、高并发等需求场景,支撑实时计算及决策。
架构优势
实时计算
支持流式计算引擎,高吞吐、低延时,秒级响应
批流一体
一个平台实现数据集成、计算、分析、应用、存储
实时决策
支持IoT、车联网、广告、风控、交易等实时业务
立即咨询
推荐产品
全域数据集成 DataSail
流式计算 Flink 版
云数据库 MySQL 版
架构优势
实时计算
批流一体
实时决策
推荐产品
全域数据集成 DataSail
流式计算 Flink 版
云数据库 MySQL 版
大数据迁移上云
架构优势
迁移简单快速
完全兼容开源
技术架构升级
推荐产品
大数据研发治理套件 DataLeap
全域数据集成 DataSail
对象存储 TOS
云原生数据湖仓
架构优势
存算分离&冷热分层
对接多种引擎
元数据管理
推荐产品
对象存储 TOS
湖仓一体分析服务 LAS
大数据研发治理套件 DataLeap
离线数据分析
架构优势
灵活的云上架构
增强版开源组件
丰富的高阶运维
推荐产品
大数据研发治理套件 DataLeap
全域数据集成 DataSail
智能数据洞察 DataWind
交互式分析
架构优势
极速查询
灵活查询
高效开发
推荐产品
全域数据集成 DataSail
大数据研发治理套件 DataLeap
智能数据洞察 DataWind
实时数据分析
架构优势
实时计算
批流一体
实时决策
推荐产品
全域数据集成 DataSail
流式计算 Flink 版
云数据库 MySQL 版
客户案例
LLM训练需要处理海量多结构数据,在计算调度与存储上面临极大挑战,通过EMR提供Spark等多种计算框架,实现集群资源共享,提高数据清洗效率,集群成本降低30%,推动Kimi的应用落地以及技术突破。
案例详情
EMR凭借开放生态、增强组件、存算分离等能力帮客户搭建低成本、高性能、安全LLM大数据平台,支撑数据预处理、多模态引擎、训练推理等场景,加快自研大模型步伐,突破百亿参数规模,助力打造AI2.0平台。
立即咨询
EMR为客户定制整套搬站方案,并搭建智驾大数据平台,解决开源组件性能低的问题,让资源成本降低30%、任务执行效率大幅提升,同时构建数据分析体系,支持业务经营决策、模型迭代效果评估,驱动智驾应用与增长。
立即咨询
与EMR合作,将架构升级至云原生实时大数据平台,支撑庞大且高频的数据采集、处理的车联网服务,通过数据挖掘推动智驾快速迭代,打造汽车研发、制造、销售、客户交互等全链路数智化能力,驱动生产优化和业务增长。
立即咨询
针对IDC逐渐暴露算力不足、不稳定等问题,EMR帮助客户平滑迁移上云,搭建存算分离&弹性伸缩大数据架构,实现资源降本30%、运维降本50%,在软件栈上实现5年的技术跨越,支撑成为国内广受欢迎教育平台。
立即咨询
业务极速增长对时效性、运维效率提出更高诉求,客户通过搬站到EMR,实现秒级的时效跃迁,满足实时报表分析需求,性能提升5倍,丰富的组件简化运维工作,实现资源降本50%,支撑广告业务智能分析、快速决策。
立即咨询
月之暗面
零一万物
毫末智行
理想汽车
洋葱学园
创量
LLM训练需要处理海量多结构数据,在计算调度与存储上面临极大挑战,通过EMR提供Spark等多种计算框架,实现集群资源共享,提高数据清洗效率,集群成本降低30%,推动Kimi的应用落地以及技术突破。
案例详情
EMR凭借开放生态、增强组件、存算分离等能力帮客户搭建低成本、高性能、安全LLM大数据平台,支撑数据预处理、多模态引擎、训练推理等场景,加快自研大模型步伐,突破百亿参数规模,助力打造AI2.0平台。
立即咨询
EMR为客户定制整套搬站方案,并搭建智驾大数据平台,解决开源组件性能低的问题,让资源成本降低30%、任务执行效率大幅提升,同时构建数据分析体系,支持业务经营决策、模型迭代效果评估,驱动智驾应用与增长。
立即咨询
与EMR合作,将架构升级至云原生实时大数据平台,支撑庞大且高频的数据采集、处理的车联网服务,通过数据挖掘推动智驾快速迭代,打造汽车研发、制造、销售、客户交互等全链路数智化能力,驱动生产优化和业务增长。
立即咨询
针对IDC逐渐暴露算力不足、不稳定等问题,EMR帮助客户平滑迁移上云,搭建存算分离&弹性伸缩大数据架构,实现资源降本30%、运维降本50%,在软件栈上实现5年的技术跨越,支撑成为国内广受欢迎教育平台。
立即咨询
业务极速增长对时效性、运维效率提出更高诉求,客户通过搬站到EMR,实现秒级的时效跃迁,满足实时报表分析需求,性能提升5倍,丰富的组件简化运维工作,实现资源降本50%,支撑广告业务智能分析、快速决策。
立即咨询
更多合作客户
产品动态
2024-11
新增元数据管理
支持对接LAS统一元数据管理以及Core节点组的缩容能力(白名单),新增软件栈v3.12.0:升级Hadoop、Proton等。
2024-07
湖仓一体增强
支持SparkSQL对StarRocks集群直读直写,Presto、Trino集群支持弹性伸缩;新增软件栈v3.11.0:升级Proton等。
2024-05
新增自研引擎
新增高性能Spark Native引擎、运维中心模块,数据湖集群支持多可用区部署;新增软件栈v3.10.0:升级Proton等。
2024-03
新增弹性实例
弹性伸缩支持预约式弹性实例(ESI);支持外部创建的KDC进行身份管理和认证;新增软件栈v3.9.0:新增Paimon组件等。
2024-01
弹性能力扩展
StarRocks独立集群支持按时间弹性伸缩;按量付费集群支持停机节省模式;云监控上线预置告警模板,一键应用;新增软件栈v3.8.0。
2023-12
新增存算分离集群
支持创建StarRocks存算分离集群;支持抢占式实例(SPOT);新增软件栈v3.7.0:升级Doris、StarRocks、Trino等组件。
2024-01
弹性能力扩展
StarRocks独立集群支持按时间弹性伸缩;按量付费集群支持停机节省模式;云监控上线预置告警模板,一键应用;新增软件栈v3.8.0。
2023-12
新增存算分离集群
支持创建StarRocks存算分离集群;支持抢占式实例(SPOT);新增软件栈v3.7.0:升级Doris、StarRocks、Trino等组件。
2023-10
安全能力增强
新增Kerberos集群能力,适配Hadoop、Kafka、HBase、Flink;新增适配GPU机型,满足AI计算场景;支持Tez Web UI。
2024-11
新增元数据管理
支持对接LAS统一元数据管理以及Core节点组的缩容能力(白名单),新增软件栈v3.12.0:升级Hadoop、Proton等。
2024-07
湖仓一体增强
支持SparkSQL对StarRocks集群直读直写,Presto、Trino集群支持弹性伸缩;新增软件栈v3.11.0:升级Proton等。
2024-05
新增自研引擎
新增高性能Spark Native引擎、运维中心模块,数据湖集群支持多可用区部署;新增软件栈v3.10.0:升级Proton等。
2024-03
新增弹性实例
弹性伸缩支持预约式弹性实例(ESI);支持外部创建的KDC进行身份管理和认证;新增软件栈v3.9.0:新增Paimon组件等。
使用指南
产品计费
灵活变更计费项规格,按需调整资源计费方式
计费说明
计费方式:按量付费
计费方式:包年包月
按量付费转包年包月
欠费说明
到期说明
退订和续费
快速入门
准备工作
创建集群
提交作业
用户指南
集群管理
服务管理
服务开发
迁移指南
迁移指南说明
成本评估优化
数据迁移
最佳实践
基于 StarRocks 的准实时数据分析
存算分离最佳实践
DataLeap Shell 结合 EMR 系列实践
一键启动火山引擎之旅
联系我们