You need to enable JavaScript to run this app.
最新活动
大模型
产品
解决方案
定价
生态与合作
支持与服务
开发者
了解我们

E-MapReduce

AI 时代开源大数据平台,提供丰富的增强型大数据组件,100% 兼容开源,具备极致弹性资源、存算分离架构,覆盖迁移上云、湖仓分析、多模数据处理、AI 应用等场景,加速 AI 业务落地,激发数据价值。
AI时代开源大数据平台,具备极致弹性资源、存算分离架构,覆盖迁移上云、湖仓分析、多模数据处理、AI应用等场景,加速AI业务落地。
10EB级别
生产实践
1000万核
集群规模
200
日均作业量
产品形态
产品功能
产品优势
产品架构
应用场景
客户案例
产品动态
使用指南

产品形态

EMR Serverless

火山引擎EMR提供Spark、Presto、StarRocks、Doris、Catalog、RSS等全托管服务,完全兼容开源,性能增强3~5倍,具备开箱即用、秒级弹性、免运维、自定义镜像的特性,让用户更专注于业务。
了解更多

EMR on ECS

火山引擎EMR基于ECS的半托管模式,提供更全面的Hadoop、Spark等36+个大数据生态组件,计算存储资源归属用户,可登陆ECS进行自定义操作,具备存算分离、分钟级弹性、灵活自运维的特性。
了解更多

EMR on VKE

火山引擎EMR基于VKE(K8S)的半托管模式,资源引擎从YARN升级为K8S统一调度,满足用户离线、在线、AI等不同Workload的潮汐混部运行,最大程度提升资源利用率,同时具备半托管的灵活性。
点击申请

产品特性

开源生态组件

开源生态组件

集成Hadoop、Flink、Hive、Kafka、Hudi、Iceberg、StarRocks、Doris等大数据全栈组件,完全兼容开源,并基于字节跳动内部实践持续优化,Spark优化2.5倍+,Presto优化4.8倍+。
存算分离架构

存算分离架构

存储与计算解耦,可按需独立扩展与优化,资源灵活配比,提高资源利用率和系统性能;统一数据湖,支持多种计算引擎,自研湖加速引擎Proton,性能超过存算一体,成本降低30%+。
弹性伸缩能力

弹性伸缩能力

基于时间规则、集群负载、混合规则的弹性伸缩策略,支持节点级、容器级、作业级弹性,提供丰富的弹性资源,如:抢占式实例、预约实例等,灵活满足业务波峰波谷资源需求,极致降本。
湖 · 仓 · AI 一体化

湖 · 仓 · AI 一体化

LAS Catalog提供湖、仓、AI一体化的元数据管理,数据统一存储、透明访问,多产品形态、多负载类型可联邦分析,支持湖仓分析、大模型数据预处理统一K8S资源池调度,提升资源利用率。
超大规模生产实践

超大规模生产实践

单集群支持10万核以上(可跨AZ部署),可单次扩容1000节点,完备的容灾能力。EMR Spark达到10EB级处理量,日均Shuffle量超过400PB,EMR Presto日均百万次查询,秒级查询响应。
云原生运维

云原生运维

一站式云托管,提供集群管理、服务管理、用户管理、监控告警、日志查询等能力;支持服务监控指标体系,企业级诊断能力,感知集群组件及任务的运行异常状况,降低运维门槛。
企业级数据安全

企业级数据安全

支持Kerberos和lAM双认证模式、RBAC模式、审计日志等,具备数据加密、数据隔离、细颗粒度访问控制等能力,协同火山引擎安全体系,提供高可用、全方位的安全管控服务。
云上生态融合

云上生态融合

无缝对接火山引擎各类云上产品,如:大数据研发治理套件DataLeap、对象存储TOS、智能数据洞察DataWind等,为客户提供专业高效、安全可靠的一站式产品体验,全链路支撑多样业务场景。
开源生态组件

开源生态组件

集成Hadoop、Flink、Hive、Kafka、Hudi、Iceberg、StarRocks、Doris等大数据全栈组件,完全兼容开源,并基于字节跳动内部实践持续优化,Spark优化2.5倍+,Presto优化4.8倍+。
存算分离架构

存算分离架构

存储与计算解耦,可按需独立扩展与优化,资源灵活配比,提高资源利用率和系统性能;统一数据湖,支持多种计算引擎,自研湖加速引擎Proton,性能超过存算一体,成本降低30%+。
弹性伸缩能力

弹性伸缩能力

基于时间规则、集群负载、混合规则的弹性伸缩策略,支持节点级、容器级、作业级弹性,提供丰富的弹性资源,如:抢占式实例、预约实例等,灵活满足业务波峰波谷资源需求,极致降本。
湖 · 仓 · AI 一体化

湖 · 仓 · AI 一体化

LAS Catalog提供湖、仓、AI一体化的元数据管理,数据统一存储、透明访问,多产品形态、多负载类型可联邦分析,支持湖仓分析、大模型数据预处理统一K8S资源池调度,提升资源利用率。
超大规模生产实践

超大规模生产实践

单集群支持10万核以上(可跨AZ部署),可单次扩容1000节点,完备的容灾能力。EMR Spark达到10EB级处理量,日均Shuffle量超过400PB,EMR Presto日均百万次查询,秒级查询响应。
云原生运维

云原生运维

一站式云托管,提供集群管理、服务管理、用户管理、监控告警、日志查询等能力;支持服务监控指标体系,企业级诊断能力,感知集群组件及任务的运行异常状况,降低运维门槛。
企业级数据安全

企业级数据安全

支持Kerberos和lAM双认证模式、RBAC模式、审计日志等,具备数据加密、数据隔离、细颗粒度访问控制等能力,协同火山引擎安全体系,提供高可用、全方位的安全管控服务。
云上生态融合

云上生态融合

无缝对接火山引擎各类云上产品,如:大数据研发治理套件DataLeap、对象存储TOS、智能数据洞察DataWind等,为客户提供专业高效、安全可靠的一站式产品体验,全链路支撑多样业务场景。
展开查看更多

核心优势

大幅降低成本
40%+

火山引擎独有的内外潮汐资源机房
存算分离架构,冷热分层存储
弹性伸缩能力,多负载混用资源
组件性能优化
3~5

行业超大数据体量深度实践
兼容开源,内外持续反哺增强
自研向量化执行引擎Bolt加速
全面Serverless
开放透明

全托管模式,100%兼容开源
开放架构,自定义镜像,自由创新
默认透明对象存储,不绑数据
专业迁移方案
丝滑快速

为客户定制化整套搬站方案
提供丰富自动化迁移工具和产品
过程可视化监控,确保迁移丝滑
运维极致提效
极简高效

高效的集群管理、运维工具
可视化、自定义的监控告警能力
企业级诊断、快速排障解决
大幅降低成本
40%+

火山引擎独有的内外潮汐资源机房
存算分离架构,冷热分层存储
弹性伸缩能力,多负载混用资源
组件性能优化
3~5

行业超大数据体量深度实践
兼容开源,内外持续反哺增强
自研向量化执行引擎Bolt加速
全面Serverless
开放透明

全托管模式,100%兼容开源
开放架构,自定义镜像,自由创新
默认透明对象存储,不绑数据
专业迁移方案
丝滑快速

为客户定制化整套搬站方案
提供丰富自动化迁移工具和产品
过程可视化监控,确保迁移丝滑
运维极致提效
极简高效

高效的集群管理、运维工具
可视化、自定义的监控告警能力
企业级诊断、快速排障解决

产品架构

架构图
架构图
架构图

应用场景

大数据迁移上云

云原生数据湖仓

离线数据分析

交互式分析

实时数据分析

架构图
大数据迁移上云
EMR具备平迁能力,提供自动化迁移和监控工具,提高效率、降低复杂度,解决开源组件版本滞后、技术栈复杂等问题,快速构建高性能低成本大数据平台。

架构优势

迁移简单快速
多种方案、丰富工具,业务无中断,快速丝滑迁移
完全兼容开源
100%兼容开源生态,组件能力企业级增强、版本常新
技术架构升级
云原生架构升级,实现存算分离、灵活弹性伸缩

推荐产品

架构图

架构优势

迁移简单快速
完全兼容开源
技术架构升级
架构图
云原生数据湖仓
随着企业发展,数据规模庞大、结构复杂、引擎众多、分析复杂,传统架构难以支撑,EMR湖仓方案满足低成本、统一存储&管理、多样分析场景等需求。

架构优势

存算分离&冷热分层
存储与计算解耦,数据分层定价,极致提效与降本
对接多种引擎
支持实时、离线、交互查询等计算引擎,数据一致
元数据管理
统一元数据视图,跨源查询分析,数据自动发现

推荐产品

架构图

架构优势

存算分离&冷热分层
对接多种引擎
元数据管理
架构图
离线数据分析
构建以Hadoop为核心的企业级离线数仓,对多种类型数据做采集、清洗、转化,一个平台支持多种计算引擎,满足复杂分析需求,支撑企业智能高效决策。

架构优势

灵活的云上架构
云原生架构,资源弹性伸缩,灵活满足业务需求
增强版开源组件
容开源深度优化,确保高可用、高稳定、高性能
丰富的高阶运维
提供丰富多样的运维工具,自动告警,可视化界面

推荐产品

架构图

架构优势

灵活的云上架构
增强版开源组件
丰富的高阶运维
架构图
交互式分析
通过对各类业务系统的结构化/非结构化数据进行加工和查询,支撑上层业务灵活且快速地进行数据分析、探索、预测,提高业务决策效率、组织响应速度。

架构优势

极速查询
物化视图加速数据查询,极速调用数据、分析数据
灵活查询
支持SQL语句,灵活支持各类逻辑分析、复杂分析
高效开发
提供集群管理、监控、扩容等能力,专注业务发展

推荐产品

架构图

架构优势

极速查询
灵活查询
高效开发
架构图
实时数据分析
支持数据实时采集和流式处理分析、支撑10万级QPS在线查询分析,达到实时数据展示和动作触发,满足实时性、高并发等需求场景,支撑实时计算及决策。

架构优势

实时计算
支持流式计算引擎,高吞吐、低延时,秒级响应
批流一体
一个平台实现数据集成、计算、分析、应用、存储
实时决策
支持IoT、车联网、广告、风控、交易等实时业务

推荐产品

架构图

架构优势

实时计算
批流一体
实时决策

大数据迁移上云

架构图

架构优势

迁移简单快速
完全兼容开源
技术架构升级
架构图

架构优势

存算分离&冷热分层
对接多种引擎
元数据管理
架构图

架构优势

灵活的云上架构
增强版开源组件
丰富的高阶运维
架构图

架构优势

极速查询
灵活查询
高效开发
架构图

架构优势

实时计算
批流一体
实时决策

客户案例

月之暗面
LLM训练需要处理海量多结构数据,在计算调度与存储上面临极大挑战,通过EMR提供Spark等多种计算框架,实现集群资源共享,提高数据清洗效率,集群成本降低30%,推动Kimi的应用落地以及技术突破。
月之暗面
零一万物
EMR凭借开放生态、增强组件、存算分离等能力帮客户搭建低成本、高性能、安全LLM大数据平台,支撑数据预处理、多模态引擎、训练推理等场景,加快自研大模型步伐,突破百亿参数规模,助力打造AI2.0平台。
零一万物
毫末智行
EMR为客户定制整套搬站方案,并搭建智驾大数据平台,解决开源组件性能低的问题,让资源成本降低30%、任务执行效率大幅提升,同时构建数据分析体系,支持业务经营决策、模型迭代效果评估,驱动智驾应用与增长。
毫末智行
理想汽车
与EMR合作,将架构升级至云原生实时大数据平台,支撑庞大且高频的数据采集、处理的车联网服务,通过数据挖掘推动智驾快速迭代,打造汽车研发、制造、销售、客户交互等全链路数智化能力,驱动生产优化和业务增长。
理想汽车
洋葱学园
针对IDC逐渐暴露算力不足、不稳定等问题,EMR帮助客户平滑迁移上云,搭建存算分离&弹性伸缩大数据架构,实现资源降本30%、运维降本50%,在软件栈上实现5年的技术跨越,支撑成为国内广受欢迎教育平台。
洋葱学园
创量
业务极速增长对时效性、运维效率提出更高诉求,客户通过搬站到EMR,实现秒级的时效跃迁,满足实时报表分析需求,性能提升5倍,丰富的组件简化运维工作,实现资源降本50%,支撑广告业务智能分析、快速决策。
创量
月之暗面零一万物毫末智行理想汽车洋葱学园创量

更多合作客户

Momenta
智谱华章
月之暗面
旺脉
山西鹏景
视客网
洋葱学园
下厨房

产品动态

一键启动火山引擎之旅
联系我们