本文介绍火山引擎 E-MapReduce(EMR) 支持的集群类型以及各集群相关的操作。
集群 | 描述 | 重要操作 |
---|---|---|
Hadoop |
| |
Flink | Flink 是一个面向有限流和无限流有状态计算的分布式计算框架,Flink集群提供开源消息引擎Flink服务,支持流处理和批处理两种应用类型。 | |
Kafka | 分布式、支持分区(partition)的、多副本(replica)的,基于 ZooKeeper 协调的分布式消息系统。 | |
Pulsar | 基于发布/订阅模式,且支持多租户、分布式、云原生的开源高性能消息与流平台,提供消息队列和计算服务,解决服务器间的消息传输与队列问题。 | |
Presto | MPP 架构的开源分布式查询分析引擎,支持 PB 级数据查询分析,支持多种数据源,如 Hive, MySQL,MongoDB,Redis 等。 | |
Trino | 开源分布式 SQL 查询引擎,支持PB级别数据的交互式分析;本身不存储数据,结合云存储,天然形成存算分离的架构进行弹性数据分析。 | |
Doris | 现代化的 MPP 分析型数据库产品。亚秒级响应时间查询效率,可高效地进行实时数据分析,满足固定历史报表,实时数据分析,交互式数据分析和探索式数据分析等多种数据分析需求。 | |
StarRocks | 新一代极速全场景 MPP (Massively Parallel Processing) 数据库,采用了全面向量化引擎,让用户的数据分析变得更加简单和敏捷。 | |
ClickHouse | 分布式实时分析型列式数据库产品,它能够亚秒级响应时间即可获得查询结果,可高效地进行实时数据分析。在用户行为分析、流量和监控、用户画像、实时BI报表等业务场景有广泛的应用。 | |
HBase | HBase集群提供的一种NoSQL数据库服务,构建在HDFS之上,提供了高并发的随机读写、实时点查。 | |
OpenSearch | Opensearch集群是一个完全兼容开源 Elasticsearch 接口的全文检索和分析引擎,为用户提供结构化、非结构化文本的多条件检索、统计、报表等功能。 | |
TensorFlow | 端到端开源机器学习平台,助力研究人员轻松的构建模型进行机器学习生产。 |