You need to enable JavaScript to run this app.
导航
EMR-VKE-1.6.0发布说明
最近更新时间:2024.08.19 17:26:31首次发布时间:2024.08.19 17:26:31

环境说明

系统环境

环境

语言

版本

OS

velinux1u3 SMP Debian 5.4.250-2

Spark

Java

1.8.0_351

Spark

Scala

2.12.18

Ray

Java

1.8.0_351

Celeborn

Java

1.8.0_351

Celeborn

Scala

2.12.15

应用程序版本

软件

版本

Spark

3.5.1

Ray

2.30.0

Kuberay

1.1.1

Celeborn

0.3.1

Hive

3.1.3

Zookeeper

3.7.1

EMR-VKE-1.6.0发布说明

新增功能

  • 使用弹性容器实例VCI调度Spark作业
    支持使用弹性容器实例(VCI)调度Spark作业,满足业务高峰弹性算力需求,减少常驻资源规模,实现降本。
  • 虚拟集群操作日志接入日志中心
    虚拟集群操作日志接入EMR控制台日志中心,用于日常操作审计和问题排查。
  • 作业监控
    通过作业管理可以监控虚拟集群上的Spark和Ray作业,支持作业详情和日志详情查看,便于作业问题分析排查。此功能当前为测试阶段。

更新、增强和解决的问题

  • 丰富监控指标
    EMR控制台丰富Spark、Celeborn监控指标,支持接入云上托管版Prometheus,用于日常运维监控。

遗留问题

【组件】单个RayCluster上持续运行超过1500+任务,可能会报low memory异常,为开源已知问题。

组件说明

组件

描述

Celeborn Master

维护Celeborn集群整体状态、活跃Shuffle和高可用

Celeborn Worker

接收、存储和服务Shuffle 数据

Spark Operator

用于在 Kubernetes 集群上部署和管理 Spark 应用程序

Spark History Server

Spark的Web UI组件,用于展示已完成的 Spark 作业的详细视图,包括作业的执行时间线、任务详情和资源使用情况

Ray Operator

用于在 Kubernetes 集群上部署和管理 Ray 应用程序

HiveMetastore

Hive元数据存储服务