You need to enable JavaScript to run this app.
E-MapReduce

E-MapReduce

复制全文
高阶使用
Iceberg 参数配置
复制全文
Iceberg 参数配置

本文为您介绍 Iceberg 表使用数据湖元数据的必要配置。

Spark 配置

Spark 支持的 catalog type 有 Hive 和 Hadoop。关于 catalog 的参数配置还可参考官网

Catalog type 为 hive

参数

参数值

描述

spark.sql.catalog..type

iceberg

底层 Iceberg catalog 实现类型,HiveCatalog,或者HadoopCatalog。如果未配置,则采用 custom catalog。

spark.sql.extensions

org.apache.iceberg.spark.extensions.IcebergSparkSessionExtensions

Spark SQL 扩展模块。固定值。

spark.sql.catalog.

org.apache.iceberg.spark.SparkCatalog

Catalog 名称。固定值。
另外,如果想看到同一个数据库下非 Iceberg 表和 Iceberg 表,该参数配置为:org.apache.iceberg.spark.SparkSessionCatalog

spark.sql.catalog..uri

thrift://master-1-1:9083

Metastore 的地址。查看 Hive 组件的配置文件 hive-site 中hive.metastore.uris参数对应的值。

spark.sql.catalog..warehouse

hdfs://master-1-1:8020/warehouse/path

Warehouse 地址。查看 Hive 组件的配置文件 hive-site 中hive.metastore.warehouse.dir参数对应的值,也可以自定义路径。也支持 TOS 路径。

示例:

spark.sql.catalog.hive_prod = org.apache.iceberg.spark.SparkCatalog
spark.sql.catalog.hive_prod.type = hive
spark.sql.catalog.hive_prod.uri = thrift://master-1-1:9083
# omit uri to use the same URI as Spark: hive.metastore.uris in hive-site.xml

Catalog type 为 hadoop

参数

参数值

描述

spark.sql.catalog..type

hadoop

底层 Iceberg catalog实现类型,HiveCatalog,或者HadoopCatalog。如果未配置,则采用 custom catalog。

spark.sql.extensions

org.apache.iceberg.spark.extensions.IcebergSparkSessionExtensions

Spark SQL 扩展模块。固定值。

spark.sql.catalog.

org.apache.iceberg.spark.SparkCatalog

Catalog 名称。固定值。
另外,如果想看到同一个数据库下非 Iceberg 表和 Iceberg 表,该参数配置为:org.apache.iceberg.spark.SparkSessionCatalog

spark.sql.catalog..warehouse

hdfs://master-1-1:8020/warehouse/path

Warehouse 地址。可以采用 HDFS 存储,也可以采用 TOS 存储

示例:

spark.sql.catalog.hadoop_prod = org.apache.iceberg.spark.SparkCatalog
spark.sql.catalog.hadoop_prod.type = hadoop
spark.sql.catalog.hadoop_prod.warehouse = hdfs://master-1-1:8020/warehouse/path

Catalog type 为空

参数

参数值

描述

spark.sql.catalog..catalog-impl

底层 Iceberg catalog 实现类型。spark.sql.catalog..type 为空时,需配置该参数。

Hive 配置

Hive 中支持 Iceberg 的 catalog type 有 Hive、Hadoop,也可以为空。 type 不同,配置项也不同:

Catalog type 为 Hive

参数

说明

iceberg.catalog.<catalog_name>.type

配置为 Hive

iceberg.catalog.<catalog_name>.uri

Metastore 的地址。查看 Hive 组件的配置文件 hive-site 中hive.metastore.uris参数对应的值。

iceberg.catalog.<catalog_name>.clients

客户端 pool 的个数

示例:

SET iceberg.catalog.another_hive.type=hive;
SET iceberg.catalog.another_hive.uri=thrift://master-1-1:9083;

Catalog type 为 hadoop

参数

说明

iceberg.catalog.<catalog_name>.type

配置为 hadoop

iceberg.catalog.iceberg.clients

客户端 pool 的个数

iceberg.catalog.iceberg.warehouse

Warehouse 地址

示例:

SET iceberg.catalog.hadoop.type=hadoop;
SET iceberg.catalog.hadoop.warehouse=hdfs://master-1-1:8020/warehouse;

Catalog type 为空

参数

说明

iceberg.catalog.<catalog_name>.catalog-impl

catalog 的实现。catalog type 为空时,需配置。

最近更新时间:2025.12.01 20:24:55
这个页面对您有帮助吗?
有用
有用
无用
无用