EMR 自 EMR-3.1.1(对应 Hadoop 3.x)开始支持 Proton SDK。本文描述了如何在火山 EMR 的 Impala 中使用 Proton SDK 读写 TOS 数据。
认证配置参考:Hadoop 使用 Proton 文档
在创建 Impala 表的时候将location字段值设置成TOS地址,即可分析TOS的数据,例如:
CREATE TABLE `impala_tos_table`( `id` STRING COMMENT '', `brand` STRING COMMENT '', `channel` STRING COMMENT '') PARTITIONED BY (dt String) LOCATION 'tos://您的bucket/impala_tos_table/';
insert into impala_tos_table partition(dt='20240512') values('0', 'brand0', 'channel0');
select * from impala_tos_table;