Presto(或 PrestoDB)作为 MPP 架构的开源分布式查询分析引擎,支持 PB 级大数据查询分析,并允许连接多种数据源,如 Hive、TOS、MySQL、Hudi、Iceberg 和 Kafka 等。同时,也支持在单个查询中查询来自多个数据源的数据,即联邦查询。
Presto Coordinator:Coordinator 作为 Presto 的协调节点,接收用户查询请求,生成执行计划,调度分布式任务,以及管理 Worker 节点。
Presto Worker:Worker 作为 Presto 执行分布式任务的工作节点,运行在各个 Core 节点和 Task 节点之上,且每台节点只启动一个实例。
Presto Connector:Connector 可以类比理解为数据库驱动程序,支持 Presto 连接和操作目标数据源。
Presto Cli:Cli 作为 Presto 的命令行工具,支持用户连接至 Coordinator 节点提交 SQL 查询语句。
火山引擎 E-MapReduce(EMR)Presto 采用与 YARN 混合部署模式,即 Coordinator 部署在 master 节点,而 Worker 与 YARN NodeManger 同时部署在同一个节点上,二者分别占用节点的部分资源,占用比例允许用户自定义。
接下来,您可以访问:
基础使用:了解如何基于 Cli 命令行、JDBC、Hue,以及 Airflow 等方式访问 Presto。
高阶使用:了解 EMR Presto 的一些高级特性,例如 Connector 配置、资源组配置、Hive 内置 UDF/UADF 支持、服务化 Web UI,以及高可用支持等。
常见问题:了解您可能会遇到的一些高频问题,以及如何予以解决。
如果您希望了解关于 Presto 更多详细信息,可以参考 Presto 官方文档。