You need to enable JavaScript to run this app.
导航
3.3.5 SFTP/FTP-Hive
最近更新时间:2022.09.05 11:25:31首次发布时间:2022.09.05 11:25:31
我的收藏
有用
有用
无用
无用

使用场景

将SFTP/FTP数据导入到Hive表中,供离线分析使用。

注意事项

如果未找到SFTP/FTP数据源信息,请在数据源管理中配置对应的SFTP/FTP数据源

新建任务

  1. 在任务开发首页,点击“新建任务”
  2. 在项目下,左侧目录结构中新建任务
    alt

任务设置

alt

数据源信息

  1. 数据源:FTP/SFTP数据源;
  2. 文件路径:FTP/SFTP文件路径;
  3. 数据格式:ftp/sftp的文件数据格式,json或csv
  4. Success标签检测: 开启检测success标签后,success_file_path必须有_SUCCESS文件存在才会执行任务,若_SUCCESS文件不存在会抛runtime异常,终止执行程序。
  5. 是否跳过文件第一行: 跳过文件的第一行数据,如需跳过表头,可选择“是”
  6. 超时时间:开启标签检测后使用,单位ms
  7. 检测success标签重试次数:开启标签检测后使用,默认60次,每次间隔1分钟

目标信息

  1. 数据库:hive所在的数据库
  2. 数据表:hive目标表
  3. 分区名:分区字段从hive表自动获取

字段信息

字段映射在选好数据来源和目标后,自动填充,来源于ftp/sftp的文件schema和hive的表结构

任务调试

点击调试按钮,选择业务日期进行调试,调试结果/日志可在页面查看
alt