使用场景
将SFTP/FTP数据导入到Hive表中,供离线分析使用。
注意事项
如果未找到SFTP/FTP数据源信息,请在数据源管理中配置对应的SFTP/FTP数据源
新建任务
- 在任务开发首页,点击“新建任务”
- 在项目下,左侧目录结构中新建任务

任务设置

数据源信息
- 数据源:FTP/SFTP数据源;
- 文件路径:FTP/SFTP文件路径;
- 数据格式:ftp/sftp的文件数据格式,json或csv
- Success标签检测: 开启检测success标签后,success_file_path必须有_SUCCESS文件存在才会执行任务,若_SUCCESS文件不存在会抛runtime异常,终止执行程序。
- 是否跳过文件第一行: 跳过文件的第一行数据,如需跳过表头,可选择“是”
- 超时时间:开启标签检测后使用,单位ms
- 检测success标签重试次数:开启标签检测后使用,默认60次,每次间隔1分钟
目标信息
- 数据库:hive所在的数据库
- 数据表:hive目标表
- 分区名:分区字段从hive表自动获取
字段信息
字段映射在选好数据来源和目标后,自动填充,来源于ftp/sftp的文件schema和hive的表结构
任务调试
点击调试按钮,选择业务日期进行调试,调试结果/日志可在页面查看
