用户可以自行搭建FTP服务器,将数仓数据定期以文件的形式推入FTP服务器中,CDP支持通过连接FTP服务器将数据下载,然后将文件结构化映射成相关表结构内容,供CDP系统进行识别读取,实现数据连接。
用户需具备 项目编辑 或 权限-按内容管理-模块-数据连接-新建连接 权限,才能使用该功能。
1.点击 数据融合 > 数据连接 。
2.在数据连接目录左上角- 新建数据连接 按钮,选择 Web连接器 - FTP/SFTP 数据连接(暂不支持SFTP连接)。
3.在编辑页面,配置对应参数。如:
说明
FTP服务器部署:
用户可以自由搭建,但是需要开放CDP系统连接访问。
FTP服务器需要配置被动模式,且端口范围需要足够大,建议值为:FTP数据集数量*2
*更多配置过程中的常见问题可参考本文档 附录2
说明
FTP文件内容及格式要求如下:
5.单击 解析表结构 ,将对文件目录进行解析,数据表预览展示表名和字段名,表名如果过多的话,支持滚动展示,默认展示第一个表名下的字段信息。
6.单击 测试连接,将进行数据源连通性测试。
7.测试成功后,单击 保存 即可。
#请按以下参数填写: ### name:字段名称(必填) ########## 字段命名规则:需确保字段名唯一性;仅支持字母、数字、下划线且以字母为首,最多100个字符 ### alias:字段别名(选填) ########## 字段别名规则:字符类型不限,最多100个字符 ### type:字段类型(必填) ########## 类型规则:无需明确长度,可指定类型如下: # string # boolean # long # double # date # datetime # 下面两种类型中的%s仅支持基本类型如int # 不支持多层嵌套,例如array<array<int>> # array<%s> # map<%s,%s> #-------------------------------------------------------------------------------- columns: - name: brand_id alias: 品牌id type: int - name: brand_name alias: 品牌名称 type: string - name: brand_desc alias: 品牌介绍 type: string - name: create_time alias: 创建时间 type: date - name: update_time alias: 变更时间 type: date
Q1:FTP连接服务器遇到530 login incorrect错误怎么解决?
1)密码错误。
2)检查/etc/vsftpd/vsftpd.conf配置
vim /etc/vsftpd/vsftpd.conf
说明
参看下面配置
anonymous_enable=YES
userlist_deny=NO //参看下面的说明
userlist_enable=YES
userlist_file=/etc/userlist
seccomp_sandbox=NOlocal_enable=YES
pam_service_name=vsftpd //这里重要,有人说ubuntu是pam_service_name=ftp,可以试试
其中关于userlist文件的说明
3.检查/etc/pam.d/vsftpd
vim /etc/pam.d/vsftpd
注释掉
#auth required pam_shells.so
Q2:Linux实例上传文件到FTP站点报“425 Security:Bad IP connection”错误怎么解决?
1)可能的原因:
FTP服务有两种连接,一种是控制连接,另一种是数据连接。默认情况下,FTP服务器在传输数据时会检查两个连接的源IP地址是否相同。如果不是,则会报告“425 安全:错误的 IP 连接”错误。此问题往往是由于NAT网络中的客户端,且NAT关联的公网IP地址多个,导致两次连接,源IP不一致造成的。
2)解决方案:
关闭被动模式下的IP地址安全检查,如下: