原【项目中心-数据输出任务】从1.22版本开始不再维护,请将历史任务迁移至升级后的模块【营销应用-数据输出】
数据输出模块支持将客户下游系统对接VeCDP,用户可以将在VeCDP上创建的数据数据输出到如自有数据库,以便进行灵活处理应用或分析工作。
输出内容 | 说明 | 支持的输出类型 |
---|---|---|
分群 | 全量主体+附带信息(包含:标签、主体属性、行为事件、业务明细、ID类型) | 全量宽表输出 |
指定主体(支持选择多个分群)+附带信息(包含:标签、主体属性、行为事件、业务明细、ID类型) | 全量宽表输出 | |
标签 | 全量主体离线&实时标签结果表标签结果+ID类型 | 全量宽表输出 |
主体属性 | 全量主体属性+ID类型 | 全量宽表输出 |
行为属性 | 全量主体行为属性+ID类型 | 全量宽表输出 |
业务明细 | 全量主体业务明细+ID类型 | 全量宽表输出 |
说明
开启方式:进入配置中心,搜索配置 data_asset_output_v2.platform_list ,追加对应通道 code
类型 | 存储名称 | code | 输出连接限制 | 支持的产品版本 | 支持部署形态 | |||
---|---|---|---|---|---|---|---|---|
表名 | 列名 | 不支持类型 | 以字母开头 | |||||
外置存储 | Las(版本号:2.0) | las | 小写字母、数字、下划线 | 小写字母,数字,下划线 | 必须 | 1.21 | 私部 | |
MaxCompute | maxCompute | 大小写字母、数字、下划线 | 大写字母、数字、下划线、中文 | / | 必须 | 1.23 | sass | |
OceanBase-Mysql | oceanBaseMysql | 大写字母、数字、下划线、中文 | 数字、下划线、中文 | 不支持array\map | 必须 | 1.23 | saas&私部 | |
OceanBase-Oracle | oceanBaseOracle | 大写字母、数字、下划线、中文 | 大写字母、数字、下划线、中文 | 不支持array\map | 必须 | 1.23 | saas&私部 | |
Oracle | oracle | 大写字母、数字、下划线、中文 | 大写字母、数字、下划线、中文 | 不支持array\map | 必须 | 1.23 | saas&私部 | |
外置 hive | externalHive | 小写字母、数字、下划线 | 小写字母,数字,下划线 | 必须 | 1.21 | 私部 | ||
自定义输出 | udfOutput | / | / | / | 1.23 | 私部 | ||
内置存储 | 内置hive | innerHive | / | 小写字母、数字、下划线 | 不支持array | 必须 | 1.19.2 | 私部 |
1.20.1 | saas 托管账号 | |||||||
内置hdfs | hdfs | / | 小写字母、数字、下划线 | / | 必须 | 1.19.2 | 私部 | |
1.20.1 | saas 托管账号 | |||||||
第三方云存储 | 火山引擎云存储 | volcEngineOss | / | 小写字母、数字、下划线 | / | 必须 | 1.19.2 | 私部 |
1.20.1 | saas 托管账号 | |||||||
1.20.1 | saas 非托管账户 | |||||||
阿里云存储 | aliOss | / | 小写字母、数字、下划线 | / | 必须 | 1.19.2 | 私部 | |
1.20.1 | saas 托管账号 | |||||||
1.20.1 | saas 非托管账户 | |||||||
腾讯云存储 | tencentOss | / | 小写字母、数字、下划线 | / | 必须 | 1.19.2 | 私部 | |
1.20.1 | saas 托管账号 | |||||||
1.20.1 | saas 非托管账户 |
第一步:通道配置(在项目中心>通道配置中,完成第三方存储、LAS、外置Hive的通道配置)
第二步:创建数据输出任务(在营销应用>数据输出中,新建数据输出任务,配置输出内容、输出频率、输出账号、任务依赖等)
1.点击 项目中心 > 通道管理 ,在第三方渠道页面选择 添加通道应用 。
2.支持火山云对象存储、阿里云对象存储、腾讯云对象存储、外置hive和LAS账号渠道的绑定
点击 项目中心 > 通道管理 ,在第三方通道页面选择 添加通道应用 ,选择 火山云对象存储, 准确填写对应信息后点击 授权 即可。
所需信息获取步骤如下:
1.登陆 火山云官网,登陆账号; 2.点击头像,选择 API访问密钥 ,获取Accesskey、AccessKeySecret信息;
3.创建存储桶,点击查看操作说明;
4.获取桶信息。在左侧导航栏,单击概览,在右侧页面查看该存储桶的用量概览、基本信息和访问域名,在该页面获取OSS地址、Bucket名称等信息。
点击 项目中心 > 通道管理 ,在第三方通道页面选择 添加通道应用 ,选择 阿里云对象存储, 准确填写对应信息后点击 授权 即可。
所需信息获取步骤如下:
1.登陆 阿里云官网,登陆账号; 2.在 访问控制 页面,获取Accesskey,AccessKeySecret信息;
3.创建存储空间,完成后可以 获取存储空间地域信息 ,取得OSS地址、Bucket名称等信息。
点击 项目中心 > 通道管理 ,在第三方通道 页面选择 添加通道应用 ,选择 腾讯云对象存储, 准确填写对应信息后点击 授权 即可。
所需信息获取步骤如下:
1.登陆 腾讯云官网,登陆账号; 2.在 访问管理 页面,获取Accesskey,AccessKeySecret信息;
3.在左侧导航中,单击存储桶列表,进入存储桶列表页面,单击创建存储桶。点击查看操作说明;
4.在 存储桶列表 页面,获取Bucket名称、Bucket Region等信息。
hiveServer2Url: jdbc:hive2://example.com:10000/;principal=hive/example.com@BYTEDANCE.COM hive user : cdp hdfs Address : hdfs://nameservice1 数据仓库: /commons/cdp principal: cdp@BYTEDANCE.COM
刷新界面,记录 账户ID/账户组ID
需提前准备好以下文件,
需将文件做以下处理
cdp.keytab, krb5.conf ,core_site.xml ,hdfs_site.xml (hdfs-site.xml、core-site.xml需要将"-"改成"_",否则会有问题)
hdfs-site.xml修改客户端创建目录的权限,默认为022 <property> <name>fs.permissions.umask-mode</name> <value>002</value> </property>
对应的路径为
#platformId为三方授权时的id,在项目中心-三方渠道-hive找到相关id上传 /user/dp/cdp/data_asset/security/kerberos/${platformId}/${userKeyTable} /user/dp/cdp/data_asset/security/kerberos/${platformId}/krb5.conf /user/dp/cdp/data_asset/security/kerberos/${platformId}/core_site.xml /user/dp/cdp/data_asset/security/kerberos/${platformId}/hdfs_site.xml 例:如果id为 1 执行 hdfs dfs -mkdir -p /user/dp/cdp/data_asset/security/kerberos/1 执行 hdfs dfs -put -f cdp.keytab /user/dp/cdp/data_asset/security/kerberos/1 hdfs dfs -put -f krb5.conf /user/dp/cdp/data_asset/security/kerberos/1 hdfs dfs -put -f core_site.xml /user/dp/cdp/data_asset/security/kerberos/1 hdfs dfs -put -f hdfs_site.xml /user/dp/cdp/data_asset/security/kerberos/1
点击 项目中心 > 通道管理 ,在第三方通道页面选择 添加通道应用 ,选择 外置Hive。
在外置Hive配置页面,按照以下要求填写所需信息:
hdfs_site.xml
, core_site.xml
, krb5.conf
, xxx.keytab
(上传的文件 xxx.keytab,需要先重命名为 cdp.keytab 再上传)文件。注意,文件名不支持使用中划线。确认所有信息填写无误后,点击“授权”按钮完成配置。
点击 项目中心 > 渠道管理 ,在第三方通道页面选择 添加通道应用 ,选择 LAS。
在配置LAS的页面,按照以下要求填写所需信息:
填写示例如下:
点击 项目中心 > 通道管理 ,在第三方通道页面选择 添加通道应用 ,选择 MaxCompute。
点击 项目中心 > 通道管理 ,在第三方通道页面选择 添加通道应用 ,选择 OceanBase-Mysql。
点击 项目中心 > 通道管理 ,在第三方通道页面选择 添加通道应用 ,选择 OceanBase-Oracle。
点击 项目中心 > 通道管理 ,在第三方通道页面选择 添加通道应用 ,选择 Oracle。
输出内容: 选择 标签 并勾选需要输出的标签。
选择ID类型: 支持多选ID信息作为附带信息一并输出。最多可以选择10个ID类型。
输出类型:
基准ID | XX_ID,如用户ID | 性别 | 年龄 | 会员等级 | 标签… | 业务日期 |
---|---|---|---|---|---|---|
63528953748201638462087 | 531916 | 男 | 23 | 白金 | …… | 2023/6/13 |
63528372748201638462087 | 638042 | 男 | 45 | 黄金 | …… | 2023/6/14 |
63528953748629738462087 | 538274 | 男 | 23 | 白银 | …… | 2023/6/15 |
73628953748201638462087 | 442187 | 男 | 30 | 白银 | …… | 2023/6/16 |
基准ID | 标签ID | 标签值 | 业务日期 |
---|---|---|---|
63528953748201638462087 | 23 | 男 | 2023/6/13 |
63528372748201638462087 | 45 | 25 | 2023/6/14 |
63528953748629738462087 | 21 | 大学 | 2023/6/15 |
73628953748201638462087 | 89 | 白金会员 | 2023/6/16 |
* **全量宽表输出**:
客户id | 客群ID_001 | 客群ID_002 |
---|---|---|
aaa | 1 | 1 |
bbb | 0 | 1 |
* **全量高表输出**:
客户id | asset_key | asset_value |
---|---|---|
aaa | segment_id | 001 |
aaa | segment_id | 002 |
bbb | segment_id | 001 |
* **全量组合输出**:
客户id | asset_key | asset_value |
---|---|---|
aaa | segment_id | 001 |
aaa | segment_id | 002 |
bbb | segment_id | 001 |
* **增量高表输出**:
首次输出
客户id | asset_key | asset_value | meta_status | meta_version |
---|---|---|---|---|
aaa | segment_id | 001 | 0 | xxxxx-xx-xx xx:xx:xx |
aaa | segment_id | 002 | 0 | xxxxx-xx-xx xx:xx:xx |
bbb | segment_id | 001 | 0 | xxxxx-xx-xx xx:xx:xx |
若人群包001中删除客户aaa,人群包002新增客户ccc
客户id | asset_key | asset_value | meta_status | meta_version |
---|---|---|---|---|
aaa | segment_id | 001 | 3 | xxxxx-xx-xx xx:xx:xx |
ccc | segment_id | 002 | 1 | xxxxx-xx-xx xx:xx:xx |
* **增量组合输出**:
首次输出
客户id | asset_key | asset_value | meta_status | meta_version |
---|---|---|---|---|
aaa | segment_id | 001 | 0 | xxxxx-xx-xx xx:xx:xx |
aaa | segment_id | 002 | 0 | xxxxx-xx-xx xx:xx:xx |
bbb | segment_id | 001 | 0 | xxxxx-xx-xx xx:xx:xx |
若人群包001中删除客户aaa,人群包002新增客户ccc
客户id | asset_key | asset_value | meta_status | meta_version |
---|---|---|---|---|
aaa | segment_id | 001 | 3 | xxxxx-xx-xx xx:xx:xx |
ccc | segment_id | 002 | 1 | xxxxx-xx-xx xx:xx:xx |
* 当添加附带信息,例如标签时,只能输出全量宽表、全量组合、增量组合:
* **全量宽表输出**:
客户id | 客群ID_001 | 客群ID_002 | tag_1 | tag_2 |
---|---|---|---|---|
aaa | 1 | 1 | xx | |
bbb | 0 | 1 | xx | xx |
* **全量组合输出**:
客户id | asset_key | asset_value | tag_1 | tag_2 |
---|---|---|---|---|
aaa | segment_id | 001 | xx | |
aaa | segment_id | 002 | xx | |
bbb | segment_id | 001 | xx | xx |
* **增量组合输出**:
首次输出
客户id | asset_key | asset_value | tag_1 | tag_2 | meta_status | meta_version |
---|---|---|---|---|---|---|
aaa | segment_id | 001 | xx | 0 | xxxxx-xx-xx xx:xx:xx | |
aaa | segment_id | 002 | xx | 0 | xxxxx-xx-xx xx:xx:xx | |
bbb | segment_id | 001 | xx | xx | 0 | xxxxx-xx-xx xx:xx:xx |
若人群包001中删除客户aaa,人群包002新增客户ccc
客户id | asset_key | asset_value | tag_1 | tag_2 | meta_status | meta_version |
---|---|---|---|---|---|---|
aaa | segment_id | 001 | xx | 3 | xxxxx-xx-xx xx:xx:xx | |
ccc | segment_id | 002 | xx | xx | 1 | xxxxx-xx-xx xx:xx:xx |
输出加密配置
数据加密处理策略:
注意:需要与隐私安全-数据加解密功能结合使用,在隐私安全内配置完成后,才能在这里选择
支持表结构预览数据和编辑;
支持多主体数据输出,基于主体间的关联关系可以输出A主体信息及关联的B主体信息。
举例:输出【人】关联的【车】关联关系
操作:选择输出主体【人】,输出内容【分群】;选择关联主体【车】,输出内容【分群】
举例:输出【人】关联的【车】关联关系,同时输出【车】的标签
操作:选择输出主体【人】,输出内容【分群】;选择关联主体【车】,输出内容【分群】,同时附带信息【标签】
举例:输出【人】关联的【车】关联关系,同时输出【人】的信息和【车】的标签
操作:选择输出主体【人】,输出内容【分群】,同时附带信息【标签】;选择关联主体【车】,输出内容【分群】,同时附带信息【标签】
备注:
1)A主体或B主体选择输出【分群】,则可支持输出全量ID或者指定分群的关联关系及附加信息
2)A主体或B主体选择输出【标签】或【主体属性】,则输出全量ID的关联关系及附加信息
模板管理支持创建并应用模板,方便业务人员快速通过模板完成数据输出任务配置。