注意事项 | |
---|---|
环境支持 | 本文档为SaaS-非云原生产品原始数据自定义导出的使用文档; 注意 SaaS-云原生版本暂不支持数据导出。 |
数据导出方式 | 通过本API导出数据时,为T+1离线的方式导出原始数据,如果需要实时数据可以查看数据输出。 |
功能开通 | 为了保证您和用户的数据安全,应用原始数据导出的接口权限默认是关闭的。 |
开通原始数据导出功能后,系统会每天自动执行任务,导出前一天数据并上传文件系统,您可以通过该开放接口获取和导出开通之日之后的原始数据。
根据数据时间(当天时间为T),接口分为:
Context-path: /datarangers
Path-parameters:
参数 | 类型 | 是否必选 | 示例值 | 描述 |
---|---|---|---|---|
app_id | int | 是 | 123456 | 应用的app_id |
begin_date | string | 是 | 2024-06-25 | yyyy-MM-dd,需要导出数据的开始日期 |
end_date | string | 是 | 2024-06-30 | yyyy-MM-dd,需要导出数据的结束日期。 |
Response:
{ "code": 200, "data": [{REULT_OBJECT}], "message": "success" }
API | 说明 |
---|---|
获取原始事件属性数据清单 | |
提交自定义数据导出任务 | |
获取自定义导出数据文件清单 |
使用 获取数据文件清单 或者 获取自定义导出数据文件清单 结果返回的urls,依次下载原始数据文件,可以并发下载,建议最多5个线程。
建议每日定时获取前一天的数据。
下载后的原始数据文件为csv.gz文件,可以直接导入hdfs,编码为utf-8。
文件字段字段如下:
字段 | 说明 | 数据类型 |
---|---|---|
app_name | 应用名称 | string |
event | 事件名称 | string |
params | 事件属性(客户端上报的params字段) | map<string, string> |
header_custom | 自定义的公共属性 | map<string, string> |
local_time_ms | 事件触发时间(客户端时间) | bigint |
server_time | 事件上报到服务器端的时间,unixtime格式 | int |
user_unique_id | 用户唯一id | string |
ssid | SSID | string |
bddid | 设备id | string |
udid | imei | string |
session_id | 会话id | string |
app_package | 应用包名 | string |
app_channel | 应用渠道 | string |
app_version | 应用版本 | string |
app_install_id | 安装id | string |
app_language | 语言 | string |
ab_version | ab测试版本 | string |
client_ip | ip地址,原device_id | string |
device_timezone | 时区 | int |
device_model | 设备型号 | string |
device_brand | 设备品牌 | string |
os_name | 操作系统 | string |
os_version | 操作系统版本 | string |
os_is_jailbroken | 设备是否越狱 | int |
network_type | 网络类型 | string |
network_carrier | 运营商 | string |
screen_resolution | 分辨率 | string |
screen_density | 像素密度 | string |
screen_density_dpi | 像素密度dpi | bigint |
push_os | 推送的os | string |
push_sdk | 推送的sdk列表 | string |
tea_event_index | 一个session中事件的发生顺序 | bigint |