You need to enable JavaScript to run this app.
导航
本地小文件导入
最近更新时间:2024.07.05 11:56:06首次发布时间:2021.10.22 10:06:12

文件导入功能允许您通过手动上传文件更新替换数据。ByteHouse 控制台提供了操作向导来引导对应任务,便于快速完成文件导入任务。
当前支持通过文件上传导入的文件类型包括: .csv / .json / .xls / .avro / .parquet / .gz。

注意

在ByteHouse控制台上,通过本地上传的文件目前最大支持 200.00 MB。
大量数据的导入,可参考离线导入流式导入方式导入,或选购数据快车服务。

创建任务

  1. 进入到 数据加载 页面,点击 新建数据加载

图片

  1. 在新页面中填写任务名称,并选择 文件上传

图片

  1. 通过选择或拖拽本地文件进行上传,并选择数据源格式类型。

图片

说明

当前支持多种方法来定义文件类型,您也可以选择 基于文件解析来生成 Schema,一旦 Schema 成功生成,您也可以手动进行调整。
对于 CSV 或者 Excel 格式,如果文件数据不包含表头,表名将默认地以 _cX 格式命名。

  1. 选择一个已存在的数据库/数据表进行导入,或者点击右边的按钮新建一个新数据表/数据表。

图片

  1. ByteHouse 支持导入时自定义列,对于不需要的列可以选择不进行导入。所以,在新建表时,也可以根据解析情况手动选择需要的列。

图片

  1. 选择数据表后,可以根据需要调整 Schema 映射。

图片

  1. 选择导入加载类型后,点击创建按钮完成任务创建。

图片

查看并编辑文件导入任务

您可以在任务列表页中找到对应的文件导入任务,当任务类型为成功状态时,即可进行数据查询。
图片
如果您需要复用已有的配置导入一个新的文件,可以在文件导入任务详情页中创建一个执行作业。注意,再次导入文件时需要确保文件类型和 table schema 和原有配置相同。
图片
图片
如果需要编辑该文件导入任务的配置信息,可以在任务详情页右上角点击... >编辑按钮,并且更新列名,目标数据库表等配置项。
图片
如果要对已经导入的任务进行排查,可以点击某个执行作业的详情信息,并且查看导入状态和错误日志,便于对导入情况进行判断和优化。
图片