You need to enable JavaScript to run this app.
导航
快速开始
最近更新时间:2025.03.05 16:07:08首次发布时间:2021.10.22 10:06:12
我的收藏
有用
有用
无用
无用

本文将带您了解 ByteHouse(云数仓版)的开通方式和基本使用,包括基本的数据分析流程如数据库/表创建、数据加载及 SQL 查询操作等。此外,本文也将介绍 ByteHouse(云数仓版)的主要功能与模块。

开通ByteHouse 云数仓版
  1. 请访问 火山引擎官网 登录或注册火山引擎账号。

    注意

    开通 ByteHouse(云数仓版)需要完成个人实名认证

  2. 验证手机号并完成实名认证后,您可以使用已实名的账号登录火山引擎官网,进入ByteHouse产品首页
  3. 在ByteHouse产品首页单击购买云数仓版
    Image
  4. 根据界面提示授权ByteHouse跨服务访问私有化网络、云监控等产品。
    Image
  5. 在开通页面,配置开通ByteHouse的地域,并配置计算、存储、网络资源后,勾选产品服务专用条款,提交购买开通。
    Image
    • 计算资源:选择ByteHouse的计算资源类型和规格。当前支持按量计费和包年包月两种付费方式,不同规格的计算资源价格以界面为准。更多关于计算组的介绍请参见计算组
    • 存储资源:查看并了解当前ByteHouse存储空间的收费单价,您不需要提前购买存储资源,后续支付所使用的存储空间和存储的压缩数据量即可。
    • 网络资源:在下拉框中选择ByteHouse绑定的VPC网络、子网和安全组。
      如果没有可用的VPC网络,可单前往先创建好VPC和子网、安全组,操作详情请参见创建VPC帮助文档
  6. 等待约 1 分钟左右即可开通ByteHouse 云数仓服务。

设置默认计算组

在使用ByteHouse前,您需要先为ByteHouse的各类任务设置默认计算组,后续执行任务时如果没有指定计算组,则使用配置的默认计算组资源。
租户管理>参数设置页面,设置默认计算组。
Image

创建数据对象

加载数据之前,首先需创建数据库和数据表。

创建数据库

  • 在数据库页签下,单击新建数据库按钮,在弹窗中创建名为 bh_demo 的数据库:
    Image
  • 您也可以使用 SQL 工作表中的 CREATE DATABASE 命令来创建数据库,SQL 语句如下所示:
    create database bh_demo;
    

创建数据表

  1. 在数据库 bh_demo 的详情页中,单击右上角【+数据表】按钮,选择 可视化页面创建。
    Image

  2. 在弹出的页面中输入基本信息表名称,如employment
    Image

  3. 参考下图输入列名,并选择数据类型。
    Image

  4. 表配置选择排序键。
    Image

  5. 此时点击 SQL 页签,可以看到创建数据表employment对应的 SQL 语句。

    CREATE TABLE `bh_demo`.`employment`
    (
       `first_name` Nullable(String),
       `last_name` String,
       `email` String,
       `address` String,
       `city` String,
       `start_date` String
    )
    ENGINE = CnchMergeTree
    ORDER BY (city);
    

    Image

  6. 创建完成后,根据数据库详情页的指引,单击【开始导入数据】进入数据导入环节。
    Image

数据导入
  1. 下载样例数据文件 employees.csv
    employees.csv
    未知大小
  2. 根据建表完成的指引,进入新建数据导入任务页面。
  3. 为导入任务取名(如dataloading),并选择【文件上传】并上传上一步下载到本地的文件。
    Image
  4. 将数据源中的“内含表头”选项选择“有表头”。
    Image
  5. “选择目标表”中选择刚刚创建的数据库和数据表。
    Image
  6. 可以看到,ByteHouse 根据源数据的格式自动进行了 table schema 解析,并和目标数据表做了匹配,校验正确性后,单击右下角的【创建】即可完成创建。
    Image
  7. 任务创建完成后,在任务窗口中点击“开启“和”确定“来启动导入作业,约 3~5s 完成导入。
    Image
    Image

    说明

    除文件上传外,ByteHouse 也提供多种数据源导入数据,详情参考数据导入简介

数据查询
  1. 进入 SQL 工作表 页签,默认情况下会自动产生一个新建工作表。
    Image
  2. 在查询 SQL 编辑区中执行以下 SQL 语句。
    • 查询数据条数

      select count(*) from bh_demo.employment;
      

      Image

    • 插入更多测试数据

      insert into bh_demo.employment values
      ('Clementine','Adamou','cadamou@bytedance.com','10510 Sachs Road','Klenak','2017-9-22'),
      ('Marlowe','De Anesy','madamouc@bytedance.co.uk','36768 Northfield Plaza','Fangshan','2017-1-26');
      
    • 根据电子邮件地址查询数据

      select email from bh_demo.employment where email like '%.uk'; 
      

      Image

  3. 最后,可以切换到审计日志页签中查看历史记录,并对查询进行分析,如下所示:
    Image

进一步使用

以上就是 ByteHouse 快速入门指南,更多文章和最佳实践参考如下: