全部產品
Search
文件中心

ApsaraDB for ClickHouse:匯入資料

更新時間:Jun 30, 2024

本文以匯入On Time資料集至clickhouse_demo資料庫的分布式表ontime_local_distributed為例,介紹如何使用用戶端clickhouse-client工具匯入資料到雲資料庫ClickHouse

前提條件

  1. 已完成快速入門系列的如下步驟。

    1. 建立叢集

    2. 建立帳號

    3. 設定白名單

      說明

      您需要將clickhouse-client所在伺服器的IP地址添加到雲資料庫ClickHouse叢集的白名單中。

    4. 串連叢集

    5. 建立資料庫

    6. 建立表

  2. 已安裝與雲資料庫ClickHouse叢集版本對應的clickhouse-client工具。下載連結,請參見clickhouse-client

操作步驟

  1. 單擊On Time Data下載On Time資料集。

  2. 解壓下載的On Time資料集。

    unzip ontime-data(1).zip
  3. 串連雲資料庫ClickHouse叢集並匯入資料到雲資料庫ClickHouse

    在clickhouse-client用戶端的安裝目錄下執行如下命令。

    ./clickhouse-client --host=<host> --port=<port> --user=<user> --password=<password> --query="INSERT INTO <ClickHouse_table> FORMAT CSVWithNames" < ontime-data.csv

    參數說明如下。

    參數

    說明

    host

    外網地址或VPC地址,您可以在叢集資訊頁面查看。

    如果clickhouse-client所在伺服器與雲資料庫ClickHouse叢集在同一VPC內,您可以使用VPC地址。否則,請使用外網地址。

    port

    TCP連接埠號碼,您可以在叢集資訊頁面查看。

    user

    您通過雲資料庫ClickHouse控制台建立的資料庫帳號。

    password

    資料庫帳號對應的密碼。

    ClickHouse_table

    要匯入資料的雲資料庫ClickHouse表。

    樣本語句如下。

    ./clickhouse-client --host=cc-bp16qwvp7hy8i****.public.clickhouse.ads.aliyuncs.com --port=3306 --user=test --password=123456Aa --query="INSERT INTO clickhouse_demo.ontime_local_distributed FORMAT CSVWithNames" < ontime-data.csv
  4. 查詢資料,驗證資料是否匯入成功。

    SELECT OriginCityName, count(*) AS flights
    FROM ontime_local_distributed
    GROUP BY OriginCityName
    ORDER BY flights DESC
    LIMIT 10; 

    查詢結果如下。

       OriginCityName      │ flights  
     ──────────────────────│────────
       Chicago, IL         │  24114    
       Atlanta, GA         │  22001  
     Dallas/Fort Worth, TX │  17340   
       Los Angeles, CA     │  14494  
       Denver, CO          │  14170  
       New York, NY        │  14075   
       Washington, DC      │  11985  
       Houston, TX         │  11483    
       San Francisco, CA   │  11259  
       St. Louis, MO       │  10721