本文以匯入On Time資料集至clickhouse_demo資料庫的分布式表ontime_local_distributed為例,介紹如何使用用戶端clickhouse-client工具匯入資料到雲資料庫ClickHouse。
前提條件
操作步驟
單擊On Time Data下載On Time資料集。
解壓下載的On Time資料集。
unzip ontime-data(1).zip
串連雲資料庫ClickHouse叢集並匯入資料到雲資料庫ClickHouse。
在clickhouse-client用戶端的安裝目錄下執行如下命令。
./clickhouse-client --host=<host> --port=<port> --user=<user> --password=<password> --query="INSERT INTO <ClickHouse_table> FORMAT CSVWithNames" < ontime-data.csv
參數說明如下。
參數
說明
host
外網地址或VPC地址,您可以在叢集資訊頁面查看。
如果clickhouse-client所在伺服器與雲資料庫ClickHouse叢集在同一VPC內,您可以使用VPC地址。否則,請使用外網地址。
port
TCP連接埠號碼,您可以在叢集資訊頁面查看。
user
您通過雲資料庫ClickHouse控制台建立的資料庫帳號。
password
資料庫帳號對應的密碼。
ClickHouse_table
要匯入資料的雲資料庫ClickHouse表。
樣本語句如下。
./clickhouse-client --host=cc-bp16qwvp7hy8i****.public.clickhouse.ads.aliyuncs.com --port=3306 --user=test --password=123456Aa --query="INSERT INTO clickhouse_demo.ontime_local_distributed FORMAT CSVWithNames" < ontime-data.csv
查詢資料,驗證資料是否匯入成功。
SELECT OriginCityName, count(*) AS flights FROM ontime_local_distributed GROUP BY OriginCityName ORDER BY flights DESC LIMIT 10;
查詢結果如下。
OriginCityName │ flights ──────────────────────│──────── Chicago, IL │ 24114 Atlanta, GA │ 22001 Dallas/Fort Worth, TX │ 17340 Los Angeles, CA │ 14494 Denver, CO │ 14170 New York, NY │ 14075 Washington, DC │ 11985 Houston, TX │ 11483 San Francisco, CA │ 11259 St. Louis, MO │ 10721