HoloWeb支援使用可視化方式一鍵匯入公用資料集,方便您快速完成公用資料匯入並查詢。本文為您介紹如何使用HoloWeb建立一鍵匯入任務並查看任務狀態資訊。
背景資訊
HoloWeb支援一鍵匯入tpch_10g、tpch_100g、tpch_1t和github_event四個公用資料集。其中:
前提條件
-
Hologres執行個體版本為 V1.3.13及以上版本。
-
HoloWeb中已登入執行個體,詳情請參見登入執行個體。
注意事項
-
僅華北2(北京)、華東2(上海)、華東1(杭州)、華南1(深圳)、華北3(張家口)地區的Hologres執行個體支援一鍵匯入公用資料集功能。
-
執行一鍵匯入公用資料集的使用者需要有建立Schema、建立表、寫入資料等許可權,授權操作請參見Hologres許可權模型。
-
公用資料集匯入任務執行時間長度預計3~20分鐘,具體受執行個體規格等因素影響。請您提前規劃計算資源,避免影響線上業務。
-
公用資料集匯入任務會自動建立兩個Schema及若干外部表格和內部表,請檢查資料庫中已有的Schema、外部表格和內部表,避免名稱相同,以免資料誤刪。
建立公用資料集匯入任務
-
進入HoloWeb開發頁面,詳情請參見串連HoloWeb。
-
在HoloWeb開發頁面的頂部功能表列,單擊數據方案。
-
在數據方案頁面,單擊左側導覽列的一鍵導入公共數據集。
-
在一鍵導入公共數據集頁面,單擊新建公共數據集導入任務。
-
在新建公共數據集導入任務頁面,選擇實例名、資料庫和公共數據集名後,選擇是否使用Serverless Computing資源執行資料匯入,然後單擊提交。

查看公用資料集匯入任務資訊
-
在一鍵導入公共數據集頁面,選擇實例名、資料庫後,單擊查詢,查看公用資料集工作清單。

工作清單包含如下資訊和操作:
-
資訊:序號、實例名、資料庫、公共數據集名、狀態、執行進度(指已完成SQL數/總SQL數)、建立時間、結束時間。
-
操作:詳情、停止、重新運行、刪除、執行歷史、去查詢。
-
-
任務狀態為執行成功時,公用資料集匯入任務即完成,然後您可單擊目標任務操作列的去查詢,進一步進行資料分析。
刪除公用資料集
執行如下SQL,刪除公用資料集所在Schema以及所有依賴項(以tpch_100g資料集為例),請謹慎使用,以防資料誤刪。
DROP SCHEMA hologres_dataset_tpch_100g, hologres_foreign_dataset_tpch_100g CASCADE;