HoloWeb支援使用可視化方式一鍵匯入公用資料集,方便您快速完成公用資料匯入並查詢。本文為您介紹如何使用HoloWeb建立一鍵匯入任務並查看任務狀態資訊。
背景資訊
HoloWeb支援一鍵匯入tpch_10g
、tpch_100g
和github_event
三個公用資料集,會佔用10~100 GB儲存空間。其中:
前提條件
Hologres執行個體版本為 V1.3.13及以上版本。
HoloWeb中已登入執行個體,詳情請參見登入執行個體。
注意事項
僅華北2(北京)、華東2(上海)、華東1(杭州)、華南1(深圳)、華北3(張家口)地區的Hologres執行個體支援一鍵匯入公用資料集功能。
執行一鍵匯入公用資料集的使用者需要有建立Schema、建立表、寫入資料等許可權,授權操作請參見Hologres許可權模型概述。
公用資料集匯入任務執行時間長度預計3~20分鐘,具體受執行個體規格等因素影響。請您提前規劃計算資源,避免影響線上業務。
公用資料集匯入任務會自動建立兩個Schema及若干外部表格和內部表,請檢查資料庫中已有的Schema、外部表格和內部表,避免名稱相同,以免資料誤刪。
建立公用資料集匯入任務
進入HoloWeb開發頁面,詳情請參見串連HoloWeb。
在HoloWeb開發頁面的頂部功能表列,單擊資料方案。
在資料方案頁面,單擊左側導覽列的一鍵匯入公用資料集。
在一鍵匯入公用資料集頁面,單擊建立公用資料集匯入任務。
在建立公用資料集匯入任務頁面,選擇執行個體名、資料庫和公用資料集名後,單擊提交。
查看公用資料集匯入任務資訊
在一鍵匯入公用資料集頁面,選擇執行個體名、資料庫後,單擊查詢,查看公用資料集工作清單。
工作清單包含如下資訊和操作:
資訊:序號、執行個體名、資料庫、公用資料集名、狀態、執行進度(指已完成SQL數/總SQL數)、建立時間、結束時間。
操作:詳情、停止、重新運行、刪除、執行歷史。
任務狀態為執行成功時,公用資料集匯入任務即完成,可以進一步進行資料分析。
刪除公用資料集
執行如下SQL,刪除公用資料集所在Shema以及所有依賴項(以tpch_100g
資料集為例),請謹慎使用,以防資料誤刪。
DROP SCHEMA hologres_dataset_tpch_100g, hologres_foreign_dataset_tpch_100g CASCADE;