全部產品
Search
文件中心

Hologres:一鍵匯入公用資料集

更新時間:Jun 30, 2024

HoloWeb支援使用可視化方式一鍵匯入公用資料集,方便您快速完成公用資料匯入並查詢。本文為您介紹如何使用HoloWeb建立一鍵匯入任務並查看任務狀態資訊。

背景資訊

HoloWeb支援一鍵匯入tpch_10gtpch_100ggithub_event三個公用資料集,會佔用10~100 GB儲存空間。其中:

  • tpch_10gtpch_100g公用資料集:類比零售情境的公開資料集,兩個資料集資料量分別為10 GB和100 GB,詳情請參見測試方案介紹

  • github_event公用資料集:GitHub官方公開事件數目據集,詳情請參見業務與資料認知

前提條件

  • Hologres執行個體版本為 V1.3.13及以上版本。

  • HoloWeb中已登入執行個體,詳情請參見登入執行個體

注意事項

  • 僅華北2(北京)、華東2(上海)、華東1(杭州)、華南1(深圳)、華北3(張家口)地區的Hologres執行個體支援一鍵匯入公用資料集功能。

  • 執行一鍵匯入公用資料集的使用者需要有建立Schema、建立表、寫入資料等許可權,授權操作請參見Hologres許可權模型概述

  • 公用資料集匯入任務執行時間長度預計3~20分鐘,具體受執行個體規格等因素影響。請您提前規劃計算資源,避免影響線上業務。

  • 公用資料集匯入任務會自動建立兩個Schema及若干外部表格和內部表,請檢查資料庫中已有的Schema、外部表格和內部表,避免名稱相同,以免資料誤刪。

建立公用資料集匯入任務

  1. 進入HoloWeb開發頁面,詳情請參見串連HoloWeb

  2. 在HoloWeb開發頁面的頂部功能表列,單擊資料方案

  3. 資料方案頁面,單擊左側導覽列的一鍵匯入公用資料集

  4. 一鍵匯入公用資料集頁面,單擊建立公用資料集匯入任務

  5. 建立公用資料集匯入任務頁面,選擇執行個體名資料庫公用資料集名後,單擊提交

    image.png

查看公用資料集匯入任務資訊

  1. 一鍵匯入公用資料集頁面,選擇執行個體名資料庫後,單擊查詢,查看公用資料集工作清單。

    image.png

    工作清單包含如下資訊和操作:

    • 資訊:序號執行個體名資料庫公用資料集名狀態執行進度(指已完成SQL數/總SQL數)、建立時間結束時間

    • 操作:詳情停止重新運行刪除執行歷史

  2. 任務狀態執行成功時,公用資料集匯入任務即完成,可以進一步進行資料分析。

刪除公用資料集

執行如下SQL,刪除公用資料集所在Shema以及所有依賴項(以tpch_100g資料集為例),請謹慎使用,以防資料誤刪。

DROP SCHEMA hologres_dataset_tpch_100g, hologres_foreign_dataset_tpch_100g CASCADE;