全部產品
Search
文件中心

E-MapReduce:JindoTable表或分區訪問熱度收集

更新時間:Jul 01, 2024

您可以通過JindoTable表或分區的訪問熱度收集功能來區分冷熱資料,從而節約整體的儲存成本,提高緩衝利用效率。

前提條件

已建立叢集,詳情請參見建立叢集

背景資訊

JindoTable支援收集訪問Hive表的記錄,收集的資料儲存在SmartData服務的Namespace中。

SmartData 3.2.x版本開始支援Spark、Hive和Presto引擎,Spark和Presto的資料收集預設是開啟的,如果需要關閉,請參見關閉熱度收集。Hive的資料收集預設是關閉的,如果需要開啟,請參見開啟Hive熱度收集

資料查詢

JindoTable提供了命令方式查詢熱度資訊。
  • 文法
    jindo table -accessStat <-d [days]> <-n [topNums]>

    daystopNums為正整數。當只設定天數為1時,表示查詢從本地時間當天0:00開始到現在的所有訪問記錄。

  • 功能

    查詢在指定時間範圍內,訪問最多的N條表或分區的記錄。

  • 樣本:查詢近七天,訪問最多的20條表或分區的記錄。
    jindo table -accessStat -d 7 -n 20

JindoTable使用詳情,請參見JindoTable使用說明

開啟Hive熱度收集


  1. 在頂部功能表列處,根據實際情況選擇地區和資源群組
  2. 單擊上方的叢集管理頁簽。
  3. 叢集管理頁面,單擊相應叢集所在行的詳情
  4. 修改Hive的參數值。
    1. 在左側導覽列,選擇叢集服務 > Hive
    2. 在Hive服務頁面,單擊配置頁簽。
    3. 搜尋參數hive.exec.post.hooks,在參數值後追加com.aliyun.emr.table.hive.HivePostHook
  5. 儲存配置。
    1. 單擊右上方的儲存
    2. 確認修改對話方塊中,輸入執行原因,開啟自動更新配置
    3. 單擊確定
  6. 重啟服務。
    1. 在Hive服務頁面,選擇右上方的操作 > 重啟HiveServer2
    2. 執行叢集操作對話方塊,輸入執行原因
    3. 單擊確定
    4. 確認對話方塊中,單擊確定

關閉熱度收集


  1. 在頂部功能表列處,根據實際情況選擇地區和資源群組
  2. 單擊上方的叢集管理頁簽。
  3. 叢集管理頁面,單擊相應叢集所在行的詳情
  4. 修改參數值。
    • Hive服務:
      1. 在左側導覽列,選擇叢集服務 > Hive
      2. 在Hive服務頁面,單擊配置頁簽。
      3. 搜尋參數hive.exec.post.hooks,刪除參數值中的com.aliyun.emr.table.hive.HivePostHookhive-site
    • Spark服務:
      1. 在左側導覽列,選擇叢集服務 > Spark
      2. 在Spark服務頁面,單擊配置頁簽。
      3. 搜尋參數spark.sql.queryExecutionListeners,刪除參數值中的com.aliyun.emr.table.spark.SparkSQLQueryListenerspark_default
    • Presto服務:
      1. 在左側導覽列,選擇叢集服務 > Presto
      2. 在Presto服務頁面,單擊配置頁簽。
      3. 搜尋參數event-listener.name,刪除參數值中的內容。
  5. 儲存配置。
    1. 單擊右上方的儲存
    2. 確認修改對話方塊中,輸入執行原因,開啟自動更新配置
    3. 單擊確定
  6. 重啟服務。
    • Hive服務:
      1. 在Hive服務頁面,選擇右上方的操作 > 重啟HiveServer2
      2. 執行叢集操作對話方塊,輸入執行原因
      3. 單擊確定
      4. 確認對話方塊中,單擊確定
    • Spark服務:
      1. 在Spark服務頁面,選擇右上方的操作 > 重啟ThriftServer
      2. 執行叢集操作對話方塊,輸入執行原因
      3. 單擊確定
      4. 確認對話方塊中,單擊確定
    • Presto服務:
      1. 在Presto服務頁面,選擇右上方的操作 > 重啟All Components
      2. 執行叢集操作對話方塊,輸入執行原因
      3. 單擊確定
      4. 確認對話方塊中,單擊確定