您可以通過JindoTable表或分區的訪問熱度收集功能來區分冷熱資料,從而節約整體的儲存成本,提高緩衝利用效率。
資料收集
JindoTable支援收集訪問Hive表的記錄,目前支援的引擎有Spark和Hive。收集的資料儲存在叢集SmartData服務的Namespace中。
資料收集是預設開啟的。如果需要關閉,請參見關閉資料收集。
資料查詢
JindoTable提供了命令方式查詢熱度資訊。
- 文法
jindo table -accessStat <-d [days]> <-n [topNums]>days和topNums為正整數。當天數為1時,表示查詢從本地時間當天0:00開始到現在的所有訪問記錄。 - 功能
查詢在指定時間範圍內,訪問最多表或分區的指定條數。
- 樣本,查詢近七天訪問最多的表或分區的20條訪問記錄。
jindo table -accessStat -d 7 -n 20
JindoTable使用詳情,請參見JindoTable使用說明。
關閉資料收集
- 在頂部功能表列處,根據實際情況選擇地區和資源群組。
- 單擊上方的叢集管理頁簽。
- 在叢集管理頁面,單擊相應叢集所在行的詳情。
- 修改參數值。刪除如下參數值中的部分內容:
- Hive服務:
- 在左側導覽列單擊。
- 單擊配置頁簽。
- 單擊hive-site頁簽。
- 搜尋參數hive.exec.post.hooks,刪除參數值中的com.aliyun.emr.table.hive.HivePostHook。

- Spark服務:
- 在左側導覽列單擊。
- 單擊配置頁簽。
- 單擊spark-defaults頁簽。
- 搜尋參數spark.sql.queryExecutionListeners,刪除參數值中的com.aliyun.emr.table.spark.SparkSQLQueryListener。

- Hive服務:
- 儲存配置。
- 單擊右上方的儲存。
- 在確認修改對話方塊中,輸入執行原因,開啟自動更新配置。
- 單擊確定。
- 重啟服務。
- Hive服務:
- 單擊右上方的。
- 在執行叢集操作對話方塊,設定相關參數。
- 單擊確定。
- 在確認對話方塊中,單擊確定。
- Spark服務:
- 單擊右上方的。
- 在執行叢集操作對話方塊,設定相關參數。
- 單擊確定。
- 在確認對話方塊中,單擊確定。
- Hive服務: