全部產品
Search
文件中心

AnalyticDB:監控

更新時間:Aug 13, 2025

本文匯總了AnalyticDB for MySQL中監控的常見問題及解決方案。

說明

當常見問題情境中未明確產品系列時,表明該問題僅適用於AnalyticDB for MySQL數倉版

常見問題概覽

如何監控數倉版預留叢集的磁碟水位?

為防止磁碟使用率超過磁碟安全水位,需要配置監控警示,提前發出警示通知,讓您及時知曉磁碟水位並管理磁碟空間,保證業務正常運行。

說明

企業版、基礎版及湖倉版叢集無需配置磁碟監控警示。

  1. 登入雲原生資料倉儲AnalyticDB MySQL控制台,在左上方選擇叢集所在地區。在左側導覽列,單擊集群清單,然後單擊目的地組群ID。

  2. 在左側導覽列單擊監控警示

  3. 監控資訊頁面,單擊查詢和寫入頁簽,查看磁碟使用量。

    預留模式下,磁碟使用量以百分比形式顯示;彈性模式下顯示讀寫節點磁碟的絕對使用量。

    • 預留模式預留模式

      說明

      最大磁碟使用率是指叢集執行個體若干台機器中,磁碟使用量最多的一台,如果該值大於或者等於90%,磁碟將會被鎖定。您需要重點關注最大磁碟使用率的值。

    • 彈性模式image.png

      說明

      磁碟使用量是指單個讀寫節點的最大磁碟使用量,如果該值大於或等於8 TB,叢集將無法寫入資料。您需要重點關注磁碟使用量的值。

  4. 監控資訊頁面,單擊報警規則設置

  5. 警示規則列表頁面,單擊建立警示規則

  6. 建立警示規則頁面,按照頁面提示進行參數配置。

    參數

    說明

    資源範圍

    警示規則的作用範圍,取值說明:

    • 全部資源:表示該規則作用在使用者名稱下對應產品的全部執行個體上。例如:您設定了全部資源粒度的AnalyticDB for MySQL磁碟使用率大於或等於80%警示,則只要使用者名稱下有AnalyticDB for MySQL資源範圍選擇全部資源時,警示的資源最多1000個,超過1000個可能會導致達到閾值不警示的問題,建議您使用應用分組按業務劃分資源後再設定警示。

    • 應用分組:警示規則作用於指定雲產品的指定應用分組內的全部資源上。

    • 執行個體:表示該規則只作用於指定雲產品的指定執行個體上。例如您如果設定了執行個體粒度的磁碟使用率大於或等於80%警示,則當該執行個體磁碟使用率大於或者等於80%時,會發送警示通知。

    規則描述

    警示規則的主體。當監控資料滿足警示條件時,觸發警示規則。 規則描述的設定方法如下:

    1. 單擊添加規則

    2. 添加規則描述面板,設定規則名稱指標類型監控指標閾值及警示層級監控圖表預覽等。

    3. 單擊確定

    通道沉默周期

    警示發生後未恢複正常,間隔多久重複發送一次警示通知。取值:5分鐘、15分鐘、30分鐘、60分鐘、3小時、6小時、12小時和24小時。某監控指標達到警示閾值時發送警示,如果監控指標在通道沉默周期內持續超過警示閾值,在通道沉默周期內不會重複發送警示通知;如果監控指標在通道沉默周期後仍未恢複正常,則CloudMonitor再次發送警示通知。

    生效時間

    警示規則的生效時間,警示規則只在生效時間內才會檢查監控資料是否需要警示。

    重要

    磁碟水位警示每個警示連絡人一天最多被通知4次,超過4次將被靜默。

    警示連絡人群組

    發送警示的連絡人群組。

    應用分組的警示通知會發送給該警示連絡人群組中的警示連絡人。警示連絡人群組是一組警示連絡人,可以包含一個或多個警示連絡人。關於如何建立警示連絡人和警示連絡人群組,請參見建立警示連絡人或警示連絡人群組

    警示回調

    填寫公網可訪問的URL,CloudMonitor會將警示資訊通過POST請求推送到該地址,目前僅支援HTTP協議。關於如何設定警示回調,請參見使用閾值警示回調

    說明

    單擊進階設定,可設定該參數。

    Auto Scaling

    如果您開啟Auto Scaling開關,當警示發生時,會觸發相應的伸縮規則。您需要設定Auto Scaling的地區Auto Scaling組Auto Scaling規則

    說明

    單擊進階設定,可設定該參數。

    Log Service

    如果您開啟Log Service開關,當警示發生時,會將警示資訊寫入Log Service。您需要設定Log Service的地區ProjectLogstore

    關於如何建立Project和Logstore,請參見快速入門:使用Logtail採集ECS文本日誌並分析

    說明

    單擊進階設定,可設定該參數。

    輕量訊息佇列(原 MNS)— topic

    如果您開啟輕量訊息佇列(原 MNS)— topic開關,當警示發生時,會將警示資訊發送至Message Service的主題。您需要設定Message Service的地區和主題。

    關於如何建立主題,請參見建立主題

    無資料警示處理方法

    無監控資料時警示的處理方式。取值:

    • 不做任何處理(預設值)

    • 發送無資料警示

    • 視為恢複

    說明

    單擊進階設定,可設定該參數。

    標籤

    警示標籤會添加到警示內容中。標籤名稱和標籤值是一一對應的,可以設定多對標籤。

  7. 完成上述參數配置後,單擊確認即可。

如何查看熱資料和冷資料佔用了多少儲存空間?

登入雲原生資料倉儲AnalyticDB MySQL控制台,在監控資訊頁面查看熱數據使用量冷數據使用量

如何檢查表的大小等資訊?

登入雲原生資料倉儲AnalyticDB MySQL控制台,在叢集監控資訊頁的表資訊統計頁簽下查看錶大小等資訊。

監控資訊頁面看到熱數據使用量比總數據使用量還多,是什麼原因?

AnalyticDB for MySQL叢集中包含多個儲存節點,磁碟數據使用量是指單個讀寫節點的最大磁碟使用量,熱數據使用量是指所有讀寫節點的磁碟數據使用量之和。

預留模式跨規格變更配置為彈性模式後,監控介面看到CPU平均使用率增大,是什麼原因?

預留模式C32規格變更配置為彈性模式,單個節點會降低到8核,Build任務預設佔用3核,此時會導致CPU平均使用率增大。CPU平均使用率增大但未影響業務時,您無需關注;若已影響業務的正常運行,請進行升配操作或提交工單聯絡支援人員。關於Build任務的詳細資料,請參見BUILD

監控資訊頁面看到有較長的查詢響應耗時,但在診斷與最佳化頁面未找到相同耗時的SQL,是什麼原因?

監控資訊頁面的查詢回應時間和診斷與最佳化頁面的總耗時的計算方式不同。與診斷與最佳化頁面的總耗時相比,監控資訊頁面的查詢回應時間還包括結果集緩衝耗時。因此當查詢返回的結果集較大,產生結果集緩衝耗時後,監控資訊頁面顯示的查詢響應耗時比診斷與最佳化頁面的總耗時間長度。您可以通過SQL審計頁面查詢回應時間長的SQL。

SQL耗時的具體說明如下:

SQL在提交至AnalyticDB for MySQL後,首先會在隊列中排隊,查詢並發數較大時,會產生較長的排隊時間;查詢出隊列後,進入執行引擎,解析查詢語句,產生執行計畫,產生較長的執行計畫耗時;執行計畫產生後,子任務會在儲存節點和計算節點執行,會產生執行耗時;查詢結束後,如果返回結果資料量大,會在前端節點緩衝返回結果,產生結果集緩衝耗時。SQL耗時如下圖所示: