ApsaraDB for MongoDB提供執行個體狀態監控及警示功能。本文將介紹設定磁碟空間使用率、IOPS使用率、串連數使用率、CPU使用率等常用的監控專案。
背景資訊
隨著資料量及業務的發展,MongoDB執行個體的效能資源使用率可能會逐步提升,直至被消耗殆盡。
某些情境下MongoDB執行個體的效能資源可能被大量地異常消耗。如大量的慢查詢引起的CPU使用率上升,大量資料寫入導致磁碟空間被急劇消耗等情況。
重要當磁碟容量不足將導致執行個體被鎖定。
通過對執行個體的關鍵效能指標設定監控警示規則,讓您在第一時間得知指標資料發生異常,協助您迅速定位並處理故障。
操作步驟
登入MongoDB管理主控台。
在頁面左上方,選擇執行個體所在的資源群組和地區。
根據執行個體類型,在左側導覽列,單擊複本集執行個體列表或分區叢集執行個體列表。
單擊目標執行個體ID或目標執行個體所在行操作列的管理。
在目標執行個體頁面的左側導覽列,單擊警示規則。
單擊設定警示規則,跳轉至CloudMonitor控制台。
在CloudMonitor控制台的警示規則頁面,單擊頁面左上方的建立警示規則。
在建立警示規則面板,設定警示規則相關參數。
參數
說明
產品
CloudMonitor可管理的雲產品名稱。例如:
ApsaraDB for MongoDB-複本集
ApsaraDB for MongoDB-分區叢集
ApsaraDB for MongoDB-單節點執行個體
資源範圍
警示規則作用的資源範圍。取值:
全部資源:警示規則作用於指定雲產品的全部資源上,對於新加入的資源生效。
應用分組:警示規則作用於指定雲產品的指定應用分組內的全部資源上,對於新加入的資源生效。
執行個體:警示規則作用於指定雲產品的指定資源上。
規則描述
警示規則的主體。當監控資料滿足警示條件時,觸發警示規則。規則描述的設定方法如下:
單擊添加規則。
在添加規則描述面板,設定規則名稱、指標類型、監控指標、閾值和警示層級等警示規則。
單擊確定。
說明關於如何設定複雜的警示條件,請參見警示規則運算式說明。
通道沉默周期
警示發生後未恢複正常,間隔多久重複發送一次警示通知。取值:5分鐘、15分鐘、30分鐘、60分鐘、3小時、6小時、12小時和24小時。
某監控指標達到警示閾值時發送警示,如果監控指標在通道沉默周期內持續超過警示閾值,在通道沉默周期內不會重複發送警示通知;如果監控指標在通道沉默周期後仍未恢複正常,則CloudMonitor再次發送警示通知。
例如:當通道沉默周期選擇12小時時,如果警示未恢複正常,則間隔12小時後,CloudMonitor會再次發送警示通知。
生效時間
警示規則的生效時間,警示規則只在生效時間內才會檢查監控資料是否需要警示。
警示連絡人群組
發送警示的連絡人群組。
應用分組的警示通知會發送給該警示連絡人群組中的警示連絡人。警示連絡人群組是一組警示連絡人,可以包含一個或多個警示連絡人。
關於如何建立警示連絡人和警示連絡人群組,請參見建立警示連絡人或警示聯絡組。
標籤
警示規則的標籤。包括標籤名稱和標籤值。
關於進階設定的設定,請參見建立警示規則。
設定完成後,單擊確認。警示規則將自動生效。