為了不錯失重要通知,建議您對重要的監控指標設定警示規則。當雲原生記憶體資料庫Tair效能指標(CPU、記憶體使用量率等)異常或執行個體觸發高可用切換時,CloudMonitor平台會向您發送警告資訊。
背景資訊
CloudMonitor(CloudMonitor)是針對阿里雲資源和互連網應用提供監控的服務,為您提供開箱即用的企業級開放型一站式監控解決方案。您可以建立警示規則、設定監控項,在監控項的警示規則被觸發時,CloudMonitor將通知警示聯絡組中的所有連絡人。
警示連絡人和聯絡組是CloudMonitor發送警示通知的基礎。您需要先建立警示連絡人和警示聯絡組,並將警示連絡人添加到警示聯絡組。具體操作,請參見建立警示連絡人或警示連絡人群組。
操作步驟
訪問Tair執行個體列表,在上方選擇地區,然後單擊目標執行個體ID。
在左側導覽列,單擊警示設定。
在警示設定頁面,查看當前執行個體的監控項。
您也可以單擊頁面右上方警示設定,進入CloudMonitor控制台,添加或管理警示規則。配置方法說明:
建立警示規則:當監控項超過設定閾值時(例如執行個體的CPU使用率大於90%),系統將自動發送警示通知,協助您及時瞭解監控資料異常並處理。
通常情況下,業務對Tair執行個體的CPU、記憶體和網路流量的波動比較敏感,建議為下述關鍵計量設定警示閾值:
CPU使用率:大於60%。
記憶體使用量率:大於80%。
流入頻寬使用率和流出頻寬使用率:大於80%。
CloudMonitor平台支援的監控指標請參見附錄1 雲產品監控指標。
訂閱事件通知:當Tair執行個體產生了主動營運事件(如執行個體遷移)、執行個體發生了故障或觸發了高可用切換,系統將自動發送警示通知,協助您及時接收警示通知並處理。包含InstanceMaintenance(主動營運事件)、執行個體異常、執行個體維護等。
常見問題
警示設定中的監控指標“阻塞用戶端串連數”是什麼意思?
建立警示規則中的監控指標Node/阻塞用戶端串連數是指Tair執行個體使用了阻塞式請求,例如BRPOP、BLPOP、BZPOPMIN、BZPOPMAX與XREAD等,並處於阻塞(等待)中的用戶端串連數。