全部產品
Search
文件中心

Tair:警示設定

更新時間:Jun 30, 2024

為了不錯失重要通知,建議您對重要的監控指標設定警示規則。當雲原生記憶體資料庫Tair效能指標(CPU、記憶體使用量率等)異常或執行個體觸發高可用切換時,CloudMonitor平台會向您發送警告資訊。

背景資訊

CloudMonitor(CloudMonitor)是針對阿里雲資源和互連網應用提供監控的服務,為您提供開箱即用的企業級開放型一站式監控解決方案。您可以建立警示規則、設定監控項,在監控項的警示規則被觸發時,CloudMonitor將通知警示聯絡組中的所有連絡人。

說明

警示連絡人和聯絡組是CloudMonitor發送警示通知的基礎。您需要先建立警示連絡人和警示聯絡組,並將警示連絡人添加到警示聯絡組。具體操作,請參見建立警示連絡人或警示連絡人群組

操作步驟

  1. 訪問Tair執行個體列表,在上方選擇地區,然後單擊目標執行個體ID。

  2. 在左側導覽列,單擊警示設定

  3. 警示設定頁面,查看當前執行個體的監控項。

    您也可以單擊頁面右上方警示設定,進入CloudMonitor控制台,添加或管理警示規則。配置方法說明:

    • 建立警示規則:當監控項超過設定閾值時(例如執行個體的CPU使用率大於90%),系統將自動發送警示通知,協助您及時瞭解監控資料異常並處理。

      通常情況下,業務對Tair執行個體的CPU、記憶體和網路流量的波動比較敏感,建議為下述關鍵計量設定警示閾值:

      • CPU使用率:大於60%。

      • 記憶體使用量率:大於80%。

      • 流入頻寬使用率和流出頻寬使用率:大於80%。

      CloudMonitor平台支援的監控指標請參見附錄1 雲產品監控指標

    • 訂閱事件通知:當Tair執行個體產生了主動營運事件(如執行個體遷移)、執行個體發生了故障或觸發了高可用切換,系統將自動發送警示通知,協助您及時接收警示通知並處理。包含InstanceMaintenance(主動營運事件)、執行個體異常、執行個體維護等。

常見問題

警示設定中的監控指標“阻塞用戶端串連數”是什麼意思?

建立警示規則中的監控指標Node/阻塞用戶端串連數是指Tair執行個體使用了阻塞式請求,例如BRPOP、BLPOP、BZPOPMIN、BZPOPMAX與XREAD等,並處於阻塞(等待)中的用戶端串連數。