阿里雲Logstash支援對執行個體進行監控,並支援設定自訂警示規則以及通知方式。為避免出現叢集狀態異常、節點磁碟使用率過高等問題而影響Logstash服務,建議您進行監控警示配置,即時監控叢集狀態、節點磁碟使用率等資訊,及時查收警示簡訊,提前做好防禦措施。本文介紹如何為Logstash執行個體配置自訂警示策略。
操作步驟
- 進入CloudMonitor控制台。
- 登入Elasticsearch控制台。
- 在頂部功能表列處,選擇地區。
- 在左側導覽列,單擊Logstash執行個體,然後在Logstash執行個體中單擊目標執行個體ID。
- 在左側導覽列,單擊叢集監控。
- 在監控警示配置地區,單擊前往CloudMonitor。
- 關閉建立警示規則面板,在左側導覽列,選擇 。
- 單擊建立警示規則,在建立警示規則面板,設定警示規則。本文的樣本參數配置如下,未提及的參數保持預設,詳細參數說明請參見建立警示規則。
參數 說明 產品 選擇阿里雲LogstashService。 資源範圍 選擇執行個體。 關聯資源 選擇待監控的執行個體。 規則描述 單擊添加規則,在添加規則描述面板,填寫規則名稱,並按照以下說明進行配置: - 指標類型:選擇多指標。
- 警示層級:選擇警告(Warn)。
- 指標類型:選擇標準建立。
- 多指標警示描述:
- 選擇Logstash執行個體節點CPU使用率的最大值>=85%
- 選擇Logstash執行個體節點磁碟使用率的最大值>=85%
- 選擇節點記憶體使用量量的最大值>=85%
- 選擇節點1分鐘負載的最大值>=5
- 多指標關係:選擇有一個滿足就警示。
- 發出警示需要滿足達到閾值的次數:選擇連續3個周期。
警示連絡人群組 選擇您已建立的警示連絡人群組。關於如何建立警示連絡人群組,請參見建立警示連絡人或警示連絡人群組。 您還可以開啟進階設定,在警示回調中填寫可通過公網訪問的URL,CloudMonitor會將警示資訊通過POST請求推送到該地址。目前僅支援HTTP協議,詳細資料請參見使用閾值警示回調。
在配置阿里雲Logstash的警示規則時,您可以參考以下監控指標說明選擇指標警示描述。說明 目前阿里雲Logstash只支援在CloudMonitor中配置以下四種監控項。如果您在配置項中觀察到其他項,請忽略。監控項 說明 Logstash執行個體節點磁碟使用率 必選。警示閾值控制在75%以下。 節點記憶體使用量量 必選。警示閾值控制在85%以下。 Logstash執行個體節點CPU使用率 可選。警示閾值控制在95%以下。 節點1分鐘負載 可選。以CPU核心數的80%為參考值。 - 單擊確定。
- 查看Logstash監控大屏。配置完成後,Logstash執行個體的監控資訊將在執行個體正常運行後開始採集。當指標值超過您設定的警示閾值時,系統會為您發送警示通知。您可以通過以下方式查看Logstash監控大屏:
- 在CloudMonitor首頁的左側導覽列,單擊Dashboard再單擊雲產品監控大盤頁簽。
- 選擇阿里雲LogstashService產品,並選擇地區。
- 選擇執行個體和監控時間段,即可查看該段時間內的監控大屏。