全部產品
Search
文件中心

Elastic Container Instance:通過CloudMonitor及時擷取儲存空間不足的執行個體資訊

更新時間:Jul 06, 2024

本教程以監控ECI執行個體的臨時儲存空間的利用率為例,介紹如何設定CloudMonitor的警示規則,以便及時擷取臨時儲存空間不足的執行個體資訊,進而可以及時建立新的執行個體來替換,避免因儲存空間不足而導致資料無法寫入,影響業務運行。

背景資訊

CloudMonitor支援監控ECI執行個體的CPU利用率、記憶體利用率、儲存空間容量等指標。基於這些指標,您可以設定警示規則,以便及時感知ECI執行個體的運行情況,並對異常執行個體進行處理。更多關於CloudMonitor支援的ECI監控指標,請參見使用CloudMonitor對ECI執行個體進行監控

操作步驟

  1. 登入CloudMonitor控制台

  2. 在左側導覽列,選擇警示服務 > 警示規則

  3. 單擊建立警示規則

  4. 在彈出面板完成警示規則配置,然後單擊確認

    需要注意的參數如下,未提及的參數可保持預設配置。更多關於警示規則的配置說明,請參見建立警示規則

    參數

    說明

    產品

    選擇Elastic Container Instance

    資源範圍

    警示規則作用的資源範圍。本教程選擇執行個體

    • 全部資源:警示規則作用於指定雲產品的全部資源上,對於新加入的資源生效。

    • 應用分組:警示規則作用於指定雲產品的指定應用分組內的全部資源上,對於新加入的資源生效。

    • 執行個體:警示規則作用於指定雲產品的指定資源上。

    關聯資源

    當資源範圍選取執行個體時,可指定具體的ECI執行個體。

    單擊添加執行個體,在彈出的對話方塊中選擇要監控的ECI執行個體。

    規則描述

    單擊添加規則,選擇簡單指標,在彈出面板完成規則配置。

    本教程採用的規則樣本如下:

    • 規則名稱:test

    • 指標類型:簡單指標

    • 監控指標:volume/儲存卷空間利用率

    • 閾值及警示層級

      • 緊急:連續3個周期(1周期=1分鐘),平均值≥90

      • 警告:連續3個周期(1周期=1分鐘),平均值≥80

      • 普通:連續3個周期(1周期=1分鐘),平均值≥70

    • 維度:EphemeralVolume

    關於如何設定複雜的警示條件,請參見警示規則運算式說明

    警示連絡人群組

    CloudMonitor預設將您的阿里雲帳號添加為警示連絡人,並自動為其建立警示聯絡組。

    您也可以前往警示連絡人頁面建立新的警示連絡人和警示連絡人群組。更多資訊,請參見建立警示連絡人或警示連絡人群組

後續操作

建立警示規則後,如果規則中設定的監控指標達到了警示閾值,系統會自動給設定的連絡人發送通知。

您也可以在警示規則頁面找到目標規則,單擊警示歷史來查看警示情況。

收到警示通知後,請根據實際業務需求進行處理,例如:建立新的ECI執行個體並增加臨時儲存空間,以此來替換舊的儲存空間不足的ECI執行個體。

相關文檔

如果您通過Kubernetes叢集使用ECI,可以為ECI Pod添加k8s.aliyun.com/eci-eviction-enable: "true"的Annotation,實現在某一ECI Pod的臨時儲存空間不足(低於100 MiB)時,自動驅逐該Pod。具體操作,請參見設定自動驅逐臨時儲存空間不足的Pod