全部產品
Search
文件中心

Elastic Container Instance:使用CloudMonitor對ECI執行個體進行監控

更新時間:Oct 22, 2024

CloudMonitor會自動擷取您當前阿里雲帳號下的雲產品資源,您可以在CloudMonitor控制台查看ECI執行個體的監控圖表,瞭解ECI執行個體健全狀態,也可以設定警示規則,以便及時得知異常監控資料,並進行處理。

監控指標說明

CloudMonitor(CloudMonitor)是一項針對阿里雲資源和互連網應用進行監控的服務。對於ECI執行個體,CloudMonitor支援以下監控指標:

類別

指標

說明

執行個體

instance_cpu_utilization

CPU利用率

instance_memory_utilization

記憶體利用率

GPU

gpu_memory_used

GPU顯存使用量

gpu_memory_utilization

GPU顯存利用率

gpu_utilization

GPU利用率

Volume

volume_space_total

儲存空間的總容量

volume_space_used

儲存空間的已使用容量

volume_space_utilization

儲存空間的利用率

volume_inode_total

Inode可用容量

volume_inode_used

Inode使用量

volume_inode_utilization

Inode利用率

重要
  • Volume類別的指標僅支援臨時儲存空間和掛載的雲端硬碟資料卷,不支援其他類型的資料卷。

  • Linux的Inode節點中記錄了檔案的類型、大小、許可權、所有者、檔案串連的數目、建立時間與更新時間等重要訊息,以及指向資料區塊的指標資訊。Inode利用率達到100%會造成無法繼續建立目錄或者檔案。

更多資訊,請參見ECI監控指標

查看監控資料

您可以在CloudMonitor控制台查看ECI執行個體的運行狀態和各個指標的監控資料。

  1. 登入CloudMonitor控制台

  2. 在左側導覽列,單擊雲資源監控 > 雲產品監控

  3. 雲產品監控頁面,選擇Elastic Container Instance

  4. 在頁面上方,選擇地區。

  5. 在執行個體列表中,單擊要查看監控資料的ECI執行個體。

  6. 選擇想要查看的監控指標類別。

    • 預設分組:CPU和記憶體指標。

    • GPU:GPU相關指標。

      僅指定GPU執行個體規格(例如gn7等規格類型系列)建立的ECI GPU執行個體,可以查看GPU的指標資料。

      選擇該類別後,可進一步選擇查看某一GPU的資料。

    • Volume:儲存相關指標。

      該類別指標僅支援臨時儲存空間和掛載的雲端硬碟資料卷,不支援其他類型的資料卷。

      擇該類別後,可進一步選擇查看臨時儲存空間(EphemeralVolume)或者某個資料卷的資料。

  7. 根據需要選擇或自訂設定時間段,查看監控資料。

    說明

    一次最多可查看連續30天的監控資料。

    預設分組

    CloudMonitor-預設-無頁簽.png

    GPU

    GPU指標.png

    Volume

    CloudMonitor-volume.png

後續操作

您可以針對ECI執行個體的一個或多個監控指標設定警示規則(例如CPU利用率高於80%),當監控資料符合警示規則時,CloudMonitor會自動發送警示通知,便於您及時瞭解資源運行狀態,處理異常情況。

教程樣本:通過CloudMonitor及時擷取儲存空間不足的執行個體資訊