CloudMonitor會自動擷取您當前阿里雲帳號下的雲產品資源,您可以在CloudMonitor控制台查看ECI執行個體的監控圖表,瞭解ECI執行個體健全狀態,也可以設定警示規則,以便及時得知異常監控資料,並進行處理。
監控指標說明
CloudMonitor(CloudMonitor)是一項針對阿里雲資源和互連網應用進行監控的服務。對於ECI執行個體,CloudMonitor支援以下監控指標:
類別 | 指標 | 說明 |
執行個體 | instance_cpu_utilization | CPU利用率 |
instance_memory_utilization | 記憶體利用率 | |
GPU | gpu_memory_used | GPU顯存使用量 |
gpu_memory_utilization | GPU顯存利用率 | |
gpu_utilization | GPU利用率 | |
Volume | volume_space_total | 儲存空間的總容量 |
volume_space_used | 儲存空間的已使用容量 | |
volume_space_utilization | 儲存空間的利用率 | |
volume_inode_total | Inode可用容量 | |
volume_inode_used | Inode使用量 | |
volume_inode_utilization | Inode利用率 |
Volume類別的指標僅支援臨時儲存空間和掛載的雲端硬碟資料卷,不支援其他類型的資料卷。
Linux的Inode節點中記錄了檔案的類型、大小、許可權、所有者、檔案串連的數目、建立時間與更新時間等重要訊息,以及指向資料區塊的指標資訊。Inode利用率達到100%會造成無法繼續建立目錄或者檔案。
更多資訊,請參見ECI監控指標。
查看監控資料
您可以在CloudMonitor控制台查看ECI執行個體的運行狀態和各個指標的監控資料。
在頁面上方,選擇地區。
在執行個體列表中,單擊要查看監控資料的ECI執行個體。
選擇想要查看的監控指標類別。
預設分組:CPU和記憶體指標。
GPU:GPU相關指標。
僅指定GPU執行個體規格(例如gn7等規格類型系列)建立的ECI GPU執行個體,可以查看GPU的指標資料。
選擇該類別後,可進一步選擇查看某一GPU的資料。
Volume:儲存相關指標。
該類別指標僅支援臨時儲存空間和掛載的雲端硬碟資料卷,不支援其他類型的資料卷。
擇該類別後,可進一步選擇查看臨時儲存空間(EphemeralVolume)或者某個資料卷的資料。
根據需要選擇或自訂設定時間段,查看監控資料。
說明一次最多可查看連續30天的監控資料。
預設分組
GPU
Volume
後續操作
您可以針對ECI執行個體的一個或多個監控指標設定警示規則(例如CPU利用率高於80%),當監控資料符合警示規則時,CloudMonitor會自動發送警示通知,便於您及時瞭解資源運行狀態,處理異常情況。