EAS在CloudMonitor上定義了兩種類型事件:服務事件(Service)和服務執行個體事件(ServiceInstance)。EAS事件控制器會即時推送EAS服務事件和服務執行個體事件到CloudMonitor。您可以通過CloudMonitor控制台或API介面查看事件,對事件進行營運、審計或警示設定。
查看EAS事件
通過控制台
您可以在CloudMonitor控制台查看EAS事件,具體操作步驟如下。
在左側導覽列,選擇。
在事件監控頁簽,產品選擇機器學習,單擊搜尋,查看EAS系統事件。

單擊目標事件操作列下的詳情,查看事件詳情。樣本如下:

通過API介面
您也可以通過API介面查看EAS事件,詳情請參見DescribeSystemEventAttribute。
建立並啟用事件警示規則
通過控制台
建立系統事件警示規則。其中關鍵參數配置如下。
產品類型:選擇機器學習。
事件類型:選擇ServiceInstance或Service。
事件等級:根據業務需要選擇單個或多個事件等級。
事件名稱:選擇需要監控的事件名稱,即附錄中的事件名稱(中文)列。支援選擇單個或多個事件名稱。
關鍵詞過濾:設定關鍵詞匹配事件資訊中content的內容過濾訂閱的事件。

通過API介面
您也可以通過API介面建立並啟用事件警示規則,具體操作,請參見建立事件警示規則和啟用事件警示規則。
常見問題
服務執行個體是指推理服務還是Pod執行個體?
事件類型為Service代表了服務等級的事件。事件類型為ServiceInstance代表格服務執行個體層級的事件,此處的服務執行個體就是指Pod執行個體。
附錄:支援查看的EAS事件
EAS定義了服務等級事件及服務執行個體層級事件如下。
事件類型 | 事件名 | 事件名稱(中文) | 事件層級 | 事件狀態 |
ServiceInstance | EAS:ServiceInstance:Running | 服務執行個體運行 | INFO | Running |
EAS:ServiceInstance:Pending | 服務執行個體等待調度 | INFO | Pending | |
EAS:ServiceInstance:Completed | 服務執行個體運行結束 | INFO | Completed | |
EAS:ServiceInstance:Terminating | 服務執行個體開始刪除 | INFO | Terminating | |
EAS:ServiceInstance:Terminated | 服務執行個體刪除成功 | INFO | Terminated | |
EAS:ServiceInstance:Unknown | 服務執行個體未知異常 | WARN | Unknown | |
EAS:ServiceInstance:Evicted | 服務執行個體驅逐 | WARN | Evicted | |
EAS:ServiceInstance:ErrImagePull | 服務執行個體拉取鏡像出錯 | WARN | ErrImagePull | |
EAS:ServiceInstance:ImagePullBackOff | 服務執行個體拉取鏡像失敗 | WARN | ImagePullBackOff | |
EAS:ServiceInstance:CrashLoopBackOff | 服務執行個體崩潰 | CRITICAL | CrashLoopBackOff | |
EAS:ServiceInstance:Error | 服務執行個體內部錯誤 | CRITICAL | Error | |
EAS:ServiceInstance:Failed | 服務執行個體運行失敗 | CRITICAL | Failed | |
EAS:ServiceInstance:SpotToBeReleased | 服務Spot執行個體即將被釋放 | WARN | SpotToBeReleased | |
Service | EAS:Service:ReplicasChanged | 服務執行個體數量改變 | INFO | ReplicasChanged |
EAS:Service:StatusChanged | 服務狀態改變 | INFO | StatusChanged | |
EAS:Service:Unavailable | 服務不可用 | CRITICAL | Unavailable | |
EAS:Service:UpdateFailed | 服務更新失敗 | CRITICAL | UpdateFailed |