全部產品
Search
文件中心

Elastic Compute Service:風險事件說明

更新時間:Jul 10, 2024

CloudLens for EBS監測到雲端硬碟存在效能資料達到規格上限或沒有及時建立快照備份資料等風險情況時,會上報風險事件,提醒您及時進行處理,以確保雲端硬碟的穩定運行和資料的安全性。本文介紹CloudLens for EBS支援上報的風險事件類型、詳細的事件說明以及針對不同事件的處理建議。

事件屬性說明

事件屬性

說明

EventName

事件名稱。

ResourceId

事件關聯的資源ID,即雲端硬碟ID。

ResourceType

事件關聯的資源類型,例如:雲端硬碟。

Description

事件的描述資訊。

EventType

事件類型:

  • Notification:使用觸發,上報事件後可以即刻自動回復

  • Alert:使用觸發,需要手動執行恢複操作

  • System Exception:底層觸發,影響使用者使用的嚴重事件

EventLevel

事件層級:

  • Critical:嚴重

  • Warn:警告

  • Info:通知

EventId

事件ID,每條事件唯一。

EventStatus

事件狀態:

  • 正在發生

  • 已恢複

StartTime

事件的開始時間。

EndTime

事件的結束時間。

RecommendAction

針對該事件推薦的操作:

  • ModifyDiskSpec:變更配置

  • CreateSnapshot:建立快照

  • ResizeDisk:擴容

  • AdjustProvision:調節預配置

  • ModifyInstanceSpec:執行個體變更配置

RecommendParam

在處理具體事件程序中的參數。例如處理成本最佳化事件時,推薦的預配置值。

說明

您可以通過控制台風險事件頁面或API介面DescribeEvents查詢具體事件的屬性。

事件處理建議

不同事件類型的處理建議說明如下表所示。

事件名稱

說明

觸發頻率

事件類型

事件層級

處理建議

判斷事件是否恢複

資料保護

如果長時間沒有給雲端硬碟建立快照,一旦遇到勒索病毒等,就無法將雲端硬碟資料恢複到最近的狀態,可能會有資料丟失的風險。

每天上午上報

Alert

Warn

建立一個雲端硬碟快照

恢複後,系統會在第二天上午針對該雲端硬碟推送一條已恢複狀態的新事件,歷史已推送的正在發生事件不會消失。

成本最佳化

  • 如果雲端硬碟設定預配置效能(例如1,000 IOPS)高於實際工作負載(例如800 IOPS),卻按照較高的效能等級付費,會造成成本浪費。

  • 如果雲端硬碟設定的預配置效能(例如1,000 IOPS)低於實際工作負載(例如1,200 IOPS),雲端硬碟將頻繁依賴突發效能來處理超出的I/O請求,會造成總成本增加。

您可以通過調節預配置值,以達到效能與成本之間的平衡。更多資訊,請參見ESSD AutoPL雲端硬碟

一周上報一次

Alert

Info

恢複後,後續不再對該雲端硬碟推送同類型的事件。

磁碟有I/O Hang發生

您的雲端硬碟存在I/O Hang,即磁碟內的檔案系統因讀寫I/O延遲過高導致系統不穩定或宕機。

即時上報

SystemException

Critical

建議您查看雲端硬碟的效能指標,協助您分析導致I/O Hang的原因。具體操作,請參見查看雲端硬碟監控資訊。Alibaba Cloud Linux作業系統檢測I/O Hang的操作,請參見檢測檔案系統和塊層的IO hang

恢複後,系統會對該雲端硬碟推送一條已恢複狀態的新事件,歷史已推送的正在發生事件不會消失。

執行個體與磁碟規格不匹配

您的磁碟規格總和超過執行個體規格上限,磁碟效能上限可能受到執行個體規格限制。

例如,某ECS執行個體最大IOPS為60,000,掛載了1塊IOPS最大為100,000的雲端硬碟,則該雲端硬碟效能會受執行個體規格的限制。

每天下午12點到15點之間上報

Alert

Warn

當磁碟效能總和達到執行個體規格上限時,可能會導致資料處理速度變慢、響應延遲增加等問題。

建議您根據業務需求變更配置執行個體規格。具體操作,請參見訂用帳戶執行個體升配規格更改隨用隨付執行個體規格

恢複後,後續不再對該雲端硬碟推送相同類型的事件。

執行個體IOPS達到上限

您執行個體中的磁碟IOPS(每秒輸入輸出操作次數)總和達到了執行個體IOPS上限。

例如,某ECS執行個體最大IOPS為60,000,掛載了2塊雲端硬碟(一塊IOPS為10,000、一塊IOPS為51,000),則執行個體中磁碟即時IOPS總和達到了執行個體IOPS上限。

5分鐘之內有觸發就上報事件

說明

5分鐘精度,延遲分鐘級。

Notification

Warn

事件觸發時上報一條已恢複狀態的事件,提醒您當前雲端硬碟存在這些問題,不涉及事件是否恢複。

執行個體BPS達到上限

您執行個體中的磁碟讀寫速度BPS(Bytes Per Second)總和達到執行個體BPS上限。

例如,某ECS執行個體最大BPS為150 MBps,掛載了2塊磁碟(一塊BPS為100 MBps、一塊BPS為60 MBps),則執行個體中磁碟即時BPS總和達到執行個體BPS上限。

Notification

Warn

磁碟IOPS達到執行個體上限

您的磁碟IOPS達到執行個體IOPS上限。

例如,某ECS執行個體最大IOPS為60,000, 掛載了N塊磁碟,其中一塊磁碟的IOPS為70,000,則磁碟的即時IOPS達到執行個體IOPS上限。

Notification

Warn

磁碟BPS達到執行個體上限

您的磁碟BPS達到執行個體BPS上限。

例如,某ECS執行個體最大BPS為150 MBps,掛載了N塊磁碟,其中一塊磁碟的BPS為160 MBps,則磁碟即時BPS達到執行個體BPS上限。

Notification

Warn

磁碟IOPS達到磁碟上限

您的磁碟IOPS達到磁碟IOPS上限。

例如,某ECS執行個體掛載的ESSD PL0雲端硬碟的IOPS達到15,000,該雲端硬碟的效能上限為10,000,則磁碟即時IOPS達到磁碟IOPS上限。

Notification

Warn

磁碟效能達到磁碟規格的上限時,可能會導致資料處理速度變慢、響應延遲增加等問題。各類雲端硬碟的效能指標,請參見Block Storage效能

磁碟BPS達到磁碟上限

您的磁碟BPS達到磁碟BPS上限。

例如,某ECS執行個體掛載的ESSD PL0雲端硬碟的BPS達到200 MBps,該雲端硬碟的效能上限為180 MBps,則磁碟即時BPS達到磁碟BPS上限。

Notification

Warn

非4K對齊讀寫

您的雲端硬碟I/O行為檢測到非4K對齊,可能影響您的雲端硬碟I/O效能。

說明

如果硬碟分區沒有按照4K對齊,寫入資料時可能會跨越兩個4K扇區的邊界,導致讀寫操作時需要兩次或更多次的I/O操作,會影響硬碟的效能。

每天下午12點到15點之間上報

Notification

Info

可參考I/O效能最佳化:通過4K對齊提高I/O效能處理

突發I/O

您的雲端硬碟發生了突發I/O,可能產生突發效能費用。

更多資訊,請參見ESSD AutoPL雲端硬碟

每隔1小時監測過去1小時內是否有突發I/O

Notification

Info

建議您確認突發I/O是否符合業務預期。