Alibaba Cloud Linux 3(核心版本5.10.60-9.al8.x86_64
開始)增加了核心統一異常架構UKFEF(Unified Kernel Fault Event Framework),用於統計可能導致風險的系統例外狀況事件,並以統一格式輸出附隨報告。本文主要介紹UKFEF所統計的事件、附隨報告輸出形式以及控制UKFEF的介面。
背景資訊
作業系統在出現嚴重問題前,可能會輸出一些特徵或提示資訊。在營運過程中,您可以利用這些資訊進行故障預測和實施營運操作,但由於這些資訊分散在系統中的不同模組,且輸出格式各異。因此,您在收集系統例外狀況事件時可能面臨以下問題:
解析系統例外狀況事件(例如例外狀況事件的含義、可能造成的影響等)需要一定的專業知識作為基礎。
不同格式的例外狀況事件,對於自動化營運不友好,您需要在資訊採集時做格式匹配,並需要做資料清洗。
基於以上問題,Alibaba Cloud Linux 3在作業系統核心層面提供了核心統一異常架構(UKFEF)。UKFEF針對各類可能導致風險的系統例外狀況事件進行統計,並自動判斷事件的嚴重程度,然後統一格式輸出附隨報告,報告包括了問題產生的情境以及建議的風險層級,從而簡化營運過程中對系統異常的識別難度。同時,UKFEF將已知例外狀況事件進行分級,並提供了歷史核心版本不具備的系統風險報告。
UKFEF功能按照例外狀況事件的類型、影響、統計等多個維度輸出報告,便於您在營運時高效地對系統異常進行診斷。此外,附隨報告通過多種形式輸出,避免資料丟失。
事件說明
UKFEF劃分的事件類型、事件層級,以及附隨報告形式的說明如下:
事件相關資訊 | 說明 |
事件類型 | UKFEF統一收集以下作業系統核心常見事件:
|
事件層級 | UKFEF將例外狀況事件分為三個層級:
|
附隨報告 | UKFEF將通過以下方式輸出附隨報告:
|
控制UKFEF的介面說明
介面 | 說明 |
| 該介面控制UKFEF的啟用與關閉。取值範圍:
|
| 該介面控制UKFEF是否輸出附隨報告。取值範圍:
|
| 該介面控制出現Fatal事件時,是否觸發作業系統的Panic機制。取值範圍:
|