全部產品
Search
文件中心

Realtime Compute for Apache Flink:查看運行異常日誌

更新時間:Sep 13, 2024

在作業啟動或者運行異常時,您可以查看運行異常日誌。本文為您介紹如何查看Job Manager異常、失效Task Managers日誌和慢Checkpoint對應的Task Managers日誌。

背景資訊

類型

詳情

Job Manager異常

如果作業出現Failover,導致作業運行失敗,則需要查看Job Manager異常。關於如何查看Job Manager異常的詳情,請參見查看Job Manager異常

說明

如果Job Manager都沒啟動起來,不屬於Job Manager異常,需要在開機記錄中去查看。

失效Task Managers日誌

運行狀態為正常的作業,不會有失敗TM。但是對於風險等級較高的,可能有失敗的TM,但TM又被拉起了,這時可以查看失敗的TM歸檔日誌去定位可能的原因。關於如何查看失敗的TM的日誌詳情,請參見查看失效Task Managers日誌

說明

只有開啟了日誌歸檔才能查看失效Task Managers日誌,並且只能查看日誌歸檔中配置的保留天數之內的失效Task Managers日誌。

慢Checkpoint對應的Task Managers日誌

作業運行過程中,如果有的Checkpoint運行耗時較長,您需要去查看其具體的原因,則可以去查看其關聯的TM的日誌。關於如何查看慢Checkpoint關聯的TM的日誌詳情,請參見定位慢Checkpoint並查看對應Task Managers的日誌

前提條件

工作執行個體為運行狀態。

注意事項

支援日誌分頁,每頁顯示1 MB,大概會顯示8000~9000行日誌,基本可以幫您排查錯誤。如果在第一頁還未定位到問題,請注意切換頁碼查看日誌。

查看Job Manager異常

  1. 登入Realtime Compute控制台

  2. 單擊目標工作空間操作列下的控制台

  3. 在左側導覽列上,單擊營運中心 > 作業營運後,單擊目標作業名稱。

  4. 作業日誌頁簽,選擇左側的異常資訊頁簽後,查看Job Manager異常資訊。

    查看運行異常日誌-1.jpg

    說明

    異常歷史中,您可以查看近7天內產生的異常資訊,並過濾異常類型後查看歷史異常。

查看失效Task Managers日誌

  1. 登入Realtime Compute控制台

  2. 單擊目標工作空間操作列下的控制台

  3. 在左側導覽列上,單擊營運中心 > 作業營運後,單擊目標作業名稱。

  4. 作業日誌頁簽,選擇作業記錄後,選擇正在啟動並執行工作執行個體。

    查看啟動和作業記錄2.jpg

  5. 單擊失效Task Managers頁簽。

定位慢Checkpoint並查看對應Task Managers的日誌

  1. 登入Realtime Compute控制台

  2. 單擊目標工作空間操作列下的控制台

  3. 在左側導覽列上,單擊營運中心 > 作業營運後,單擊目標作業名稱。

  4. 查看慢Checkpoint日誌資訊。

    1. 作業日誌頁簽,單擊Checkpoints頁簽,單擊Checkpoints歷史。

    2. 查看End to End Duration列值,確認慢Checkpoint對應的ID。

      查看運行異常日誌.jpg

    3. 單擊慢Checkpoint對應的ID左側的加號,確認慢Checkpoint對應的Operators節點。

    4. 單擊Operators節點左側的加號,展開查看每個Task的情況。

    5. 單擊慢Checkpoint對應的Task節點對應的ID

      查看運行異常日誌2.jpg

    6. 在跳轉的頁面運行Task Managers頁簽,查看慢Checkpoint日誌資訊。