全部產品
Search
文件中心

Application Real-Time Monitoring Service:通過調用鏈路和日誌分析定位業務異常問題

更新時間:Jul 06, 2024

定位業務異常問題難度大、效率低,為瞭解決這一難題,ARMS應用監控通過結合調用鏈路和日誌分析,可以快速、準確地定位業務異常問題,提升微服務架構下的診斷效率。

前提條件

背景資訊

在使用調用鏈路和日誌分析定位業務異常問題前,需要先瞭解Metrics、Tracing和Logging三個概念。

  • Metrics:應用的關鍵效能指標,如應用提供服務要求量、應用提供服務平均回應時間、應用依賴服務要求量等。

  • Tracing:調用鏈路,應用的任何介面調用、請求響應等動作都會綁定到完整的鏈路。

  • Logging:業務日誌,應用的任何介面調用、請求響應等動作都會輸出完整的業務日誌。

當應用出現業務異常問題時,應用指標統計圖會出現明顯波動,您可據此粗略地分析異常問題;通過完整的調用鏈路和業務日誌分析,可以精準定位業務異常問題。

關聯業務日誌與TraceId

  1. 登入ARMS控制台,在左側導覽列選擇應用監控 > 應用列表

  2. 應用列表頁面頂部選擇目標地區,然後單擊目標應用程式名稱。

    說明

    語言列的表徵圖含義如下:

    Java表徵圖:接入應用監控的Java應用。

    image:接入應用監控的Golang應用。

    -:接入Managed Service for OpenTelemetry的應用。

  3. 在左側導覽列中單擊應用設定,並在右側單擊自訂配置頁簽。

  4. 自訂配置頁簽的應用日誌關聯配置地區,選擇日誌源為Log Service,開啟關聯業務日誌與TraceId開關,選擇Log Service所在地區,然後綁定Project和Logstore。

    Link Business Logs with TraceId

  5. 自訂配置頁簽左下角單擊儲存

從應用指標的角度排查業務異常問題

  1. 登入ARMS控制台,在左側導覽列選擇應用監控 > 應用列表

  2. 應用列表頁面頂部選擇目標地區,然後單擊目標應用程式名稱。

    說明

    語言列的表徵圖含義如下:

    Java表徵圖:接入應用監控的Java應用。

    image:接入應用監控的Golang應用。

    -:接入Managed Service for OpenTelemetry的應用。

  3. 在左側導覽列單擊應用總覽,在頂部選擇概覽分析,然後在右上方選擇或自訂設定目標時間段。

    概覽分析頁面展示目標應用的關鍵計量,如應用提供服務要求量應用提供服務平均回應時間應用依賴服務要求量等。

  4. 概覽分析頁面選擇某個應用指標,在該指標的曲線圖上拖動滑鼠選取目標時間段。

    本樣本以應用提供服務平均回應時間指標為例。Application Service Average Response Time

  5. 查看步驟4所選時間段的調用鏈路。

    1. 單擊查看所選時間段的調用鏈路

    2. 在調用鏈路列表面板選擇狀態異常(顯示報錯)的調用鏈路記錄,單擊該調用鏈路記錄TraceId列下的TraceId值。

      您也可以在該調用鏈路記錄操作列下單擊查看日誌,查看該時間點的業務日誌,分析業務異常原因。EXception-Traceid

    3. 單擊調用鏈路頁簽,然後在詳情列下單擊放大表徵圖表徵圖。

    4. 單擊方法棧,在鏈路詳情資訊頁面尋找錯誤資訊,滑鼠移至上方在錯誤資訊上可查看異常原因。

      Exception

  6. 查看步驟4所選時間段的業務日誌。

    1. 單擊查看所選時間段的日誌

    2. 日誌分析頁面選擇異常錯誤資訊,查看日誌並定位業務異常原因。

      Log Analysis

從介面調用的角度排查業務異常問題

  1. 登入ARMS控制台,在左側導覽列選擇應用監控 > 應用列表

  2. 應用列表頁面頂部選擇目標地區,然後單擊目標應用程式名稱。

    說明

    語言列的表徵圖含義如下:

    Java表徵圖:接入應用監控的Java應用。

    image:接入應用監控的Golang應用。

    -:接入Managed Service for OpenTelemetry的應用。

  3. 在左側導覽列單擊介面調用

  4. 介面調用頁面的介面列表地區單擊目標介面,然後單擊調用鏈查詢頁簽。

  5. 調用鏈查詢頁簽選擇狀態異常(顯示報錯)的介面調用記錄。

    Interface Snapshot-Exception

  6. 查看介面調用的調用鏈路。

    1. 在目標介面調用記錄的TraceId列下單擊TraceId的值。

    2. 單擊調用鏈路頁簽,然後在詳情列下單擊放大表徵圖表徵圖。

    3. 單擊方法棧,在鏈路詳情資訊頁面尋找錯誤資訊,滑鼠移至上方在錯誤資訊上可查看異常原因。

      Exception

  7. 查看介面調用的日誌。

    1. 在目標介面調用記錄的操作列下單擊查看日誌

    2. 日誌分析頁面選擇異常錯誤資訊,查看日誌並定位業務異常原因。

      Log Analysis

相關文檔

您可以通過建立警示對相關指標進行異常檢測。具體操作,請參見應用監控警示規則