全部產品
Search
文件中心

ApsaraDB for Redis:解讀執行個體診斷報告

更新時間:Jun 19, 2024

執行個體的診斷報告從效能水位、訪問傾斜情況、慢日誌等多方面評估執行個體的健康情況,協助您快速定位執行個體的異常情況。

前提條件

發起執行個體診斷

診斷報告組成

執行個體基本資料

展示執行個體的ID、規格、類型及地區資訊。

圖 1. 執行個體基本資料執行個體基本資料

健康情況概要

展示執行個體診斷的結果,並對健康狀態進行評分(滿分為100分)。如果未達滿分,您需要關注展示的診斷項和詳細資料。

圖 2. 健康情況概要健康情況概要

效能水位

展示執行個體關鍵效能指標的統計資訊及狀態,您需要特別關注狀態為危險的效能指標。

說明 當您的執行個體為叢集架構讀寫分離架構時,您需要關注效能指標是否發生傾斜及傾斜的資料節點,同時您還可以結合Top 5 節點中各效能指標的曲線圖,重點關注負載較高資料節點。
圖 3. 效能水位效能水位
效能指標危險閾值影響可能的原因及排查方法
CPU使用率60%CPU使用率持續升高將影響執行個體整體的輸送量和用戶端應用的響應速度,極端情況下甚至會導致應用不可用。

可能的原因:

  • 執行高複雜度的命令。
  • 存在熱點Key。
  • 頻繁建立串連。

排查方法,請參見排查Redis執行個體CPU使用率高的問題

記憶體使用量率80%記憶體使用量率持續升高可能導致Key頻繁被逐出、回應時間上升、QPS(每秒訪問次數)不穩定等問題,進而影響業務運行。可能的原因:
  • 記憶體被資料佔滿。
  • 大Key較多。

排查方法,請參見排查Redis執行個體記憶體使用量率高的問題

串連數使用率(資料節點)80%資料節點的串連數被打滿後將會導致連線逾時或失敗。
說明
  • 如果執行個體為叢集架構,且用戶端通過直連地址串連至Redis執行個體,此指標具備參考價值。
  • 如果執行個體為叢集或讀寫分離架構,且用戶端通過Proxy節點串連至Redis執行個體,此監控指標不具參考價值,您需要效能監控關注Proxy節點的串連數。具體操作,請參見查看效能監控

可能的原因:

  • 訪問量突增。
  • 空閑串連長時間未釋放。

排查方法,請參見分析Redis執行個體的即時會話

網路入口流量80%當網路的入口或出口超過該規格的最大頻寬時,應用服務的效能將會受到影響。

可能的原因:

  • 業務流量突增。
  • 頻繁讀寫大Key。

排查方法,請參見排查Redis執行個體流量使用率高的問題

網路出口流量80%

當您的執行個體為叢集架構讀寫分離架構時,系統還會綜合分析上述效能指標,來衡量執行個體整體訪問的均衡度並體現在診斷報告中。訪問傾斜的判斷標準、可能的原因及排查方法請參見下表。

說明 如果診斷報告中提示某個效能指標發生了訪問傾斜,您需要關注具體的傾斜節點。
訪問傾斜判斷標準可能的原因排查方法

同時滿足下述條件:

  • 執行個體的所有資料節點的效能指標峰值大於下述閾值:
    • CPU使用率:10%。
    • 記憶體使用量率:20%。
    • 網路入口和出口流量:5 MB/s。
    • 串連數使用率:5%。
  • 效能指標的均衡度計算結果大於1.3,計算公式為:max{各資料節點的效能指標平均值} ÷ 所有資料節點的效能指標平均值的中位元。

    例如執行個體包含4個資料節點,CPU使用率的平均值分別為10%、30%、50%、60%,則中位元為40%,計算結果為1.5(即60%÷40%)。由於該值大於1.3,系統判斷該執行個體的CPU使用率發生傾斜。

  • 某個資料節點存在較多的大Key。
  • 某個資料節點存在熱點Key。
  • 設定的Hash Tag不合理。
    說明 當某些Key的Hash Tag設定相同時,這些Key會被儲存在同一資料節點中。如果大量的Key設定相同的Hash Tags將會導致資料集中在某個節點。

TOP 10 節點慢請求

展示發生慢請求次數排名前十的資料節點,並展示對應的慢請求資訊,統計來源如下:

  • 系統審計日誌中儲存的資料節點慢日誌(僅保留4天)。
  • 資料節點本身記錄的慢日誌(僅儲存最近的1024條)。您可以通過redis-cli串連執行個體並執行SLOWLOG GET查看。
圖 4. 慢請求慢請求

您可以根據展示的慢請求具體命令分析是否存在不合理的命令,不同原因對應的解決方案如下。

原因解決方案

執行時間複雜度為O(N)或更高的高消耗命令引起,例如keys *命令。

評估並禁用高風險命令和高消耗命令,例如FLUSHALLKEYSHGETALL等。具體操作,請參見禁用高風險命令
讀寫到資料節點中的大Key引起。對大Key進行分析和評估,具體操作,請參見離線全量Key分析,然後從業務方向對大Key進行拆分。