全部產品
Search
文件中心

Tair:可觀測效能力

更新時間:Jun 30, 2024

相比原生Redis,雲原生記憶體資料庫Tair提供了維度更廣、種類更多及功能更強大的可觀測效能力(Observability)。

背景資訊

可觀測性是以系統的指標、日誌、鏈路追蹤三巨量資料支柱為基礎,衍生出如資料監控、問題分析、系統診斷等一系列的能力。
  • 指標(Metrics):記錄一段時間內各個維度量化資訊,用來觀察系統的某些狀態和趨勢。
  • 日誌(Logs):記錄程式運行過程中產生的一些離散事件。
  • 鏈路追蹤(Traces):記錄一次請求從接收到處理完成整個生命週期內的調用鏈路。
同時,雲原生記憶體資料庫Tair還基於三巨量資料支柱進行資訊彙總,提供資料分析能力,下表為雲原生記憶體資料庫Tair、KVStore for Redis與原生Redis的可觀測效能力對比。為便於瀏覽和內容表達,表格約定使用下述注釋:
  • ✔️表示支援。
  • ❌表示不支援。
  • ➖表示不涉及。
可觀測效能力原生RedisKVStore for Redis雲原生記憶體資料庫Tair
指標效能指標✔️✔️(更細化)✔️(更細化)
日誌作業記錄✔️✔️✔️
慢日誌✔️✔️✔️
審計日誌✔️✔️
時延洞察✔️✔️
鏈路追蹤
分析能力即時熱Key分析✔️✔️
即時Top Key統計✔️✔️
離線全量Key分析✔️✔️
執行個體診斷✔️✔️
說明 鏈路追蹤通常需要對用戶端進行改造或由中介軟體提供。

指標

原生Redis提供了豐富的統計指標,包含Memory(記憶體配置、記憶體使用量、記憶體片段率情況等), Stats(串連數、命令、網路、同步狀態等)、CPU使用方式、Keyspace資訊等。雲原生記憶體資料庫Tair結合使用者的使用體驗,在原生Redis的基礎上增加了更細化的指標,例如讀QPS、寫QPS等,更多資訊請參見查看效能指標

與此同時,雲原生記憶體資料庫Tair的指標可觀測效能力還具備如下優勢:

日誌

雲原生記憶體資料庫Tair提供了查詢作業記錄、慢日誌、審計日誌、時延洞察等功能。

  • 作業記錄(log)

    按行輸出Tair運行過程中的日誌資訊,記錄運行過程中持久化、同步複製、報錯資訊以及代碼中定義的調試記錄等。

    在控制台目標執行個體詳情頁的日誌管理 > 作業記錄頁簽中,查看該執行個體的作業記錄資訊,更多資訊請參見查詢作業記錄

  • 慢日誌(Slowlog)

    記錄Tair中執行時間(不含命令排隊與網路傳輸時間)超過指定閾值的請求,慢日誌資訊包含執行時間戳記、執行時間長度、命令參數、用戶端資訊等。您可以通過該功能第一時間查詢耗時過長的命令列表,並進行相應最佳化,避免線上服務發生阻塞。

    在控制台目標執行個體詳情頁的日誌管理 > 慢日誌頁簽中,查看該執行個體的慢日誌資訊,更多資訊請參見查詢慢日誌

  • 審計日誌(Audit log)

    雲原生記憶體資料庫Tair基於Log ServiceSLS(Log Service),提供審計日誌功能,每條審計日誌包含日誌類型、執行時間長度、DB序號、用戶端IP、賬戶名、命令詳細資料以及擴充資訊等。基於該功能,為您提供線上查詢、分析動作記錄(包含敏感操作FLUSHALLFLUSHDBDEL等)、慢日誌及作業記錄等,並且支援匯出。

    在控制台目標執行個體詳情頁的日誌管理 > 审计日志頁簽中,查看該執行個體的審計日誌資訊,更多資訊請參見審計日誌

  • 時延洞察(Latency metric)

    時延洞察是雲原生記憶體資料庫Tair提供的升級版時延統計功能,支援記錄多達27個事件及所有Tair命令的執行耗時,並支援儲存最近3天內所有的時延統計資料。

    在控制台目標執行個體詳情頁的CloudDBA > 時延洞察頁簽中,查看該執行個體的時延資訊,更多資訊請參見時延洞察

分析能力

分析能力是基於指標、日誌、鏈路追蹤三大基礎資料進行的資訊彙總,是雲原生記憶體資料庫Tair重要的服務能力。

  • 熱Key與大Key分析

    當某個Key接收的訪問次數顯著高於其它Key時,可以將其稱為熱Key(Hotkeys),若未能及時處理熱Key可能會導致訪問傾斜甚至緩衝擊穿等問題;當某個Key含有較多資料成員或者佔用較大記憶體時,可以將其稱為大Key(Big keys),若未能及時處理大Key會導致執行命令的耗時增加,嚴重時甚至引發記憶體溢出(Out Of Memory)。

    您可以通過即時Top Key統計功能,協助定位熱Key與大Key,即時Top Key統計功能支援即時展示執行個體中的熱Key和大Key資訊,同時支援查看4天內大Key和熱Key的歷史資訊。即時Top Key統計功能準確性高,且對效能幾乎無影響,協助您掌握Key在記憶體中的佔用、Key的訪問頻次等資訊,溯源分析問題,為您的最佳化操作提供資料支援。

    在控制台目標執行個體詳情頁的CloudDBA > 即時Top Key統計頁簽中,進行熱Key與大Key分析,更多資訊請參見即時Top Key統計

  • 離線全量Key分析

    離線全量Key分析功能支援全資料結構、全執行個體架構及Tair各個版本的離線RDB備份檔案解析,對線上服務無影響。相比開源工具redis-rdb-tool的解析速度,離線全量Key分析在大小Key混合(佔比1:9)的情境下實現4倍速度提升,在中大Key情境下實現20倍速度提升,同時保證進程記憶體佔用固定維持在1 GB以內,避免大Key解析可能帶來記憶體溢出的問題。離線全量Key分析還提供了最長子項目查詢,方便進一步業務排查。

    在控制台目標執行個體詳情頁的CloudDBA > 離線全量Key分析頁簽中進行分析,更多資訊請參見離線全量Key分析

  • 執行個體診斷

    雲原生記憶體資料庫Tair綜合了效能指標、慢日誌、key分析等能力,提供了一站式全鏈路的執行個體診斷功能,從效能水位、訪問傾斜情況、慢日誌等多方面評估執行個體的健康情況,並給出改善建議,極大程度地提高了Tair執行個體的自動化營運能力,降低使用成本。

    在控制台目標執行個體詳情頁的CloudDBA > 診斷報告頁簽中,進行執行個體診斷,更多資訊請參見執行個體診斷