全部產品
Search
文件中心

Tair:排查流量使用率高的問題

更新時間:Jun 30, 2024

Tair執行個體作為更靠近應用服務的資料層,通常會執行較多的資料存取並消耗網路頻寬。不同的執行個體規格對應的最大頻寬有所不同,當超過該規格的最大頻寬時,將對應用服務的資料訪問效能造成影響。

步驟一:查詢流量使用率

查詢執行個體在指定時段的流量使用率。具體操作,請參見查看效能監控

本案例中,入流量和出流量的使用率快速上升並持續維持在100%,如下圖所示:

說明
  • 通常來說,流量的平均使用率持續保持在80%時需引起注意,可能流量不足。
  • 需關注的監控指標為Intranet In Ratio(入流量使用率)和Intranet Out Ratio(出流量使用率)。
圖 1. 流量使用率樣本流量使用率樣本

步驟二:最佳化流量使用率

  1. 調整執行個體的頻寬,降低對業務的影響並獲得較長的時間視窗來排查問題。具體操作,請參見手動增加執行個體頻寬
  2. 當業務的訪問量與預期頻寬消耗不匹配,例如流量使用率的增長趨勢和QPS的增長趨勢明顯不一致。您可以通過緩衝分析功能,發現執行個體中存在的大Key。具體操作,請參見離線全量Key分析
    對大Key(通常大於10 KB)進行最佳化,例如將大Key拆分、減少對大Key的訪問、刪除不必要的大Key等。
    圖 2. 大Key分析樣本大Key分析樣本
  3. 對於叢集架構的記憶體型執行個體,可開啟代理查詢快取功能(Proxy Query Cache)以應對因熱點Key引發的流量過大或傾斜的問題。更多資訊,請參見即時Top Key統計通過Proxy Query Cache最佳化熱點Key問題
  4. 可選:對於叢集架構的執行個體,可使用直連模式來應對業務上的網路超大流量。具體操作,請參見開通直連訪問
    說明 開啟直連後,執行個體的整體頻寬節流設定變為單個分區的最大頻寬*分區數,例如128分區的叢集執行個體,每個分區的最大頻寬為96 MB/s,開啟直連後整體頻寬為12,288 MB/s。
  5. 經過上述步驟最佳化後,流量使用率依舊較高,可評估升級至更大記憶體的規格,以承載更大的網路流量。具體操作,請參見變更執行個體配置
    說明 在正式升級執行個體的規格前,您可以先購買一個隨用隨付的執行個體,測試要升級到的目標規格是否能夠滿足業務的負載需求,測試完成後可將其釋放。關於如何釋放執行個體,請參見釋放隨用隨付執行個體