全部產品
Search
文件中心

Tair:災備方案

更新時間:Jun 30, 2024

雲原生記憶體資料庫Tair作為高效能的記憶體資料庫,在業務情境中往往承載著大量的重要資料,為保障資料安全性,Tair提供了多種災備方案供您選擇。

Tair容災架構演化

Tair執行個體因不可預料的原因(例如裝置故障、機房斷電等)發生故障,容災機制可用於保障資料的一致性和業務可用性。Tair提供多種災備方案供您選擇,可滿足不同的業務情境。

圖 1. Tair容災架構演化Redis容災架構演化
災備方案災備層級說明
單可用性區域高可用方案★★★☆☆主備節點部署在同一可用性區域中的不同機器上,當任一節點發生故障時,由高可用HA(High Availability)系統自動執行故障切換,避免單點故障引起的服務中斷。
同城容災方案★★★★☆主備節點分別部署在同一地區下兩個不同的可用性區域,當任一可用性區域因電源、網路等不可抗因素失去通訊時,高可用HA系統將執行故障切換,確保整個執行個體的持續可用。
跨地區容災方案★★★★★由多個子執行個體構成全球分布式執行個體,所有子執行個體通過同步通道保持即時資料同步,由通道管理器負責子執行個體的健康狀態監測、主備切換等等例外狀況事件的處理,適用於異地災備、異地多活、應用就近訪問、分攤負載等情境。

單可用性區域高可用方案

Tair全架構均支援單機房高可用架構。由高可用HA(High Availability)系統監控主備節點的健康狀態並自動執行故障切換,避免單點故障引起的服務中斷。

部署架構說明
標準架構
圖 2. 標準版-雙副本高可用架構

標準架構(雙副本)執行個體採用雙機主從(Master-Replica)架構,高可用HA模組偵測到主節點故障時,會自動進行主從切換,將Replica提升為Master,而原來的Master恢複串連後會成為新的Replica。

叢集架構
圖 3. 叢集版-雙副本高可用架構

叢集架構(雙副本)執行個體中的資料分區用於承載資料,每個資料分區均為雙副本(分別部署在不同機器上)高可用架構,主節點發生故障後,系統會自動進行主備切換保證服務高可用。關於各組件的詳細介紹,請參見叢集架構

讀寫分離架構
圖 4. 讀寫分離版高可用架構
  • 自動監控各節點的健康狀態,異常時發起主備切換或重搭唯讀節點,並更新相應的路由及權重資訊。
  • Proxy會即時探測唯讀節點的狀態,當出現下述情況時,Proxy會執行流量管控動作:
    • 唯讀節點處於異常狀態:Proxy會降低該節點的服務權重,如果多次無法串連該節點,Proxy會停止該節點的服務(即不再將流量轉寄至該節點),待該異常被修複後重新啟用該節點。
    • 唯讀節點處於全量同步狀態:Proxy會暫時停止該節點的服務,直到該節點完成全量同步。

關於各組件的詳細介紹,請參見讀寫分離架構

同城容災方案

Tair標準版和叢集版提供跨雙機房的同城容災架構。如果業務為單一地區部署,且對容災要求較高,可在建立Tair執行個體時,選擇支援同城容災的可用性區域(即多可用性區域)。操作方法,請參見建立執行個體

圖 5. 建立同城容災執行個體建立同城容災執行個體

完成建立後,備機房將建立與主機房相同規格的Replica執行個體,主備機房的執行個體資料通過專門的複製通道同步。

當主機房出現電源或網路問題時,Replica執行個體將升級為Master執行個體,系統調用Config Server介面為Proxy更新路由資訊。同時,Tair最佳化了同步機制,在同步位點上借鑒MySQL的GTID,實現了全域Opid,尋找Opid的操作通過後台線程無鎖進行,發送AOF binlog是非同步同步的過程(可限流),保障了Tair服務的效能。

圖 6. 同城容災執行個體的資料同步過程

跨地區容災方案

隨著業務的快速發展,在業務分布較廣時,如果還採用跨地區遠距離訪問的架構,將導致訪問的延遲大,影響使用者體驗。藉助阿里雲的Tair全球分布式緩衝功能,可協助您解決業務因跨地區訪問導致延遲大的問題,分布式緩衝功能具有如下優勢:

  • 可直接建立或指定需要同步的子執行個體,無需通過業務自身的冗餘設計來實現,極大降低業務設計的複雜度,讓您專註於上層業務的開發。
  • 可提供跨域複製(Geo-replication)能力,快速實現資料異地災備和多活。

該功能可應用於跨地區資料同步情境及多媒體、遊戲、電商等行業的全球化業務部署等情境。更多介紹,請參見Tair全球多活簡介

圖 7. Tair全球分布式緩衝架構全球多活架構