すべてのプロダクト
Search
ドキュメントセンター

Tair (Redis® OSS-Compatible):ディザスタリカバリ

最終更新日:Nov 14, 2024

Tair (Redis OSS-compatible) は、高性能なkey-valueデータベースサービスです。 このサービスは、さまざまなシナリオで大量の重要なデータを保存するのに役立ちます。 このトピックでは、Tairが提供するディザスタリカバリソリューションについて説明します。

Tair災害復旧ソリューションの進化

Tairインスタンスは、デバイスの障害やデータセンターの電源障害など、予期しない理由で失敗することがあります。 この場合、ディザスタリカバリは、データの一貫性とサービスの可用性を確保するのに役立ちます。

図 1. Tair災害復旧ソリューションの進化

image

災害復旧ソリューション

保護レベル

説明

シングルゾーンHAソリューション

★★★☆☆

マスターノードとレプリカノードは、同じゾーン内の異なるマシンにデプロイされています。 マスターノードに障害が発生した場合、高可用性 (HA) システムはフェールオーバーを実行して、単一障害点 (SPOF) によるサービスの中断を防ぎます。

ゾーン災害復旧ソリューション

★★★★☆

マスターノードとレプリカノードは、同じリージョンの2つの異なるゾーンにデプロイされます。 電源障害やネットワーク障害などの不可抗力要因によりマスターノードが存在するゾーンが切断された場合、HAシステムはフェールオーバーを実行してインスタンス全体の継続的な可用性を確保します。

クロスリージョンディザスタリカバリソリューション

★★★★★

グローバル分散キャッシュのアーキテクチャでは、分散インスタンスは、同期チャネルを使用してリアルタイムでデータを相互に同期する複数の子インスタンスで構成されます。 チャネルマネージャは、子インスタンスのヘルスステータスを監視し、子インスタンスで発生する例外 (プライマリデータベースとセカンダリデータベース間の切り替えなど) を処理します。 グローバル分散キャッシュは、ジオディザスタリカバリ、アクティブなジオ冗長性、近隣のアプリケーションアクセス、負荷分散などのシナリオに適しています。

シングルゾーンHAソリューション

すべてのTairインスタンス

シングルゾーンHAアーキテクチャをサポートします。 HAシステムは、マスターノードとレプリカノードのヘルスステータスを監視し、SPOFによるサービスの中断を防ぐためにフェイルオーバーを実行します。

配置アーキテクチャ

説明

標準的なマスター /レプリカアーキテクチャ

図2. 標準マスターレプリカインスタンスのHAアーキテクチャ

標準のマスターレプリカインスタンスは、マスターレプリカアーキテクチャで実行されます。 HAシステムがマスターノードの障害を検出すると、システムはワークロードをマスターノードからレプリカノードに切り替え、レプリカノードがマスターノードの役割を引き継ぎます。 元のマスターノードは、リカバリ後にレプリカノードとして機能します。

クラスターマスターレプリカアーキテクチャ

図3. クラスターマスターレプリカインスタンスのHAアーキテクチャ

クラスターマスターレプリカインスタンスでは、データはデータシャードに格納されます。 各データシャードは、マスターノードとレプリカノードで構成されます。 マスターノードとレプリカノードは、HAアーキテクチャの異なるマシンにデプロイされます。 マスターノードに障害が発生した場合、HAシステムはマスター /レプリカの切り替えを実行して、高いサービス可用性を確保します。 クラスターインスタンスのコンポーネントの詳細については、「クラスターマスターレプリカインスタンス」をご参照ください。

読み書き分離アーキテクチャ

図4. 読み書き分離インスタンスのHAアーキテクチャ

  • HAシステムは, 各ノードの状態を監視します。 マスタノードに障害が発生した場合、HAシステムはマスタノードとレプリカノードの切り替えを実行します。 読み取りレプリカに障害が発生した場合、HAシステムは別の読み取りレプリカを作成して読み取り要求を処理します。 切り替え中に、HAシステムはルーティングと重みの情報を更新します。

  • プロキシノードは、各リードレプリカのステータスをリアルタイムで監視します。 読み取りレプリカが次のいずれかの状態にある場合、プロキシノードは読み取りレプリカへのトラフィックのルーティングを停止します。

    • 異常: 読み取りレプリカに異常がある場合、プロキシノードは読み取りレプリカへのトラフィックの重みを減らします。 読み取りレプリカの接続が指定された回数失敗した場合、プロキシノードは、読み取りレプリカが再び正常になるまで、読み取りレプリカへのトラフィックのルーティングを停止します。

    • 完全データ同期: プロキシノードが読み取りレプリカで完全データが同期されていることを検出した場合、プロキシノードは、同期が完了するまで、読み取りレプリカへのトラフィックのルーティングを停止します。

読み書き分離インスタンスのコンポーネントの詳細については、「読み書き分離インスタンス」をご参照ください。

ゾーンディザスタリカバリソリューション

Tair標準インスタンスとクラスターインスタンスは、2つのデータセンターにわたるゾーンディザスタリカバリをサポートしています。 ワークロードが単一のリージョンにデプロイされており、ディザスタリカバリが必要な場合は、Tairインスタンスの作成時にゾーンディザスタリカバリをサポートするゾーンを選択できます。 Tairインスタンスの作成方法の詳細については、「手順1: インスタンスの作成」をご参照ください。

図5. ゾーンディザスタリカバリインスタンスの作成 创建同城容灾实例

ゾーンディザスタリカバリインスタンスを作成すると、マスターノードと同じ仕様のレプリカノードがマスターノードとは異なるゾーンにデプロイされます。 マスターノードは、専用チャネルを介して複製ノードにデータを同期させる。

マスターノードで停電やネットワークエラーが発生した場合、レプリカノードがマスターノードの役割を引き継ぎます。 システムは、プロキシノードのルーティング情報を更新するために構成サーバー上でAPI操作を呼び出します。 さらに、Tairは最適化されたRedis同期メカニズムを提供します。 MySQLのグローバルトランザクション識別子 (GTID) と同様に、Tairはグローバルオペレーション識別子 (OpID) を使用して同期オフセットを示し、バックグラウンドでロックフリーのスレッドを実行してOpIDを検索します。 システムは、追加専用ファイル (AOF) バイナリログ (binlog) をマスターノードからレプリカノードに非同期に同期します。 同期を調整して、サービスパフォーマンスを確保できます。

リージョン間のディザスタリカバリソリューション

ビジネスが急速に成長し、さまざまなリージョンに分岐すると、リージョン間および長距離アクセスの結果、レイテンシが大きくなり、ユーザーエクスペリエンスが低下する可能性があります。 Alibaba Cloud Tairのグローバル分散キャッシュ機能は、クロスリージョンアクセスによって引き起こされる高レイテンシを削減するのに役立ちます。 グローバル分散キャッシュ機能には、次の利点があります。

  • アプリケーションに冗長性を組み込むことなく、子インスタンスを直接作成したり、同期が必要な子インスタンスを指定したりできます。 これにより、アプリケーション設計の複雑さが大幅に軽減され、アプリケーション開発に集中できます。

  • geo-disaster recoveryまたはactive geo-redundancyを実装するgeoレプリケーション機能を提供します。

この機能は、リージョン間のデータ同期シナリオと、マルチメディア、ゲーム、eコマースなどの業界でのグローバルなビジネス展開に適用されます。 詳細については、「Tairのグローバル分散キャッシュの概要」をご参照ください。

図7. Tair全球多活架构 のグローバル分散キャッシュのアーキテクチャ