このページは機械翻訳によるものです。内容の正確さは保証しておりません。 人力翻訳を依頼する

ディザスタリカバリ

更新日時2024-12-24 12:56

Tair (Redis OSS-compatible) は、さまざまなシナリオで大量の重要なデータを保存するために使用できる、高性能なkey-valueデータベースサービスです。 このトピックでは、Tair (Redis OSS-compatible) が提供するディザスタリカバリソリューションについて説明します。

ディザスタリカバリソリューションの進化

インスタンスは、データセンターのデバイス障害や電源障害など、いくつかの理由で障害が発生する可能性があります。 この場合、ディザスタリカバリは、データの一貫性とサービスの可用性を確保するのに役立ちます。

図 1. ディザスタリカバリソリューションの進化

image

災害復旧ソリューション

保護レベル

説明

シングルゾーンHAソリューション

★★★☆☆

マスターノードとレプリカノードは、同じゾーン内の異なるマシンにデプロイされます。 マスターノードに障害が発生した場合、高可用性 (HA) システムはフェールオーバーを実行して、単一障害点 (SPOF) によるサービスの中断を防ぎます。

ゾーン災害復旧ソリューション

★★★★☆

マスターノードとレプリカノードは、同じリージョンの2つの異なるゾーンにデプロイされます。 マスターノードが存在するゾーンが電源障害やネットワーク障害などの要因によって切断された場合、HAシステムはフェールオーバーを実行してインスタンス全体の継続的な可用性を確保します。

クロスリージョンディザスタリカバリソリューション

★★★★★

グローバル分散キャッシュのアーキテクチャでは、分散インスタンスは、同期チャネルを使用してリアルタイムでデータを同期する複数の子インスタンスで構成されます。 チャネルマネージャは、子インスタンスのヘルスステータスを監視し、子インスタンスで発生する例外 (プライマリデータベースとセカンダリデータベース間の切り替えなど) を処理します。 グローバル分散キャッシュは、ジオディザスタリカバリ、アクティブなジオ冗長性、近隣のアプリケーションアクセス、負荷分散などのシナリオに適しています。

シングルゾーンHAソリューション

すべてのインスタンス

シングルゾーンHAアーキテクチャをサポートします。 HAシステムは、マスターノードとレプリカノードのヘルスステータスを監視し、SPOFによるサービスの中断を防ぐためにフェイルオーバーを実行します。

デプロイメントアーキテクチャ

説明

標準的なマスター /レプリカアーキテクチャ

図2. 標準マスターレプリカインスタンスのHAアーキテクチャ

image

標準のマスターレプリカインスタンスは、マスターレプリカアーキテクチャで実行されます。 HAシステムがマスターノードの障害を検出すると、システムはワークロードをマスターノードからレプリカノードに切り替え、レプリカノードがマスターノードの役割を引き受けます。 復旧後、元のマスターノードはレプリカノードとして機能します。

クラスターマルチレプリカアーキテクチャ

図3. クラスタマルチレプリカインスタンスのHAアーキテクチャ

image

クラスターマルチレプリカインスタンスでは、データはデータシャードに格納されます。 各データシャードは、マスターノードと複数のレプリカノードで構成されています。 マスターノードとレプリカノードは、HAアーキテクチャの異なるマシンにデプロイされます。 マスターノードに障害が発生した場合、HAシステムはマスター /レプリカの切り替えを実行して、高いサービス可用性を確保します。

読み書き分離アーキテクチャ

図4. 読み書き分離インスタンスのHAアーキテクチャ 云盘读写分离版

  • HAシステムは, すべてのノードの状態を監視します。 マスタノードに障害が発生した場合、HAシステムはマスタノードとレプリカノードの切り替えを実行します。 読み取りレプリカに障害が発生した場合、HAシステムは別の読み取りレプリカを作成して読み取り要求を処理します。 切り替え中に、HAシステムはルーティングと重みの情報を更新します。

  • プロキシノードは、各リードレプリカのリアルタイムステータスを監視します。 読み取りレプリカが次のいずれかの状態にある場合、プロキシノードは読み取りレプリカへのトラフィックのルーティングを停止します。

    • 異常: 読み取りレプリカが異常な場合、プロキシノードは読み取りレプリカのトラフィックを減らします。 読み取りレプリカが特定の回数後に接続に失敗した場合、プロキシノードは、読み取りレプリカが正常に戻るまで、読み取りレプリカへのトラフィックのルーティングを停止します。

    • 完全データ同期: プロキシノードが読み取りレプリカで完全データが同期されていることを検出した場合、プロキシノードは、同期が完了するまで、読み取りレプリカへのトラフィックのルーティングを停止します。

ゾーンディザスタリカバリソリューション

Tair標準インスタンスとクラスターインスタンスは、2つのデータセンターにわたるゾーンディザスタリカバリをサポートしています。 ワークロードが単一のリージョンにデプロイされており、ディザスタリカバリが必要な場合は、Tairインスタンスの作成時にゾーンディザスタリカバリをサポートするゾーンを選択できます。 Tairインスタンスの作成方法の詳細については、「手順1: インスタンスの作成」をご参照ください。

図5. ゾーンディザスタリカバリインスタンスの作成 创建同城容灾实例

ゾーンディザスタリカバリインスタンスを作成すると、マスターノードと同じ仕様のレプリカノードがマスターノードとは異なるゾーンにデプロイされます。 マスターノードは、専用チャネルを介して複製ノードにデータを同期させる。

マスターノードで停電やネットワークエラーが発生した場合、レプリカノードはマスターノードの役割を引き受けます。 システムは、プロキシノードのルーティング情報を更新するために構成サーバー上でAPI操作を呼び出します。 Tairは、最適化されたRedis同期メカニズムも提供します。 MySQLのグローバルトランザクション識別子 (GTID) と同様に、Tairはグローバルオペレーション識別子 (OpID) を使用して同期オフセットを示し、バックグラウンドでロックフリーのスレッドを実行してOpIDを検索します。 システムは、追加専用ファイル (AOF) バイナリログ (binlog) をマスターノードからレプリカノードに非同期に同期します。 同期を調整して、最適なサービスパフォーマンスを確保できます。

リージョン間のディザスタリカバリソリューション

ビジネスが複数のリージョンに拡大すると、リージョン間および長距離アクセスでは、レイテンシが大きくなり、ユーザーエクスペリエンスが低下する可能性があります。 Alibaba Cloud Tairのグローバル分散キャッシュ機能は、クロスリージョンアクセスによって引き起こされる高レイテンシを削減するのに役立ちます。 この機能には次の利点があります。

  • 子インスタンスを直接作成したり、アプリケーションに冗長性を組み込むことなく同期する必要がある子インスタンスを指定したりできます。 これにより、アプリケーション設計の複雑さが大幅に軽減され、アプリケーション開発に集中できるようになります。

  • geo-disaster recoveryまたはactive geo-redundancyを実装するgeoレプリケーション機能を提供します。

この機能は、リージョン間のデータ同期シナリオと、マルチメディア、ゲーム、eコマースなどの業界でのグローバルなビジネス展開に適用されます。 詳細については、「Tairのグローバル分散キャッシュの概要」をご参照ください。

図7. Tair全球多活架构 のグローバル分散キャッシュのアーキテクチャ

  • 目次 (1, M)
  • ディザスタリカバリソリューションの進化
  • シングルゾーンHAソリューション
  • ゾーンディザスタリカバリソリューション
  • リージョン間のディザスタリカバリソリューション
フィードバック