停電やネットワーク障害など、アベイラビリティゾーン全体に障害が発生すると、重要なデータ分析ワークロードが停止し、厳しいコンプライアンス要件に違反する可能性があります。この問題に対処するため、MaxCompute は、単一リージョン内のマルチゾーンアーキテクチャを活用した包括的なゾーンディザスタリカバリソリューションを提供します。3 つのゾーンにわたってデータを同期的に複製 (マルチゾーンストレージ) し、正常なゾーンに計算容量を確保 (マルチゾーンコンピューティング高可用性 (HA)) することで、MaxCompute はデータへの完全なアクセスを維持し、計算ジョブを自動的にフェールオーバーできるようにします。このアプローチにより、データセンターレベルの災害時でも、データ損失ゼロ (RPO=0) で業務継続性を保証します。
概要
MaxCompute のゾーンディザスタリカバリは、データストレージと計算サービスの可用性を単一ゾーンから同一リージョン内の 3 つのゾーンに拡張します。3 つのゾーン間の物理的な分離と低遅延ネットワーク接続を活用することで、このアーキテクチャはデータセンター間のリアルタイムデータ同期と障害分離を提供します。この設計により、単一のデータセンター障害によるサービス中断を防ぎ、ビジネスの耐障害性を向上させます。
MaxCompute のゾーンディザスタリカバリは、マルチゾーンストレージとマルチゾーンコンピューティング HA という 2 つの主要コンポーネントで構成されています。
マルチゾーンストレージ:プロジェクトレベルで有効化されるこの機能は、データを単一ゾーンから 3 つのゾーンにまたがる冗長ストレージに移行します。新しいデータは 3 つのゾーンすべてに同期的に書き込まれます。ゾーンレベルの障害が発生した場合、マルチゾーンストレージはデータ損失なしでデータ読み取りおよび書き込みサービスを中断なく提供し、目標復旧時点 (RPO) 0 を達成します。メタデータ、ユーザー権限、すべてのテーブルタイプ、マテリアライズドビュー、UDF、リソースなど、プロジェクト内のすべてのユーザーデータを保護します。
マルチゾーンコンピューティング HA:マルチゾーンストレージが有効化されたプロジェクトにマルチゾーン HA 計算リソースを関連付けることで、ストレージとコンピューティングの両方で包括的なディザスタリカバリを実現できます。複数のゾーンにわたって十分なマルチゾーン HA 計算リソースを確保できます。ゾーンレベルの障害が発生した場合、計算リソースは影響を受けたゾーンから影響を受けていないゾーンに自動的にフェールオーバーします。マルチゾーン HA 計算リソースは、SQL タスク、MaxFrame、Cupid タスク、MapReduce タスクなど、すべてのジョブタイプをサポートします。

ディザスタリカバリプロセス
ゾーンディザスタリカバリを有効化した後にゾーンで障害が発生した場合、システムは次の回復操作を実行します。
Alibaba Cloud MaxCompute から障害に関する通知が届きます。
サーバー側は、直ちに正常なゾーンに計算リソースを割り当てます。システムは、プロジェクト内のテーブル、パーティション、権限などのデータの完全性と可用性をチェックします。
クライアントから送信されたジョブは失敗する可能性があります。失敗したジョブは再送信する必要があります。エンドポイント、認証情報、project_name、quota_name などの MaxCompute の構成を変更する必要はありません。
ジョブが再開された後も、上流のビジネスアプリケーションのステータスを監視し続け、ビジネス全体が完全に回復したことを確認してください。
利用シーン
金融サービス
データセンターの障害によるサービス中断なしに、金融サービスがビジネストランザクションデータを継続的に分析および処理できるようにします。
重要インフラ
電力、水道、交通などの公共事業のデータ分析システムを保護し、公共の福祉に不可欠な重要な情報サービスがデータセンターの障害によって中断されないようにします。
メリット
データの冗長性とバックアップ。
サービスダウンタイムの削減。
業界規制への準拠。
上流のビジネスアプリケーションの顧客体験の向上。
サポート対象リージョン
中国 (杭州)、中国 (上海)、中国 (北京)、中国 (深セン)、中国東部 2 Finance、中国 (香港)、シンガポール、インドネシア (ジャカルタ)、マレーシア (クアラルンプール)、ドイツ (フランクフルト) リージョン。
課金
マルチゾーンストレージを有効にすると、MaxCompute はマルチゾーンストレージの課金に基づいて請求します。
マルチゾーンコンピューティング HA を使用するには、マルチゾーン高可用性計算リソースを購入する必要があります。
注意事項
ストレージとコンピューティングの両方で包括的なディザスタリカバリを実現するには、マルチゾーンストレージとマルチゾーンコンピューティング HA の両方を有効にする必要があります。
ストレージデータの移行プロセスは、実行中のジョブに影響を与えず、アプリケーションに対して透過的です。
データ移行プロセス中に、テーブルパーティションに対して長時間のストリーミング書き込みが進行中の場合、そのパーティションの移行は書き込み操作がコミットされるまで待機します。すべてのテーブルとパーティションのタイムリーな移行を確実にするために、定期的に新しいパーティションに切り替えてデータ書き込みを行ってください (例:日次または週次)。
マルチゾーンストレージを有効にする前に生成されたローカルバックアップデータと TimeTravel データは、元のゾーンのローカルストレージに残ります。
MaxCompute は、マルチゾーンストレージを有効にした後に生成されたローカルバックアップデータと TimeTravel データを 3 つのゾーンにわたって冗長に保存します。
マルチゾーンストレージの有効化
MaxCompute コンソールにログインし、左上のコーナーでリージョンを選択します。
左側のナビゲーションウィンドウで、を選択します。
ディザスタリカバリページで、ゾーンディザスタリカバリタブをクリックします。
新しい同じ都市の耐障害性をクリックします。同じ都市災害復旧機能を追加するダイアログボックスで、ディザスタリカバリが必要なプロジェクトを選択してくださいドロップダウンリストからディザスタリカバリを有効にするプロジェクトを選択します。確認チェックボックスを選択し、OK をクリックします。
タスクが作成されると、システムはプロジェクトデータを単一ゾーンから 3 つのゾーンにまたがって保存するように移行し、ストレージのディザスタリカバリの準備をします。このプロセスには約 2 日かかります。プロセスが完了すると、プロジェクトはストレージのディザスタリカバリ機能を持つようになります。
マルチゾーン コンピュート HA の有効化 (特定リージョン限定)
マルチゾーンコンピューティング HA を有効にするには、マルチゾーン HA 計算リソースを購入し、ターゲットプロジェクトのデフォルトの計算クォータがこれらのリソースを使用するように設定する必要があります。この機能は現在、特定のリージョンでのみ利用可能です。
MaxCompute コンソールにログインし、左上のコーナーでリージョンを選択します。
左側のナビゲーションウィンドウで、を選択します。
クォータ管理ページで、新しいクォータをクリックします。
リソース購入ページで、購入パラメーターを設定します。
仕様タイプ: [マルチゾーン HA コンピューティングリソース]を選択します。
マルチゾーン HA CU: 購入する CU 数を選択します。最小購入数は 50 CU で、1 CU の増分で購入する必要があります。
[今すぐ購入] をクリックし、画面の指示に従って支払いを完了します。
左側のナビゲーションウィンドウで、を選択します。
作成したMulti-zone HA Computing Resourcesを表示できます。
ターゲットプロジェクトのデフォルトクォータをマルチゾーン HA 計算リソースに設定します。
MaxCompute コンソールにログインし、左上のコーナーでリージョンを選択します。
左側のナビゲーションウィンドウで、を選択します。
プロジェクト管理ページで、ターゲットプロジェクトを見つけ、操作列の管理をクリックします。
プロジェクト設定ページで、パラメーター設定タブを選択できます。
基本情報セクションで、編集をクリックします。
デフォルトクォータをマルチゾーン HA 計算リソースに設定し、提出をクリックします。
ディザスタリカバリステータスの監視
ディザスタリカバリ監視ページでは、プロジェクト全体のディザスタリカバリステータス、ゾーン監視情報、およびテーブルデータの詳細を表示できます。
MaxCompute コンソールにログインし、左上のコーナーでリージョンを選択します。
左側のナビゲーションウィンドウで、を選択します。
ディザスタリカバリページで、ゾーンディザスタリカバリタブをクリックします。
ゾーンディザスタリカバリページで、プロジェクト名をクリックしてプロジェクトレベルの監視ページを開きます。
基本情報セクションで、ゾーン、制御ディザスタリカバリ情報、現在のステータス、ディザスタリカバリ作成時間、最終フェールオーバー時間など、プロジェクト全体のディザスタリカバリステータスを表示します。
現在のステータスが準備中の場合、MaxCompute がデータをマルチゾーンストレージに移行中であることを示します。
現在のステータスが正常の場合、データは複数のゾーンにわたって保存され、ゾーンレベルのストレージディザスタリカバリによって保護されています。
可用性ゾーン (AZ) モニタリング
このセクションには、マルチゾーン HA コンピューティングの監視情報が表示されます。購入し、プロジェクトにバインドされたマルチゾーン HA 計算リソースが配置されているゾーンを表示できます。
[使用中] ステータスのゾーンは、ジョブが現在実行されているアクティブなゾーンです。
(予約済み) ステータスのゾーンは、スタンバイゾーンです。アクティブなゾーンで障害が発生した場合、計算リソースはこの予約済みゾーンに自動的にフェールオーバーします。
テーブルデータの詳細
スキーマ名とテーブル名で特定のテーブルを検索します。フィルターを適用しない場合、システムはプロジェクト内のすべてのテーブルの情報を表示します。
列
説明
スキーマ名
プロジェクト内のスキーマ。
テーブル名
テーブルの名前。
パーティションテーブル
テーブルがパーティションテーブルであるかどうかを示します。
最終データ更新時間
テーブル内のデータが最後に更新された日時。
データ量
テーブル内のデータのサイズ。
データ分布
テーブルデータが分散しているゾーン。
ゾーンステータスが(準備中) の場合、MaxCompute がデータをマルチゾーンストレージに移行中であることを示します。
ゾーンステータスが(使用中) の場合、MaxCompute がデータを複数のゾーンにわたって冗長に保存していることを示します。
操作
テーブルがパーティション分割されている場合は、パーティションの詳細を表示をクリックして、各パーティションの最終データ更新時間、データ量、およびデータ分布を表示します。
災害復旧訓練の実施
災害復旧訓練を実施する必要がある場合、MaxCompute はプロジェクトレベルの災害シミュレーションとフェールオーバーソリューションを提供します。プロセスは次のとおりです。
Alibaba Cloud にサポートチケットを起票し、災害復旧訓練をリクエストします。チケットには、リージョン、プロジェクト名、クォータ名、および希望する訓練タイムウィンドウを記載してください。ビジネスへの影響を最小限に抑えるため、訓練はオフピーク時にスケジュールしてください。
Alibaba Cloud がチケットを承認すると、プロジェクトレベルのディザスタリカバリステータスの監視ページに フェールオーバー ボタンが表示されます。その後、画面の指示に従って手動でフェールオーバーをトリガーし、計算リソースのアクティブゾーンを切り替えることができます。フェールオーバー後、新しく送信されたジョブは直ちに実行されます。フェールオーバープロセス中に失敗したジョブは、手動で再送信する必要があります。
上記の手順は訓練シナリオのみを対象としています。実際のゾーンレベルの災害では、システムが自動的に計算リソースをフェールオーバーします。
ディザスタリカバリの無効化
左側のナビゲーションウィンドウで、を選択します。
ディザスタリカバリページで、ゾーンディザスタリカバリタブをクリックします。
ゾーンディザスタリカバリタブで、ターゲットプロジェクトの操作列にある災害復旧をキャンセルをクリックします。
同じ都市の災害復旧能力をキャンセルするダイアログボックスで、確認チェックボックスを選択し、OK をクリックします。
ディザスタリカバリの無効化は、高リスクな操作です。プロジェクトは直ちにディザスタリカバリ機能を失います。潜在的な影響を慎重に評価し、注意して進めてください。
ディザスタリカバリを無効にすると、システムはプロジェクトデータを単一ゾーンのローカルストレージに再配布します。