すべてのプロダクト
Search
ドキュメントセンター

Auto Scaling:負荷分散された分散を使用して回復力のあるコンピューティング クラスタをデプロイする

最終更新日:Apr 09, 2025

Auto Scaling は、複数のゾーンに均等に分散された Elastic Compute Service (ECS) インスタンスを含むコンピューティング クラスタを迅速にデプロイできます。インスタンスの状態をリアルタイムで監視して、高いクラスタ可用性を確保します。このトピックでは、Auto Scaling を使用して高可用性 ECS クラスタをデプロイし、ゾーン全体に均等に分散させ、プリエンプティブル インスタンスでコストを削減する方法について説明します。

シナリオ

説明

分散ビッグデータ コンピューティングまたは AI トレーニングのピーク時間帯には、需要を満たすために高可用性コンピューティング クラスタを迅速にプロビジョニングする必要があります。

たとえば、ターゲット広告に機械学習を使用するオンライン広告会社は、トラフィックの多い期間に大量のコンピューティング リソースを必要とします。複数の ECS インスタンスを使用してコンピューティング クラスタをデプロイする場合、時間のかかる手動プロセスやリソース不足によって発生する作成エラー、ゾーンレベルのインスタンス障害による一時的なダウンタイムなどのリスクが発生する可能性があり、ビジネス運用が中断される可能性があります。

ソリューション

Auto Scaling を使用すると、複数のゾーンに ECS インスタンスを自動的にデプロイし、高可用性のためのバランスのとれた分散を確保できます。さらに、低価格で同じ機能を提供するプリエンプティブル インスタンスを組み込むことで、コストを削減できます。このアプローチは、リソース割り当てとコスト効率の両方を最適化します。

ソリューションのメリット

高可用性コンピューティング クラスタに Auto Scaling を使用すると、次のメリットがあります。

  • ゼロ O&M コスト

    Auto Scaling は ECS インスタンスを自動的に調整するため、手動による介入が不要になります。

  • 高可用性

    Auto Scaling のバランスのとれた分散ポリシーは、ECS インスタンスを複数のゾーンに均等に割り当て、単一ゾーンのリソース不足によるスケーリング障害を防ぎます。デフォルトでは、インスタンス ヘルスチェック機能により、すべてのスケーリング グループ インスタンスが使用可能な状態に維持されます。

  • 費用対効果

    プリエンプティブル インスタンスを計算ノードとして使用すると、リソース コストが大幅に削減されます。

手順

説明
  • 続行する前に、アーキテクチャごとにビジネス モジュールを評価し、高可用性のニーズに合わせてスケーリング グループを設定します。

  • ECS インスタンスがビジネス ニーズを満たしていることを確認するには、アプリケーションからカスタム イメージを作成し、スケーリング設定で指定します。詳細については、「インスタンスからカスタム イメージを作成する」をご参照ください。

  1. Auto Scaling コンソール にログオンします。

  2. スケーリング グループを作成します。

    1. 左側のナビゲーション ウィンドウで、[スケーリング グループ] をクリックします。

    2. 上部のナビゲーションバーで Auto Scaling リージョンを選択します。

    3. スケーリング グループ[スケーリング グループ] ページの左上隅にある をクリックします。

    4. [フォームから作成] タブで、スケーリング グループを設定し、[作成] をクリックします。

      次の表は、このトピックで使用されているパラメータ設定を示しています。含まれていないパラメータはすべてデフォルト値のままです。スケーリング グループの作成方法については、「スケーリング グループを作成する」をご参照ください。

      均衡分布.png

      パラメータ

      説明

      [スケーリング グループ名]

      test

      スケーリング グループの名前を入力します。名前は、UI に表示される形式要件に準拠している必要があります。

      [タイプ]

      ECS

      ECS を選択します。これは、スケーリング グループに ECS インスタンスが含まれていることを指定します。

      [インスタンス設定ソース]

      新規作成

      この段階では、ECS インスタンスを自動的に作成するためのテンプレートを指定しないでください。スケーリング グループを作成した後、スケーリング設定の作成に進むことができます。

      [インスタンスの最小数]

      100

      スケーリング グループ内のインスタンスの最小数を指定します。スケーリング グループ内のインスタンス数がこのパラメータの値よりも小さい場合、Auto Scaling は、スケーリング グループ内の ECS インスタンス数が下限に達するまで、スケーリング グループに ECS インスタンスを追加します。

      [インスタンスの最大数]

      120

      スケーリング グループ内のインスタンスの最大数を指定します。スケーリング グループ内のインスタンス数がこのパラメータの値よりも大きい場合、Auto Scaling は、スケーリング グループ内の ECS インスタンス数が上限を超えなくなるまで、スケーリング グループから ECS インスタンスを削除します。

      [詳細設定を表示] > [スケーリング ポリシー]

      バランスのとれた分散ポリシー

      この例では、このパラメータを [バランスのとれた分散ポリシー] に設定します。ポリシーを有効にするには、複数の vSwitch を選択する必要があります。

      [VPC]

      vpc-2zeghwzptn5zii0w7****

      スケーリング グループの ECS インスタンスの VPC を選択します。

      [vSwitch]

      vsw-2ze23nqzig8inprou****

      vsw-2zeet2ksvw7f14ryz****

      vsw-2ze94pjtfuj9vaymf****

      スケーリング グループの ECS インスタンスに 1 つ以上の vSwitch を選択します。

      バランスを改善し、スケールアウトの成功率を高めるために、複数の vSwitch を選択して ECS インスタンスをゾーン全体に均等に分散させることをお勧めします。

  3. スケーリング設定を作成します。

    1. [スケーリング グループ] ページで、目的のスケーリング グループを見つけ、その ID をクリックします。

    2. スケーリング グループの詳細ページの上部にある [インスタンス設定ソース] タブをクリックします。

    3. [スケーリング設定] タブで、[スケーリング設定の作成] をクリックします。

    4. [スケーリング設定の作成] ページで、パラメータを設定してスケーリング設定の作成プロセスを完了し、[作成] をクリックします。

      次の表は、このトピックで使用されているパラメータ設定を示しています。含まれていないパラメータはすべてデフォルト値のままです。スケーリング設定の作成方法については、「ECS タイプのスケーリング設定を作成する」をご参照ください。

      セクション

      パラメータ

      説明

      [基本情報]

      [スケーリング設定名]

      test

      スケーリング設定の名前を入力します。名前は、UI に表示される形式要件に準拠している必要があります。

      [課金方法]

      プリエンプティブル インスタンス

      Auto Scaling は無料ですが、スケールアウト イベント中に起動された ECS インスタンスに対して課金されます。この例では、請求方法請求の概要 パラメータを [プリエンプティブル インスタンス] に設定します。詳細については、「」をご参照ください。

      [イメージとインスタンス]

      [インスタンス設定モード]

      インスタンス パターンの指定

      [インスタンス パターンの指定] を選択して、ECS インスタンスの仕様を設定します。

      [インスタンス属性の組み合わせ]

      2 vCPU、4 GiB メモリ、エンタープライズ レベル

      ビジネス要件に基づいて、ECS インスタンスに適切な vCPU 数とメモリ サイズを指定します。

      [イメージの選択]

      test

      ECS インスタンスをデプロイするイメージを選択します。

      実際のビジネス用途では、アプリケーションから作成されたカスタム イメージを選択することをお勧めします。

      [ストレージ]

      [システム ディスク]

      エンタープライズ SSD (ESSD)、40 GiB、PL0

      ECS インスタンスのシステム ディスクを選択します。ビジネス要件に基づいて、このセクションのパラメータを設定することをお勧めします。

      [ネットワークとセキュリティ グループ]

      [セキュリティ グループ]

      sg-bp18kz60mefsicfg****

      既存のセキュリティ グループを選択します。セキュリティ グループの作成方法については、「セキュリティ グループを作成する」をご参照ください。

      [管理設定]

      [ログオン資格情報]

      後で設定

      後で設定 を選択して、作成後に ECS インスタンスのパスワードを手動で設定します。

  4. 画面の指示に従って、スケーリング グループとスケーリング設定を有効にします。

結果

[最小インスタンス数]100 に設定すると、Auto Scaling により 100 個の ECS インスタンスが指定されたゾーンに均等に分散されます。これにより、コンピューティング クラスターの高可用性を維持しながら、リソース コストを最適化できます。

  • 1 つのゾーンのリソース不足が原因で問題が発生した場合、Auto Scaling は他のゾーンに ECS インスタンスをデプロイして、ビジネスへの影響を最小限に抑えます。

  • プリエンプティブル インスタンスが回収されると、Auto Scaling はそれらと異常な ECS インスタンスを新しいインスタンスに置き換えます。

次のステップ

1 つのゾーンのリソース不足が原因で ECS インスタンスがゾーン全体に均等に分散されていない場合は、再調整できます。詳細については、「ECS インスタンスの分散を再調整する」をご参照ください。