Auto Scalingには、自動化、費用対効果、高可用性、柔軟性、インテリジェンス、および簡単な監査という利点があります。
自動化
Auto Scalingは、設定に基づいて自動スケーリングを実行し、手動操作によるエラーを防止します。
スケールアウト活動:
Auto Scalingは、指定した数のElastic Compute Service (ECS) インスタンスまたはelasticコンテナインスタンスを自動的に作成し、スケーリンググループに追加して、ビジネス要件を満たすのに十分なコンピューティングパワーを提供します。
スケーリンググループがServer Load Balancer (SLB) インスタンスに関連付けられている場合、Auto scalingはスケーリンググループ内のECSインスタンスまたはエラスティックコンテナインスタンスをSLBインスタンスに自動的にアタッチします。 SLBインスタンスは、アタッチされたECSインスタンスまたはエラスティックコンテナインスタンスにリクエストを転送できます。
スケーリンググループがApsaraDB RDSインスタンスに関連付けられている場合、Auto scalingはスケーリンググループ内のECSインスタンスまたはエラスティックコンテナインスタンスのIPアドレスをApsaraDB RDSインスタンスのホワイトリストに自動的に追加します。 ECSインスタンスまたはエラスティックコンテナインスタンスで実行されるアプリケーションのデータをApsaraDB RDSインスタンスに保存できます。
スケールイン活動:
Auto Scalingは、指定された数のECSインスタンスまたはエラスティックコンテナインスタンスをスケーリンググループから自動的に削除し、できるだけ早い機会にアイドルリソースを解放します。
スケーリンググループがSLBインスタンスに関連付けられている場合、Auto scalingはECSインスタンスまたはelastic containerインスタンスをSLBインスタンスから自動的にデタッチします。 SLBインスタンスは、ECSインスタンスまたはエラスティックコンテナインスタンスにリクエストを転送しなくなりました。
スケーリンググループがApsaraDB RDSインスタンスに関連付けられている場合、Auto scalingは、ApsaraDB RDSインスタンスのホワイトリストからECSインスタンスまたはエラスティックコンテナインスタンスのIPアドレスを自動的に削除します。 スケーリンググループから自動的に削除されたECSインスタンスまたはエラスティックコンテナインスタンスで実行されるアプリケーションのデータをApsaraDB RDSインスタンスに保存することはできません。
コスト効率
Auto Scalingは、リソースの需要が増加するとリソースをプロビジョニングし、リソースの需要が減少するとリソースをリリースします。 これにより、リソース利用率が向上し、コストが大幅に削減されます。
ピーク時にサービスの可用性を確保するために、追加のECSインスタンスまたはelasticコンテナインスタンスを準備する必要はありません。 また、リソースの浪費について心配する必要はありません。 Auto Scalingは、できるだけ早い機会にコンピューティングリソースをスケーリングします。 これにより、リソースコストが大幅に削減されます。
Auto Scalingは、人員と時間の節約にも役立ちます。
High availability
Auto Scalingは、スケーリンググループ内のECSインスタンスまたはエラスティックコンテナインスタンスが正常かどうか、またはインスタンスが期待どおりに実行されているかどうかを検出できます。 Auto Scalingが、スケーリンググループ内のECSインスタンスまたはエラスティックコンテナインスタンスが期待どおりに実行されないことを検出した場合、Auto scalingはインスタンスが異常であると見なし、サービスの可用性を確保するためにインスタンスを新しいインスタンスに置き換えます。 Auto Scalingを使用すると、異常なECSインスタンスまたはエラスティックコンテナインスタンスをできるだけ早く検出し、業務を中断することなく異常なインスタンスを置き換えることができます。
柔軟性とインテリジェンス
Auto Scalingは、さまざまなビジネスシナリオに適した豊富なインテリジェント機能を提供し、設定を簡素化します。 これは、動作効率を改善します。
スケーリングモード: Auto Scalingは、固定数モード、ヘルスモード、スケジュールモード、動的モード、カスタムモードをサポートしています。 ビジネス要件に基づいて、これらのスケーリングモードを組み合わせることができます。 ダイナミックモードでは、CloudMonitorを使用してAuto Scalingリソースをモニタリングできます。 API操作を呼び出して、外部モニタリングシステムをCloudMonitorと相互接続できます。 詳細については、「スケーリングモード」をご参照ください。
インスタンス設定ソース:
Auto Scalingは、複数のインスタンス設定ソースをサポートします。 たとえば、既存のインスタンスをインスタンス設定ソースとして指定したり、スケーリング設定を最初から作成したりできます。 スケーリンググループの作成時に [タイプ] パラメーターを [ECS] に設定した場合、起動テンプレートをインスタンス設定ソースとして指定することもできます。
Auto Scalingでは、複数のインスタンスタイプを指定することもできます。 これにより、テンプレートの柔軟性が向上し、スケールアウト活動の成功率が向上します。 たとえば、ECSインスタンスの作成に使用するテンプレートで、複数のインスタンスタイプとディスクカテゴリを指定できます。 エラスティックコンテナインスタンスの作成に使用するテンプレートで、複数のvCPUとメモリサイズを指定して、インスタンスタイプの範囲を決定することもできます。 詳細については、「概要」をご参照ください。
スケーリングポリシー: スケーリンググループの作成時に [タイプ] パラメーターを [ECS] に設定した場合、Auto Scalingはさまざまなスケーリングポリシーを提供します。 スケーリンググループの作成時にTypeパラメーターをECIに設定した場合、デフォルトのスケーリングポリシーが使用されます。
優先度ポリシー: Auto Scalingは、優先度が最も高いゾーンのインスタンスを優先的にスケーリングします。 スケーリングアクティビティが失敗した場合、Auto scalingは次に高い優先順位を持つゾーン内のインスタンスをスケーリングします。
バランスの取れた配布ポリシー: Auto Scalingは複数のゾーンにECSインスタンスを均等に作成し、インスタンスの高可用性を確保します。
コスト最適化ポリシー: インスタンス設定ソースで複数のインスタンスタイプを指定した場合、Auto ScalingはvCPUの単価が最も低いECSインスタンスを優先的に作成し、vCPUの単価が最も高いECSインスタンスを削除します。
インスタンス削除ポリシー: 最も古いスケーリング設定から作成されたECSインスタンスを削除できます。 最も早い時点または最も遅い時点で作成されたECSインスタンスを削除することもできます。
インスタンス回収ポリシー: すべてのECSインスタンスをリリースできます。 特定のリソースを保持してコストを削減することもできます。
詳細については、「スケーリンググループの作成」をご参照ください。
簡単な監査
Auto Scalingは、各スケーリングアクティビティの詳細を記録します。 これにより、問題を効果的に特定してトラブルシューティングできます。
Auto Scalingにはモニタリング機能もあります。 CloudMonitorを使用して、スケーリンググループ内のインスタンスが期待どおりに実行されるかどうかを監視できます。 これにより、サービスの可用性を効率的に維持できます。