すべてのプロダクト
Search
ドキュメントセンター

Auto Scaling:用語

最終更新日:Sep 10, 2024

このトピックでは、Auto Scalingで使用される一般的な用語について説明します。

用語

期間

説明

関連ドキュメント

Auto Scaling

Auto Scalingは、ビジネス要件とスケーリングポリシーに基づいてインスタンス数を動的に調整するサービスです。 Auto Scalingを使用して、Elastic Compute Service (ECS) インスタンスまたはelasticコンテナインスタンスをスケールできます。 十分なコンピューティングリソースを使用できるようにするには、Auto Scalingを使用して、ピーク時に指定したタイプのインスタンスを追加します。 リソースの無駄を防ぎ、コストを削減するために、Auto Scalingを使用して、オフピーク時に指定されたタイプのインスタンスを削除できます。

Auto Scaling とは

スケーリンググループ

スケーリンググループは、同様のビジネスシナリオに使用できる同じタイプのインスタンスで構成されます。 スケーリンググループを設定して、スケーリンググループ内のインスタンスの最小数と最大数を指定し、Server Load Balancer (SLB) インスタンスとApsaraDB RDSインスタンスをスケーリンググループに関連付けることができます。

概要

ECS インスタンス

ECSインスタンスは、vCPU、メモリ、オペレーティングシステム、ネットワーク構成、ディスクなどの基本的なコンピューティングコンポーネントで構成される仮想サーバーです。 ECSにより、ITハードウェアへの先行投資が不要になり、コンピューティングリソースをオンデマンドでスケーリングできます。 これにより、ECSインスタンスは物理サーバーよりも便利で効率的になります。

ECSとは

elasticコンテナーインスタンス

Elastic Container Instanceは、Alibaba Cloudが提供するコンテナーサービスで、コンテナーとサーバーレステクノロジーを組み合わせたものです。

Elastic Containerインスタンスとは

SLBインスタンス

SLBは、ネットワークトラフィックをバックエンドサーバーに転送して、アプリケーションのスループットを向上させるサービスです。 SLBを使用すると、単一障害点 (SPOF) によって引き起こされるサービスの中断を防ぎ、アプリケーションの可用性を向上させることができます。

SLBの概要

ApsaraDB RDS インスタンス

ApsaraDB RDSは、柔軟なスケーリングをサポートする安定した信頼性の高いオンラインデータベースサービスです。 ApsaraDB RDSは、主流のデータベースエンジンをサポートし、ディザスタリカバリ、バックアップ、復元、モニタリング、移行などのさまざまなデータベースソリューションを提供します。

ApsaraDB RDSとは

スケーリングモード

スケーリングモードは、スケーリンググループの特定の数のインスタンスをいつ追加または削除するかを指定します。 スケーリングモードには、スケジュールモード、動的モード、固定数モード、カスタムモード、ヘルスモード、および複数のモードがあります。

スケーリングモード

インスタンス設定ソース

Auto Scalingは、選択したインスタンス設定ソースを使用してインスタンスを作成します。 インスタンス設定ソースは、スケーリング設定または起動テンプレートです。

概要

スケーリング設定

スケーリング設定は、インスタンス設定ソースのタイプであり、インスタンスの設定情報が含まれています。

ECSタイプのスケーリング設定の作成

スケーリングルール

  • ステップスケーリングルール、ターゲット追跡スケーリングルール、および単純スケーリングルールは、スケーリングアクティビティがトリガーされたときにインスタンスを追加または削除するために使用されます。

  • 予測スケーリングルールは、過去のモニタリングデータに基づいて将来のメトリック値を予測し、スケーリンググループのインスタンスの最大数と最小数をインテリジェントに指定するために使用されます。

概要

スケーリングタスク

スケーリングタスクは、スケジュールタスクとイベントトリガータスクに分類されます。 スケジュールされたタスクを使用して、指定された時間にインスタンスをスケーリングできます。 イベントトリガータスクを使用して、指定されたモニタリングメトリックに基づいてインスタンスを動的にスケーリングできます。

スケーリングアクティビティ

スケーリングアクティビティは、スケーリンググループ内のインスタンス数、スケーリンググループ内のインスタンスの最大数と最小数、およびインスタンスの予想数の変化を記録します。 スケーリングルールが実行されたとき、スケーリンググループ内のインスタンスの最大数と最小数が変更されたとき、またはインスタンスの予想数が変更されたときに、スケーリングアクティビティがトリガーされます。

スケーリングアクティビティの詳細の表示

インスタンスの予想数

スケーリンググループの [期待インスタンス数] 機能を有効にすると、Auto scalingは自動的にインスタンス数を期待値に維持します。

説明

Expected Number of Instances機能を有効にするには、スケーリンググループを作成するときにExpected Number of Instancesパラメーターを設定する必要があります。 スケーリンググループ内の指定されたインスタンスの予想数を変更できます。

予想インスタンス数

並列スケーリングアクティビティ

次のいずれかのメソッドを使用してトリガーされるスケーリングアクティビティは、並列スケーリングアクティビティです。

  • 手動またはスケジュールタスクを使用して、スケーリングルールを実行します。

  • ECS インスタンスを手動で追加または削除します。

  • インスタンスの正常性、またはインスタンスの予想数、最小数、または最大数のチェックを実行します。

進行中のスケーリングアクティビティが並列スケーリングアクティビティでもある場合、並列スケーリングアクティビティをトリガーできます。

説明

並列スケーリングアクティビティと非並列スケーリングアクティビティは、期待されるインスタンス数機能が有効になっている場合にのみ区別されます。 [期待インスタンス数] 機能が無効になっている場合、スケーリングアクティビティの進行中に他のスケーリングアクティビティをトリガーすることはできません。

予想インスタンス数

非並列スケーリングアクティビティ

並列スケーリング活動以外のスケーリング活動は、非並列スケーリング活動です。 非並列スケーリングアクティビティが進行中の場合、他のスケーリングアクティビティをトリガーすることはできません。

説明

並列スケーリングアクティビティと非並列スケーリングアクティビティは、期待されるインスタンス数機能が有効になっている場合にのみ区別されます。 [期待インスタンス数] 機能が無効になっている場合、スケーリングアクティビティの進行中に他のスケーリングアクティビティをトリガーすることはできません。

予想インスタンス数

安定したインスタンス

安定したインスタンスとは、スケーリンググループでサービス中、保護中、またはスタンバイ状態にあるECSインスタンスを指します。

インスタンスライフサイクル

スケーリングプロセス

スケーリングプロセスとは、スケールアウト、スケールイン、ヘルスチェック、スケジュールタスク、イベントトリガータスクなど、手動で中断および再開できるプロセスのことです。 スケーリングプロセスは、プロセスレベルでスケーリンググループを制御するのに役立ちます。

スケーリンググループ内のインスタンスのライフサイクル

スケーリンググループ内のECSインスタンスまたはエラスティックコンテナインスタンスのライフサイクルは、インスタンスが作成されてからリリースされるまでのプロセスを指します。 ECSインスタンスまたはエラスティックコンテナインスタンスのライフサイクル管理モードは、インスタンスの作成方法によって異なります。

  • インスタンスがAuto Scalingによって自動的に作成される場合、インスタンスのライフサイクルはスケーリンググループによって管理されます。

  • インスタンスが手動で作成され、スケーリンググループがインスタンスのライフサイクルを管理できるようにした場合、インスタンスのライフサイクルはスケーリンググループによって管理されます。 スケーリンググループでインスタンスのライフサイクルを管理できない場合は、インスタンスのライフサイクルを手動で管理する必要があります。

インスタンスライフサイクル

ライフサイクルフック

ライフサイクルフックを使用すると、スケーリンググループに追加または削除されているECSインスタンスまたはエラスティックコンテナインスタンスがPending状態になります。 ECSインスタンスまたはエラスティックコンテナインスタンスがPending状態になった後、それらに対してカスタム操作を実行できます。 たとえば、ECSインスタンスまたはエラスティックコンテナインスタンスの作成後、ライフサイクルフックを使用してインスタンスをPending状態にすることができます。 インスタンスでテストを実行して、サービスの可用性を確認できます。 その後、Auto Scalingはインスタンスをバックエンドサーバーとして関連付けられたSLBインスタンスに追加します。

ライフサイクルフックの作成

クールダウン時間

クールダウン時間は、スケーリンググループでスケーリングアクティビティが完了した後、Auto Scalingが新しいスケーリングアクティビティをトリガーできない期間を指します。 クールダウン期間中、Auto ScalingはCloudMonitorからのイベントトリガータスクのすべてのスケーリングアクティビティ要求を拒否します。 これにより、メトリック値の変動によってスケーリングアクティビティが頻繁にトリガーされるのを防ぎます。

クールダウン期間