プロビジョニングされたインスタンスは、ピーク時のコールドスタートによるリクエストの待ち時間を減らすのに役立ちます。 プロビジョニングされたインスタンスに対して、スケジュールされたスケーリングポリシーや水位スケーリングポリシーなどの自動スケーリングポリシーを設定して、リソース使用率を改善し、リソースの無駄を防ぐことができます。
制限事項
次の表は、異なるリージョンでプロビジョニングされたインスタンスのスケールアウト率の制限を示しています。
リージョン | バーストインスタンスの上限 | インスタンスの成長率の上限 |
中国 (杭州) 、中国 (上海) 、中国 (北京) 、中国 (張家口) 、中国 (深セン) | 300 | 1分あたりの300 |
他のリージョン | 100 | 100/ 分 |
より高速なスケーリングが必要な場合は、DingTalkグループ64970014484に参加してテクニカルサポートを行います。
プロビジョニング済みインスタンスの設定
手順1: プロビジョニング済みインスタンスポリシーの作成
次のいずれかの方法を使用して、プロビジョニングされたインスタンスポリシーを作成できます。
ページで、プロビジョニング済みインスタンスポリシーを作成します。 このメソッドはこのトピックで使用されます。
ページで、プロビジョニング済みインスタンスポリシーを作成します。
プロビジョニングされたインスタンスを設定して、コールドスタートの問題を軽減し、レイテンシーに敏感なオンラインサービスのパフォーマンスを向上させることができます。 プロビジョニングされた関数インスタンスを設定した後、プロビジョニングされたインスタンスはアクティブのままです。 これらのプロビジョニングされたインスタンスは、リクエストが処理されない場合でも、リリースされない前に課金されます。 課金の詳細については、「課金の概要」をご参照ください。
Function Compute コンソールにログインします。 左側のナビゲーションウィンドウで、[関数] をクリックします。 上部のナビゲーションバーで、リージョンを選択します。 [関数] ページで、管理する関数をクリックします。
ページで、[プロビジョニング済みインスタンスポリシーの作成] をクリックします。
[プロビジョニング済みインスタンスポリシーの作成] パネルで、プロビジョニング済みインスタンスの数を指定します。
[プロビジョニング済みインスタンスポリシーの作成] パネルで、プロビジョニング済みインスタンスの自動スケーリングポリシーを設定します。
スケジュールされたスケーリング
スケジューリングされたスケーリングは、明確な周期パターンまたは予測可能なトラフィックピークを有する関数に適している。 同時呼び出しの数がスケジュールされたスケーリングポリシーの同時実行容量よりも大きい場合、過剰なリクエストは処理のためにオンデマンドインスタンスに送信されます。 詳細については、「スケジュールされたスケーリング」をご参照ください。
前の図の例では、タイムゾーンはアジア /上海 (UTC + 8) に設定されており、ポリシーは2024年8月1日から2024年8月30日まで有効です。 この期間中、プロビジョニングされたインスタンスは毎週月曜日の10:00に50に増加し、毎週月曜日の22:00に10に減少します。
水位スケーリング
水位スケーリングは、プロビジョニングされたインスタンスの同時使用率またはリソース使用率に基づいて、プロビジョニングされたインスタンスを1分ごとにスケーリングします。 詳細については、「水位スケーリング」をご参照ください。
上の図の例では、タイムゾーンはアジア /上海 (UTC + 8) に設定されており、ポリシーは8月1日の10:00 (2024) から2024 8月30日の10:00まで有効になります。 プロビジョニングされたインスタンスの同時実行使用率が追跡され、しきい値が60% に設定されます。 同時実行使用率が60% を超えると、プロビジョニングされたインスタンスはスケールアウトされます。 同時実行使用率が60% より低い場合、プロビジョニングされたインスタンスはスケールインされます。 プロビジョニングされたインスタンスの最大数は100、最小数は10です。
ステップ2: ポリシーの確認
関数をクリックし、
ページに移動して、[関数プロビジョニングインスタンス (カウント)] でプロビジョニングされたインスタンスの数を表示します。プロビジョニング済みインスタンスポリシーの変更または削除
[関数の詳細] ページの [設定] タブで、左側のナビゲーションツリーの [プロビジョニング済みインスタンス] タブをクリックして、作成されたポリシーを表示します。 ポリシーを変更または削除するには、[操作] 列の [変更] または [削除] をクリックします。
関連ドキュメント
オンデマンドモードとプロビジョニングモードの基本的な概念と課金方法の詳細については、「インスタンスタイプと使用モード」をご参照ください。
オンデマンドモードおよびプロビジョニングモードの関数インスタンスの制限、動作、およびスケーリングルールの詳細については、「自動インスタンススケーリングの制限とルール」をご参照ください。
デフォルトでは、同じリージョンのAlibaba Cloudアカウント内のすべての関数は、前述のスケーリング制限を共有します。 関数のインスタンス数を制限するには、同時インスタンスの最大数を設定します。 詳細については、「同時インスタンスの最大数の指定」をご参照ください。 同時インスタンスの最大数を設定した後、Function Computeは、関数の実行中インスタンスの総数が指定された制限に達すると、スロットリングエラーを返します。