安定拡散WebUI、ComfyUI、検索拡張世代 (RAG) 、TensorRTなど、高速化のためにGPU高速化インスタンスを必要とする一般的なAIプロジェクトを使用する必要がある場合は、イメージを使用して関数アプリケーションをデプロイすることをお勧めします。 これにより、コンテナイメージを関数の成果物として使用して、開発と配信の効率を向上させることができます。
関数を作成
Function Computeコンソールにログインします。 左側のナビゲーションウィンドウで、[関数] をクリックします。
上部のナビゲーションバーで、リージョンを選択します。 [関数] ページで、[関数の作成] をクリックします。
[関数の作成] ページで、[GPU関数] を選択します。 次のパラメーターを設定し、[作成] をクリックします。
基本設定: 関数名を設定します。
Code: 関数のランタイムとコード情報を設定します。
パラメーター
説明
例
ランタイム
サンプルイメージの使用: イメージ関数をすばやくデプロイするために、Function Computeが提供するサンプルイメージを選択します。 [Container Images] パラメーターの下の画像リストから画像を選択します。
Container Registry Imagesの使用: Container imageパラメーターの下にあるContainer Registry Imagesの選択をクリックします。 表示される [コンテナーイメージの選択] パネルで、[コンテナーイメージインスタンス] および [コンテナーレジストリリポジトリ] パラメーターを指定し、イメージリストで目的のイメージを見つけて、右側の [操作] 列の [選択] をクリックします。
サンプル画像の使用
コンテナイメージ
イメージを選択します。
SpringBoot Webアプリケーションのサンプルイメージ
Startupコマンド
プログラムの起動コマンドを設定します。 起動コマンドが設定されていない場合は、イメージ内のEntrypointまたはCMD命令が使用されます。
なし
リスニングポート
コード内のHTTPサーバーがリッスンするポートを指定します。
9000
詳細設定: インスタンス関連情報や機能実行タイムアウト時間など、機能の詳細設定を設定します。
パラメーター
説明
例
GPUタイプ
GPUカードタイプを指定します。 GPUカードタイプの詳細については、「インスタンスタイプと使用モード」をご参照ください。
Teslaシリーズ
リソースプランの仕様
ビジネス要件に基づいて、GPUメモリサイズ、vCPU容量、メモリ容量などの機能の仕様を指定します。 課金の詳細については、「課金の概要」をご参照ください。
e= 4 GB GPUメモリSiz
vCPU容量= 2 vCPU
メモリ容量= 4 GB
一時ディスクのサイズ
業務要件に基づいて、一時的にファイルを格納するために使用するディスクのサイズを指定します。 デフォルト値: 512 MB。
有効な値:
512 MB: このサイズの一時ディスクの使用に対しては課金されません。 Function Computeは、512 MBの空きディスク容量を提供します。
10 GB: 9.5 GBのディスクサイズに基づいて課金されます。
説明データは一時ディスク内のすべてのディレクトリに書き込むことができ、一時ハードディスクのスペースを共有します。
一時ディスクのライフサイクルは、基盤となるインスタンスのライフサイクルと一致しています。 インスタンスがシステムによってリサイクルされると、ディスク上のデータも消去されます。 ファイルを永続化するには、File Storage NAS (NAS) またはObject Storage Service (OSS) を使用できます。 詳細については、「NASファイルシステムの設定」および「OSSファイルシステムの設定」をご参照ください。
512 MB
実行タイムアウト期間
関数実行のタイムアウト時間を指定します。 単位は秒です。 デフォルト値は60、最大値は86400です。
60
インスタンスの同時実行
インスタンスの同時実行性を指定します。 Function Computeは、各インスタンスが一度に複数のリクエストを処理できるインスタンス同時実行機能をサポートしています。
20
タイムゾーン
関数のタイムゾーンを指定します。 タイムゾーンを設定すると、指定されたタイムゾーン値を持つ環境変数TZが自動的に関数に追加されます。
UTC
関数の役割
関数のRAM (Resource Access Management) ロールを指定します。 Function Computeはこのロールを引き受けて、Alibaba Cloudリソースにアクセスするための一時キーを生成し、コードに渡します。 詳細については、「他のAlibaba Cloudサービスへのアクセス権限付与」をご参照ください。
mytestrole
VPCへのアクセス
Virtual Private Cloud (VPC) リソースへのアクセスを許可するかどうかを指定します。 詳細については、「ネットワーク設定の構成」をご参照ください。
はい
[VPC]
VPCを指定します。 このパラメーターは、[VPへのアクセス] [C] を [はい] に設定した場合に必要です。 新しいVPCを作成するか、ドロップダウンリストからアクセスする既存のVPCのIDを選択します。
fc.auto.create.vpc.1632317 ****
vSwitch
vSwitchを指定します。 このパラメーターは、[VPCへのアクセス] が [はい] に設定されている場合に必要です。 新しいvSwitchを作成するか、ドロップダウンリストから既存のvSwitchのIDを選択します。
fc.auto.create.vswitch.vpc-bp1p8248 ****
[セキュリティグループ]
セキュリティグループを指定します。 このパラメーターは、[VPCへのアクセス] が [はい] に設定されている場合に必要です。 セキュリティグループを作成するか、ドロップダウンリストから既存のセキュリティグループを選択します。
fc.auto.create.SecurityGroup.vsw-bp15ftbbbbd ****
デフォルトNICによるインターネットへのアクセス許可
デフォルトNICからインターネットへのアクセスを許可するかどうかを指定します。 [いいえ] を選択した場合、関数はFunction ComputeのデフォルトNICを介してインターネットにアクセスできません。
重要静的パブリックIPアドレス機能を使用する場合は、[デフォルトNICからインターネットへのアクセスを許可] を [いいえ] に設定する必要があります。 それ以外の場合、設定された静的パブリックIPアドレスは有効になりません。 詳細については、「静的パブリックIPアドレスの設定」をご参照ください。
はい
ロギング
ロギング機能を有効にするかどうかを指定します。 有効な値:
有効化: ロギング機能を有効にします。 関数の実行ログはSimple Log Serviceに永続的に保存され、コードのデバッグ、障害分析、およびデータ分析に使用できます。
無効: ロギング機能を有効にしません。 関数の実行ログは、Simple Log Serviceを介して保存および照会することはできません。
有効
環境変数: 関数ランタイムで環境変数を設定します。 詳細については、「環境変数の設定」をご参照ください。
関数の変更
関数の作成後、イメージを変更する必要がある場合は、[設定] ページの [ランタイム] タブで関数を変更できます。
環境変数やログなどの他の設定を変更する方法の詳細については、「関数の設定」をご参照ください。
関数の削除
Function Computeコンソールにログインし、[関数] をクリックして、削除する関数を見つけ、[操作] 列の [詳細] > [削除] を選択して関数を削除します。
[関数の詳細] ページで、[関数の削除] をクリックして関数を削除します。
詳細情報
Function Computeは、イベント関数、web関数、タスク関数、およびさまざまなシナリオのGPU関数の4種類の関数を提供します。 シナリオに基づいて関数タイプを選択する方法については、「関数を作成するメソッドの選択」をご参照ください。
Function Computeコンソールに加えて、Function Compute APIを使用して関数を管理することもできます。 詳細については、「Function」をご参照ください。
関数の実行がタイムアウトした場合は、関数の実行がタイムアウトし、エラー "function time out after" が報告された場合はどうすればよいですか?を参照して問題のトラブルシューティングを行います。
頻繁に使用されない関数を呼び出すには、より長い時間がかかる場合があります。 詳細については、「あまり使用されない関数の呼び出しに時間がかかるのはなぜですか?」をご参照ください。 コールドスタートを軽減するために、プロビジョニング済みインスタンスを使用できます。 詳細については、「コールドスタートの影響を排除するためにインスタンスを存続させる方法は?」をご参照ください。
関数のARN (Alibaba Cloud Resource Name) を取得して、コード内の対応するリソースを検索する場合は、「関数のARNの取得」をご参照ください。