このトピックでは、Function Compute (FC) の機能リリースとドキュメントの更新について説明します。
2025年12月
機能名 | 変更タイプ | 説明 | 関連ドキュメント |
GPU ハイブリッドインスタンスモード (深セン、上海で利用可能) | 新規 | 常駐インスタンスとオンデマンドインスタンスのハイブリッドモードをサポートします。常駐インスタンスは安定したトラフィックを処理し、オンデマンドインスタンスはピーク負荷時に自動的にスケールアップします。アイドル状態のオンデマンドインスタンスは低コスト状態に移行します。これにより、安定性と可用性を維持しながらコストを削減します。 | |
すべての GPU タイプでリクエストベースの自動スケーリングをサポート | 新規 | すべての GPU タイプで、リクエスト量に基づく自動スケーリングをサポートするようになりました。システムはリアルタイムの同時リクエスト数に基づいてインスタンスを動的に作成および解放します。これにより、リソース消費をビジネス負荷に合わせ、非永続的なタスクに対して柔軟なコスト削減ソリューションを提供します。(注:新規インスタンスではコールドスタートが発生します。遅延の影響を受けやすいサービスの場合は、プロビジョニング済みインスタンスを設定してください。) | |
GPU イメージサイズの制限を 30 GB に引き上げ | 最適化 | GPU 関数のデプロイで使用される圧縮イメージの最大サイズが 15 GB から 30 GB に増加しました。これにより、大規模な依存関係や大規模言語モデル (LLM) を持つイメージのデプロイ成功率が向上します。また、イメージの分割やマルチステージビルドにかかるコストも削減されます。 | |
PolarDB 動的マウント (香港 (中国)、米国西部、シンガポールで利用可能) | 新規 | PolarDB ストレージディレクトリの動的マウントをサポートします。これにより、異なるインスタンス間で永続データや大規模モデルの重みファイルを共有できます。データアクセス性能を向上させ、複雑なエンタープライズアプリケーションの配信と O&M 効率を最適化します。 | |
OSS 動的マウント (香港 (中国)、米国西部、シンガポールで利用可能) | 新規 | サービスの再起動やイメージの再構築なしに、実行時に OSS バケットディレクトリを動的にマウントまたはアンマウントします。この機能は、コンピューティングと大規模な非構造化データを分離します。モデルのトレーニングデータの読み込みやマルチメディアコンテンツのストリーミングを簡素化します。 | |
HTTP トリガーのネイティブ CORS ポリシー設定 | 新規 | ネイティブのオリジン間リソース共有 (CORS) ルールを設定できます。必要に応じて、許可されるオリジン、リクエストメソッド、ヘッダー、プリフライトリクエストのキャッシュ時間をカスタマイズできます。これにより、追加のミドルウェアコードを記述することなく、ブラウザからのクロスドメイン呼び出しを安全に処理できます。 | |
コンソールの概要ページのアップグレードと FunctionQ アシスタント | 最適化 | FC の概要ページが再設計され、コストセンター、Resource Management、ソリューション+AI のセクションが追加されました。新しい FunctionQ インテリジェント開発アシスタントは、開発者に正確なドキュメントインデックスと技術サポートを提供します。 |
2025年11月
機能名 | 変更タイプ | 説明 | 関連ドキュメント |
GPU と ARMS の統合による LLM の可観測性のサポート | 新規 | 関数インスタンス内にサイドカーモードで OpenTelemetry Collector をデプロイします。これにより、LLM 推論エンジンによって公開される Prometheus メトリック (トークンスループットやリクエストレイテンシなど) を自動的に収集およびレポートします。これにより、LLM サービスの本番環境レベルでの、視覚的でアラート対応可能なリアルタイムモニタリングが可能になります。 | |
カスタムイメージランタイムで DevPods をサポート | 新規 | DevPod は、完全なクラウドベースのコンテナ開発環境を提供します。VS Code、Jupyter、ターミナルを統合しています。DevPod は、カスタムイメージ、永続ストレージ、リモートデバッグをサポートしており、AI モデル開発に最適です。 | |
常駐リソースプールの弾性ポリシー | 新規 | GPU 常駐リソースプールは、リソース使用率を向上させるために、リクエストベースの弾力性、スケジュールされた弾力性、メトリックベースのスケーリングをサポートするようになりました。 | |
ウランチャブコンプライアンスクラウドのローンチ | 新規 | 中国 (ウランチャブ) リージョンで専用クラウドと一般産業クラウドをローンチしました。 | |
オンデマンドインスタンスの遅延リリースが軽量休止をサポート | 新規 | CPU と GPU の両方のオンデマンドインスタンスが遅延リリース機能をサポートします。遅延リリースモードでは、両方のインスタンスタイプが軽量休止の課金をサポートします。GPU オンデマンドインスタンスの遅延リリース機能は、現在 WebSocket 接続の軽量休止をサポートしていません。 |
2025年10月
機能名 | 変更タイプ | 説明 | 関連ドキュメント |
オンデマンドインスタンスの遅延リリース | 新規 | リクエスト処理後のログのアップロードやデータの同期など、バックグラウンドの非同期タスクには、遅延リリース機能を使用します。これにより、タスクの中断やデータ損失を防ぎます。遅延リリース時間を設定すると、システムは vCPU 使用率に基づいて、オンデマンドインスタンスを自動的にアクティブに保つか、アイドル状態に切り替えるか、タイムアウト後にリクエストがない場合は破棄します。 | |
動的 NAS マウント | 新規 | 動的 NAS マウント機能を使用して、関数インスタンスの各ユーザーセッションを File Storage NAS の専用サブディレクトリに動的にマウントします。これにより、マルチテナント環境で永続データの安全な隔離が提供されます。 | |
新しい GPU タイプのサポート | 新規 | Hopper.2 と Blackwell.1 の 2 つの新しい GPU タイプのサポートが追加されました。 |
2025年9月
機能名 | 変更タイプ | 説明 | 関連ドキュメント |
HTTP トリガーの gRPC サポート | 新規 | Function Compute は gRPC プロトコルをサポートします。HTTP トリガーを使用して gRPC サービスを直接トリガーできます。関数は gRPC サーバーとして機能し、ストリーミングおよび非ストリーミングのクライアントリクエストを処理します。また、サーバーレスアーキテクチャの弾性スケーリングと完全マネージド機能の恩恵も受けられます。 | |
MCP Streamable アフィニティ | 新規 | MCP Streamable HTTP アフィニティ機能を有効にすると、同じ MCP セッションからのリクエストを、セッションを作成したバックエンド関数インスタンスにルーティングします。MCP Streamable HTTP セッションが初期化されると、FC は関数の応答の HTTP ヘッダーにある Mcp-Session-Id フィールドを解析します。その後、この ID をプラットフォーム上のセッションに関連付けます。同じ Mcp-Session-Id を持つ後続のリクエストは、同じ MCP Streamable HTTP セッションの一部と見なされ、セッションを初期化したインスタンスにルーティングされます。 | |
セッションライフサイクル管理 | 新規 | セッションの管理性を向上させるため、FC は HeaderField および Cookie アフィニティのためのセッション API 管理を導入します。これにより、セッションが明示的なリソースにアップグレードされ、完全なライフサイクル管理 API が提供されます。セッションの作成、クエリ、更新、削除が可能です。 |
2025年8月
機能名 | 変更タイプ | 説明 | 関連ドキュメント |
トレース分析機能 | 新規 | FC は Alibaba Cloud Managed Service for OpenTelemetry と統合されました。このサービスは、デファクトスタンダードである OpenTelemetry の W3C プロトコルに基づいています。分散アプリケーションにおけるパフォーマンスボトルネックを容易に特定し、診断するのに役立ちます。これにより、サーバーレスアーキテクチャにおける開発および O&M 効率が大幅に向上します。 | |
Basic 認証 | 新規 | カスタムドメイン名または HTTP トリガーに対して Basic 認証を有効にします。クライアントは、設定されたユーザー名とパスワードの Base64 エンコードされた認証情報をリクエストに含める必要があります。認証情報が検証された後にのみ、バインドされた関数サービスへのアクセスが許可されます。 |
2025年7月
機能名 | 変更タイプ | 説明 | 関連ドキュメント |
セッション保持 | 新規 | セッション保持機能は、同じクライアントからのリクエストが一定期間、同じ関数インスタンスにルーティングされることを保証します。その主な目的は、特にステートフルサービスにおいてセッションの継続性を維持することです。 | |
インスタンス隔離 | 新規 | AI サンドボックスの隔離されたランタイム環境の需要に応えるため、FC はインスタンス隔離を導入します。この機能により、インスタンスは単一のリクエストまたは単一セッション内のすべてのリクエストのみを処理できます。リクエストまたはセッションが終了するとインスタンスは解放されます。これにより、安全で信頼性が高く、弾力的でコスト効率の良いサンドボックスランタイム環境が提供されます。 | |
FC とリソースグループの統合 | 新規 | FC リソースをより効率的に管理するために、リソースグループを使用してリソースをグループ化します。リソースグループを使用すると、部門、プロジェクト、環境などのディメンションでリソースをグループ化できます。Resource Access Management (RAM) と組み合わせることで、単一の Alibaba Cloud アカウント内でリソースの隔離と詳細な権限管理を実現できます。 | |
常駐リソースプール (サブスクリプション) | 新規 | 常駐リソースプールを購入して、特定の仕様の計算能力リソースを事前に確保します。その後、必要に応じて特定のタイプの常駐インスタンスを関数に割り当てることができます。これにより、ビジネスの安定性が確保され、固定的で管理可能なコストが提供されます。 |
2025年5月
機能名 | 変更タイプ | 説明 | 関連ドキュメント |
新しいコマンドタイプの Initialize フック | 新規 | Initialize フックは、コード呼び出しタイプに加えてコマンドタイプをサポートするようになりました。インスタンス起動後に関数に HTTP リクエストを送信して初期化するためのコマンドを設定できます。 典型的なシナリオは、Initializer フックにプリフェッチスクリプトを設定することによる AI 推論アプリケーションでのモデルのプリフェッチです。 現在、コマンドタイプの Initializer フックをサポートしているのは GPU 関数のみです。 | |
Bearer 認証 | 新規 | Bearer 認証では、FC コンソールで関数へのアクセスを許可するトークン情報を設定します。クライアントがリクエストを開始するとき、Authorization ヘッダーに有効なトークンを付与します。リクエスト内のトークンがトリガーで設定されたトークンと一致する場合にのみ、関数にアクセスできます。 |
2025年4月
機能名 | 変更タイプ | 説明 | 関連ドキュメント |
関数管理の強化 | 最適化 | FC コンソールの関数リストは、大規模な関数リソースを効率的に管理するために、以下のように最適化されています。
| |
Function Compute 3.0 が OSS オブジェクトアクセスポイントをサポート | 新規 | アクセスポイントを使用すると、OSS の | |
Function Compute 3.0 が ZIP ファイル展開をサポート | 新規 | Function Compute は ZIP ファイル展開トリガーをサポートします。展開ルールを設定した後、ルールに一致する ZIP ファイルを OSS バケットにアップロードすると、自動的に関数がトリガーされます。関数はファイルを解凍し、抽出されたファイルをターゲットディレクトリに書き込みます。 |
2025年3月
機能名 | 変更タイプ | 説明 | 関連ドキュメント |
ALB トリガー | 新規 | Function Compute は Application Load Balancer (ALB) をイベントソースとしてサポートします。Function Compute タイプのサーバーグループを ALB インスタンスに追加して、ALB から Function Compute にリクエストを転送し、関数を呼び出します。 |
2025年2月
機能名 | 変更タイプ | 説明 | 関連ドキュメント |
gRPC プロトコルのサポート | 新規 | ドメイン名を関数にバインドした後、gRPC クライアントを使用して gRPC リクエストを送信できます。関数は gRPC サーバーとして機能し、gRPC リクエストを処理して結果をクライアントに返すことができます。 |