すべてのプロダクト
Search
ドキュメントセンター

Platform For AI:インターネットまたはイントラネット経由でゲートウェイを介してサービスを呼び出す(デフォルト)

最終更新日:Feb 27, 2026

Elastic Algorithm Service (EAS) では、共有ゲートウェイと専用ゲートウェイの両方が提供されています。どちらもインターネットおよびイントラネット経由でのサービス呼び出しをサポートしており、呼び出しフローはほぼ同一です。ご要件に応じて、適切なゲートウェイおよびエンドポイントを選択してください。

ゲートウェイの選択

EAS では、共有ゲートウェイと専用ゲートウェイの 2 種類のゲートウェイが利用可能です。主な違いは以下のとおりです:

比較項目

共有ゲートウェイ

専用ゲートウェイ

インターネット経由の呼び出し

デフォルトでサポートされます。

有効化後にサポートされます。

イントラネット経由の呼び出し

デフォルトでサポートされます。

有効化後にサポートされます。

コスト

無料です。

有料です。

適用シナリオ

帯域幅を共有します。トラフィック量が少なく、カスタムアクセスポリシーの設定が不要なサービスに最適です。テスト環境でのご利用を推奨します。

専用帯域幅を提供します。高いセキュリティ性・安定性・パフォーマンスが求められ、大量のトラフィックを処理するサービスに最適です。本番環境でのご利用を推奨します。

サービス構成方法

デフォルト構成です。そのままご利用いただけます。

事前に作成する必要があります。その後、サービスのデプロイ時に選択します。詳細については、「専用ゲートウェイの使用」をご参照ください。

エンドポイントの選択

  • インターネットエンドポイント:インターネットに接続可能な任意の環境でご利用ください。リクエストは EAS 共有ゲートウェイを経由し、オンラインの EAS サービスに送信されます。

  • VPC エンドポイント:呼び出し元プログラムと EAS サービスが同一リージョンにデプロイされている場合にご利用ください。同一リージョン内の VPC は相互に接続可能です。

重要

VPC 内部ネットワーク経由の呼び出しは、ネットワークパフォーマンスのオーバーヘッドを回避できるため、インターネット経由の呼び出しよりも高速です。また、内部ネットワークトラフィックは通常無料であるため、コストも低減できます。

サービスの呼び出し手順

サービスを呼び出すには、まずそのエンドポイントとトークンを取得します。その後、ご使用のモデルサービスに応じたリクエストを構築します。

ステップ 1:エンドポイントとトークンの取得

サービスをデプロイすると、EAS が自動的に必要なエンドポイントおよび認証トークンを生成します。

重要

コンソールに表示されるエンドポイントはベース URL です。完全なリクエスト URL を構成するには、正しい API パスを追加する必要があります。404 Not Found エラーの最も一般的な原因は、誤ったパスの指定です。

  1. Inference Service タブで、対象のサービス名をクリックして Overview ページを開きます。Basic Information セクションで、View Endpoint Information をクリックします。

  2. Invocation Method パネルから、エンドポイントとトークンを取得します。ご要件に応じて、インターネットエンドポイントまたは VPC エンドポイントのいずれかを選択してください。以降、これらの値をそれぞれ <EAS_ENDPOINT> および <EAS_TOKEN> と表記します。

    image

ステップ 2:リクエストの構築と送信

インターネットエンドポイントまたは VPC エンドポイントのいずれを利用する場合でも、リクエスト構造はほぼ同一です。異なるのは URL のみです。標準的なリクエストには、以下の 4 つのコア要素があります:

  • HTTP メソッド:最も一般的なのは POST および GET です。

  • URL:ベースエンドポイント <EAS_ENDPOINT> に特定の API パスを結合します。

  • リクエストヘッダー:最低限、Authorization: <Token> を含める必要があります。

  • リクエストボディ:そのフォーマット(例:JSON)は、デプロイ済みのモデルの API 仕様によって異なります。

    重要

    ゲートウェイを介して呼び出す場合、リクエストボディは 1 MB を超えてはなりません。

サンプル

サンプル 1:Model Gallery からモデルを呼び出す

Model Gallery のモデルの Overview ページに移動します。このページには、curl または Python コードによる正確な API 呼び出し例(完全な URL パスおよびリクエストボディのフォーマットを含む)が通常表示されます。

cURL コマンド

cURL の基本構文は curl [options] [URL] です:

  • オプションは任意です。代表的なものとして、-X(HTTP メソッドの指定)、-H(ヘッダーの指定)、-d(リクエストボディの指定)などがあります。

  • URL は、呼び出す HTTP エンドポイントです。

image

Python コード

この例では Qwen3-Reranker-8B モデルを使用します。URL およびリクエストボディは cURL の例とは異なります。必ずモデルの説明ページをご確認ください。

image

サンプル 2:大規模言語モデル(LLM)の呼び出し

大規模言語モデル(LLM)サービスでは、OpenAI 互換 API が提供されることが多く、チャット完了エンドポイント(/v1/chat/completions)や完了エンドポイント(/v1/completions)などが該当します。

たとえば、vLLM を使用してデプロイされた DeepSeek-R1-Distill-Qwen-7B モデルのチャット完了エンドポイントを呼び出す場合、以下の要素を使用します(詳細については、「LLM の呼び出し」をご参照ください):

  • HTTP メソッド: POST

  • URL: <EAS_ENDPOINT>/v1/chat/completions

  • リクエストヘッダー: Authorization: <Token> および Content-Type: application/json

  • リクエストボディ:

    {
        "model": "DeepSeek-R1-Distill-Qwen-7B",
        "messages": [
        {
            "role": "system",
            "content": "You are a helpful assistant."
        },
        {
            "role": "user",
            "content": "hello!"
        }
        ]
    }

例: <EAS_ENDPOINT> が http://16********.cn-hangzhou.pai-eas.aliyuncs.com/api/predict/test の場合です。

curl http://16********.cn-hangzhou.pai-eas.aliyuncs.com/api/predict/test/v1/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: *********5ZTM1ZDczg5OT**********" \
-X POST \
-d '{
    "model": "DeepSeek-R1-Distill-Qwen-7B",
    "messages": [
    {
        "role": "system",
        "content": "You are a helpful assistant."
    },
    {
        "role": "user",
        "content": "hello!"
    }
    ]
}' 
import requests

# 実際のエンドポイントに置き換えてください
url = 'http://16********.cn-hangzhou.pai-eas.aliyuncs.com/api/predict/test/v1/chat/completions'
# 実際のトークンに置き換えて Authorization を設定してください
headers = {
    "Content-Type": "application/json",
    "Authorization": "*********5ZTM1ZDczg5OT**********",
}
# モデルの要求するデータ形式に基づいてリクエストボディを構築します。
data = {
    "model": "DeepSeek-R1-Distill-Qwen-7B",
    "messages": [
        {
            "role": "system",
            "content": "You are a helpful assistant."
        },
        {
            "role": "user",
            "content": "hello!"
        }
    ]
}
# リクエストを送信します
resp = requests.post(url, json=data, headers=headers)
print(resp)
print(resp.content)

その他のユースケース

よくある質問

サービス呼び出しに関するよくある質問」をご参照ください。