すべてのプロダクト
Search
ドキュメントセンター

Platform For AI:Lingjunクラスターの作成

最終更新日:Jul 22, 2024

クラスターは、PAI-Lingjun AI Computing Service (Lingjun) を実行するために必要なリソースのグループで、計算ノードLingjun接続インスタンスを含みます。 クラスター内のノードをノードグループに分割できます。 各ノードグループには、同じ構成を持つ1つ以上の計算ノードが含まれています。 このトピックでは、Lingjunクラスターを作成する方法について説明します。

前提条件

  • コンピューティングノードLingjun接続インスタンスは、ビジネス要件に基づいて購入されます。 詳細については、「Lingjun AI Computing Serviceの有効化とリソースの購入」をご参照ください。

  • Lingjunの使用に必要なその他のAlibaba Cloudサービス (Cloud Enterprise Network (CEN) 、Application Real-Time Monitoring Service (ARMS) 、Virtual Private Cloud (VPC) など) は、ビジネス要件に基づいてアクティブ化および構成されます。 詳細については、「その他のAlibaba Cloudサービスの有効化と設定」をご参照ください。

Lingjunクラスターの作成と設定

  1. Intelligent Computing Lingjunコンソールにログインします。

  2. 左側のナビゲーションウィンドウで、[リソースとノード]> [クラスター管理] を選択します。

  3. [クラスター管理] ページで、[クラスターの作成] をクリックします。

  4. [マネージドクラウドクラスターの作成] ページで、[基本的なLingjunクラスターサービス] セクションに移動し、[クリック] をクリックしてクラスターを作成します。

    画面上の指示に従って、[クラスターとグループ] および [ネットワーク設定] の手順でパラメーターを設定します。

クラスターとノードグループの設定

ビジネス要件に基づいて複数のクラスターを計画し、クラスター内の計算ノードをノードグループに分割できます。 クラスターとコンピュートノードを計画することで、コンピュートノードのリソース使用率を向上させることができます。 クラスターと計算ノードを計画したら、このセクションで説明する手順を実行して、クラスターとノードグループを設定します。

image
  1. クラスター情報を設定します。

    クラスター名、クラスターノードのルートパスワード、リソースグループなどの情報を指定します。 リソースグループの作成方法の詳細については、「リソースグループの作成」をご参照ください。

  2. [グループの作成] をクリックして、ノードグループを作成します。

    1. [グループの作成] ダイアログボックスで、グループ名と、グループに属するノードに関する情報 (計画に基づくノードモデルやイメージなど) を指定します。

    2. ノードインスタンスの横にある [ノードインスタンスの選択] をクリックして、グループに追加するノードを選択します。

  3. 保存をクリックして、次のステップに進みます。 ネットワーク設定

ネットワークの設定

Lingjunクラスターは、最初は分離されたネットワークに存在します。 Lingjun接続インスタンスCENインスタンスを使用してクラスターをAlibaba Cloudパブリッククラウドに接続し、ネットワーク接続を監視するためにVPCを指定する必要があります。

image

上の図に示すように、ネットワークトポロジには次のコアネットワークが含まれます。

  • クラスターネットワーク: クラスターが計算ノードにIPアドレスを割り当てるために使用するCIDRブロック。 CIDRブロックはプライベートCIDRブロックです。

  • Monitoring network: ネットワーク接続の監視に使用されるVPC。

ネットワークを計画および構成するときは、上記のネットワークのCIDRブロックが互いに競合しないようにしてください。 ネットワークを計画したら、次の手順を実行して、クラスターのネットワークを構成できます。

説明

クラスターのネットワークを設定した後、CENインスタンスのネットワーク設定が正しいかどうかを確認する必要があります。 CENインスタンスの設定方法の詳細については、「その他のAlibaba Cloudサービスの有効化と設定」トピックの「CEN設定」セクションをご参照ください。

  1. Lingjun VPDを設定します。

    • Lingjun仮想プライベートデータセンター (VPD) は、Lingjunクラスター内の計算ノードにIPアドレスを割り当てるために使用されます。 有効なプライベートCIDRブロックを入力します。

    • Lingjunサブネットは、Lingjun VPDのサブネットです。 Lingjun VPDとそのサブネットの詳細については、「Lingjun VPDの管理」をご参照ください。

    説明
    • 事前にLingjun VPDを計画する必要があります。 Lingjun VPDは、Lingjunクラスターが接続される他のネットワークのCIDRブロック (VPCやデータセンターのCIDRブロックなど) と競合することはありません。

    • Lingjun VPDで使用可能なIPアドレスの数によって、Lingjunクラスターにデプロイできるノードの最大数が決まります。 クラスターがスケールアップできないようにするには、サブネットマスクの長さが22ビットを超えるCIDRブロックを準備する必要があります。

  2. オプションです。 Lingjunサブネットのボンド割り当てポリシーを設定します。 特定のノードモデルを選択した場合、Lingjunノードの物理NICのボンド割り当てポリシーを設定する必要があります。 ボンドはLingjunノードに関連付けられています。 ボンド割り当てポリシーノードモデル割り当てポリシー、またはノード割り当てポリシーを設定して、ボンドを設定できます。

    債券割り当てポリシーの設定

    結合の数は、ノードモデルに基づいて変化する。 クラスタ内の結合の数は、クラスタ内のすべてのノードモデル間の結合の最大数に等しい。 クラスタの結合は、bondx形式で命名される。 xは0から始まります。

    例えば、ノードAに対するボンドの数が3であり、ノードBに対するボンドの数が4である場合、クラスタ内のボンドの数は4である。 クラスタ内の結合は、bond0からbond3までと名付けられる。 ノードAは、bond0、bond1、bond2のポリシーを使用します。

    説明

    クラスターに設定できるボンド割り当てポリシーは1つだけです。

    手順

    1. クラスターのボンド割り当てポリシーを設定します。

    2. オプションです。 デフォルトの債券割り当てポリシーを設定します。 ポリシーが割り当てられていない債券は、デフォルトの債券割り当てポリシーを使用します。 [すべて適用] を選択して、デフォルトの債券ポリシーをすべての債券に割り当てます。

    ノードモデル割り当てポリシーの設定

    クラスター内のノードモデルごとに、ノードモデルの割り当てポリシーを指定できます。 クラスター内のノードモデル割り当てポリシーの最大数は、クラスター内のノードグループの数に等しくなります。

    手順

    1. [モデルタイプ] をクリックします。 [AddModelタイプ] ダイアログボックスで、[モデル] ドロップダウンリストからノードモデルを選択します。

    2. ノードモデル割り当てポリシーを設定します。 ポリシーは、選択したモデルのすべてのノードに適用されます。

    ノード割り当てポリシーの設定

    クラスター内の各ノードにノード割り当てポリシーを設定できます。 ノードの異なる結合は、Lingjunクラスターの異なるCIDRブロックまたはサブネットに接続できます。

    手順

    1. [ノードポリシー] をクリックします。 [AddNodeポリシー] ダイアログボックスで、[ノード] ドロップダウンリストからノードを選択します。

    2. ノード割り当てポリシーを設定します。 選択したノードにポリシーが適用されます。

  3. Lingjun接続インスタンスを設定します。

    1. [権限付与] をクリックして、Lingjun接続インスタンスに他のAlibaba Cloudサービスへのアクセスを許可します。

      Lingjun接続インスタンスを使用して、LingjunクラスターをCENインスタンスに接続し、他のAlibaba Cloudサービスにアクセスできます。 したがって、Lingjunに他のAlibaba Cloudサービスへのアクセスを許可する必要があります。 詳細については、「付録: Lingjun接続インスタンスのサービスにリンクされたロール」をご参照ください。

    2. InstanceIDドロップダウンリストからLingjun接続インスタンスのIDを選択します。 Lingjun接続インスタンスは、Alibaba Cloudパブリッククラウドに接続するためにクラスターによって使用されます。

    3. CENドロップダウンリストからCENインスタンスを選択します。 クラスターは、Lingjun接続インスタンスを使用してCENインスタンスに接続されています。

      重要

      CENインスタンスにトランジットルーターを作成する必要があります。 トランジットルーターのリージョンは、Lingjunノードのリージョンと同じである必要があります。 詳細については、「トランジットルーター」をご参照ください。

  4. モニタリングネットワークを設定します。

    1. CEN インスタンスを設定します。 前の手順で作成したCENインスタンスのトランジットルーターにVPCを接続します。 VPCを作成するか、既存のVPCを使用できます。 詳細については、「その他のAlibaba Cloudサービスのアクティブ化と設定」トピックの「CEN設定」セクションをご参照ください。 VPCのvSwitchに少なくとも1つのアイドルIPアドレスがあることを確認します。 Lingjunクラスターは、このvSwitchを使用してLingjun接続インスタンスのネットワーク接続を監視します。

      重要
      • VPCを選択したトランジットルーターに接続する場合にのみ、ドロップダウンリストからVPCを選択できます。

      • Lingjun VPDと監視ネットワークとして使用されるVPCのCIDRブロックは互いに競合できません。また、監視ネットワークとして使用されるVPCのCIDRブロックは、Lingjunクラスターが接続される他のネットワークのCIDRブロック (他のVPCやデータセンターのCIDRブロックなど) と競合できません。

    2. VPCドロップダウンリストとスイッチ (VSwitch) ドロップダウンリストの横にあるimageアイコンをクリックします。 次に、作成したVPCとvSwitchを選択します。

  5. 保存をクリックして、次のステップに進みます。 ソフトウェアインスタンスの基本パラメータ。

クラスター設定の確認

[設定の確認] ステップで、クラスターの基本情報、ネットワーク情報、およびインスタンスパラメーターを確認し、[設定の送信] をクリックしてクラスターを作成します。 クラスターの作成後、[クラスター管理] ページに移動します。