Lingjunリソースは、Alibaba Cloud Platform for AI (PAI) のAIコンピューティングエンジンの不可欠なコンポーネントとして、大規模で高密度なコンピューティング向けに設計されています。 Lingjunリソースは、高性能AIトレーニングとコンピューティングに合わせた異種コンピューティングパワーを提供します。 LingjunリソースをData Science Workshop (DSW) 、Deep Learning Containers (DLC) 、およびElastic Algorithm Service (EAS) で使用して、AIの開発、トレーニング、およびサービスの展開を容易にすることができます。 このトピックでは、リソースグループを作成してLingjunリソースを購入する方法について説明します。
概要
Lingjunリソース
Lingjunリソースは、Alibaba Cloudによって開発された次の機能を提供する新世代のインテリジェントコンピューティングリソースです。
高速リモートダイレクトメモリアクセス (RDMA) ネットワークアーキテクチャ
高性能通信ライブラリ
高性能加速ソフトウェア
GPU仮想化の技術ソリューション
Lingjunリソースは、高性能コンピューティングの要件を満たすことができます。
Lingjunリソースグループ
PAIは、PAIコンソールのリソースグループで購入して使用できる完全マネージドLingjunリソースを提供します。 Lingjunハードウェアリソースを購入した場合、リソースを半管理リソースとしてPAIコンソールに追加し、それらを使用してトレーニングジョブを実行できます。
制限事項
サポートされるリージョン
Lingjunのリソースは、中国 (ウランカブ) およびシンガポールリージョンでのみご利用いただけます。
サポートされているユーザー
Lingjunリソースを使用できるのは、ホワイトリストのユーザーのみです。 Lingjunリソースを使用してトレーニングジョブを実行する場合は、チケットを起票してホワイトリストへの参加を申請します。
サポートされるジョブタイプ
Lingjunリソースは、TensorFlow、PyTorch、ElasticBatch、およびMPIJobタイプのトレーニングジョブのみをサポートします。
アカウントと権限の要件
Alibaba Cloudアカウント: Alibaba Cloudアカウントを使用して、追加の権限なしですべての操作を実行できます。
RAMユーザー: Alibaba Cloudアカウントに連絡して、リソースプールを管理する権限を付与するか、AliyunPAIFullAccessポリシーをRAMユーザーにアタッチします。 詳細については、「RAMユーザーのカスタムポリシー」トピックの「リソースプールの管理権限」をご参照ください。
重要AliyunPAIFullAccessポリシーは、PAIのすべてのリソースと機能を管理する権限を提供します。 これらの権限を付与するときは注意してください。
依存関係
Lingjunリソースは、次のAlibaba Cloudサービスに依存しています。 Lingjunリソースを作成、購入、使用するには、これらのAlibaba Cloudサービスに精通してアクティブ化し、ビジネス要件に基づいてリソースを準備します。
VPC (必須)
Lingjunリソースを割り当てるときは、リソースを同じリージョンの仮想プライベートクラウド (VPC) に関連付け、vSwitchとセキュリティグループを設定する必要があります。 これにより、Lingjunリソースと他のAlibaba Cloudサービス間のネットワーク接続が保証されます。
インターネットNATゲートウェイとEIP (オプション)
Lingjunリソースはインターネットにアクセスする必要があります。 たとえば、インターネットからカスタムイメージを取得する必要がある場合があります。 この場合、SNATを有効にしてインターネットNATゲートウェイを設定し、EIP (elastic IP address) をインターネットNATゲートウェイに関連付ける必要があります。
詳細については、「インターネットNATゲートウェイのSNAT機能を使用したインターネットへのアクセス」をご参照ください。
OSS、NAS、およびCPFS (オプション)
LingjunリソースにDLCトレーニングジョブを送信するには、まずデータセットを作成する必要があります。 Lingjunリソースは、Object Storage Service (OSS) 、Apsara File Storage NAS (NAS) 、およびCloud Parallel File Storage (CPFS) データセットのみをサポートします。 詳細については、「一般的なプロセス」トピックの「データセットの準備」セクションをご参照ください。
手順
Lingjunリソースグループの作成
PAIコンソールの [リソースプール] ページに移動します。
[Intelligent Computing Lingjun resources] タブで、[リソースグループの作成] をクリックします。
[リソースグループの作成] ダイアログボックスで、次の表に示すパラメーターを設定し、[OK] をクリックします。
パラメーター
説明
データ型
[専用リソースグループ] を選択します。
リソースグループ名
命名規則に基づいてリソースグループ名を入力します。
Lingjunリソースの購入
専用リソースグループのLingjunリソースを購入するには、次の手順を実行します。 Lingjunリソースの課金の詳細については、「Lingjunリソースの課金 (Serverless Edition) 」をご参照ください。
[Intelligent Computing Lingjun resources] タブで、管理するリソースグループの名前をクリックします。
リソースグループの詳細ページの右上隅にある [注文の作成] をクリックします。
購入ページで、[ノード仕様] 、[ノード] 、[期間] などのパラメーターを設定します。 次に、[今すぐ購入] をクリックします。
支払いが完了すると、購入したLingjunリソースがリソースグループの詳細ページの [注文] タブに表示されます。
関連ドキュメント
リソースグループを作成してコンピューティングリソースを購入したら、次の操作を実行できます。
リソースグループの詳細ページで、リソースグループの基本情報を表示し、購入したリソースを管理します。 詳細については、「概要」トピックの「リソースの管理」セクションをご参照ください。
リソースクォータを設定して、購入したリソースを特定のトレーニングジョブに割り当てます。 詳細については、「Lingjun resource quotas」をご参照ください。