このトピックでは、トレーニングジョブのデータセットとソースコードリポジトリを構成する方法について説明します。
前提条件
AI開発者コンソールとクラウドネイティブAIスイートのスケジューリングコンポーネントがACK Proクラスターにインストールされます。 クラスターはKubernetes 1.20以降を実行します。
リソースアクセス管理 (RAM) ユーザーは、クラスター管理者によってRAMコンソールに作成されます。 クォータグループが追加され、RAMユーザーに関連付けられます。 詳細については、「手順1: RAMユーザーのクォータグループの作成」をご参照ください。
永続ボリュームクレーム (PVC) を作成します。 詳細については、「コンソールに静的にプロビジョニングされたNASボリュームをマウントする」および「コンソールを使用して静的にプロビジョニングされたOSSボリュームをマウントする」をご参照ください。
説明ほとんどの場合、モデルのトレーニングに使用されるデータは、Object Storage Service (OSS) ボリュームまたはApsara File Storage NAS (NAS) ボリュームに保存されます。
データセットの設定
AI開発者コンソールにログインします。 詳細については、「手順2: AI開発者コンソールへのログイン」をご参照ください。
AI開発者コンソールの左側のナビゲーションウィンドウで、[データ設定] をクリックします。
[データ設定] ページで、[新しいデータ設定] をクリックします。
[新しいデータ構成] ページで、データセットの [名前] 、[名前空間] 、および [ボリューム要求] を設定し、要件に基づいてローカルディレクトリを指定します。
PVCの詳細については、「PVCの作成」をご参照ください。.
ACKクラスターがジョブを実行すると、ACKクラスターはローカルディレクトリをジョブが実行されているコンテナーにマウントします。 これにより、ジョブはローカルディレクトリに格納されているデータとモデルにアクセスできます。
[送信] をクリックします。
設定が完了したら、[データ設定] ページの [データ] タブでデータセットに関する詳細情報を表示できます。
ソースコードリポジトリの設定
AI開発者コンソールの左側のナビゲーションウィンドウで、[データ設定] をクリックします。
[データ設定] ページで、[新しいGit設定] をクリックします。
[新しいコード構成] ダイアログボックスで、ソースコードリポジトリの [名前] 、[Gitリポジトリ] 、および [デフォルトブランチ] を設定し、要件に基づいてローカルディレクトリを指定します。 ACKクラスターがジョブを実行すると、ACKクラスターはローカルディレクトリをジョブが実行されているコンテナーにマウントします。 これにより、ジョブはローカルディレクトリに格納されているソースコードにアクセスできます。
[送信] をクリックします。
設定が完了したら、[データ設定] ページの [データ] タブでデータセットに関する詳細情報を表示できます。