トレーニングジョブのデータセットとソースコードリポジトリの構成 - Container Service for Kubernetes

このトピックでは、トレーニングジョブのデータセットとソースコードリポジトリを構成する方法について説明します。

前提条件

ACK Proクラスターが作成されました。
AI開発者コンソールとクラウドネイティブAIスイートのスケジューリングコンポーネントがACK Proクラスターにインストールされます。クラスターはKubernetes 1.20以降を実行します。
リソースアクセス管理 (RAM) ユーザーは、クラスター管理者によってRAMコンソールに作成されます。クォータグループが追加され、RAMユーザーに関連付けられます。詳細については、「手順1: RAMユーザーのクォータグループの作成」をご参照ください。
永続ボリュームクレーム (PVC) を作成します。詳細については、「コンソールに静的にプロビジョニングされたNASボリュームをマウントする」および「コンソールを使用して静的にプロビジョニングされたOSSボリュームをマウントする」をご参照ください。
説明
ほとんどの場合、モデルのトレーニングに使用されるデータは、Object Storage Service (OSS) ボリュームまたはApsara File Storage NAS (NAS) ボリュームに保存されます。

AI開発者コンソールにログインします。詳細については、「手順2: AI開発者コンソールへのログイン」をご参照ください。
AI開発者コンソールの左側のナビゲーションウィンドウで、[データ設定] をクリックします。
[データ設定] ページで、[新しいデータ設定] をクリックします。
[新しいデータ構成] ページで、データセットの [名前] 、[名前空間] 、および [ボリューム要求] を設定し、要件に基づいてローカルディレクトリを指定します。
- PVCの詳細については、「PVCの作成」をご参照ください。.
- ACKクラスターがジョブを実行すると、ACKクラスターはローカルディレクトリをジョブが実行されているコンテナーにマウントします。これにより、ジョブはローカルディレクトリに格納されているデータとモデルにアクセスできます。
[送信] をクリックします。
設定が完了したら、[データ設定] ページの [データ] タブでデータセットに関する詳細情報を表示できます。

AI開発者コンソールの左側のナビゲーションウィンドウで、[データ設定] をクリックします。
[データ設定] ページで、[新しいGit設定] をクリックします。
[新しいコード構成] ダイアログボックスで、ソースコードリポジトリの [名前] 、[Gitリポジトリ] 、および [デフォルトブランチ] を設定し、要件に基づいてローカルディレクトリを指定します。 ACKクラスターがジョブを実行すると、ACKクラスターはローカルディレクトリをジョブが実行されているコンテナーにマウントします。これにより、ジョブはローカルディレクトリに格納されているソースコードにアクセスできます。
[送信] をクリックします。
設定が完了したら、[データ設定] ページの [データ] タブでデータセットに関する詳細情報を表示できます。