Platform for AI (PAI) の Dataset Accelerator を使用する前に、データソースのアドレスを関連付けるスロットを作成する必要があります。スロットを作成すると、システムはトレーニングに使用されるデータ型、データサイズ、フレームワーク、モデルに基づいて関連付けられたデータセットを前処理し、データセットへのアクセスを高速化します。このトピックでは、スロットの作成と管理方法について説明します。
前提条件
アクセラレータが作成されていること。詳細については、「アクセラレータの作成と管理」をご参照ください。
スロットの作成
PAI コンソール にログインします。 左側のナビゲーションウィンドウで、 を選択します。
[スロットの作成] パネルに移動します。
方法 1:[スロット] タブで、[スロットの作成] をクリックします。
方法 2:アクセラレータの詳細ページに移動します。
アクセラレータの詳細ページでスロットを作成する場合は、[関連付けられたインスタンス] パラメーターを現在のアクセラレータに設定します。
[アクセラレータ] タブで、アクセラレータの名前をクリックします。
アクセラレータの詳細ページで、[スロットの作成] をクリックします。
[スロットの作成] パネルで、パラメーターを構成します。次の表でパラメーターについて説明します。
パラメーター
説明
パラメーター
説明
関連付けられたインスタンス
既存のアクセラレータを選択します。
関連付けられたクラウドサービス
アクセラレータのストレージタイプ パラメーターに指定したクラウドサービスにスロットを関連付けることができます。有効な値:
Alibaba Cloud OSS汎用 NAS および Extreme NAS読み取り/書き込み属性: Object Storage Service (OSS) の読み取りおよび書き込み権限。有効な値:[読み取り専用] および [読み取り/書き込み]。
OSS パス: データセットが格納されている OSS ディレクトリを選択します。
ファイルシステムの選択: 既存の File Storage NAS の ID。
マウントポイント: ファイルシステムへのアクセスに使用するマウントポイント。
ファイルシステムパス: NAS ファイルシステム内の既存のストレージパス。デフォルト値:
/
。
容量
スロットの容量。高速化するデータセットの容量に基づいて、このパラメーターを構成できます。
スロット容量は、データセット容量以上である必要があります。
マウントポイント
このパラメーターは、[関連付けられたクラウドサービス] パラメーターを [Alibaba Cloud OSS] に設定した場合にのみ使用できます。
マウントポイントを選択または作成して、アクセラレータをトレーニングジョブのトレーニングクラスタにマウントできます。トレーニングクラスタでモデルをトレーニングする場合、トレーニングジョブはマウントポイントを使用してスロットにアクセスし、スロットに関連付けられたデータセットを読み取ることができます。これにより、データセットアクセス効率が向上します。
次のいずれかの方法でマウントポイントを構成できます。
[マウントポイントの選択]: 既存のマウントポイントを選択します。
[マウントポイントの作成]: 次のパラメーターを構成して、マウントポイントを作成します。
タイプ: VPC のみがサポートされています。
VPC: 既存の VPC を選択します。VPC が使用できない場合は、[VPC の作成] をクリックして VPC を作成できます。
vSwitch: 既存の vSwitch を選択します。vSwitch が使用できない場合は、[vSwitch の作成] をクリックして vSwitch を作成できます。
Dataset Accelerator は、VPC タイプのマウントポイントのみをサポートしています。
VPC のマウントポイントは、同じ VPC 内の異なる vSwitch を使用するトレーニングクラスタで使用できます。
ファイルシステムのマウントポイントを作成すると、ファイルシステムに IP アドレスが割り当てられます。使用可能な内部 IP アドレスの数が多い vSwitch を選択することをお勧めします。
マウントポイントを使用する場合、マウントポイントと同じ VPC に属するトレーニングクラスタのみをマウントできます。
自動リサイクルを有効にする
自動リサイクルを有効にすると、スロットの実行期間または停止時間を構成できます。
[送信] をクリックします。
システムはスロットを初期化します。ステータスが [実行中] に変わると、スロットは使用できる状態になります。
スロットの管理
[スロット] ページまたはアクセラレータの詳細ページでスロットを管理できます。管理操作は、2 つのページで同じです。
スロットの名前をクリックします。スロットの詳細ページで、スロットの [基本情報] を表示します。
ポインターを ② に移動して、データセットのストレージタイプを表示します。
不要になったスロットを停止または削除したり、スロットのクローンを作成したりできます。また、[自動リサイクル] をクリックして、スロットの実行期間または停止時間を構成することもできます。
マウントポイントの管理
スロットの名前をクリックして、スロットの詳細ページに移動します。このページでは、マウントポイントを管理できます。
構成情報の表示:マウントポイントの名前にポインターを移動して、マウントポイントの構成を表示します。
デプロイ構成の表示:マウントポイントの名前をクリックします。[デプロイ構成] ページが表示されます。
デプロイ構成のダウンロード:[デプロイ構成] パネルで、[ダウンロード] をクリックして YAML ファイルをダウンロードします。トレーニングクラスタでアクセラレータを構成するときに、YAML ファイルを使用できます。
次のステップ
Data Science Workshop (DSW) インスタンスの作成時または Deep Learning Containers (DLC) ジョブの送信時にデータセットのアクセラレーション機能を有効にして、データセットへのアクセスを高速化できます。詳細については、「Dataset Accelerator の使用」をご参照ください。