Dataset Accelerator of Platform for AI (PAI) を使用してトレーニングデータを高速化する前に、データソースのストレージアドレスを関連付けるスロットを作成する必要があります。 スロットを作成した後、トレーニングに使用されたデータ型、データサイズ、フレームワーク、モデルに基づいて、関連付けられたデータセットを前処理し、データセットへのアクセスを高速化します。 このトピックでは、スロットを作成および管理する方法について説明します。
前提条件
アクセラレータが作成されます。 詳細については、「アクセラレータの作成と管理」をご参照ください。
スロットの作成
PAIコンソールにログインします。
スロットの作成パネルに移動します。
次のいずれかの方法を使用して、[スロットの作成] パネルに移動できます。
方法1: [スロット] タブに移動します。
左側のナビゲーションウィンドウで、 を選択します。
[スロット] タブで、[スロットの作成] をクリックします。
方法2: アクセラレータの詳細ページに移動します。
説明アクセラレータの詳細ページでスロットを作成する場合は、Associated Instanceパラメーターの値を選択したアクセラレータに設定します。
左側のナビゲーションウィンドウで、 を選択します。
[アクセラレータ] タブで、表示するアクセラレータの名前をクリックします。
[スロット] タブで、[スロットの作成] をクリックします。
[スロットの作成] パネルで、パラメーターを設定します。 下表に、各パラメーターを説明します。
パラメーター
説明
関連インスタンス
既存のアクセラレータを選択します。
関連クラウドサービス
アクセラレータの [ストレージタイプ] パラメーターに指定したクラウドサービスにスロットを関連付けることができます。 有効な値:
Alibaba Cloud OSS
読み取り /書き込み属性: Object Storage Service (OSS) の読み取りおよび書き込み権限。 有効な値: 読み取り専用および読み取り /書き込み。
OSSパス: データセットが保存されているOSSディレクトリを選択します。
汎用NASおよびExtreme NAS
Select File System: 既存のApsara File Storage NAS (NAS) ファイルシステムのID。
マウントターゲット: ファイルシステムへのアクセスに使用するマウントターゲット。
ファイルシステムパス: NASファイルシステム内の既存のストレージパス。 デフォルト値:
/
。
容量
スロットの容量。 このパラメーターは、高速化するデータセットの容量に基づいて設定できます。
重要スロット容量は、データセット容量以上でなければなりません。
マウントターゲット
このパラメーターは、Associate Cloud ServicesパラメーターをAlibaba Cloud OSSに設定した場合にのみ使用できます。.
マウントターゲットを使用して、トレーニングジョブのトレーニングクラスターにアクセラレータをマウントできます。 トレーニングクラスターでモデルをトレーニングする場合、トレーニングジョブはマウントターゲットを使用してスロットにアクセスし、スロットに関連付けられているデータセットを読み取ることができます。 これにより、データセットアクセスの効率が向上します。
次のいずれかの方法を使用して、マウントターゲットを設定できます。
Select Mount Target: 既存のマウントターゲットを選択します。
マウントターゲットの作成: 次のパラメーターを設定して、マウントターゲットを作成します。
Type: VPCのみサポートされています。
VPC: 既存の仮想プライベートクラウド (VPC) を選択します。 利用可能なVPCがない場合は、[VPCの作成] をクリックしてVPCを作成します。
vSwitch: 既存のvSwitchを選択します。 使用できるvSwitchがない場合は、[vSwitchの作成] をクリックしてvSwitchを作成します。
説明Dataset Acceleratorは、VPCタイプのマウントターゲットのみをサポートします。
VPCのマウントターゲットは、同じVPC内で異なるvSwitchを使用するトレーニングクラスターで使用できます。
ファイルシステムのマウント対象を作成すると、ファイルシステムにIPアドレスが割り当てられます。 使用可能な多数の内部IPアドレスを持つvSwitchを選択することを推奨します。
マウントターゲットを使用する場合、マウントターゲットと同じVPCに属するトレーニングクラスターのみをマウントできます。
自動リサイクルの有効化
自動リサイクルを有効にすると、スロットの実行時間または停止時間を設定できます。 システムは指定された時間にスロットを自動的に停止します。
[送信] をクリックします。
システムはスロットを初期化する。 ステータスが実行中に変わると、スロットは使用できる状態になります。
スロットの管理
スロットは、アクセラレータの [スロット] ページまたは詳細ページで管理できます。
スロットの名前をクリックします。 スロットの詳細ページで、スロットに関する基本情報を表示します。
ポインタを ② の上に移動して、スロット内のデータセットのストレージタイプを表示します。
使用しなくなったスロットを停止または削除したり、スロットをクローンしたりできます。 [自動リサイクル] をクリックして、スロットの実行時間または停止時間を設定することもできます。
マウントターゲットの管理
スロットの名前をクリックして、スロットの詳細ページに移動します。 このページでは、マウント対象を管理できます。
マウントターゲットの設定を表示するには、マウントターゲットの名前の上にポインターを移動します。
マウントターゲットの名前をクリックします。 [デプロイ設定] ページが表示されます。 [デプロイ設定] パネルで、[ダウンロード] をクリックして、Dataset AcceleratorクライアントのYAMLファイルをダウンロードします。 YAMLファイルは、トレーニングクラスターでアクセラレータを設定するときに使用できます。
次に何をすべきか
Data Science Workshop (DSW) インスタンスを作成するとき、またはDeep Learning Containers (DLC) ジョブを送信するときに、データセットの高速化機能を有効にして、データセットへのアクセスを高速化できます。 詳細については、「データセットアクセラレータの使用」をご参照ください。