Platform for AI (PAI) でデータセットを作成するときに、データセットの高速化を有効にできます。 Data Science Workshop (DSW) インスタンスを作成するとき、またはDeep Learning Containers (DLC) ジョブを送信するときに、高速化されたデータセットを直接使用して、データの読み取り効率を向上させることができます。 このトピックでは、PAIでDataset Acceleratorを使用する方法について説明します。
前提条件
アクセラレータが作成されます。 詳細については、「データセットアクセラレータの作成と管理」をご参照ください。
データセットの作成時にデータセットの高速化を有効にする
[データセット] ページで、データセットを作成し、パラメーターを設定します。 下表に、各パラメーターを説明します。 詳細については、「データセットの作成と管理」をご参照ください。
パラメーター
説明
データセットの作成
[Alibaba Cloudから] を選択します。
データセットアクセラレーションの有効化
[データセットアクセラレーションの有効化] を選択し、データセットアクセラレーションを有効にする関連パラメーターを設定します。
選択したデータストレージタイプに基づいてアクセラレータを選択し、名前、最大容量、高速マウントターゲットなど、スロットのパラメーターを設定します。 詳細については、「スロットの作成と管理」をご参照ください。
[送信] をクリックします。
作成されたデータセットがデータセットリストに表示されます。 次の図は、高速化されたデータセットを示しています。
既存のデータセットのデータセットアクセラレーションの有効化
[データセット] ページで、データセットの名前をクリックして、[データセットの詳細] ページに移動します。 詳細については、「データセットの作成と管理」をご参照ください。
[データセットの詳細] ページで、右上隅の [データセットの加速] をクリックします。 [Dataset Acceleration] パネルで、[dataset accelerator] を選択し、スロットのパラメーターを設定します。 詳細については、「スロットの作成と管理」をご参照ください。
[送信] をクリックして、データセットの高速化を有効にします。
データセットアクセラレータの使用
Dataset Acceleratorは、DSWインスタンスの作成時やDLCジョブの送信時に使用できます。
DSWインスタンスを作成するときに、[ストレージ] セクションで高速化データセットを選択できます。 詳細については、「DSWインスタンスの作成と管理」をご参照ください。
DLCジョブを送信するときに、[データセット] セクションで高速化データセットを選択できます。 詳細については、「トレーニングジョブの送信」をご参照ください。