すべてのプロダクト
Search
ドキュメントセンター

Platform For AI:DLC トレーニングジョブのクラウドストレージの使用

最終更新日:Apr 03, 2025

Deep Learning Containers (DLC) でトレーニングジョブを送信する際、コードビルドまたはマウントを使用して、Object Storage Service (OSS)、NAS ファイルシステム (NAS)、Cloud Parallel File Storage (CPFS)、または MaxCompute ストレージを使用できます。これにより、トレーニング中にストレージから直接データを読み書きできます。このトピックでは、DLC トレーニングジョブの OSS、MaxCompute、NAS、または CPFS ストレージを構成する方法について説明します。

前提条件

OSS の使用

マウントによる OSS の構成

DLC トレーニングジョブを送信する際に、OSS データセットをマウントできます。次の表は、サポートされているマウントタイプについて説明しています。image

マウントタイプ

説明

データセット

カスタムまたはパブリックデータセットをマウントします。

  • パブリックデータセットは、読み取り専用マウントのみをサポートします。

  • 読み取り専用 をオンにして、OSS などのカスタムデータセットに対する読み取りおよび書き込み権限を設定できます。

[OSS] タイプのデータセットを選択し、[マウントパス] を構成します。 DLC ジョブの実行中に、システムはこのパスを介して OSS データにアクセスできます。

直接マウント

マウントパスを指定して OSS バケットをマウントします。 読み取り専用読み取り専用 スイッチをオンにして、データセットに対する読み取り専用権限を付与し、 スイッチをオフにして、データセットに対する読み取りおよび書き込み権限を付与できます。

DLC は、JindoFuse または ossfs を使用して OSS をマウントします。

  • JindoFuse: デフォルトの方法です。ただし、デフォルトの構成には制限があり、すべてのシナリオに適しているとは限りません。ビジネスシナリオに基づいてパラメーターを調整できます。詳細については、「JindoFuse」をご参照ください。

  • ossfs: [直接マウント] 方法を使用するには、[詳細設定]{"mountType":"ossfs"} 構成を追加する必要があります。image

マウントなしの OSS の構成

DLC ジョブでは、OSS Connector for AI/ML または OSS SDK を使用して、OSS からデータを読み書きできます。 トレーニングジョブを送信する際に、コードビルドを構成して OSS ストレージを使用できます。サンプルコードの詳細については、「OSS Connector for AI/ML」または「OSS SDK」をご参照ください。image

NAS または CPFS ストレージの使用

DLC トレーニングジョブのカスタム NAS または CPFS データセットをマウントするか、DLC トレーニングジョブの作成時に NAS または CPFS ストレージ をトレーニングジョブに直接マウントできます。image

マウントタイプ

説明

データセット

読み取り専用 をオンにして、カスタム データセットの読み取りおよび書き込み権限を構成できます。

直接マウント

NAS または CPFS ファイルシステムをマウントします。 読み取り専用 をオンにして、読み取りおよび書き込み権限を構成できます。

詳細設定 で nconnect パラメーターを構成して、NAS にアクセスする DLC コンテナーのスループットを向上させることもできます。 nconnect パラメーターは、Linux ECS インスタンスに NFS ファイルシステムをマウントするためのオプションです。 このパラメーターを使用すると、NFS クライアントと ECS インスタンス間でより多くの TCP 接続を確立して、スループットを向上させることができます。 nconnect パラメーターを 4 に設定することをお勧めします。サンプル コード:

{"nconnect":"4"}

MaxCompute ストレージの使用

トレーニングジョブを作成する際に、マウントせずにコードビルドを構成して MaxCompute ストレージを使用できます。サンプルコードの詳細については、「MaxCompute の使用」をご参照ください。image

よくある質問

PAIIO を使用してテーブルからデータを読み取るときにエラーが発生しないのに、ログに killed と表示されるのはなぜですか。

リソースが限られており、PAIIO に制限がないため、MaxCompute データがメモリ内で大幅に拡張される可能性があります。オペレーティングシステムやその他のシステムコンポーネントもメモリの一部を消費します。