すべてのプロダクト
Search
ドキュメントセンター

Platform For AI:データファイルのアップロードまたはダウンロード

最終更新日:Jul 22, 2024

data Science Workshop (DSW) でデータファイルをアップロードおよびダウンロードできます。 アップロードしたデータファイルをモデルのトレーニングと評価に使用できます。 モデルのトレーニングが完了したら、予測結果をダウンロードしてモデルのパフォーマンスを評価したり、他のアプリケーションやシステムでのサービス展開用にトレーニング済みモデルをダウンロードしたりできます。 このトピックでは、DSWインスタンスのNotebookまたはWebIDEページでデータファイルをアップロードおよびダウンロードする方法について説明します。

背景情報

DSWでデータファイルをアップロードまたはダウンロードするときは、ファイルサイズに基づいて方法を選択できます。

  • ファイルサイズが5 GB以下の場合、次のいずれかの方法でデータファイルをアップロードまたはダウンロードできます。

    • ノートブック

      説明

      DSWはNotebookでファイル転送ステーションを提供します。 オンプレミスマシンの大きなモデルや大きなデータファイルをDSWインスタンスにアップロードする場合、ファイル転送ステーションはアップロードプロセスを高速化し、追加料金は発生しません。 同じRAMユーザーに属する複数のDSWインスタンスにアップロードした大きなファイルを保存して使用できます。

    • WebIDE

  • ファイルサイズが5 GBを超える場合は、ossutilを使用してファイルをObject Storage Service (OSS) バケットにアップロードすることを推奨します。 次に、データファイルに基づいてOSSデータセットを作成し、データセットをDSWインスタンスにマウントします。 これにより、DSWインスタンスはデータファイルからデータを読み取ることができます。 詳細については、「データセットデータの読み取りと書き込み」をご参照ください。

制限事項

Notebookのファイル転送ステーションを使用してデータファイルをアップロードする場合、次の制限事項に注意してください。

  • 一度に最大5つのデータファイルをアップロードできます。 5つ以上のデータファイルをアップロードした場合、余分なファイルはアップロードされるキューで待機します。

  • フォルダをアップロードできません。 フォルダーをアップロードする場合は、フォルダーをパッケージに圧縮してパッケージをアップロードすることをお勧めします。

  • ファイル転送ステーションのデータファイルのデフォルトの有効期間は7日です。 データファイルの有効期限が切れる前に、ワンクリックでファイルの有効期間をさらに7日間延長できます。

    有効期限が切れるデータファイルの有効期間を延長することはできません。

  • ファイル転送ステーションの容量は10 GBです。 ファイル転送ステーションには、最大1,000個のデータファイルを保存できます。

前提条件

DSWインスタンスが作成されます。 詳細については、「DSWインスタンスの作成」をご参照ください。

ノートブックページでデータファイルをアップロードまたはダウンロード

  1. DSW開発環境に移動します。

    1. Platform for AI (PAI) コンソールにログインします。

    2. 左側のナビゲーションウィンドウで、[ワークスペース] をクリックします。 [ワークスペース] ページで、管理するワークスペースの名前をクリックします。

    3. ページの左上隅で、DSWを使用するリージョンを選択します。

    4. 左側のナビゲーションウィンドウで、[モデルトレーニング] > [データサイエンスワークショップ (DSW)] を選択します。 表示されるページで、[Enter Data Science Workshop (DSW)] をクリックします。

    5. オプション: [Data Science Workshop (DSW)] ページで、検索ボックスにDSWインスタンスの名前またはキーワードを入力してインスタンスを検索します。

    6. [操作] 列の [開く] をクリックします。

  2. ノートブックページでデータファイルをアップロードまたはダウンロードします。

    エリア

    アップロード /ダウンロード

    操作

    エリア1

    アップロード

    アイコンをクリックするimageか、データファイルをファイルリストの空白の領域にドラッグして、ファイルをアップロードします。 システムは、ファイルサイズに基づいてアップロード方法を決定します。

    • ファイルサイズが10 MB以下の場合、現在のブラウザを使用して、データファイルがDSWインスタンスにアップロードされます。

    • ファイルサイズが10 MB以上5 GB以下の場合、データファイルは自動的にファイル転送ステーションにアップロードされ、インスタンスに保存されます。

    エリア2

    ダウンロード

    データファイルを右クリックし、[ダウンロード] を選択します。 データファイルはオンプレミスマシンにダウンロードされます。

    image

  3. (オプション) 左側のツールバーのimageアイコンをクリックして、ファイル転送ステーションページに移動します。 このページで、転送リストを表示したり、データファイルに対する操作を実行したりできます。

    エリア

    操作

    エリア1

    アイコンをクリックしimageて、ファイル転送ステーションに転送リストを表示します。

    エリア2

    管理するimageデータファイルの右側にあるアイコンをクリックして、次の操作を実行します。

    • ファイル転送が完了すると、データファイルは自動的にインスタンスに保存されます。 データファイルを現在のインスタンスに繰り返し保存する場合は、[インスタンスに保存] をクリックします。 同じRAMユーザーに属する他のインスタンスでデータファイルを使用する場合は、[インスタンスに保存] をクリックします。

    • ファイル転送ステーションのデータファイルのデフォルトの有効期間は7日です。 [有効期限の延長] をクリックすると、データファイルの有効期間が終了する前に有効期間を延長できます。

    • [削除] をクリックして、ファイル転送ステーションからデータファイルを削除します。 データファイルはファイルリストから削除されません。

    image

WebIDEページでデータファイルをアップロードまたはダウンロード

  1. 管理するDSWインスタンスを開き、表示されるページの上部のナビゲーションバーで [WebIDE] をクリックします。

  2. WebIDEページで、左側のツールバーのimage.pngアイコンをクリックして、ファイルリストにデータファイルをアップロードまたはダウンロードします。

    • データファイルをアップロードする: データファイルを保存するディレクトリを右クリックし、ショートカットメニューから [アップロード] を選択し、プロンプトに従ってファイルをアップロードします。

    • データファイルをダウンロードする: ダウンロードするデータファイルを右クリックし、ショートカットメニューから [ダウンロード] を選択します。

      説明

      データファイルのみダウンロードできます。 フォルダはダウンロードできません。 フォルダーをダウンロードする場合は、ターミナルページでフォルダーを圧縮し、WebIDEページでパッケージを右クリックして、ショートカットメニューの [ダウンロード] を選択します。

関連ドキュメント

  • DSWは、PAIでの機械学習のためのクラウドベースの統合開発環境 (IDE) です。 データファイルをアップロードした後、DSWの使用を開始できます。 詳細については、「DSWの概要」をご参照ください。

  • DSWは、OSS、Apsara File Storage NAS、MaxComputeデータソースなど、さまざまなデータソースをサポートしています。 詳細については、「データの読み取りと書き込み」をご参照ください。