すべてのプロダクト
Search
ドキュメントセンター

Platform For AI:DSWインスタンスの作成

最終更新日:Nov 21, 2024

Data Science Workshop (DSW) は、インタラクティブプログラミング用にPlatform for AI (PAI) によって提供されるクラウド統合開発環境 (IDE) です。 DSWを使用する前に、DSWインスタンスを作成する必要があります。

このトピックでは、DSWインスタンスを作成する方法について説明します。

背景情報

PAIコンソールでDSWインスタンスを作成および管理できます。 詳細については、このトピックの「PAIコンソールでのDSWインスタンスの作成」をご参照ください。

前提条件

  • DSWを使用するために必要な権限が取得されます。 詳細については、「DSWの使用に必要な権限の付与」をご参照ください。

  • DSWインスタンスの実行に使用する一般的なコンピューティングリソースまたはLingjun AI computing Service (Lingjun) リソースが用意されています。

  • (オプション) File Storage NAS またはOSS (Object Storage Service) データセットが作成されます。 詳細については、「データセットの作成と管理」をご参照ください。

    重要

    DSWインスタンスのOSSまたはNASデータセットを作成した後、OSSまたはNASにアクセスするための権限を取得する必要があります。 そうしないと、DSWインスタンスはOSSまたはNASからデータを読み書きできません。 詳細については、「DSWの使用に必要な権限の付与」をご参照ください。

    • パブリックリソースグループを使用してDSWインスタンスを作成する場合、DSWはディスクストレージクォータを提供します。 データセットをマウントするか、追加のディスクを購入して、ストレージサイズを増やすことができます。

    • 専用リソースグループを使用してDSWインスタンスを作成した場合、DSWは非永続的なオンプレミスストレージを提供します。 データセットをマウントしてデータを永続化できます。

制限事項

各Alibaba Cloudアカウントは、リージョンごとに最大2つのGPUを購入できます。 リソース使用量が制限を超えると、エラーが発生する可能性があります。 クォータを増やしたい場合は、チケットを起票してください

PAIコンソールでDSWインスタンスを作成する

  1. インタラクティブモデリング (DSW) ページに移動します。

    1. PAIコンソールにログインします。

    2. 概要ページで、上部のナビゲーションバーでリージョンを選択します。

    3. 左側のナビゲーションウィンドウで、[ワークスペース] をクリックします。 [ワークスペース] ページで、管理するワークスペースの名前をクリックします。

    4. 左側のナビゲーションウィンドウで、モデル开発とトレーニング > インタラクティブモデリング (DSW)を選択します。

  2. インスタンスの作成をクリックします。

  3. インスタンスの作成ページで、次の表で説明するパラメーターを設定します。

  4. パラメーター

    説明

    基本情報

    [インスタンス名]

    DSWインスタンスの名前。

    リソース情報

    リソースクォータ

    有効な値:

    • このパラメーターのデフォルト値は、Public Resource Group (従量課金) です。 CPUまたはGPUインスタンスタイプを選択できます。 使用可能なインスタンスタイプを表示および選択できます。 インスタンスタイプのメトリクスと説明については、「インスタンスファミリーの概要」をご参照ください。

    • 汎用コンピューティングリソースの専用リソースグループを使用して、DSWインスタンスを作成できます。 使用可能な専用リソースグループがない場合は、[リソースクォータの関連付け] をクリックして、専用リソースグループをワークスペースに関連付けます。

    • Lingjunリソースを使用してインスタンスを作成できます。 利用可能なLingjunリソースがない場合は、[リソースの割り当て] をクリックして、Lingjunリソースを現在のワークスペースに関連付けます。

    説明

    汎用コンピューティングリソースの専用リソースグループまたはLingjunリソースグループを使用してDSWインスタンスを作成する場合は、次のパラメーターを設定する必要があります。

    • 優先度: 有効な値: 1 ~ 9。 大きい値は、高い優先度を示す。

    • CPUアフィニティ: CPUアフィニティ機能を有効にすると、コンテナーまたはポッド内のプロセスを特定のCPUにバインドして実行できます。 これにより、CPUキャッシュミスやコンテキスト切り替えなどの問題を防ぎ、CPU使用率を高め、アプリケーションのパフォーマンスを向上させます。 ビジネスのパフォーマンスと適時性に高い要件がある場合は、CPUアフィニティ機能を有効にできます。 CPUアフィニティ機能は、中国 (北京) および中国 (深セン) リージョンでのみ使用できます。

    [インスタンスタイプ]

    • [リソースクォータ] に [パブリックリソースグループ (従量課金)] を選択した場合、ビジネス要件に基づいてCPU、GPU、または無料インスタンスタイプを選択します。

    • [リソースクォータ] に専用のリソースグループを選択する場合は、ビジネス要件に基づいて、GPUの数、vCPUの数、メモリ、および優先度を設定します。

    環境情報

    [イメージ]

    有効な値:

    • Alibaba Cloudイメージ: 組み込みの公式イメージ。 PAIは、Python、TensorFlow、PyTorchなど、複数のバージョンのフレームワーク用の組み込みイメージを提供します。

    • カスタムイメージ: 既存のカスタムイメージを選択できます。 カスタムイメージの作成方法については、「カスタムイメージ」をご参照ください。

    • 画像アドレス: 画像の公開アクセス可能なURLを入力して画像を使用できます。 現在のリージョンの [Container Registry Personal Editionインスタンスの作成] に、イメージのパブリックアクセス可能なURLを入力することもできます。

    システムディスク

    • [リソースクォータ] に [パブリックリソースグループ (従量課金)] を選択した場合、次の手順に基づいてこのパラメーターを設定します。

      • システムディスク: 各従量課金インスタンスは、永続ストレージ用に100 GiBの無料システムディスクを提供します。 DSWインスタンスが15日以上停止した場合、システムディスクはクリアされます。 空きシステムディスクがビジネス要件を満たしていない場合は、ディスクのストレージスペースを拡張できます。 ディスクの価格については、PAIコンソールにアクセスしてください。

        警告
        • 拡張後は、ストレージ容量を減らすことはできません。 作業は慎重に行ってください。

        • 拡張後、インスタンスが停止し、15日を超えて回復されない場合、ディスクはクリアされません。 ただし、データストレージに対しては引き続き課金されます。

        • インスタンスを削除すると、システムディスクも解放され、ディスクに保存されているデータが削除されます。 インスタンスを削除する前に、データをバックアップしていることを確認してください。

      • マウント設定: デフォルトのシステムディスクのストレージ容量が制限されています。 [追加] をクリックし、インスタンスにマウントするデータセットを選択して、ストレージ容量を拡張できます。 OSS、File Storage NAS、およびCloud Parallel File Storage (CPFS) データセットをマウントできます。 利用可能なデータセットがない場合は、[データセットの作成] をクリックしてデータセットを作成します。 詳細については、「データセットの作成と管理」をご参照ください。

    • [リソースクォータ] に専用リソースグループを選択した場合、次の手順に基づいてこのパラメーターを設定します。

      インスタンスのシステムディスクは一時保存に使用されます。 インスタンスが停止または削除されると、システムディスクはクリアされます。 永続ストレージが必要な場合は、[データセット] の横にある [追加] をクリックして使用可能なデータセットを選択するか、[マウント設定] の横にある [追加] をクリックしてOSSパスを選択します。

      利用可能なデータセットがない場合は、[データセットの作成] をクリックしてデータセットを作成します。 データセットの作成方法の詳細については、「データセットの作成と管理」をご参照ください。

    説明
    • 複数のデータセットを同じディレクトリにマウントすることはできません。

    • CPFSデータセットを使用する場合は、DSWインスタンスに仮想プライベートクラウド (VPC) を指定します。 VPCはCPFSデータセットのVPCと同じである必要があります。 そうしないと、インスタンスの作成に失敗する可能性があります。

    • Resource Quotaパラメーターを専用リソースグループに設定した場合、インスタンスにマウントする最初のデータセットはNASデータセットである必要があります。 データセットは、指定したパスとデフォルトの作業ディレクトリ /mnt/workspace/ に同時にマウントされます。

    データセット

    [追加] をクリックすると、カスタムデータセットをマウントできます。 カスタムOSSデータセットは、複数のマウントモードとカスタム設定をサポートしています。 パブリックデータセットは、読み取り専用マウントモードのみをサポートします。

    マウント設定

    [追加] をクリックしてOSSパスをマウントします。 OSSは複数のマウントモードとカスタム設定をサポートしています。

    作業ディレクトリ

    作業ディレクトリは、JupyterLabおよびWebIDEの起動ディレクトリです。 作業ディレクトリは /mnt/workspaceディレクトリにマウントされます。

    ネットワーク情報

    VPC設定

    このパラメーターは、[リソースクォータ] パラメーターを [パブリックリソースグループ (従量課金)] に設定した場合にのみ使用できます。

    DSWインスタンスのネットワークを設定する方法の詳細については、「DSWネットワーク設定」をご参照ください。

    VPC経由でDSWインスタンスに接続するには、VPCvSwitch、およびセキュリティグループのパラメーターを設定します。 作成したVPCを選択するか、ドロップダウンリストの下部にある [VPCの作成] をクリックしてVPCを作成します。

    Internet Access Gateway

    • インターネットアクセスゲートウェイ: 次のいずれかのオプションを選択できます。

      • パブリックゲートウェイ: DSWインスタンスは、クラスター内の他のインスタンスと帯域幅を共有します。 同時実行性の高いシナリオでは、ダウンロード速度が遅くなります。

      • Private Gateway: DSWインスタンスは専用帯域幅を使用します。 ビジネス要件に基づいて専用帯域幅を設定できます。 このオプションを選択した場合、DSWインスタンスに関連付けられているVPCのインターネットNATゲートウェイを作成し、DSWインスタンスにEIP (elastic IP address) を関連付け、SNATエントリを設定する必要があります。 詳細については、「プライベートインターネットNATゲートウェイを使用したDSWインスタンスのインターネットアクセスの有効化」をご参照ください。

    • [マウント設定] パラメーターにCPFSデータセットを選択する場合は、次のパラメーターを設定する必要があります。

      • すべてのオプションを有効にする: デフォルトでは、このオプションは選択されていません。これは、CPFSデータセットに接続できないVPCをシステムが無効にすることを示します。

      • 使用できないオプションを非表示: このオプションを選択すると、CPFSデータセットに接続できないVPCは表示されません。

      説明

      CPFSデータセットを使用する場合、DSWインスタンスにVPCを指定する必要があります。VPCはCPFSデータセットのVPCと同じである必要があります。

    アクセス設定

    SSHの有効化

    VPCを使用する場合、このパラメーターを設定できます。

    SSHを有効にすると、選択したVPCに基づいてSSHを使用してDSWインスタンスに直接ログインできます。 カスタムイメージを設定する場合は、カスタムイメージにsshdがインストールされていることを確認する必要があります。

    SSH公開キー

    このパラメーターは、[SSHの有効化] をオンにした後に設定できます。

    説明

    VPCとインターネットログオンを有効にする場合は、複数のクライアントの公開鍵を追加する必要があります。 Enterキーを押して公開キーを区切ります。 最大10個の公開キーを追加できます。

    SSHアクセス方法

    このパラメーターは、[SSHの有効化] をオンにした後に設定できます。

    • VPC経由のアクセス: デフォルトのアクセス方法。 VPC内のECSインスタンスなど、別の端末からSSHを使用してDSWインスタンスにリモート接続できます。

    • インターネット経由のアクセス: インターネットアクセスとVPCアクセスを有効にできます。 Access over Internetを選択し、次のパラメーターを設定した後、オンプレミスCLIまたは別の端末を使用してSSH経由でDSWインスタンスに接続できます。

      • NAT Gateway: VPC用に作成したインターネットNATゲートウェイを選択します。

      • EIP: インターネットNATゲートウェイで作成したelastic IPアドレス (EIP) を選択します。

    カスタムサービス

    インスタンスで実行されているカスタムサービスへの外部アクセスを許可します。 詳細については、「カスタムサービスアクセス設定」をご参照ください。

    詳細情報

    可視性

    [インスタンス所有者に表示] または [現在のワークスペースに表示] を選択できます。

    インスタンス所有者

    ワークスペース管理者のみがインスタンス所有者を変更できます。

    インスタンスRAMロール

    RAMロールをDSWインスタンスに関連付けて、インスタンスがSecurity Token Service (STS) の一時的な認証情報に基づいて他のクラウドサービスのAPIにアクセスできるようにすることができます。 一時的なクレデンシャルは定期的に更新される。 これにより、AccessKeyペアのセキュリティが確保され、RAMを使用してきめ細かい権限制御と管理を実装するのに役立ちます。

    インスタンスRAMロールには、PAIのデフォルトロールカスタムロール、およびロールを関連付けないが含まれます。

    インスタンスRAMロールを設定する方法の詳細については、「DSWインスタンスのRAMロールの設定」をご参照ください。

  5. 設定を確認したら、[はい] をクリックします。

関連ドキュメント

  • DSWインスタンスを作成した後、開発に必要なデータファイルを準備できます。 DSWは、OSS、NAS、MaxComputeなどの複数のデータソースタイプをサポートしています。 詳細については、「データの読み書きとファイル転送」をご参照ください。 DSWは、データのアップロードとダウンロード機能も提供します。 詳細については、「データファイルのアップロードまたはダウンロード」をご参照ください。

  • DSWの機能とワークフロー、およびDSWの使用方法については、「DSWの概要」をご参照ください。

  • DSWのユースケースの詳細については、「DSWユースケース」をご参照ください。