Data Science Workshop (DSW) は、インタラクティブプログラミング用にPlatform for AI (PAI) によって提供されるクラウド統合開発環境 (IDE) です。 DSWを使用する前に、DSWインスタンスを作成する必要があります。
このトピックでは、DSWインスタンスを作成する方法について説明します。
背景情報
PAIコンソールでDSWインスタンスを作成および管理できます。 詳細については、このトピックの「PAIコンソールでのDSWインスタンスの作成」をご参照ください。
前提条件
DSWを使用するために必要な権限が取得されます。 詳細については、「DSWの使用に必要な権限の付与」をご参照ください。
DSWインスタンスの実行に使用する一般的なコンピューティングリソースまたはLingjun AI computing Service (Lingjun) リソースが用意されています。
一般的なコンピューティングリソースのパブリックリソースグループを使用する場合は、ディープラーニングコンテナ (DLC) に関連付けられているサービスにリンクされたロールに必要な権限が付与されます。 詳細については、「DLCを使用するために必要な権限の付与」をご参照ください。
一般的なコンピューティングリソースの専用リソースグループを使用する場合は、専用リソースが購入され、専用リソースのクォータが作成されます。 詳細については、「専用リソースグループの作成と一般的なコンピューティングリソースの購入」および「一般的なコンピューティングリソースのクォータ」をご参照ください。
Lingjunリソースを使用する場合は、Lingjunリソースが購入され、Lingjunリソースクォータが作成されます。 詳細については、「リソースグループの作成とLingjunリソースの購入」および「Lingjunリソースクォータ」をご参照ください。
(オプション) File Storage NAS またはOSS (Object Storage Service) データセットが作成されます。 詳細については、「データセットの作成と管理」をご参照ください。
重要DSWインスタンスのOSSまたはNASデータセットを作成した後、OSSまたはNASにアクセスするための権限を取得する必要があります。 そうしないと、DSWインスタンスはOSSまたはNASからデータを読み書きできません。 詳細については、「DSWの使用に必要な権限の付与」をご参照ください。
パブリックリソースグループを使用してDSWインスタンスを作成する場合、DSWはディスクストレージクォータを提供します。 データセットをマウントするか、追加のディスクを購入して、ストレージサイズを増やすことができます。
専用リソースグループを使用してDSWインスタンスを作成した場合、DSWは非永続的なオンプレミスストレージを提供します。 データセットをマウントしてデータを永続化できます。
制限事項
各Alibaba Cloudアカウントは、リージョンごとに最大2つのGPUを購入できます。 リソース使用量が制限を超えると、エラーが発生する可能性があります。 クォータを増やしたい場合は、チケットを起票してください。
PAIコンソールでDSWインスタンスを作成する
インタラクティブモデリング (DSW) ページに移動します。
PAIコンソールにログインします。
概要ページで、上部のナビゲーションバーでリージョンを選択します。
左側のナビゲーションウィンドウで、[ワークスペース] をクリックします。 [ワークスペース] ページで、管理するワークスペースの名前をクリックします。
左側のナビゲーションウィンドウで、 を選択します。
インスタンスの作成をクリックします。
インスタンスの作成ページで、次の表で説明するパラメーターを設定します。
このパラメーターのデフォルト値は、Public Resource Group (従量課金) です。 CPUまたはGPUインスタンスタイプを選択できます。 使用可能なインスタンスタイプを表示および選択できます。 インスタンスタイプのメトリクスと説明については、「インスタンスファミリーの概要」をご参照ください。
汎用コンピューティングリソースの専用リソースグループを使用して、DSWインスタンスを作成できます。 使用可能な専用リソースグループがない場合は、[リソースクォータの関連付け] をクリックして、専用リソースグループをワークスペースに関連付けます。
Lingjunリソースを使用してインスタンスを作成できます。 利用可能なLingjunリソースがない場合は、[リソースの割り当て] をクリックして、Lingjunリソースを現在のワークスペースに関連付けます。
優先度: 有効な値: 1 ~ 9。 大きい値は、高い優先度を示す。
CPUアフィニティ: CPUアフィニティ機能を有効にすると、コンテナーまたはポッド内のプロセスを特定のCPUにバインドして実行できます。 これにより、CPUキャッシュミスやコンテキスト切り替えなどの問題を防ぎ、CPU使用率を高め、アプリケーションのパフォーマンスを向上させます。 ビジネスのパフォーマンスと適時性に高い要件がある場合は、CPUアフィニティ機能を有効にできます。 CPUアフィニティ機能は、中国 (北京) および中国 (深セン) リージョンでのみ使用できます。
[リソースクォータ] に [パブリックリソースグループ (従量課金)] を選択した場合、ビジネス要件に基づいてCPU、GPU、または無料インスタンスタイプを選択します。
[リソースクォータ] に専用のリソースグループを選択する場合は、ビジネス要件に基づいて、GPUの数、vCPUの数、メモリ、および優先度を設定します。
Alibaba Cloudイメージ: 組み込みの公式イメージ。 PAIは、Python、TensorFlow、PyTorchなど、複数のバージョンのフレームワーク用の組み込みイメージを提供します。
カスタムイメージ: 既存のカスタムイメージを選択できます。 カスタムイメージの作成方法については、「カスタムイメージ」をご参照ください。
画像アドレス: 画像の公開アクセス可能なURLを入力して画像を使用できます。 現在のリージョンの [Container Registry Personal Editionインスタンスの作成] に、イメージのパブリックアクセス可能なURLを入力することもできます。
[リソースクォータ] に [パブリックリソースグループ (従量課金)] を選択した場合、次の手順に基づいてこのパラメーターを設定します。
システムディスク: 各従量課金インスタンスは、永続ストレージ用に100 GiBの無料システムディスクを提供します。 DSWインスタンスが15日以上停止した場合、システムディスクはクリアされます。 空きシステムディスクがビジネス要件を満たしていない場合は、ディスクのストレージスペースを拡張できます。 ディスクの価格については、PAIコンソールにアクセスしてください。
警告拡張後は、ストレージ容量を減らすことはできません。 作業は慎重に行ってください。
拡張後、インスタンスが停止し、15日を超えて回復されない場合、ディスクはクリアされません。 ただし、データストレージに対しては引き続き課金されます。
インスタンスを削除すると、システムディスクも解放され、ディスクに保存されているデータが削除されます。 インスタンスを削除する前に、データをバックアップしていることを確認してください。
マウント設定: デフォルトのシステムディスクのストレージ容量が制限されています。 [追加] をクリックし、インスタンスにマウントするデータセットを選択して、ストレージ容量を拡張できます。 OSS、File Storage NAS、およびCloud Parallel File Storage (CPFS) データセットをマウントできます。 利用可能なデータセットがない場合は、[データセットの作成] をクリックしてデータセットを作成します。 詳細については、「データセットの作成と管理」をご参照ください。
[リソースクォータ] に専用リソースグループを選択した場合、次の手順に基づいてこのパラメーターを設定します。
インスタンスのシステムディスクは一時保存に使用されます。 インスタンスが停止または削除されると、システムディスクはクリアされます。 永続ストレージが必要な場合は、[データセット] の横にある [追加] をクリックして使用可能なデータセットを選択するか、[マウント設定] の横にある [追加] をクリックしてOSSパスを選択します。
利用可能なデータセットがない場合は、[データセットの作成] をクリックしてデータセットを作成します。 データセットの作成方法の詳細については、「データセットの作成と管理」をご参照ください。
複数のデータセットを同じディレクトリにマウントすることはできません。
CPFSデータセットを使用する場合は、DSWインスタンスに仮想プライベートクラウド (VPC) を指定します。 VPCはCPFSデータセットのVPCと同じである必要があります。 そうしないと、インスタンスの作成に失敗する可能性があります。
Resource Quotaパラメーターを専用リソースグループに設定した場合、インスタンスにマウントする最初のデータセットはNASデータセットである必要があります。 データセットは、指定したパスとデフォルトの作業ディレクトリ /mnt/workspace/ に同時にマウントされます。
インターネットアクセスゲートウェイ: 次のいずれかのオプションを選択できます。
パブリックゲートウェイ: DSWインスタンスは、クラスター内の他のインスタンスと帯域幅を共有します。 同時実行性の高いシナリオでは、ダウンロード速度が遅くなります。
Private Gateway: DSWインスタンスは専用帯域幅を使用します。 ビジネス要件に基づいて専用帯域幅を設定できます。 このオプションを選択した場合、DSWインスタンスに関連付けられているVPCのインターネットNATゲートウェイを作成し、DSWインスタンスにEIP (elastic IP address) を関連付け、SNATエントリを設定する必要があります。 詳細については、「プライベートインターネットNATゲートウェイを使用したDSWインスタンスのインターネットアクセスの有効化」をご参照ください。
[マウント設定] パラメーターにCPFSデータセットを選択する場合は、次のパラメーターを設定する必要があります。
すべてのオプションを有効にする: デフォルトでは、このオプションは選択されていません。これは、CPFSデータセットに接続できないVPCをシステムが無効にすることを示します。
使用できないオプションを非表示: このオプションを選択すると、CPFSデータセットに接続できないVPCは表示されません。
説明CPFSデータセットを使用する場合、DSWインスタンスにVPCを指定する必要があります。VPCはCPFSデータセットのVPCと同じである必要があります。
VPC経由のアクセス: デフォルトのアクセス方法。 VPC内のECSインスタンスなど、別の端末からSSHを使用してDSWインスタンスにリモート接続できます。
インターネット経由のアクセス: インターネットアクセスとVPCアクセスを有効にできます。 Access over Internetを選択し、次のパラメーターを設定した後、オンプレミスCLIまたは別の端末を使用してSSH経由でDSWインスタンスに接続できます。
NAT Gateway: VPC用に作成したインターネットNATゲートウェイを選択します。
EIP: インターネットNATゲートウェイで作成したelastic IPアドレス (EIP) を選択します。
設定を確認したら、[はい] をクリックします。
パラメーター | 説明 | |
基本情報 | [インスタンス名] | DSWインスタンスの名前。 |
リソース情報 | リソースクォータ | 有効な値: 説明 汎用コンピューティングリソースの専用リソースグループまたはLingjunリソースグループを使用してDSWインスタンスを作成する場合は、次のパラメーターを設定する必要があります。 |
[インスタンスタイプ] | ||
環境情報 | [イメージ] | 有効な値: |
システムディスク | 説明 | |
データセット | [追加] をクリックすると、カスタムデータセットをマウントできます。 カスタムOSSデータセットは、複数のマウントモードとカスタム設定をサポートしています。 パブリックデータセットは、読み取り専用マウントモードのみをサポートします。 | |
マウント設定 | [追加] をクリックしてOSSパスをマウントします。 OSSは複数のマウントモードとカスタム設定をサポートしています。 | |
作業ディレクトリ | 作業ディレクトリは、JupyterLabおよびWebIDEの起動ディレクトリです。 作業ディレクトリは | |
ネットワーク情報 | VPC設定 | このパラメーターは、[リソースクォータ] パラメーターを [パブリックリソースグループ (従量課金)] に設定した場合にのみ使用できます。 DSWインスタンスのネットワークを設定する方法の詳細については、「DSWネットワーク設定」をご参照ください。 VPC経由でDSWインスタンスに接続するには、VPC、vSwitch、およびセキュリティグループのパラメーターを設定します。 作成したVPCを選択するか、ドロップダウンリストの下部にある [VPCの作成] をクリックしてVPCを作成します。 |
Internet Access Gateway | ||
アクセス設定 | SSHの有効化 | VPCを使用する場合、このパラメーターを設定できます。 SSHを有効にすると、選択したVPCに基づいてSSHを使用してDSWインスタンスに直接ログインできます。 カスタムイメージを設定する場合は、カスタムイメージにsshdがインストールされていることを確認する必要があります。 |
SSH公開キー | このパラメーターは、[SSHの有効化] をオンにした後に設定できます。 説明 VPCとインターネットログオンを有効にする場合は、複数のクライアントの公開鍵を追加する必要があります。 Enterキーを押して公開キーを区切ります。 最大10個の公開キーを追加できます。 | |
SSHアクセス方法 | このパラメーターは、[SSHの有効化] をオンにした後に設定できます。 | |
カスタムサービス | インスタンスで実行されているカスタムサービスへの外部アクセスを許可します。 詳細については、「カスタムサービスアクセス設定」をご参照ください。 | |
詳細情報 | 可視性 | [インスタンス所有者に表示] または [現在のワークスペースに表示] を選択できます。 |
インスタンス所有者 | ワークスペース管理者のみがインスタンス所有者を変更できます。 | |
インスタンスRAMロール | RAMロールをDSWインスタンスに関連付けて、インスタンスがSecurity Token Service (STS) の一時的な認証情報に基づいて他のクラウドサービスのAPIにアクセスできるようにすることができます。 一時的なクレデンシャルは定期的に更新される。 これにより、AccessKeyペアのセキュリティが確保され、RAMを使用してきめ細かい権限制御と管理を実装するのに役立ちます。 インスタンスRAMロールには、PAIのデフォルトロール、カスタムロール、およびロールを関連付けないが含まれます。 インスタンスRAMロールを設定する方法の詳細については、「DSWインスタンスのRAMロールの設定」をご参照ください。 |
関連ドキュメント
DSWインスタンスを作成した後、開発に必要なデータファイルを準備できます。 DSWは、OSS、NAS、MaxComputeなどの複数のデータソースタイプをサポートしています。 詳細については、「データの読み書きとファイル転送」をご参照ください。 DSWは、データのアップロードとダウンロード機能も提供します。 詳細については、「データファイルのアップロードまたはダウンロード」をご参照ください。
DSWの機能とワークフロー、およびDSWの使用方法については、「DSWの概要」をご参照ください。
DSWのユースケースの詳細については、「DSWユースケース」をご参照ください。