すべてのプロダクト
Search
ドキュメントセンター

Elastic GPU Service:コマンド参照

最終更新日:Aug 01, 2024

FastGPUコマンドを実行して、Alibaba CloudにGPU高速化クラスターを効率的にデプロイし、リソースのライフサイクルを管理できます。 また、FastGPUコマンドを実行して、ディープラーニング環境のインストール、コードの実行、操作ログの表示、クラスターでのリソースのリリースを行うこともできます。

前提条件

  • Python 3.6以降がクライアントにインストールされます。

    説明

    クライアントとしてElastic Compute Service (ECS) インスタンス、オンプレミスマシン、またはAlibaba Cloud Shellを使用して、FastGPUをインストールし、AIコンピューティングタスクを構築できます。

  • Alibaba Cloud AccessKeyペアが取得されました。 詳細については、「AccessKeyペアの作成」をご参照ください。

環境準備

  1. 次のコマンドを実行して、FastGPUパッケージをインストールします。

    pip3 install --force-reinstall https://ali-perseus-release.oss-cn-huhehaote.aliyuncs.com/fastgpu/fastgpu-1.1.5-py3-none-any.whl
  2. 次のコマンドを実行して環境変数を設定します。

    環境変数を設定するには、Alibaba CloudアカウントのAccessKeyペア、デフォルトリージョン、デフォルトゾーンなどの環境情報を取得する必要があります。 ECSインスタンス、オンプレミスマシン、またはAlibaba Cloud Shellで次のコマンドを実行し、環境変数を設定します。

    export ALIYUN_ACCESS_KEY_ID=**** # Enter your AccessKey ID.
    export ALIYUN_ACCESS_KEY_SECRET=**** # Enter your AccessKey secret.
    export ALIYUN_DEFAULT_REGION=cn-hangzhou # Enter the ID of the region in which you want to use FastGPU.
    export ALIYUN_DEFAULT_ZONE=cn-hangzhou-i # Optional. Enter the ID of the zone in which you want to use FastGPU.

コマンド

次の表では、コマンドの {instance_name} にインスタンスの名前を指定できます。 たとえば、コマンドの {instance_name} をtask0.my_jobに設定した場合、コマンドはtask0.my_jobインスタンスでのみ実行されます。 コマンドの {instance_name} を、{my_job} などの中かっこ ({}) で囲まれた値に設定することもできます。 この場合、コマンドは、名前の末尾にmy_jobが付いているGPU高速化インスタンスクラスターで実行されます。

コマンド

説明

fastgpu [help,-h,--help]

すべてのFastGPUコマンドの説明を表示します。

fastgpu-ヘルプ

fastgpu -h

fastgpu {command} --help

特定のFastGPUコマンドの説明を表示します。

fastgpu ls-ヘルプ

fastgpu ls

FastGPUユーザーによって作成されたインスタンスを表示します。 以下の情報が含まれています。

  • instance name: インスタンスの名前。

  • age(hours): インスタンスが作成された時点から現在の時点までの期間。 単位:時間。

  • public_ip: インスタンスのパブリックIPアドレス。

  • private_ip: インスタンスのプライベートIPアドレス。

  • GPU: GPUの仕様と数。

  • instance_type: インスタンスタイプ。

パラメーター :

-a: Alibaba Cloudアカウント内のすべてのインスタンスを表示します。 -aがコマンドに追加された場合、コマンド出力にはKey-Ownerパラメーターとinstance_idパラメーターも含まれます。 Key-Ownerパラメーターはキーペアを示し、instance_idパラメーターはインスタンスのIDを示します。

  • 現在のLinuxアカウントによって作成されたインスタンスを照会するには、次のコマンドを実行します。

    fastgpu ls

  • Alibaba Cloudアカウント内の異なるLinuxアカウントによって作成されたインスタンスを照会するには、次のコマンドを実行します。

    fastgpu ls -a

fastgpu create --config create.cfg
fastgpu create --name {instance_name} --machine {count} --instance_type {ins_type}

インスタンスまたはクラスターを作成します。

パラメーター:

  • -f、-c、または -- config: インスタンスの作成に使用する設定ファイル。

  • -n、または -- name: インスタンスの名前。

  • -- image、または -- image_name: インスタンスにインストールするイメージの名前。 queryimageコマンドを実行して、イメージを照会できます。

  • -- image_type: イメージのタイプ。 image_nameを指定しない場合は、image_typeを指定してイメージを照会できます。 有効な値: Aliyun、Ubuntu、CentOS。

  • -np、または -- machines: 作成するインスタンスの数。

  • -i、または -- instance_type: vCPU、メモリ、GPUモデルなどのインスタンス仕様。 querygpuコマンドを実行して、すべてのインスタンス仕様を照会できます。

  • -- system_disk_size: システムディスクのサイズ。 単位は GB です。

  • -- data_disk_size: データディスクのサイズ。 単位は GB です。

  • -- skip_setup: インスタンスの初期化をスキップします。

  • -nas、-- nas、または -- enable-nas: Apsara File Storage NAS (NAS) ファイルシステムをインスタンスにマウントできます。 詳しくは、「」をご参照ください。NASとは何ですか?.

  • -- zone_id: インスタンスをデプロイするゾーンのID。 デフォルトでは、システムはゾーンIDを選択します。 querygpuコマンドを実行して、使用可能なゾーンのIDを照会できます。

  • -- spot: プリエンプティブルインスタンスを作成します。 詳細については、「」をご参照ください。プリエンプティブルインスタンスとは.

  • -- confirm_cost: 支払い確認ステップをスキップします。

  • -- install_script: インスタンスのインストール後にインスタンスで実行されるコマンド。

  • -vpc、-- vpc、または -- vpc_name: インスタンスが存在する仮想プライベートクラウド (VPC) の名前。

  • -cuda、-- install_cuda、または -- cuda_install: CUDA (Compute Unified Device Architecture) をインスタンスに自動的にインストールします。

  • Ubuntuインスタンスを作成するには、インスタンス名とインスタンスタイプを指定し、システムがインスタンスにCUDAを自動的にインストールできるようにし、次のコマンドを実行します。

    fastgpu create -- name fastgpu_vm -np 1 -- instance_type ecs.gn6v-c8g1.16xlarge -- image_type ubuntu -- install_cuda

  • 設定ファイルを使用してインスタンスを作成するには、次のコマンドを実行します。

    fastgpu create -c config.cfg

fastgpu ssh {instance_name}

SSHを使用してインスタンスに接続し、ログインします。

説明

SSHを使用してインスタンスに接続する前に、オンプレミスマシンのパブリックIPアドレスをインスタンスのセキュリティグループに追加する必要があります。 セキュリティグループにパブリックIPアドレスを追加するには、fastgpu addip -aコマンドを実行することを推奨します。

SSHを使用してtask0.my_jobインスタンスに接続するには、次のコマンドを実行します。

fastgpu ssh task0.my_job

fastgpu scp /local/path/to/upload {instance_name}:/remote/path/to/save
fastgpu scp {instance_name}:/remote/path/to/copy /local/path/to/save

オンプレミスマシンからインスタンスにファイルをコピーするか、インスタンスからオンプレミスマシンにファイルをコピーします。

  • オンプレミスマシンからインスタンスにファイルをコピーするには、次のコマンドを実行します。

    fastgpu scp /root/test.txt task0.my_job:/root/

  • インスタンスからオンプレミスマシンにファイルをコピーするには、次のコマンドを実行します。

    fastgpu scp task0.my_job:/home/cuda/ ~/cuda/

  • オンプレミスマシンから、名前の接尾辞がmy_jobであるクラスター内のすべてのインスタンスの /rootディレクトリにファイルをコピーするには:

    fastgpu scp /root/test.txt {my_job}:/root/

fastgpu querygpu
fastgpu query
fastgpu query -gpu {gpu_type}
fastgpu query -np  {number of gpus per node}
fastgpu query -gpu {gpu_type} -np {number of gpus per node}

Alibaba CloudでサポートされているGPU高速化インスタンスタイプを照会します。

パラメーター:

  • -gpu: 特定のGPUモデルを使用するインスタンスタイプを照会します。

    次のGPUモデルがサポートされています: V100、P100、A10、T4、P4、M40など。

  • -np: 特定の数のGPUで構成されているインスタンスタイプを照会します。 次の数のGPUがサポートされています: 1、2、4、および8。

  • すべてのインスタンスタイプを照会するには、次のいずれかのコマンドを実行します。

    fastgpu querygpu

    fastgpuクエリ

  • V100 GPUを使用するインスタンスタイプを照会するには、次のコマンドを実行します。

    fastgpuクエリ-gpu "V100"

  • 4つのGPUで構成されているインスタンスタイプを照会するには、次のコマンドを実行します。

    fastgpuクエリ-np 4

fastgpu queryimage
fastgpu queryimage {os_type}

Alibaba Cloudでサポートされているインスタンスイメージを照会します。

パラメーター :

os_type: Alibaba CloudでサポートされているOSタイプ。 有効な値: CentOS、Ubuntu、Debian、SUSE、およびAliyun。

  • すべての画像を照会するには、次のコマンドを実行します。

    fastgpu queryimage

  • CentOSイメージのすべてのバージョンを照会するには、次のコマンドを実行します。

    fastgpu queryimage centos

fastgpu describe {instance_name}
fastgpu describe

インスタンスのすべてのプロパティを照会します。 プロパティには、GPU、イメージ、メモリサイズ、作成時間、キーペア、ステータス、およびvCPUの数が含まれます。

  • すべてのインスタンスのすべてのプロパティを照会するには、次のコマンドを実行します。

    fastgpuの説明

  • task0.my_jobインスタンスのすべてのプロパティを照会するには、次のコマンドを実行します。

    fastgpuはtask0.my_jobを説明します

  • 名前の接尾辞がmy_jobであるクラスター内のすべてのインスタンスのすべてのプロパティを照会するには、次のコマンドを実行します。

    fastgpu describe {my_job}

fastgpu kill {instance_name}
fastgpu kill -y {instance_name}
fastgpu kill {instance_a_name} {instance_b_name} {instance_c_name}
fastgpu kill -f {instance_name}

インスタンスをリリースします。

パラメーター:

  • -f: インスタンスを強制的にリリースします。

  • -y: 確認ステップをスキップします。

  • 停止状態のtask0.my_jobインスタンスをリリースするには、次のコマンドを実行します。

    fastgpu kill task0.my_job

  • インスタンスのステータスに関係なくtask0.my_jobインスタンスを強制的にリリースするには、次のコマンドを実行します。

    fastgpu kill -f task0.my_job

  • 名前の接尾辞がmy_jobであるクラスター内のすべてのインスタンスを強制的にリリースするには、次のコマンドを実行します。

    fastgpu kill -f {my_job}

fastgpu stop {instance_name}
fastgpu stop {instance_a_name} {instance_b_name} {instance_c_name}
fastgpu stop -f {instance_name}
fastgpu stop -k {instance_name}

インスタンスを停止します。 クラスター内のすべてのインスタンスを一度に停止する場合は、コマンドで {instance_name} を {Suffix of the cluster name} に設定します。

パラメーター:

  • -f: インスタンスを強制停止します。

  • -k: インスタンスは停止しますが、インスタンスの課金は停止しません。

  • -y: 確認ステップをスキップします。

  • 実行状態にあるtask0.my_jobインスタンスを停止するには、次のコマンドを実行します。

    fastgpu stop task0.my_job

  • task0.my_jobインスタンスを強制停止するには、次のコマンドを実行します。

    fastgpu stop -f task0.my_job

  • 名前の接尾辞がmy_jobであるクラスター内のすべてのインスタンスを強制的に停止するには、次のコマンドを実行します。

    fastgpu stop -f {my_job}

fastgpu start {instance_name}

インスタンスを起動します。

パラメーター :

-y: 確認ステップをスキップします。

  • task0.my_jobインスタンスを起動するには、次のコマンドを実行します。

    fastgpu start task0.my_job

  • 名前の接尾辞がmy_jobであるクラスターを起動するには、次のコマンドを実行します。

    fastgpu start {my_job}

fastgpu mount {instance_name}
fastgpu mount {instance_name} {mount_target_domain}

NASファイルシステムをインスタンスの /nclusterディレクトリにマウントします。

パラメーター :

mount_target_domain: NASファイルシステムのマウントターゲット。 このパラメーターを指定しない場合、システムは自動的にマウントターゲットを作成し、インスタンスにNASファイルシステムをマウントします。

  • NASファイルシステムのマウントターゲットを自動的に作成し、task0.my_jobインスタンスにNASファイルシステムをマウントするには、次のコマンドを実行します。

    fastgpuマウントtask0.my_job

  • NASファイルシステムのマウントターゲットを手動で作成し、task0.my_jobインスタンスにNASファイルシステムをマウントするには、次のコマンドを実行します。

    fastgpuマウントtask0.my_jo b example.cn-hangzhou.nas.aliyuncs.com

  • 名前の接尾辞がmy_jobであるクラスター内のすべてのインスタンスにNASファイルシステムをマウントするには、次のコマンドを実行します。

    fastgpuマウント {my_job}

fastgpu run {instance_name} {cmd}

インスタンスでshellコマンドを実行します。

パラメーター :

cmd: インスタンスで実行するコマンド。

  • task0.my_jobインスタンスのIPアドレスを照会するには、次のコマンドを実行します。

    fastgpu run task0.my_job ifconfig

  • 名前の接尾辞がmy_jobであるクラスター内のすべてのインスタンスのIPアドレスを照会するには、次のコマンドを実行します。

    fastgpu run {my_job} ifconfig

fastgpu addip {instance_name}
fastgpu addip {instance_name} {your_public_ip}
fastgpu addip {instance_name} {your_public_ip} {port_range}
fastgpu addip {instance_name} {your_public_ip} {port_range} {description}
fastgpu addip -a {your_public_ip} {port_range} {description}

パブリックIPアドレスからインスタンスにアクセスできるように、インスタンスのセキュリティグループにパブリックIPアドレスを追加します。

パラメーター:

  • your_public_ip: インスタンスにアクセスできるパブリックIPアドレス。

  • port_range: ポート範囲。 開始ポートと終了ポートをスラッシュ (/) で区切ります。

  • description: 追加するパブリックIPアドレスの説明。

  • -a: デフォルトのセキュリティグループ。

  • オンプレミスマシンのパブリックIPアドレスをデフォルトのセキュリティグループに追加し、ポート22を介したパブリックIPアドレスからインスタンスへのアクセスを許可するには、次のコマンドを実行します。

    fastgpu addip -a

  • オンプレミスマシンのパブリックIPアドレスをtask0.my_jobインスタンスのセキュリティグループに追加し、ポート22を介したパブリックIPアドレスからインスタンスへのアクセスを許可するには、次のコマンドを実行します。

    fastgpu addip task0.my_job

  • IPアドレスが203.0.113.0であるオンプレミスマシンからtask0.my_jobインスタンスへのポート2000〜3000を介したアクセスを有効にするには、次のいずれかのコマンドを実行します。

    fastgpu addip task0.my_job 203.0.113.0 2000/3000

    fastgpu addip task0.my_job 203.0.113.0 2000/3000 "open 2000-3000 port"

  • IPアドレスが203.0.113.0であるオンプレミスマシンから、名前の接尾辞がmy_jobであるクラスター内のすべてのインスタンスに対して、ポート2000〜3000を介してアクセスできるようにするには、次のコマンドを実行します。

    fastgpu addip {my_job} 203.0.113.0 2000/3000

fastgpu deleteip {instance_name}
fastgpu deleteip {instance_name} {your_public_ip}
fastgpu deleteip {instance_name} {your_public_ip} {port_range}
fastgpu deleteip -a

インスタンスのセキュリティグループからIPアドレスを削除します。

パラメーター:

  • your_public_ip: セキュリティグループに追加されたパブリックIPアドレス。

  • port_range: ポート範囲。 開始ポートと終了ポートをスラッシュ (/) で区切ります。

  • -a: ポート22経由でインスタンスにアクセスできるすべてのパブリックIPアドレスを削除します。

  • task0.my_jobインスタンスのセキュリティグループからオンプレミスマシンのパブリックIPアドレスを削除するには、次のコマンドを実行します。

    fastgpu deleteip task0.my_job

  • task0.my_jobインスタンスのセキュリティグループからオンプレミスマシンのIPアドレス203.0.113.0を削除するには、次のコマンドを実行します。

    fastgpu deleteip task0.my_job 203.0.113.0

  • オンプレミスマシンのIPアドレス203.0.113.0からtask0.my_jobインスタンスへのポート2000から3000へのアクセスを無効にするには、次のコマンドを実行します。

    fastgpu deleteip task0.my_job 203.0.113.0 2000/3000

  • ポート22を介してtask0.my_jobインスタンスのセキュリティグループからオンプレミスマシンのすべてのIPアドレスを削除するには、次のコマンドを実行します。

    fastgpu deleteip -a task0.my_job

  • 名前の接尾辞がmy_jobであるクラスター内のすべてのインスタンスから、IPアドレスが203.0.113.0であるオンプレミスマシンを削除するには、次のコマンドを実行します。

    fastgpu deleteip {my_job} 203.0.113.0

fastgpu queryip
fastgpu queryip -a
fastgpu queryip {instance_name}

インスタンスのセキュリティグループに追加されたIPアドレスを照会します。 デフォルトでは、ポート22経由でインスタンスにアクセスできるIPアドレスが照会されます。

パラメーター:

-a: ポート経由でインスタンスにアクセスできるすべてのIPアドレスを照会します。

  • ポート22経由でインスタンスにアクセスできるすべてのIPアドレスを照会するには、次のコマンドを実行します。

    fastgpu queryip

  • ポート22経由でtask0.my_jobインスタンスにアクセスできるIPアドレスを照会するには、次のコマンドを実行します。

    fastgpu queryip task0.my_job

  • ポート経由でtask0.my_jobインスタンスにアクセスできるすべてのIPアドレスを照会するには、次のコマンドを実行します。

    fastgpu queryip -a task0.my_job

fastgpu addpub {string of id_rsa.pub}

オンプレミスマシンの公開キーをインスタンスに追加します。

パラメーター :

id_rsa.pubの文字列: 公開鍵ファイルのパス。

~/.ssh/id_rsa.pubをインスタンスに追加するには、次のコマンドを実行します。

fastgpu addpub

fastgpu rename {instance_name} {instance_new_name}
fastgpu rename {instance_id} {instance_new_name}

インスタンスの名前を変更します。

パラメーター:

  • instance_new_name: インスタンスの新しい名前。

  • instance_id: インスタンスのID。 describeコマンドを実行して、インスタンスIDを照会できます。

インスタンス名をtask0.my_jobからmy_new_insに変更するには、次のコマンドを実行します。

fastgpu rename task0.my_job task0.my_new_ins

fastgpu tmux {instance_name}

SSHを使用してインスタンスに接続し、デフォルトのtmuxプロセスを使用します。

task0.my_jobインスタンスに接続し、tmuxプロセスを作成するには、次のコマンドを実行します。

fastgpu tmux task0.my_job

fastgpu deletekeypair

オンプレミスマシンのSSHキーペアを削除します。

説明

SSHキーペアがインスタンスで使用されている場合、インスタンスに接続できないか、SSHキーペアの削除後にインスタンスのクエリに失敗する可能性があります。 インスタンスをクエリする場合は、fastgpu ls -aコマンドを実行する必要があります。

~/.fastgpu/ ディレクトリからSSHキーペアを削除するには、次のコマンドを実行します。

fastgpu deletekeypair

fastgpu createkeypair

オンプレミスマシンのSSHキーペアを作成します。 SSHキーペアは、インスタンスを作成し、その後の操作でインスタンスに接続するときに使用されます。

オンプレミスマシンの ~/.fastgpu/ ディレクトリにSSHキーペアを作成するには、次のコマンドを実行します。

fastgpu createkeypair

fastgpu attachkeypair {instance_name}

SSHキーペアをインスタンスにアタッチします。

  • オンプレミスマシンの ~/.fastgpu/ ディレクトリにあるSSHキーペアをtask0.my_jobインスタンスにアタッチするには、次のコマンドを実行します。

    fastgpu attachkeypair task0.my_job

  • オンプレミスマシンの ~/.ncluster/ ディレクトリにあるSSHキーペアを、名前の接尾辞がmy_jobであるクラスター内のすべてのインスタンスにアタッチするには、次のコマンドを実行します。

    fastgpu attachkeypair {my_job}

fastgpu detachkeypair {instance_name}

インスタンスからSSHキーペアをデタッチします。

説明

SSHキーペアがインスタンスからデタッチされた後、インスタンスに接続したり、インスタンスを照会したりすることはできません。 インスタンスに接続またはクエリする場合は、attachkeypairコマンドを実行してSSHキーペアをインスタンスにアタッチすることを推奨します。

  • task0.my_jobインスタンスからSSHキーペアをデタッチするには、次のコマンドを実行します。

    fastgpu detachkeypair task0.my_job

  • 名前の接尾辞がmy_jobであるクラスター内のすべてのインスタンスからSSHキーペアをデタッチするには、次のコマンドを実行します。

    fastgpu detachkeypair {my_job}

fastgpu notebooksample {instance_name} {passwd_of_login}

インスタンスにサンプルJupyter Notebookプロジェクトを作成してデプロイします。

  • デフォルトのパスワード: AIACC。

  • プロジェクトインスタンス: tensorflow-1.14-python36

パラメーター :

passwd_of_login: Jupyter Notebookサーバーのパスワード。

task0.my_jobインスタンスにサンプルJupyter Notebookプロジェクトを作成してデプロイするには、次のコマンドを実行します。

fastgpu notebooksample task0.my_job

fastgpu cuda {instance_name} {gpu_driver_version} {cuda_version} {cudnn_version}

NVIDIA GPUドライバー、CUDA、およびcuDNNをインスタンスにインストールします。 デフォルトのバージョン:

  • gpu_driver_version: 460.91.03。

  • CUDA: 11.2.2

  • cuDNN: 8.1.1

パラメーター:

  • gpu_driver_version: インストールするNVIDIA GPUドライバーのバージョン。

  • cuda_version: インストールするCUDAのバージョン。

  • cudn_version: インストールするcuDNNのバージョン。

  • task0.my_jobインスタンスにデフォルトバージョンのCUDAをインストールするには、次のコマンドを実行します。

    fastgpu cuda task0.my_job

  • task0.my_jobインスタンスにNVIDIA GPUドライバー460.91.03、CUDA 11.2.2、およびcuDNN 8.1.1をインストールするには、次のコマンドを実行します。

    fastgpu cuda task0.my_job 460.91.03 11.2.2 8.1.1

fastgpu conda {instance_name}
fastgpu conda {instance_name} -f {conda_yaml_file}
fastgpu conda {instance_name} -h
fastgpu conda {instance_name} --cuda 10.0 -tf -v 1.15.0

Condaをインスタンスにインストールし、特定のバージョンのPythonとCUDAがインストールされている仮想環境を作成します。

パラメーター:

  • -h: ヘルプ情報を表示します。

  • -fまたは -- yaml: Condaのインストールに使用するYAMLファイル。

  • -cuまたは -- cuda: CUDAのバージョン。 有効な値: 11.0、10.2、10.1、10.0

  • -py、または -- python: Pythonのバージョンです。 有効な値: 3.5、3.6、3.7、3.8

  • -tfまたは -- tensorflow: メインフレームワークとしてTensorFlowを使用します。

  • -ptまたは -- pytorch: メインフレームワークとしてPyTorchを使用します。

  • -mxまたは -- mxnet: メインフレームワークとしてMXNetを使用します。

  • -v、-- vers、または -- framework_version: メインフレームワークのバージョン。

説明

TensorFlow、PyTorch、およびMXNetフレームワークに関連するパラメーターを一度に指定することはできません。

  • 仮想環境がインストールされていないtask0.my_jobインスタンスにCondaをインストールするには、次のコマンドを実行します。

    fastgpu conda task0.my_job

  • 名前の接尾辞がmy_jobであるクラスター内のすべてのインスタンスにCondaをインストールするには、次のコマンドを実行します。

    fastgpu conda {my_job}

  • task0.my_jobインスタンスにCondaをインストールし、Python 3.6、CUDA 11.0、およびPyTorch 1.7.0がインストールされている仮想環境を作成するには、次のコマンドを実行します。

    fastgpu conda -py 3.6 -cu 11.0 -pt -v 1.7.0

fastgpu allconda {instance_name}

インスタンスでサポートされているすべてのConda環境を作成します。

説明

このコマンドの実行に時間がかかります。

  • task0.my_jobインスタンスでサポートされているすべてのConda環境を作成するには、次のコマンドを実行します。

    fastgpu allconda task0.my_job

  • 名前の接尾辞がmy_jobであるクラスター内のすべてのインスタンスでサポートされているすべてのConda環境を作成するには、次のコマンドを実行します。

    fastgpu allconda {my_job}

fastgpu replaceimage {instance_name} {image_id}

インスタンスのイメージを置き換えます。

パラメーター:

image_id: 新しいイメージの名前またはID。

  • CentOSイメージを使用してtask0.my_jobインスタンスのイメージを置き換えるには、次のコマンドを実行します。

    fastgpu replaceimage task0.my_job centos_8_2_x64_20G_alibase_20210712.vhd

  • 名前の接尾辞がmy_jobであるクラスター内のすべてのインスタンスのイメージをCentOSイメージを使用して置き換えるには、次のコマンドを実行します。

    fastgpu replaceimage {my_job} centos_8_2_x64_20G_alibase_20210712.vhd

サンプル设定ファイル

次のサンプルコードでは、fastgpu createコマンドで使用されるcreate.cfgサンプル構成ファイルの例を示します。 コマンドのパラメーターの詳細については、このトピックの「fastgpu create」コマンドを参照してください。

[fastgpu]
name=fastgpu-v100
machines=1
system_disk_size=500
data_disk_size=0
image_name=
image_type=ubuntu_18_04
instance_type=ecs.gn6v-c8g1.2xlarge
spot=False
confirm_cost=False
mount_nas=True
vpc_name=fastgpu-vpc
install_cuda=True

[cmd]
install_script=pwd