コマンド | 説明 | 例 |
fastgpu [help,-h,--help]
| すべてのFastGPUコマンドの説明を表示します。 | fastgpu-ヘルプ
fastgpu -h
|
fastgpu {command} --help
| 特定のFastGPUコマンドの説明を表示します。 | fastgpu ls-ヘルプ
|
fastgpu ls
| FastGPUユーザーによって作成されたインスタンスを表示します。 以下の情報が含まれています。 instance name: インスタンスの名前。 age(hours): インスタンスが作成された時点から現在の時点までの期間。 単位:時間。 public_ip: インスタンスのパブリックIPアドレス。 private_ip: インスタンスのプライベートIPアドレス。 GPU: GPUの仕様と数。 instance_type: インスタンスタイプ。
パラメーター : -a: Alibaba Cloudアカウント内のすべてのインスタンスを表示します。 -aがコマンドに追加された場合、コマンド出力にはKey-Ownerパラメーターとinstance_idパラメーターも含まれます。 Key-Ownerパラメーターはキーペアを示し、instance_idパラメーターはインスタンスのIDを示します。 | |
fastgpu create --config create.cfg
fastgpu create --name {instance_name} --machine {count} --instance_type {ins_type}
| インスタンスまたはクラスターを作成します。 パラメーター: -f、-c、または -- config: インスタンスの作成に使用する設定ファイル。 -n、または -- name: インスタンスの名前。 -- image、または -- image_name: インスタンスにインストールするイメージの名前。 queryimage コマンドを実行して、イメージを照会できます。 -- image_type: イメージのタイプ。 image_nameを指定しない場合は、image_typeを指定してイメージを照会できます。 有効な値: Aliyun、Ubuntu、CentOS。 -np、または -- machines: 作成するインスタンスの数。 -i、または -- instance_type: vCPU、メモリ、GPUモデルなどのインスタンス仕様。 querygpu コマンドを実行して、すべてのインスタンス仕様を照会できます。 -- system_disk_size: システムディスクのサイズ。 単位は GB です。 -- data_disk_size: データディスクのサイズ。 単位は GB です。 -- skip_setup: インスタンスの初期化をスキップします。 -nas、-- nas、または -- enable-nas: Apsara File Storage NAS (NAS) ファイルシステムをインスタンスにマウントできます。 詳しくは、「」をご参照ください。NASとは何ですか?. -- zone_id: インスタンスをデプロイするゾーンのID。 デフォルトでは、システムはゾーンIDを選択します。 querygpu コマンドを実行して、使用可能なゾーンのIDを照会できます。 -- spot: プリエンプティブルインスタンスを作成します。 詳細については、「」をご参照ください。プリエンプティブルインスタンスとは. -- confirm_cost: 支払い確認ステップをスキップします。 -- install_script: インスタンスのインストール後にインスタンスで実行されるコマンド。 -vpc、-- vpc、または -- vpc_name: インスタンスが存在する仮想プライベートクラウド (VPC) の名前。 -cuda、-- install_cuda、または -- cuda_install: CUDA (Compute Unified Device Architecture) をインスタンスに自動的にインストールします。
| Ubuntuインスタンスを作成するには、インスタンス名とインスタンスタイプを指定し、システムがインスタンスにCUDAを自動的にインストールできるようにし、次のコマンドを実行します。 fastgpu create -- name fastgpu_vm -np 1 -- instance_type ecs.gn6v-c8g1.16xlarge -- image_type ubuntu -- install_cuda
設定ファイルを使用してインスタンスを作成するには、次のコマンドを実行します。 fastgpu create -c config.cfg
|
fastgpu ssh {instance_name}
| SSHを使用してインスタンスに接続し、ログインします。
説明 SSHを使用してインスタンスに接続する前に、オンプレミスマシンのパブリックIPアドレスをインスタンスのセキュリティグループに追加する必要があります。 セキュリティグループにパブリックIPアドレスを追加するには、fastgpu addip -a コマンドを実行することを推奨します。 | SSHを使用してtask0.my_jobインスタンスに接続するには、次のコマンドを実行します。 fastgpu ssh task0.my_job
|
fastgpu scp /local/path/to/upload {instance_name}:/remote/path/to/save
fastgpu scp {instance_name}:/remote/path/to/copy /local/path/to/save
| オンプレミスマシンからインスタンスにファイルをコピーするか、インスタンスからオンプレミスマシンにファイルをコピーします。 | オンプレミスマシンからインスタンスにファイルをコピーするには、次のコマンドを実行します。 fastgpu scp /root/test.txt task0.my_job:/root/
インスタンスからオンプレミスマシンにファイルをコピーするには、次のコマンドを実行します。 fastgpu scp task0.my_job:/home/cuda/ ~/cuda/
オンプレミスマシンから、名前の接尾辞がmy_jobであるクラスター内のすべてのインスタンスの /rootディレクトリにファイルをコピーするには: fastgpu scp /root/test.txt {my_job}:/root/
|
fastgpu querygpu
fastgpu query
fastgpu query -gpu {gpu_type}
fastgpu query -np {number of gpus per node}
fastgpu query -gpu {gpu_type} -np {number of gpus per node}
| Alibaba CloudでサポートされているGPU高速化インスタンスタイプを照会します。 パラメーター: -gpu: 特定のGPUモデルを使用するインスタンスタイプを照会します。 次のGPUモデルがサポートされています: V100、P100、A10、T4、P4、M40など。 -np: 特定の数のGPUで構成されているインスタンスタイプを照会します。 次の数のGPUがサポートされています: 1、2、4、および8。
| すべてのインスタンスタイプを照会するには、次のいずれかのコマンドを実行します。 fastgpu querygpu
fastgpuクエリ
V100 GPUを使用するインスタンスタイプを照会するには、次のコマンドを実行します。 fastgpuクエリ-gpu "V100"
4つのGPUで構成されているインスタンスタイプを照会するには、次のコマンドを実行します。 fastgpuクエリ-np 4
|
fastgpu queryimage
fastgpu queryimage {os_type}
| Alibaba Cloudでサポートされているインスタンスイメージを照会します。 パラメーター : os_type: Alibaba CloudでサポートされているOSタイプ。 有効な値: CentOS、Ubuntu、Debian、SUSE、およびAliyun。 | すべての画像を照会するには、次のコマンドを実行します。 fastgpu queryimage
CentOSイメージのすべてのバージョンを照会するには、次のコマンドを実行します。 fastgpu queryimage centos
|
fastgpu describe {instance_name}
fastgpu describe
| インスタンスのすべてのプロパティを照会します。 プロパティには、GPU、イメージ、メモリサイズ、作成時間、キーペア、ステータス、およびvCPUの数が含まれます。 | すべてのインスタンスのすべてのプロパティを照会するには、次のコマンドを実行します。 fastgpuの説明
task0.my_jobインスタンスのすべてのプロパティを照会するには、次のコマンドを実行します。 fastgpuはtask0.my_job を説明します
名前の接尾辞がmy_jobであるクラスター内のすべてのインスタンスのすべてのプロパティを照会するには、次のコマンドを実行します。 fastgpu describe {my_job}
|
fastgpu kill {instance_name}
fastgpu kill -y {instance_name}
fastgpu kill {instance_a_name} {instance_b_name} {instance_c_name}
fastgpu kill -f {instance_name}
| インスタンスをリリースします。 パラメーター: -f: インスタンスを強制的にリリースします。 -y: 確認ステップをスキップします。
| 停止状態のtask0.my_jobインスタンスをリリースするには、次のコマンドを実行します。 fastgpu kill task0.my_job
インスタンスのステータスに関係なくtask0.my_jobインスタンスを強制的にリリースするには、次のコマンドを実行します。 fastgpu kill -f task0.my_job
名前の接尾辞がmy_jobであるクラスター内のすべてのインスタンスを強制的にリリースするには、次のコマンドを実行します。 fastgpu kill -f {my_job}
|
fastgpu stop {instance_name}
fastgpu stop {instance_a_name} {instance_b_name} {instance_c_name}
fastgpu stop -f {instance_name}
fastgpu stop -k {instance_name}
| インスタンスを停止します。 クラスター内のすべてのインスタンスを一度に停止する場合は、コマンドで {instance_name} を {Suffix of the cluster name} に設定します。 | 実行状態にあるtask0.my_jobインスタンスを停止するには、次のコマンドを実行します。 fastgpu stop task0.my_job
task0.my_jobインスタンスを強制停止するには、次のコマンドを実行します。 fastgpu stop -f task0.my_job
名前の接尾辞がmy_jobであるクラスター内のすべてのインスタンスを強制的に停止するには、次のコマンドを実行します。 fastgpu stop -f {my_job}
|
fastgpu start {instance_name}
| インスタンスを起動します。 パラメーター : -y: 確認ステップをスキップします。 | task0.my_jobインスタンスを起動するには、次のコマンドを実行します。 fastgpu start task0.my_job
名前の接尾辞がmy_jobであるクラスターを起動するには、次のコマンドを実行します。 fastgpu start {my_job}
|
fastgpu mount {instance_name}
fastgpu mount {instance_name} {mount_target_domain}
| NASファイルシステムをインスタンスの /nclusterディレクトリにマウントします。 パラメーター : mount_target_domain: NASファイルシステムのマウントターゲット。 このパラメーターを指定しない場合、システムは自動的にマウントターゲットを作成し、インスタンスにNASファイルシステムをマウントします。 | NASファイルシステムのマウントターゲットを自動的に作成し、task0.my_jobインスタンスにNASファイルシステムをマウントするには、次のコマンドを実行します。 fastgpuマウントtask0.my_job
NASファイルシステムのマウントターゲットを手動で作成し、task0.my_jobインスタンスにNASファイルシステムをマウントするには、次のコマンドを実行します。 fastgpuマウントtask0.my_jo b example.cn-hangzhou.nas.aliyuncs.com
名前の接尾辞がmy_jobであるクラスター内のすべてのインスタンスにNASファイルシステムをマウントするには、次のコマンドを実行します。 fastgpuマウント {my_job}
|
fastgpu run {instance_name} {cmd}
| インスタンスでshell コマンドを実行します。 パラメーター : cmd: インスタンスで実行するコマンド。 | task0.my_jobインスタンスのIPアドレスを照会するには、次のコマンドを実行します。 fastgpu run task0.my_job ifconfig
名前の接尾辞がmy_jobであるクラスター内のすべてのインスタンスのIPアドレスを照会するには、次のコマンドを実行します。 fastgpu run {my_job} ifconfig
|
fastgpu addip {instance_name}
fastgpu addip {instance_name} {your_public_ip}
fastgpu addip {instance_name} {your_public_ip} {port_range}
fastgpu addip {instance_name} {your_public_ip} {port_range} {description}
fastgpu addip -a {your_public_ip} {port_range} {description}
| パブリックIPアドレスからインスタンスにアクセスできるように、インスタンスのセキュリティグループにパブリックIPアドレスを追加します。 パラメーター: your_public_ip: インスタンスにアクセスできるパブリックIPアドレス。 port_range: ポート範囲。 開始ポートと終了ポートをスラッシュ (/) で区切ります。 description: 追加するパブリックIPアドレスの説明。 -a: デフォルトのセキュリティグループ。
| オンプレミスマシンのパブリックIPアドレスをデフォルトのセキュリティグループに追加し、ポート22を介したパブリックIPアドレスからインスタンスへのアクセスを許可するには、次のコマンドを実行します。 fastgpu addip -a
オンプレミスマシンのパブリックIPアドレスをtask0.my_jobインスタンスのセキュリティグループに追加し、ポート22を介したパブリックIPアドレスからインスタンスへのアクセスを許可するには、次のコマンドを実行します。 fastgpu addip task0.my_job
IPアドレスが203.0.113.0であるオンプレミスマシンからtask0.my_jobインスタンスへのポート2000〜3000を介したアクセスを有効にするには、次のいずれかのコマンドを実行します。 fastgpu addip task0.my_job 203.0.113.0 2000/3000
fastgpu addip task0.my_job 203.0.113.0 2000/3000 "open 2000-3000 port"
IPアドレスが203.0.113.0であるオンプレミスマシンから、名前の接尾辞がmy_jobであるクラスター内のすべてのインスタンスに対して、ポート2000〜3000を介してアクセスできるようにするには、次のコマンドを実行します。 fastgpu addip {my_job} 203.0.113.0 2000/3000
|
fastgpu deleteip {instance_name}
fastgpu deleteip {instance_name} {your_public_ip}
fastgpu deleteip {instance_name} {your_public_ip} {port_range}
fastgpu deleteip -a
| インスタンスのセキュリティグループからIPアドレスを削除します。 パラメーター: your_public_ip: セキュリティグループに追加されたパブリックIPアドレス。 port_range: ポート範囲。 開始ポートと終了ポートをスラッシュ (/ ) で区切ります。 -a: ポート22経由でインスタンスにアクセスできるすべてのパブリックIPアドレスを削除します。
| task0.my_jobインスタンスのセキュリティグループからオンプレミスマシンのパブリックIPアドレスを削除するには、次のコマンドを実行します。 fastgpu deleteip task0.my_job
task0.my_jobインスタンスのセキュリティグループからオンプレミスマシンのIPアドレス203.0.113.0を削除するには、次のコマンドを実行します。 fastgpu deleteip task0.my_job 203.0.113.0
オンプレミスマシンのIPアドレス203.0.113.0からtask0.my_jobインスタンスへのポート2000から3000へのアクセスを無効にするには、次のコマンドを実行します。 fastgpu deleteip task0.my_job 203.0.113.0 2000/3000
ポート22を介してtask0.my_jobインスタンスのセキュリティグループからオンプレミスマシンのすべてのIPアドレスを削除するには、次のコマンドを実行します。 fastgpu deleteip -a task0.my_job
名前の接尾辞がmy_jobであるクラスター内のすべてのインスタンスから、IPアドレスが203.0.113.0であるオンプレミスマシンを削除するには、次のコマンドを実行します。 fastgpu deleteip {my_job} 203.0.113.0
|
fastgpu queryip
fastgpu queryip -a
fastgpu queryip {instance_name}
| インスタンスのセキュリティグループに追加されたIPアドレスを照会します。 デフォルトでは、ポート22経由でインスタンスにアクセスできるIPアドレスが照会されます。 パラメーター: -a: ポート経由でインスタンスにアクセスできるすべてのIPアドレスを照会します。 | ポート22経由でインスタンスにアクセスできるすべてのIPアドレスを照会するには、次のコマンドを実行します。 fastgpu queryip
ポート22経由でtask0.my_jobインスタンスにアクセスできるIPアドレスを照会するには、次のコマンドを実行します。 fastgpu queryip task0.my_job
ポート経由でtask0.my_jobインスタンスにアクセスできるすべてのIPアドレスを照会するには、次のコマンドを実行します。 fastgpu queryip -a task0.my_job
|
fastgpu addpub {string of id_rsa.pub}
| オンプレミスマシンの公開キーをインスタンスに追加します。 パラメーター : id_rsa.pubの文字列: 公開鍵ファイルのパス。 | ~/.ssh/id_rsa.pubをインスタンスに追加するには、次のコマンドを実行します。 fastgpu addpub
|
fastgpu rename {instance_name} {instance_new_name}
fastgpu rename {instance_id} {instance_new_name}
| インスタンスの名前を変更します。 | インスタンス名をtask0.my_jobからmy_new_insに変更するには、次のコマンドを実行します。 fastgpu rename task0.my_job task0.my_new_ins
|
fastgpu tmux {instance_name}
| SSHを使用してインスタンスに接続し、デフォルトのtmuxプロセスを使用します。 | task0.my_jobインスタンスに接続し、tmuxプロセスを作成するには、次のコマンドを実行します。 fastgpu tmux task0.my_job
|
fastgpu deletekeypair
| オンプレミスマシンのSSHキーペアを削除します。
説明 SSHキーペアがインスタンスで使用されている場合、インスタンスに接続できないか、SSHキーペアの削除後にインスタンスのクエリに失敗する可能性があります。 インスタンスをクエリする場合は、fastgpu ls -a コマンドを実行する必要があります。 | ~/.fastgpu/ ディレクトリからSSHキーペアを削除するには、次のコマンドを実行します。 fastgpu deletekeypair
|
fastgpu createkeypair
| オンプレミスマシンのSSHキーペアを作成します。 SSHキーペアは、インスタンスを作成し、その後の操作でインスタンスに接続するときに使用されます。 | オンプレミスマシンの ~/.fastgpu/ ディレクトリにSSHキーペアを作成するには、次のコマンドを実行します。 fastgpu createkeypair
|
fastgpu attachkeypair {instance_name}
| SSHキーペアをインスタンスにアタッチします。 | オンプレミスマシンの ~/.fastgpu/ ディレクトリにあるSSHキーペアをtask0.my_jobインスタンスにアタッチするには、次のコマンドを実行します。 fastgpu attachkeypair task0.my_job
オンプレミスマシンの ~/.ncluster/ ディレクトリにあるSSHキーペアを、名前の接尾辞がmy_jobであるクラスター内のすべてのインスタンスにアタッチするには、次のコマンドを実行します。 fastgpu attachkeypair {my_job}
|
fastgpu detachkeypair {instance_name}
| インスタンスからSSHキーペアをデタッチします。
説明 SSHキーペアがインスタンスからデタッチされた後、インスタンスに接続したり、インスタンスを照会したりすることはできません。 インスタンスに接続またはクエリする場合は、attachkeypair コマンドを実行してSSHキーペアをインスタンスにアタッチすることを推奨します。 | task0.my_jobインスタンスからSSHキーペアをデタッチするには、次のコマンドを実行します。 fastgpu detachkeypair task0.my_job
名前の接尾辞がmy_jobであるクラスター内のすべてのインスタンスからSSHキーペアをデタッチするには、次のコマンドを実行します。 fastgpu detachkeypair {my_job}
|
fastgpu notebooksample {instance_name} {passwd_of_login}
| インスタンスにサンプルJupyter Notebookプロジェクトを作成してデプロイします。 パラメーター : passwd_of_login: Jupyter Notebookサーバーのパスワード。 | task0.my_jobインスタンスにサンプルJupyter Notebookプロジェクトを作成してデプロイするには、次のコマンドを実行します。 fastgpu notebooksample task0.my_job
|
fastgpu cuda {instance_name} {gpu_driver_version} {cuda_version} {cudnn_version}
| NVIDIA GPUドライバー、CUDA、およびcuDNNをインスタンスにインストールします。 デフォルトのバージョン: パラメーター: gpu_driver_version: インストールするNVIDIA GPUドライバーのバージョン。 cuda_version: インストールするCUDAのバージョン。 cudn_version: インストールするcuDNNのバージョン。
| task0.my_jobインスタンスにデフォルトバージョンのCUDAをインストールするには、次のコマンドを実行します。 fastgpu cuda task0.my_job
task0.my_jobインスタンスにNVIDIA GPUドライバー460.91.03、CUDA 11.2.2、およびcuDNN 8.1.1をインストールするには、次のコマンドを実行します。 fastgpu cuda task0.my_job 460.91.03 11.2.2 8.1.1
|
fastgpu conda {instance_name}
fastgpu conda {instance_name} -f {conda_yaml_file}
fastgpu conda {instance_name} -h
fastgpu conda {instance_name} --cuda 10.0 -tf -v 1.15.0
| Condaをインスタンスにインストールし、特定のバージョンのPythonとCUDAがインストールされている仮想環境を作成します。 パラメーター: -h: ヘルプ情報を表示します。 -fまたは -- yaml: Condaのインストールに使用するYAMLファイル。 -cuまたは -- cuda: CUDAのバージョン。 有効な値: 11.0、10.2、10.1、10.0 -py、または -- python: Pythonのバージョンです。 有効な値: 3.5、3.6、3.7、3.8 -tfまたは -- tensorflow: メインフレームワークとしてTensorFlowを使用します。 -ptまたは -- pytorch: メインフレームワークとしてPyTorchを使用します。 -mxまたは -- mxnet: メインフレームワークとしてMXNetを使用します。 -v、-- vers、または -- framework_version: メインフレームワークのバージョン。
説明 TensorFlow、PyTorch、およびMXNetフレームワークに関連するパラメーターを一度に指定することはできません。 | 仮想環境がインストールされていないtask0.my_jobインスタンスにCondaをインストールするには、次のコマンドを実行します。 fastgpu conda task0.my_job
名前の接尾辞がmy_jobであるクラスター内のすべてのインスタンスにCondaをインストールするには、次のコマンドを実行します。 fastgpu conda {my_job}
task0.my_jobインスタンスにCondaをインストールし、Python 3.6、CUDA 11.0、およびPyTorch 1.7.0がインストールされている仮想環境を作成するには、次のコマンドを実行します。 fastgpu conda -py 3.6 -cu 11.0 -pt -v 1.7.0
|
fastgpu allconda {instance_name}
| インスタンスでサポートされているすべてのConda環境を作成します。 | task0.my_jobインスタンスでサポートされているすべてのConda環境を作成するには、次のコマンドを実行します。 fastgpu allconda task0.my_job
名前の接尾辞がmy_jobであるクラスター内のすべてのインスタンスでサポートされているすべてのConda環境を作成するには、次のコマンドを実行します。 fastgpu allconda {my_job}
|
fastgpu replaceimage {instance_name} {image_id}
| インスタンスのイメージを置き換えます。 パラメーター: image_id: 新しいイメージの名前またはID。 | CentOSイメージを使用してtask0.my_jobインスタンスのイメージを置き換えるには、次のコマンドを実行します。 fastgpu replaceimage task0.my_job centos_8_2_x64_20G_alibase_20210712.vhd
名前の接尾辞がmy_jobであるクラスター内のすべてのインスタンスのイメージをCentOSイメージを使用して置き換えるには、次のコマンドを実行します。 fastgpu replaceimage {my_job} centos_8_2_x64_20G_alibase_20210712.vhd
|