Elastic High Performance Computing (E-HPC) クラスターを作成する場合は、ハードウェア、ソフトウェア、および基本設定を構成する必要があります。このトピックでは、E-HPC コンソールでウィザードを使用してクラスターを作成する方法について説明します。
前提条件
E-HPC のサービスリンクロールが作成されていること。E-HPC コンソールに初めてログオンすると、E-HPC のサービスリンクロールを作成するように求められます。
仮想プライベートクラウド (VPC) と vSwitch が作成されていること。詳細については、「VPC の作成と管理」および「vSwitch の作成と管理」をご参照ください。
File Storage NAS (NAS) がアクティブになっていること。NAS ファイルシステムとマウントターゲットが作成されていること。詳細については、「ファイルシステムの作成」および「マウントターゲットの管理」をご参照ください。
背景情報
クラスターは、コンピューティングリソースとストレージリソースを提供します。クラスターでは、ジョブの送信、ジョブのデバッグ、結果の保存、および結果の表示を行うことができます。E-HPC クラスターを作成して使用する前に、以下の情報に注意してください。
ステップ 1:ハードウェア設定の構成
クラスターを作成する場合は、クラスターのハードウェア設定を構成する必要があります。ハードウェア設定は、リージョン、デプロイモード、ノード数、ネットワークタイプ、ストレージなど、クラスターのパフォーマンスを決定します。
ビジネス要件に基づいてハードウェア設定を構成できます。
E-HPC コンソールにログオンします。
上部ナビゲーションバーの左側で、リージョンを選択します。
左側のナビゲーションペインで、[クラスター] をクリックします。
[クラスター] ページで、[クラスターの作成] をクリックします。
[ハードウェア構成] ステップで、ハードウェア設定を構成します。次の表は、構成できるパラメーターについて説明しています。
パラメーター
説明
アベイラビリティーゾーン
クラスターが属するゾーン。
説明E-HPC ノード間の効率的な通信を確保するために、すべてのノードが同じリージョンとゾーンに存在することを確認してください。詳細については、「リージョンとゾーン」をご参照ください。
料金モデル
クラスター内のノードの課金方法。課金方法は、Elastic IP アドレスと NAS ファイルシステムには適用されません。
サブスクリプション:週、月、または年単位でノードを購入または更新できます。
従量課金:ノードに対して時間単位で課金されます。
プリエンプティブインスタンス:コンピューティングノードのみがプリエンプティブインスタンスをサポートしています。管理ノードとログオンノードの両方で、従量課金制のみがサポートされています。
詳細については、「ECS 課金方法の概要」をご参照ください。
デプロイモード
クラスターのデプロイモード。有効な値:
標準:ログオンノード、管理ノード、およびコンピューティングノードは個別にデプロイされます。
Tiny:ログオンノードと管理ノードは同じインスタンスにデプロイされます。コンピューティングノードは個別にデプロイされます。
重要Open Grid Scheduler (SGE) を使用する場合は、クラスターを Tiny モードでデプロイする必要があります。
ノードタイプと数量
デプロイモードに基づいて、インスタンスタイプとノード数を指定します。
ビジネス要件に基づいてインスタンスタイプを指定します。クラスターを使用して分子動力学計算を実行する場合は、GPU タイプを選択して分析を高速化できます。詳細については、「仕様」および「インスタンスタイプ選択のベストプラクティス」をご参照ください。
説明倚天プロセッサを搭載したクラスターを作成するには、倚天プロセッサを搭載したインスタンスタイプを選択します。たとえば、ecs.g8m.large を選択できます。 g8m インスタンスファミリは招待制プレビュー中です。g8m インスタンス無料トライアル申請フォーム ページにアクセスして、無料トライアルの使用を申請できます。
コンピューティングノードの数に基づいて管理ノードのインスタンス仕様を指定することをお勧めします。
クラスター内のコンピューティングノードの数が 100 以下の場合は、16 個以上の vCPU と 64 GiB 以上のメモリを選択することをお勧めします。
クラスター内のコンピューティングノードの数が 500 以下の場合は、32 個以上の vCPU と 128 GiB 以上のメモリを選択することをお勧めします。
クラスター内のコンピューティングノードの数が 500 を超える場合は、64 個以上の vCPU と 256 GiB 以上のメモリを選択することをお勧めします。
ログオンノードは開発環境として構成されます。ログオンノードは、クラスターユーザーにソフトウェア開発とデバッグに必要なリソースとテスト環境を提供します。コンピューティングノードの CPU とメモリの比率以上の CPU とメモリの比率を使用してログオンノードを構成することをお勧めします。
システムディスク
すべてのノードシステムディスクのクラウドディスクタイプと容量。有効な値:40 ~ 2000。単位:GB。
説明500 GB を超える容量のシステムディスクを構成するには、チケットを送信します。
[詳細設定] セクションを展開します。 [詳細設定] セクションで、ネットワークとストレージの設定を構成します。
パラメーター
説明
承認済みインスタンス構成
有効
RAM ロールをノードにバインドします。これにより、ノード上の Alibaba Cloud サービスにアクセスできます。
重要デフォルトでは、この機能は無効になっています。この機能を有効にするには、チケットを送信します。
チケットが承認されたら、ユーザータイプに基づいて次の操作を実行します。
Alibaba Cloud アカウント:[RAM に切り替えて承認] をクリックして、現在のユーザーにデフォルトの RAM ロールの使用を承認します。
RAM ユーザー:Alibaba Cloud アカウントを使用して RAM コンソールにログオンし、次のいずれかの方法を選択して RAM ユーザーに権限を付与します。
次のカスタムポリシーを追加し、RAM ユーザーにアタッチします。詳細については、「カスタムポリシーの作成」および「RAM ユーザーへの権限の付与」をご参照ください。
{ "Version": "1", "Statement": [ { "Effect": "Allow", "Action": [ "ram:PassRole", // ロールを引き継ぐ "ram:ListRoles" // ロールを一覧表示する ], "Resource": "*" }, { "Effect": "Allow", "Action": "ecs:AttachInstanceRamRole", // インスタンスに RAM ロールをアタッチする "Resource": "*" } ] }
RAM ユーザーに AliyunRAMFullAccess 権限を付与します。
AliyunRAMFullAccess 権限は、RAM ユーザーと権限を管理するために使用されます。この権限は、カスタムポリシーと比較してより多くの権限を付与します。詳細については、「RAM ユーザーを作成し、RAM ユーザーにログサービスへのアクセスを承認する」をご参照ください。
ロール名
ノードにバインドする RAM ロール。デフォルトロールの AliyunECSInstanceForEHPCRole を選択することをお勧めします。
ノードタイプ
RAM ロールをバインドするノードのタイプ。有効な値:
スケジューリングノード
ドメインアカウントノード
ログオンノード
コンピューティングノード
説明[コンピューティングノード] を選択すると、スケールアウトアクティビティ中に追加されたコンピューティングノードは、指定された RAM ロールに自動的にバインドされます。
リソースグループ
リソースグループ
クラスターノードが属するリソースグループ。リソースグループを使用して、アカウントに属する複数のクラスターノードを一元管理できます。
ネットワーキング
EIP
Elastic IP アドレス (EIP) は、個別に購入して所有できるパブリック IP アドレスです。静的 IP アドレスからクラスターにアクセスする場合は、EIP を購入してクラスターのログオンノードにバインドできます。
使用:EIP が自動的に作成され、ログオンノードにバインドされます。インターネット経由でクラスターにアクセスできます。
使用しない:VPC 経由でのみクラスターにアクセスできます。
説明EIP リソースの使用には料金が発生します。詳細については、「課金概要」をご参照ください。
VPC と vSwitch
クラスターが存在する VPC。異なる VPC は論理的に互いに分離されています。VPC 内で E-HPC クラスターを作成および管理できます。
デフォルトでは、[VPC] ドロップダウンリストと [vSwitch] ドロップダウンリストの最初の VPC と vSwitch が選択されています。使用可能な IP アドレスの数がクラスターノードの数よりも多いことを確認してください。
[VPC の作成] と [vswitch の作成 (サブネット用)] をクリックして、VPC と vSwitch を作成できます。詳細については、「VPC の作成と管理」および「vSwitch の作成と管理」をご参照ください。
セキュリティグループの作成
セキュリティグループルールを構成して、セキュリティグループ内のノードのインバウンドトラフィックとアウトバウンドトラフィックを管理できます。
スイッチをオンにする場合は、[セキュリティグループ名] フィールドに新しいセキュリティグループ名を入力する必要があります。
スイッチをオフにする場合は、[セキュリティグループの選択] ドロップダウンリストから既存のセキュリティグループを選択する必要があります。
ストレージ
ディレクトリ別に構成
[ディレクトリ別に構成] をオフにすると、クラスター用に 1 つのファイルシステムのみが構成されます。
[ディレクトリ別に構成] をオンにすると、ファイルシステムがすべてのノードのディレクトリにマウントされます。これにより、クラスターの共有ストレージ容量が向上します。
タイプ
ファイルシステムのタイプ。有効な値:
汎用 NAS
エクストリーム NAS
ファイルシステム ID と マウントポイント
デフォルトでは、[ファイルシステム ID] ドロップダウンリストと [マウントポイント] ドロップダウンリストの最初のファイルシステムとマウントポイントが選択されています。ファイルシステムに十分なマウントポイントがあることを確認してください。
[ファイルシステムの作成] と [マウントポイントの作成] をクリックして、ファイルシステムとマウントポイントを作成できます。
マウント構成
汎用 NAS ファイルシステムをマウントする場合は、マウントプロトコルを選択できます。有効な値:NFSv3 経由でマウント、NFSv4 経由でマウント。
リモートディレクトリ
ファイルシステムがマウントされるリモートディレクトリ。
ステップ 2:ソフトウェア設定の構成
ソフトウェア設定には、ノードにインストールされるイメージとスケジューラー、およびクラスターとクラスターユーザーを管理するドメインアカウントサービスが含まれます。
ハードウェア設定を構成したら、[次へ] をクリックします。
[ソフトウェア構成] ステップで、ソフトウェア設定を構成します。次の表は、構成できるパラメーターについて説明しています。
パラメーター
説明
イメージタイプ と イメージ
ビジネス要件に基づいてイメージタイプを選択します。有効な値:
パブリックイメージ
カスタムイメージ
共有イメージ
Alibaba Cloud Marketplace イメージ
コミュニティイメージ
[イメージタイプ] を [カスタムイメージ] に設定する場合は、次の制限事項に注意してください。
E-HPC は、CentOS イメージと、Alibaba Cloud イメージに基づいて作成されたカスタムイメージをサポートしています。イメージをインポートする際は、[インポート後にチェック] が選択されていることを確認してください。選択されていない場合、E-HPC コンソールでイメージを識別できません。
別のクラスター用に生成された既存のイメージは使用できません。使用した場合、現在のクラスターの作成後にコンピューティングノードが予期したとおりに実行されない可能性があります。
カスタムイメージのオペレーティングシステムの yum リポジトリ構成を変更することはできません。変更した場合、クラスターを作成またはスケールアウトできません。
カスタムイメージのマウントディレクトリを
/home
ディレクトリまたは/opt
ディレクトリにすることはできません。
イメージタイプを選択した後、使用するイメージを選択できます。異なるイメージは異なるオペレーティングシステムに適用されます。システムは、選択したイメージに基づいてクラスターノードをデプロイします。
重要システムは、選択したリージョン、使用可能なイメージリソース、およびノードインスタンスタイプでサポートされているイメージに基づいて、使用可能なイメージを自動的に表示します。
スケジューラー
スケジューラーはジョブの管理に役立ち、E-HPC クラスターにデプロイされます。
E-HPC は複数のスケジューラーをサポートしています。ただし、異なるスケジューラーは異なるイメージタイプに適用されます。E-HPC コンソールには、指定されたイメージタイプでサポートされているスケジューラーが表示されます。
ドメインサービス
クラスターとクラスターユーザーの管理の基盤となるドメインアカウントサービス。 nis と ldap がサポートされています。
VNC
VNC をオンにすると、システムは Virtual Network Computing (VNC) サービスを自動的に有効にします。VNC を使用して、別のコンピューターで E-HPC コンソールにアクセスできます。
キューとインストール後スクリプトの設定を構成します。
パラメーター
説明
キュー構成
新しいキューの作成
E-HPC では、異なるジョブを実行したり、異なるタスクを実行したりするコンピューティングノードを、異なるキューに追加することで分類できます。ジョブは、指定されたキューとスケジューラーによって決定される順序で実行されます。
デフォルトキュー:クラスターのコンピューティングノードは、指定されたスケジューラーのデフォルトキューに自動的に追加されます。たとえば、PBS のデフォルトキューは workq で、slurm のデフォルトキューは comp です。
新しいキュー:[キュー名] フィールドにキュー名を入力する必要があります。キューが自動的に作成され、指定されたコンピューティングノードがキューに追加されます。
インストール後スクリプト
スクリプト URL
クラスターの作成後にスクリプトをダウンロードするために使用される URL。
説明HTTP または HTTPS 経由でスクリプトをダウンロードできます。スクリプトはパブリック Object Storage Service (OSS) バケットに保存することをお勧めします。
引数
スクリプトの実行時パラメーター。詳細については、「インストールスクリプトの構成」をご参照ください。
ステップ 3:基本設定の構成
ソフトウェア設定を構成したら、[次へ] をクリックします。
[基本構成] ステップで、基本設定を構成します。次の表は、構成できるパラメーターについて説明しています。
パラメーター
説明
クラスター名
クラスターの名前。クラスター名は [クラスター] ページに表示されます。
ログオンパスワード と パスワードの確認入力
クラスターのパスワード。SSH を使用してクラスターのログオンノードにリモートアクセスする場合に、このパスワードが必要です。ユーザー名は root です。
[構成リスト] セクションで、構成したパラメーターを確認します。 [alibaba Cloud 国際ウェブサイト製品利用規約] を読んで選択し、[OK] をクリックします。
結果の確認
クラスターを作成したら、[クラスター] ページでクラスターのステータスを確認できます。クラスターとすべてのクラスターノードが 実行中 状態の場合、クラスターは作成されています。