ここでは、E-HPC クラスターを作成し設定する手順、構成リストを確認する方法、および詳細設定の使用方法を学習します。
一般的な設定
前提条件
E-HPC コンソールにログインします。このコンソールにアクセスするには、まず登録済みアカウントが必要です。中国本土の最新の規則と規制に従って実名登録を完了するには、[無料アカウント] をクリックします。
E-HPC > クラスタを選択し、リージョン (中国 (杭州) など) を選択して、[クラスタ作成] をクリックします。
注:
E-HPC クラスターを作成、管理、または使用する場合、必要でない限り、ECS コンソールで単一のクラスターを操作しないでください。関連する操作は、E-HPC コンソールで実行する必要があります。
ステップ 1:ハードウェア構成
[ハードウェア構成] では、ゾーン、価格設定モデル、デプロイメント方法、計算ノード、管理ノード、ログインノードを設定します。
1. ゾーンの選択
E-HPC ノード間の効率的なネットワーク通信を確保するには、クラスター内のすべてのノードが同じゾーンでなければなりません。詳細は、「リージョンとゾーン」をご参照ください。E-HPC クラスターの作成時にターゲットリージョンが利用できない場合、「なぜ E-HPC クラスターは一部のリージョンで有効化できないのか」をご参照ください。
2. 価格設定モデルの選択
価格設定モデルは、クラスター内の ECS インスタンスに使用される課金方法です。Elastic IP アドレスと Network Attached Storage (NAS) の課金は含まれません。価格設定モデルには、サブスクリプション、従量課金、およびスポットインスタンスの課金方法があります。
3. デプロイメント方法の選択
標準:ログインノード、管理ノード、および計算ノードを個別にデプロイします。管理ノードに 2 つまたは 4 つの高可用性インスタンスを割り当てます。
シンプル:同じインスタンスにログインサービスと管理サービスをデプロイし、複数のインスタンスに計算ノードをデプロイします。
One-box:すべてのサービスをクラスター内の同じインスタンスにデプロイします。ローカルストレージか NAS を選択します。NAS はクラスター拡張をサポートしています。
4. クラスターを構成するノードタイプの指定
E-HPC クラスターは、主に次のノードで構成されています。
計算ノード:高パフォーマンスコンピューティングを実行します。
管理ノード:このノードには、2 つの独立したサブノードが含まれます。
ジョブスケジューリングサブノード:ジョブのデプロイに使用されるスケジューラ。
アカウント管理サブノード:クラスターをデプロイするドメインアカウント管理ソフトウェア。
- ログインノード:パブリック IP アドレスをサポートします。このノードにリモートでログインし、コマンドを使用して HPC クラスターを操作できます。
ジョブスケジューリングサブノードはジョブのみを処理し、ドメインアカウント管理ノードはアカウント情報のみを処理します。したがって、高可用性を確保するには、一般的なエンタープライズレベルのインスタンス (最大 4 つの CPU を備えた sn1ne インスタンスなど) を選択することを推奨します。
クラスターのパフォーマンスは、計算ノードのハードウェア構成に依存します。
ログインノードは開発環境として構成します。クラスターのずべてのユーザーがソフトウェア開発とデバッグを行うために必要なリソースと共有クラスターテスト環境を備える必要があります。そのため、計算ノードと比較して CPU とメモリの比率が同等以上のログインノードを構成することを推奨します。インスタンスタイプの詳細は、「設定」をご参照ください。
[次へ] をクリックして、ソフトウェアの構成を開始します。
ステップ 2:ソフトウェア構成
イメージの種類、オペレーティングシステム、スケジューラ、およびアプリケーションを指定します。
オペレーティングシステムのオプションは、イメージの種類によって異なります。オペレーティングシステムは、クラスターのすべてのノードにデプロイされます。
スケジューラは、HPC クラスターにデプロイされるジョブスケジューリングソフトウェアです。クラスター内のジョブの送信に使用されるジョブスクリプトとパラメーターは、スケジューラによって異なります。
アプリケーションは、HPC クラスターにデプロイされる HPC ソフトウェアです。HPC は、GROMACS、OpenFOAM、LAMMPS など、さまざまなアプリケーション (対応するソフトウェアと操作の依存関係を含む) を提供します。クラスターの作成後、指定したアプリケーションはクラスターにプレインストールされます。
ステップ 3:基本構成
クラスター名とログインパスワードを指定します。
基本構成の名前はクラスター名です。クラスターのリストにこの名前が表示されます。必要なクラスターをこのリストで検索できます。
[ログイン設定] で、クラスターへのログインに使用するパスワードを入力します。このパスワードを使用して、ルートユーザーとしてログインノードにセキュアシェル (SSH) でリモートログインできます。
[利用規約] チェックボックスをオンにして、[OK] をクリックします。
構成リストの確認
クラスターの作成手順の横に表示される構成リストを確認できます。デフォルトでは、構成リストには一般的な構成のみが表示されます。詳細設定を表示するには、[詳細設定] を選択します。
トポロジー関係の確認
構成ページの上部にある [トポロジーを表示] をクリックすると、現在の構成のトポロジー関係を表示または非表示にすることができます。
トポロジー関係には、仮想プライベートクラウド (VPC) 名、VSwitch 名、NAS インスタンス名、およびログインノード、管理ノード、計算ノードの構成とインスタンス数が含まれます。
作成したクラスターのステータスの確認
クラスターのステータスを確認するには、クラスターを作成してから約 20 分後に [クラスタ] ページに戻リます。クラスター内のすべてのノードのステータスが [実行中] の場合、クラスターは作成されています。これで、このクラスターにログインして、関連する操作を実行できます。詳細は、「クラスターの使用」をご参照ください。
詳細設定
前の手順に従って、E-HPC クラスターを作成します。詳細設定で、さらに多くのパラメーターを指定することもできます。[ハードウェア構成] と [ソフトウェア構成] ページの下部にある [詳細設定] をクリックします。
高度なハードウェア構成
[クラスタ作成] > [ハードウェア構成] を選択し、[ハードウェア構成] ページの下部にある [詳細設定] をクリックしてパラメーターを指定します。
1. ネットワーク設定
Alibaba Cloud VPC コンソールで VPC と VSwitch を作成し、Alibaba Cloud ECS コンソールでセキュリティグループを作成できます。次に、必要な VPC、VSwitch、セキュリティグループを [ネットワーク設定] で選択します。[VPC を作成] や [VSwitch を作成する(サブネット用)] をクリックしてコンソールに移動し、コンポーネントを作成することもできます。
注:
VPC と vSwitch を作成していない場合、デフォルトで VPC CIDR ブロックは 192.168.0.0/16 に、VSwitch CIDR ブロックは 192.168.0.0/20 に設定されます。
VPC を作成済みの場合、必要なゾーンに VSwitch を作成して、クラスターの作成手順を続行します。
複数の VPC と VSwitch を作成した場合、クラスターの作成には最初の VPC と VSwitch が選択されます。VSwitchで使用可能な IP アドレスの数が、クラスター内のノードの数よりも多いことを確認してください。[詳細設定] で作成した VPC と VSwitch を選択することもできます。
2. ストレージ
E-HPC は、すべてのユーザーデータ、ユーザー管理データ、ジョブ共有データ、その他のストレージインスタンス情報を保存します。クラスター内のすべてのノードがこの情報にアクセスできます。E-HPC では Network Attached Storage (NAS) を使用して情報を保存します。NAS を使用するには、マウントポイントとリモートディレクトリを指定します。詳細は、「NAS の概要」をご参照ください。
注:
現在のゾーンで NAS インスタンスとマウントポイントを作成していない場合、クラスター作成時のゾーンのデフォルト NAS インスタンスとマウントポイントが使用されます。
現在のゾーンに複数の NAS インスタンスとマウントポイントを作成している場合、クラスター作成時のゾーンの最初の NAS インスタンスとマウントポイントが選択されます。この NAS インスタンスで使用可能なマウントポイントがゾーン内にない場合、クラスター作成時にマウントポイントが作成されます。マウントポイントが作成される前に、すべてのゾーン間でこの NAS インスタンスに作成されるマウントポイントの数がしきい値に達していないことを確認してください。
高度なソフトウェア構成
[クラスタ作成] > [ソフトウェア構成] を選択し、[ソフトウェア構成] ページの下部にある [詳細設定] をクリックしてパラメーターを指定します。
クラスターのデプロイ後に実行されるスクリプトの指定
クラスターをデプロイした後に自動的に実行されるスクリプトを指定します。スクリプト URL は、指定したスクリプトのあるアドレスです。スクリプトは Object Storage Service (OSS) に保存されます。このスクリプトが保存されている OSS ファイルの URL を入力できます。引数は、スクリプトの実行に必要なコマンドラインパラメーターです。
ソフトウェアバージョン
リストに表示されるドメインサービスとターゲットソフトウェアを選択できます。
mpich や openmpi などの依存ソフトウェアに従って、プレインストールされた E-HPC アプリケーションを選択できます。アプリケーション名のサフィックスは、依存ソフトウェアを示します。”-gpu” というサフィックスが付いたソフトウェアを選択する場合、計算ノードで GPU インスタンスを使用していることを確認してください。そうしないと、クラスターを作成できないか、アプリケーションが正しく実行されない可能性があります。