全部產品
Search
文件中心

Elastic High Performance Computing:建立混合雲叢集

更新時間:Jul 06, 2024

混合雲叢集指混合部署在本地和雲上的叢集,調度節點、域帳號節點都在本地,計算節點在本地和雲上。您可以利用本地的HPC叢集在阿里雲擴容計算節點資源,統一調度雲上資源和您的本地資源進行高效能運算。本文介紹如何通過E-HPC管理主控台建立混合雲叢集。

前提條件

背景資訊

本地HPC叢集管控節點的環境要求如下:

  • 作業系統:CentOS 7.2、7.3、7.4、7.5、7.6、8.0

  • 調度叢集類型:custom、deadline、PBS 18.1.1、SGE(Open Grid Scheduler)

    說明

    PBS和SGE叢集僅支援作業系統CentOS 7.x。

  • 帳號管理類型:custom

使用流程

建立並使用混合雲叢集的流程如下所示:

  1. 步驟一:建立混合雲叢集

    建立混合雲叢集時,您需要配置叢集計算節點的硬體設定、軟體配置、基礎配置等資訊。

  2. 步驟二:擴容混合雲叢集

    建立混合雲叢集後,叢集中並沒有任何計算節點,若需要使用混合雲叢集,還需要進行擴容。

    擴容前,請根據業務需要準備好自訂鏡像,該自訂鏡像中須安裝有deadline或custom調度器。關於如何建立自訂鏡像,請參見使用執行個體建立自訂鏡像

步驟一:建立混合雲叢集

  1. 登入彈性高效能運算控制台

  2. 在頂部功能表列左上方處,選擇地區。

  3. 在左側導覽列,選擇叢集

  4. 叢集頁面右上方,單擊建立混合雲叢集

  5. 配置硬體資訊。

    1. 填寫基本配置資訊。

      配置項

      說明

      可用性區域

      叢集計算節點的可用性區域。

      付費類型

      叢集計算節點的計費方式,其中不包括Elastic IP Address、NAS儲存的費用。

      • 訂用帳戶:按周、月或年購買及續約,為預付費模式。

      • 隨用隨付:按實際開通時間長度以小時為單位進行收費,為後付費模式。

      • 搶佔式執行個體:相對於隨用隨付執行個體價格有一定的折扣,價格隨供求波動,按實際使用時間長度進行收費,後付費模式。

      更多資訊,請參見計費方式概述

      計算節點

      用於執行高效能運算作業的節點,其配置決定了E-HPC叢集的總體效能。

      使用代理模式

      開啟後,在雲上建立代理節點,用於管理雲上叢集資源。

      雲上代理節點

      開啟使用代理模式時,配置雲上代理節點的執行個體規格。

    2. 展開進階配置,按需設定參數。

      配置項

      說明

      網路設定

      VPC交換器

      叢集所在的專用網路,不同的專用網路之間邏輯上徹底隔離。您可以在專用網路內建立和管理叢集。

      預設選擇第一個已建立的VPC和交換器,請確保交換器下的IP地址空間足夠(可用IP數大於叢集所有節點的數量)。

      您可以分別單擊建立VPC建立子網(交換器)建立專用網路和交換器。具體操作,請參見建立專用網路建立交換器

      建立安全性群組安全性群組名稱

      目前僅支援建立安全性群組,請輸入建立的安全性群組名稱。

      共用儲存

      檔案儲存體位置

      選擇檔案儲存體位置。支援不掛載檔案儲存體、使用本地檔案儲存體和使用雲上儲存

      本地叢集儲存掛載地址

      使用本地檔案儲存體時,本機存放區的地址。

      掛載路徑

      使用本地檔案儲存體時,要掛載儲存的叢集路徑。

      本地路徑

      使用本地檔案儲存體時,要掛載到叢集的本地路徑。

      按檔案夾配置

      使用雲上檔案儲存體時,選擇是否為各個檔案夾分別掛載不同的檔案系統。

      類型

      使用雲上檔案儲存體時,選擇檔案系統的類型。

      檔案系統ID掛載點

      預設選擇第一個已建立的檔案系統ID和掛載點,請確保該檔案系統還有可用的掛載點餘量。

      您也可以分別單擊建立檔案系統建立掛載點建立新的檔案系統和掛載點。具體操作,請參見建立檔案系統添加掛載點

      掛載選項

      掛載通用型NAS時,可選擇掛載協議,支援使用NFS v3協議或NFS v4協議掛載。

      遠程目錄

      要掛載的檔案系統的遠程目錄。

  6. 單擊下一步,配置軟體資訊。

    配置項

    說明

    鏡像類型鏡像

    按需選擇鏡像類型和對應的鏡像,用於部署計算節點環境。

    調度器

    本地叢集的調度器類型。

    調度器節點IP

    本地叢集中部署了調度器的節點的IP地址。

    調度器節點主機名稱

    本地叢集中部署了調度器的節點的主機名稱。

    帳號系統

    本地叢集中域帳號服務的類型。

    本地叢集網域名稱

    本地叢集的網域名稱。

    帳號節點IP

    本地叢集中部署了域帳號服務的節點的IP地址。

    帳號節點主機名稱

    本地叢集中部署了域帳號服務的節點的主機名稱。

  7. 單擊下一步,配置基礎資訊。

    配置項

    說明

    名稱

    叢集名稱,該名稱將會在叢集列表中顯示,便於您尋找識別。

    登入密碼

    叢集的登入密碼。該密碼用於遠程SSH訪問叢集登入節點,對應的使用者名稱為root。

    說明

    當開啟代理模式時,叢集登入密碼必須與本地叢集root密碼保持一致。

    確認密碼

    再次輸入登入密碼。

  8. 在右側配置清單查看建立的叢集配置,閱讀並選中《E-HPC服務條款》,單擊確認

    建立完成後,在E-HPC叢集頁面,當新建立的叢集狀態為運行中,則混合雲叢集已建立。

步驟二:擴容混合雲叢集

  1. 叢集頁面,選擇需要擴容的混合雲叢集,單擊擴容

  2. 叢集擴容面板,完成基本配置。

    具體操作,請參見手動擴容叢集。請注意以下配置參數:

    • 鏡像類型:選擇自訂鏡像

    • 鏡像:選擇已建立好的自訂鏡像。

  3. 確認當前配置,閱讀並選中《E-HPC服務條款》,單擊立即購買

    擴容後,您可以單擊資源管理 > 節點與隊列,在叢集列表中選擇已擴容的混合雲叢集,在節點類型列表中選擇計算節點,即可查看已擴容節點的狀態。當該節點狀態為運行中,說明擴容混合雲叢集已完成。