全部產品
Search
文件中心

Elastic High Performance Computing:提交作業

更新時間:Jul 06, 2024

作業是E-HPC叢集進行高效能運算的基本工作單元,包括Shell指令碼、可執行檔等。本文介紹如何使用E-HPC用戶端提交作業。

準備工作

提交作業前,您需要準備好作業檔案,並上傳到E-HPC叢集中。

E-HPC用戶端支援以下兩種方式上傳作業檔案:

  • 通過資料管理功能,您可以建立並編輯作業檔案,或者直接將本地的作業檔案上傳到叢集。具體操作,請參見管理檔案

  • 通過會話管理功能,您可以遠程登入到叢集,執行命令建立作業檔案。具體操作,請參見管理會話

方式一:通過用戶端直接提交作業

  1. 登入E-HPC用戶端。

    具體操作,請參見登入用戶端

  2. 在左側導覽列,選擇作業提交

  3. 單擊提交作業

  4. 在彈出面板,配置作業相關參數,然後單擊提交作業

    新增作業

    參數

    描述

    隊列

    運行作業的隊列。如果計算節點已加入到指定隊列中,則必須將作業提交到對應的隊列,否則作業會執行失敗;如果計算節點沒有排入佇列,則預設將作業提交到調度器所在的預設隊列中。

    作業名稱

    作業的名稱。

    如果需要自動下載解壓作業檔案,解壓目錄也將以作業名稱進行命名。

    執行命令

    向調度器提交的作業執行命令,可以是指令檔(如/home/test目錄下的job.pbs檔案),也可以是一段命令文本。有以下兩種情況:

    • 指令檔可執行,可填寫相對路徑,如./job.pbs

    • 指令檔沒有可執行許可權,則需要填寫執行命令,如:/opt/mpi/bin/mpirun /home/test/job.pbs。如果是PBS調度器,還需要在命令前加--,如:--/opt/mpi/bin/mpirun /home/test/job.pbs

    優先順序

    作業啟動並執行優先順序。取值範圍為0~9,取值越大,優先順序越高。如果叢集的調度原則設定為根據優先順序調度,高優先順序的作業會被優先調度運行。

    計算節點數

    用來運行此作業的計算節點數。

    任務數

    每個計算節點運行此作業使用的任務數,即進程數。

    最大記憶體

    每個計算節點運行此作業可使用的最大記憶體。預設為空白,表示不限制記憶體大小。

    執行時間

    作業最長已耗用時間,逾時作業將執行失敗,預設為空白,表示不限制已耗用時間。

    線程數

    每個任務所使用的線程數。預設為空白,表示線程數為1。

    GPU數

    每個計算節點運行此作業使用的GPU數。配置該參數時請確保計算節點為GPU執行個體。

    標準輸出路徑、錯誤輸出路徑

    定義Linux系統的stderr、stdout輸出重新導向路徑,包含輸出檔案名。

    • stdout:標準檔案輸出路徑。

    • stderr:錯誤檔案輸出路徑。

    叢集使用者必須有該路徑的可寫入權限,預設按照調度器設定產生輸出檔案。

    添加環境變數

    可根據需要添加環境變數。

方式二:通過命令列提交作業

  1. 通過Terminal遠程登入叢集。

    1. 在左側導覽列,選擇會話管理

    2. 在右側頁面單擊terminal

  2. 在快顯視窗,根據調度器類型執行相關命令提交作業。

    以PBS調度器為例,假設作業檔案為test.pbs,則執行qsub test.pbs命令提交作業。

    更多資訊,請參見通過命令列提交作業

方式三:通過工作範本提交作業

  1. 建立工作範本。

    1. 作業提交頁面,單擊提交作業

    2. 新增作業面板,配置作業相關參數。

      參數說明請參見作業參數說明表

    3. 單擊儲存為模板

    4. 在彈出的對話方塊中輸入模板名稱,單擊確定

  2. 作業提交頁面的作業提交模板地區,找到目標工作範本,單擊對應的提交作業表徵圖表徵圖。

    工作範本

    說明

    工作範本地區以卡片的形式展示工作範本,您可以根據需要單擊卡片底部的表徵圖進行提交作業、編輯或者刪除工作範本操作。

  3. 在彈出面板,確認作業相關參數,單擊提交作業

方式四:通過應用中心提交作業

E-HPC用戶端提供了可視化的介面來配置GROMACS、Fluent等軟體應用,方便您配置應用相關的作業參數,可以快速提交作業。更多資訊,請參見運行應用