作業是E-HPC叢集進行高效能運算的基本工作單元,包括Shell指令碼、可執行檔等。本文介紹如何使用E-HPC用戶端提交作業。
準備工作
提交作業前,您需要準備好作業檔案,並上傳到E-HPC叢集中。
E-HPC用戶端支援以下兩種方式上傳作業檔案:
方式一:通過用戶端直接提交作業
登入E-HPC用戶端。
具體操作,請參見登入用戶端。
在左側導覽列,選擇作業提交。
單擊提交作業。
在彈出面板,配置作業相關參數,然後單擊提交作業。
參數
描述
隊列
運行作業的隊列。如果計算節點已加入到指定隊列中,則必須將作業提交到對應的隊列,否則作業會執行失敗;如果計算節點沒有排入佇列,則預設將作業提交到調度器所在的預設隊列中。
作業名稱
作業的名稱。
如果需要自動下載解壓作業檔案,解壓目錄也將以作業名稱進行命名。
執行命令
向調度器提交的作業執行命令,可以是指令檔(如
/home/test
目錄下的job.pbs檔案),也可以是一段命令文本。有以下兩種情況:指令檔可執行,可填寫相對路徑,如
./job.pbs
。指令檔沒有可執行許可權,則需要填寫執行命令,如:
/opt/mpi/bin/mpirun /home/test/job.pbs
。如果是PBS調度器,還需要在命令前加--
,如:--/opt/mpi/bin/mpirun /home/test/job.pbs
。
優先順序
作業啟動並執行優先順序。取值範圍為0~9,取值越大,優先順序越高。如果叢集的調度原則設定為根據優先順序調度,高優先順序的作業會被優先調度運行。
計算節點數
用來運行此作業的計算節點數。
任務數
每個計算節點運行此作業使用的任務數,即進程數。
最大記憶體
每個計算節點運行此作業可使用的最大記憶體。預設為空白,表示不限制記憶體大小。
執行時間
作業最長已耗用時間,逾時作業將執行失敗,預設為空白,表示不限制已耗用時間。
線程數
每個任務所使用的線程數。預設為空白,表示線程數為1。
GPU數
每個計算節點運行此作業使用的GPU數。配置該參數時請確保計算節點為GPU執行個體。
標準輸出路徑、錯誤輸出路徑
定義Linux系統的stderr、stdout輸出重新導向路徑,包含輸出檔案名。
stdout:標準檔案輸出路徑。
stderr:錯誤檔案輸出路徑。
叢集使用者必須有該路徑的可寫入權限,預設按照調度器設定產生輸出檔案。
添加環境變數
可根據需要添加環境變數。
方式二:通過命令列提交作業
通過Terminal遠程登入叢集。
在左側導覽列,選擇會話管理。
在右側頁面單擊terminal。
在快顯視窗,根據調度器類型執行相關命令提交作業。
以PBS調度器為例,假設作業檔案為test.pbs,則執行
qsub test.pbs
命令提交作業。更多資訊,請參見通過命令列提交作業。
方式三:通過工作範本提交作業
建立工作範本。
在作業提交頁面,單擊提交作業。
在新增作業面板,配置作業相關參數。
參數說明請參見作業參數說明表。
單擊儲存為模板。
在彈出的對話方塊中輸入模板名稱,單擊確定。
在作業提交頁面的作業提交模板地區,找到目標工作範本,單擊對應的表徵圖。
說明工作範本地區以卡片的形式展示工作範本,您可以根據需要單擊卡片底部的表徵圖進行提交作業、編輯或者刪除工作範本操作。
在彈出面板,確認作業相關參數,單擊提交作業。
方式四:通過應用中心提交作業
E-HPC用戶端提供了可視化的介面來配置GROMACS、Fluent等軟體應用,方便您配置應用相關的作業參數,可以快速提交作業。更多資訊,請參見運行應用。