阿里雲Container ServiceACK支援對各種異構計算資源進行統一調度和營運管理,能夠顯著提高異構計算叢集資源的使用效率。本文介紹阿里雲Container ServiceACK支援的異構計算叢集。
背景資訊
隨著5G、人工智慧、HPC( High Performance Computing)、邊緣計算等業務的興起,人們對算力的效能要求達到了一個新的高度,以CPU為代表的通用計算越來越不能滿足這些業務的算力需求。因此,人們逐漸將注意力轉移到以領域專有架構DSA(Domain Specific Architecture)為代表的異構計算上,各種異構計算裝置(GPU、FPGA等)在這些業務領域承擔著重要的角色。
如何大規模管理這些異構計算資源成為一個比較棘手的問題。為瞭解決這個問題,阿里雲Container Service提供一站式管理異構計算資源方案,實現對異構計算資源的統一調度和營運管理。
異構計算叢集介紹
阿里雲Container ServiceACK支援對GPU、FPGA、ASIC和RDMA異構資源進行統一調度和營運管理,提高叢集資源的使用效率。Container ServiceACK支援的異構計算叢集及具體功能如下。
異構資源 | 功能描述 |
GPU | 阿里雲Container ServiceACK支援建立帶有T4、P100、V100等市場主流GPU卡的叢集。更多資訊,請參見建立GPU叢集和建立專有GPU叢集。
|
FPGA | 阿里雲Container ServiceACK支援建立帶有FPGA裝置的叢集。更多資訊,請參見建立FPGA叢集。
|
ASIC | 阿里雲Container ServiceACK支援建立帶有NETINT ASIC裝置的叢集,支援以單張NETINT ASIC卡為單位申請叢集資源。更多資訊,請參見建立ASIC叢集。 |
RDMA | Container ServiceACK支援建立帶有RDMA裝置的叢集。更多資訊,請參見eRDMA。
|