阿里云容器服务ACK支持对各种异构计算资源进行统一调度和运维管理,能够显著提高异构计算集群资源的使用效率。本文介绍阿里云容器服务ACK支持的异构计算集群。
背景信息
随着5G、人工智能、HPC( High Performance Computing)、边缘计算等业务的兴起,人们对算力的性能要求达到了一个新的高度,以CPU为代表的通用计算越来越不能满足这些业务的算力需求。因此,人们逐渐将注意力转移到以领域专有架构DSA(Domain Specific Architecture)为代表的异构计算上,各种异构计算设备(GPU、FPGA等)在这些业务领域承担着重要的角色。
如何大规模管理这些异构计算资源成为一个比较棘手的问题。为了解决这个问题,阿里云容器服务提供一站式管理异构计算资源方案,实现对异构计算资源的统一调度和运维管理。
异构计算集群介绍
阿里云容器服务ACK支持对GPU、FPGA、ASIC和RDMA异构资源进行统一调度和运维管理,提高集群资源的使用效率。容器服务ACK支持的异构计算集群及具体功能如下。
异构资源 | 功能描述 |
GPU | 阿里云容器服务ACK支持创建带有T4、P100、V100等市场主流GPU卡的集群。更多信息,请参见创建GPU集群和创建专有GPU集群。
|
FPGA | 阿里云容器服务ACK支持创建带有FPGA设备的集群。更多信息,请参见创建FPGA集群。
|
ASIC | 阿里云容器服务ACK支持创建带有NETINT ASIC设备的集群,支持以单张NETINT ASIC卡为单位申请集群资源。更多信息,请参见创建ASIC集群。 |
RDMA | 容器服务ACK支持创建带有RDMA设备的集群。更多信息,请参见eRDMA。
|