基于Pod的容量预留为弹性业务形态提供资源确定性保障。GPU Pod容量预留不需要直接绑定集群,您只需要购买时指定Pod规格、可用区、锁定时间等属性,ACS会保证在需要资源时,分钟级启动相应规格的Pod。通过GPU Pod容量预留,可以保障资源确定性,同时Pod预留价格相比于按量付费Pod更低。本文介绍GPU Pod容量预留的功能和特点。
功能特点
资源确定性:在GPU Pod容量预留生效期间,系统保障资源成功拉起。
降低成本:Pod拉起后按照按量价格收费,Pod销毁后按照容量预留价格收费,您可以根据业务流量灵活配置Pod拉起和销毁时间点。
资源灵活性:可以创建多种不同规格的GPU Pod容量预留,以满足不同业务的需求。
GPU Pod容量预留不支持为BestEffort算力类型的Pod提供保障。
GPU Pod容量预留支持地域、类型等属性相匹配的节省计划。
GPU Pod容量预留根据库存情况反馈创建是否成功。
使用场景
周期性实时业务的资源需求:业务在每天/每周的周期中呈现"潮汐"特征,任务需要保证实时执行和完成。例如实时推理业务等。
偶发性的大量资源需求:业务中存在突发性的实时计算需求,需要保证资源的快速交付和扩容,避免对业务的影响。例如互联网业务中的热点事件引发的资源需求等。
使用与计费示例
GPU Pod容量预留是按量付费方式。在容量预留生效期间,支付费用包括:
未使用的容量预留按量费用。
启动Pod的按量费用。
本文以购买两个GPU Pod容量预留并分别创建按量付费Pod1和按量付费Pod2的业务场景为例,展示使用流程以及不同阶段的计费算法,如下图所示。
阶段1:购买创建容量预留
在容器计算服务控制台中,选择资源管理 > 创建GPU资源预留,配置容量预留参数,单击创建。
配置项 | 说明 |
容量预留名称 | 用户自定义容量预留名称。 |
地域 | 需要预留资源的地域。 |
可用区 | 需要预留资源的可用区。 |
预留类型 | GPU卡型。 |
资源规格 | 容量预留的Pod规格。 |
预留方式 | Pod预留(不可修改)。 |
计费模式 | 按量付费(不可修改)。 |
释放方式 | 默认释放容量预留的时间。 |
数量 | 此规格GPU Pod容量预留的数量。 |
对应阶段的费用算法如下:
阶段 | 费用 | 说明 |
阶段1 | 无 | 未创建容量预留 |
阶段2-6:容量预留生效期
在生效期内,您可以随时创建与预留配置相同的Pod实例,系统保证创建成功,同时扣除对应数量的容量预留额度。Pod销毁后,相应配置的GPU Pod容量预留额度会同时恢复。
对应阶段的费用算法如下:
阶段 | 费用 |
阶段2 | 2×容量预留单价×阶段2时长 |
阶段3 | 1×容量预留单价×阶段3时长+ Pod1按量单价×阶段3时长 |
阶段4 | Pod1按量单价×阶段4时长+ Pod2按量单价×阶段4时长 |
阶段5 | 1×容量预留单价×阶段5时长+ Pod2按量单价×阶段5时长 |
阶段6 | 2×容量预留单价×阶段6时长 |
其中容量预留单价为未使用的容量预留按量费用,Pod1和Pod2的按量单价以Pod启动后的按量费用计算。
当您创建的Pod规格与预留配置不同时,ACS将采用按量的方式直接进行创建,不会使用当前的容量预留,Pod创建状态会根据库存情况实时反馈。
阶段7:容量预留到期
容量预留到期后,系统会自动释放GPU Pod容量预留。