全部產品
Search
文件中心

Container Service for Kubernetes:kube-scheduler

更新時間:Sep 14, 2024

kube-scheduler是一個控制面組件,負責結合節點資源使用方式和Pod的調度要求將Pod調度到叢集的合適節點上。

組件介紹

kube-scheduler介紹

基於Pod申明的Request和節點的Allocatable屬性,kube-scheduler可以為調度隊列中每個Pod確定其可放置的節點,並保證節點的合法性。此外,kube-scheduler還可以將所有合法的節點排序,將Pod綁定到一個合適的節點。kube-scheduler預設根據Request值對Pod進行均勻放置。更多資訊,請參見Kubernetes官方文檔kube-scheduler

Filter及Score外掛程式介紹

Kubernetes調度架構(Scheduling Framework)將複雜的調度邏輯提煉為外掛程式,基於外掛程式實現調度的靈活拓展。其中,Filter(過濾)外掛程式可以在Pod調度時篩選出無法運行特定Pod的節點,Score(評分)外掛程式可以根據演算法邏輯對過濾的節點打分,得出的分數代表節點適合運行該Pod的程度。

下表介紹各kube-scheduler版本中,調度外掛程式開啟FilterScore的列表及預設權重。

展開查看預設開啟的外掛程式情況

組件版本

Filter

Score

v1.30.1-aliyun.6.5.4.fcac2bdf

  • 開源預設開啟外掛程式:

    與開源社區一致,請參見v1.30.1 Filter預設開啟外掛程式

  • ACK預設開啟外掛程式:

    • NodeNUMAResource

    • topologymanager

    • EciPodTopologySpread

    • ipawarescheduling

    • BatchResourceFit

    • PreferredNode

    • gpushare

    • NetworkTopology

    • CapacityScheduling

    • elasticresource

    • resourcepolicy

    • gputopology

    • ECIBinderV1

    • loadawarescheduling

    • EciScheduling

  • 開源預設開啟外掛程式:

    與開源社區一致,請參見v1.30.1 Score預設開啟外掛程式

  • ACK預設開啟外掛程式及外掛程式對應權重:

    • Name: NodeNUMAResource Default Weight: 1

    • Name: ipawarescheduling Default Weight: 1

    • Name: gpuNUMAJointAllocation Default Weight: 1

    • Name: PreferredNode Default Weight: 10000

    • Name: gpushare Default Weight: 20000

    • Name: gputopology Default Weight: 1

    • Name: numa Default Weight: 1

    • Name: EciScheduling Default Weight: 2

    • Name: NodeAffinity Default Weight: 2

    • Name: elasticresource Default Weight: 1000000

    • Name: resourcepolicy Default Weight: 1000000

    • Name: NodeBEResourceLeastAllocated Default Weight: 1

    • Name: loadawarescheduling Default Weight: 10

v1.28.3-aliyun-6.5.2.7ff57682

  • 開源預設開啟外掛程式:

    與開源社區一致,請參見v1.28.3 Filter預設開啟外掛程式

  • ACK預設開啟外掛程式:

    • NodeNUMAResource

    • topologymanager

    • EciPodTopologySpread

    • ipawarescheduling

    • BatchResourceFit

    • PreferredNode

    • gpushare

    • NetworkTopology

    • CapacityScheduling

    • elasticresource

    • resourcepolicy

    • gputopology

    • ECIBinderV1

    • loadawarescheduling

    • EciScheduling

  • 開源預設開啟外掛程式:

    與開源社區一致,請參見v1.28.3 Score預設開啟外掛程式

  • ACK預設開啟外掛程式及外掛程式對應權重:

    • Name: NodeNUMAResource Default Weight: 1

    • Name: ipawarescheduling Default Weight: 1

    • Name: gpuNUMAJointAllocation Default Weight: 1

    • Name: PreferredNode Default Weight: 10000

    • Name: gpushare Default Weight: 20000

    • Name: gputopology Default Weight: 1

    • Name: numa Default Weight: 1

    • Name: EciScheduling Default Weight: 2

    • Name: NodeAffinity Default Weight: 2

    • Name: elasticresource Default Weight: 1000000

    • Name: resourcepolicy Default Weight: 1000000

    • Name: NodeBEResourceLeastAllocated Default Weight: 1

    • Name: loadawarescheduling Default Weight: 10

v1.26.3-aliyun-6.6.1.605b8a4f

  • 開源預設開啟外掛程式:

    與開源社區一致,請參見v1.26.3 Filter預設開啟外掛程式

  • ACK預設開啟外掛程式:

    • NodeNUMAResource

    • topologymanager

    • EciPodTopologySpread

    • ipawarescheduling

    • BatchResourceFit

    • PreferredNode

    • gpushare

    • NetworkTopology

    • CapacityScheduling

    • elasticresource

    • resourcepolicy

    • gputopology

    • ECIBinderV1

    • loadawarescheduling

    • EciScheduling

  • 開源預設開啟外掛程式:

    與開源社區一致,請參見v1.26.3 Score預設開啟外掛程式

  • ACK預設開啟外掛程式:

    • Name: NodeNUMAResource Default Weight: 1

    • Name: ipawarescheduling Default Weight: 1

    • Name: gpuNUMAJointAllocation Default Weight: 1

    • Name: PreferredNode Default Weight: 10000

    • Name: gpushare Default Weight: 20000

    • Name: gputopology Default Weight: 1

    • Name: numa Default Weight: 1

    • Name: EciScheduling Default Weight: 2

    • Name: NodeAffinity Default Weight: 2

    • Name: elasticresource Default Weight: 1000000

    • Name: resourcepolicy Default Weight: 1000000

    • Name: NodeBEResourceLeastAllocated Default Weight: 1

    • Name: loadawarescheduling Default Weight: 10

外掛程式功能介紹

展開查看外掛程式介紹及其相關功能文檔

外掛程式名稱

說明

相關功能文檔

NodeNUMAResource

管理CPU拓撲感知調度。

啟用CPU拓撲感知調度

topologymanager

管理節點NUMA資源分派。

啟用NUMA拓撲感知調度

EciPodTopologySpread

在虛擬節點調度情境下增強拓撲分布約束功能。

開啟叢集虛擬節點調度策略

ipawarescheduling

剩餘IP的感知調度。

調度FAQ

BatchResourceFit

開啟並管理在離線混部。

在離線混部概述

PreferredNode

為開啟節點伸縮的節點池預留節點。

節點伸縮概述

gpushare

管理共用GPU調度。

共用GPU調度

NetworkTopology

管理網路拓撲感知調度。

拓撲感知調度

CapacityScheduling

管理CapacityScheduling。

使用Capacity Scheduling

elasticresource

管理ECI彈性調度。

使用ECI彈性調度

resourcepolicy

管理自訂彈性資源的調度。

自訂彈性資源優先順序調度

gputopology

管理GPU拓撲感知調度。

GPU拓撲感知調度

ECIBinderV1

負責ECI彈性調度情境下虛擬節點的綁定。

通過虛擬節點將Pod調度到ECI上運行

loadawarescheduling

管理負載感知調度。

使用負載感知調度

EciScheduling

管理虛擬節點調度。

開啟叢集虛擬節點調度策略

使用說明

kube-scheduler組件預設安裝,無需配置即可使用。推薦您及時升級kube-scheduler組件版本,以便享用最新版本組件帶來的功能最佳化和缺陷修複。您可以登入Container Service管理主控台,單擊目的地組群,然後在左側導覽列選擇營運管理 > 組件管理升級組件。

變更記錄

1.31版本變更記錄

版本號碼

變更時間

變更內容

v1.31.0-aliyun.6.6.0.ba473715

2024年09月13日

在1.31版本的ACK叢集中支援此前的全部功能。

1.30版本變更記錄

版本號碼

變更時間

變更內容

v1.30.3-aliyun.6.6.1.d98352c6

2024年09月11日

  • 網路拓撲感知調度支援搶佔

  • SlurmOperator

    • 支援Kubernetes & Slurm叢集混合調度。

  • Coscheduling

    • 支援社區最新版本CRD。

v1.30.3-aliyun.6.5.6.fe7bc1d5

2024年08月20日

修複v1.30.1-aliyun.6.5.1.5dad3be8引入的PodAffinity/PodAntiaffinity調度異常。

v1.30.3-aliyun.6.5.5.8b10ee7c

2024年08月01日

  • Rebase到社區版本v1.30.3。

v1.30.1-aliyun.6.5.5.fcac2bdf

2024年08月01日

  • CapacityScheduling

    • 修複Coscheduling與CapacityScheduling同時使用可能發生的Quota計算錯誤的問題。

  • GPUShare

    • 修複算力調度節點剩餘資源計算錯誤的問題。

  • 自訂彈性資源優先順序調度

    • 最佳化ResourcePolicy與ClusterAutoscaler同時使用時節點彈出行為。當所有Unit中Pod已經達到Max時不再彈出節點。

v1.30.1-aliyun.6.5.4.fcac2bdf

2024年07月22日

  • Coscheduling

    • 修複使用ECI時Quota統計出錯的問題。

  • 修複偶發的"xxx is in cache, so can't be assumed"問題。

v1.30.1-aliyun.6.5.3.9adaeb31

2024年07月10日

修複v1.30.1-aliyun.6.5.1.5dad3be8版本引入的Pod長時間Pending的問題。

v1.30.1-aliyun.6.5.1.5dad3be8

2024年06月27日

  • Coscheduling

    • 最佳化Coscheduling調度速度。

  • 支援Pod順序調度。

  • 支援通過申明等價類別提升調度效能。

  • 通過PreEnqueue最佳化現有調度器外掛程式效能。

v1.30.1-aliyun.6.4.7.6643d15f

2024年05月31日

  • 在1.30版本的ACK叢集中支援此前的全部功能。

1.28版本變更記錄

版本號碼

變更時間

變更內容

v1.28.12-aliyun-6.6.1.348b251d

2024年09月11日

  • 網路拓撲感知調度支援搶佔。

  • SlurmOperator

    • 支援Kubernetes & Slurm叢集混合調度。

v1.28.12-aliyun-6.5.4.79e08301

2024年08月20日

修複v1.28.3-aliyun-6.5.1.364d020b引入的PodAffinity/PodAntiaffinity調度異常。

v1.28.12-aliyun-6.5.3.aefde017

2024年08月01日

  • Rebase到社區版本v1.28.12。

v1.28.3-aliyun-6.5.3.79e08301

2024年08月01日

  • CapacityScheduling

    • 修複Coscheduling與CapacityScheduling同時使用可能發生的Quota計算錯誤的問題。

  • GPUShare

    • 修複算力調度節點剩餘資源計算錯誤的問題。

  • 自訂彈性資源優先順序調度

    • 最佳化ResourcePolicy與ClusterAutoscaler同時使用時節點彈出行為。當所有Unit中Pod已經達到Max時不再彈出節點。

v1.28.3-aliyun-6.5.2.7ff57682

2024年07月22日

  • Coscheduling

    • 修複使用ECI時Quota統計出錯的問題。

  • 修複偶發的"xxx is in cache, so can't be assumed"問題。

  • 修複v1.28.3-aliyun-6.5.1.364d020b版本引入的Pod長時間Pending的問題。

v1.28.3-aliyun-6.5.1.364d020b

2024年06月27日

  • Coscheduling

    • 最佳化Coscheduling調度速度。

  • 支援Pod順序調度。

  • 支援通過申明等價類別提升調度效能。

  • 通過PreEnqueue最佳化現有調度器外掛程式效能。

v1.28.3-aliyun-6.4.7.0f47500a

2024年05月24日

  • 網路拓撲感知調度

    • 修複網路拓撲感知調度在偶發情況下無法調度的問題。

v1.28.3-aliyun-6.4.6.f32dc398

2024年05月16日

  • 共用GPU調度

    • 修複靈駿叢集中節點ack.node.gpu.schedule標籤從egpu修改為default後將導致GPU調度異常的問題。

  • CapacityScheduling

    • 修複偶發的錯誤提示:running AddPod on PreFilter plugin

  • 彈性調度

    • 新增使用alibabacloud.com/burst-resource生產eci時,產生wait for eci provisioning的事件。

v1.28.3-aliyun-6.4.5.a8b4a599

2024年05月09日

v1.28.3-aliyun-6.4.3.f57771d7

2024年03月18日

  • 共用GPU調度

    • 支援提交ConfigMap進行指定卡的隔離。

  • 自訂彈性資源優先順序調度

    • 新增支援elastic資源類型。

v1.28.3-aliyun-6.4.2.25bc61fb

2024年03月01日

預設關閉SchedulerQueueingHints功能。詳情可參考Pull Request #122291

v1.28.3-aliyun-6.4.1.c7db7450

2024年02月21日

  • 新增支援NUMA聯合調度

  • 自訂彈性資源優先順序調度

    • 新增支援在Unit間嘗試等待。

  • 修複剩餘IP感知調度中由於剩餘IP計數錯誤導致可調度Pod變少的問題

v1.28.3-aliyun-6.3.1ab2185e

2024年01月10日

  • 自訂彈性資源優先順序調度

    • 修複了使用自訂彈性資源優先順序調度時,ECI可用性區域親和以及打散不生效的問題。

  • CPU拓撲感知調度

    • 避免重複給單個Pod分配相同CPU核,從而導致Pod在節點上啟動失敗。

  • ECI彈性調度

    • 修複了使用alibabacloud.com/burst-resource標籤指定策略時,若標籤的value不為eci或eci_only,依然會調度到ECI上的問題。

v1.28.3-aliyun-6.2.84d57ad9

2023年12月21日

新增自訂彈性資源優先順序支援MatchLabelKeys,在應用發版時自動為不同版本進行分組。

v1.28.3-aliyun-6.1.ac950aa0

2023年12月13日

  • CapacityScheduling

    • 新增指定Quota功能,Pod上可通過quota.scheduling.alibabacloud.com/name指定自身所屬Quota。

    • 新增隊列關聯功能,支援只統計被Kube Queue管理的Pod的資源量。

    • 最佳化搶佔邏輯,新版本中CapacityScheduling搶佔將不會導致被搶佔Quota的Pod使用量低於Min值,同樣不會導致搶佔Quota的Pod使用量高於Min值。

  • 自訂彈性資源優先順序

    • 新增支援更新ResourcePolicy的Unit和Node的Label,更新後將會同步修改Pod的Deletion-Cost。

    • 新增IgnoreTerminatingPod,支援在統計某個Unit下的Pod數量時忽略正在刪除的Pod。

    • 新增IgnorePreviousPod選項,支援在統計某個Unit下的Pod數量時忽略CreationTimestamp早於關聯的ResourcePolicy的Pod。

    • 新增PreemptPolicy選項,支援在Unit之間進行Pod搶佔嘗試。

  • GPUShare

    • 最佳化GPUShare調度速度,將Filter外掛程式的P99調度延遲由毫秒級降低到微秒級。

v1.28.3-aliyun-5.8-89c55520

2023年10月28日

在1.28版本的ACK叢集中支援此前的全部功能。

1.26版本變更記錄

版本號碼

變更時間

變更內容

v1.26.3-aliyun-6.6.3.67f250fe

2024年09月04日

  • SlurmOperator

    • 最佳化外掛程式調度效能。

v1.26.3-aliyun-6.6.2.9ea0a6f5

2024年08月30日

  • InterPodAffinity

    • 修複新節點去除汙點不會觸發Pod重新調度的問題。

v1.26.3-aliyun-6.6.1.605b8a4f

2024年07月31日

  • SlurmOperator

    • 支援Kubernetes & Slurm叢集混合調度。

  • 自訂彈性資源優先順序調度

    • 最佳化產品功能,與自動調整節點池一起使用時避免不必要得彈出節點。

v1.26.3-aliyun-6.4.7.2a77d106

2024年06月27日

  • Coscheduling

    • 最佳化Coscheduling調度速度。

v1.26.3-aliyun-6.4.6.78cacfb4

2024年05月16日

  • CapacityScheduling

    • 修複偶發的錯誤提示:running AddPod on PreFilter plugin

  • 彈性調度

    • 新增使用alibabacloud.com/burst-resource生產eci時,產生wait for eci provisioning的事件。

v1.26.3-aliyun-6.4.5.7f36e9b3

2024年05月09日

v1.26.3-aliyun-6.4.3.e7de0a1e

2024年03月18日

  • 共用GPU調度

    • 支援提交ConfigMap進行指定卡的隔離。

  • 自訂彈性資源優先順序調度

    • 新增支援elastic資源類型。

v1.26.3-aliyun-6.4.1.d24bc3c3

2024年02月21日

  • 最佳化Virtual Node在NodeResourceFit外掛程式打分時的得分。目前Virtual Node在NodeResourceFit外掛程式打分時總會得到0分,使得Preferred類型的NodeAffinity可以正常實現優先調度ECS節點的功能。

  • 新增支援NUMA聯合調度

  • 自訂彈性資源優先順序調度

    • 新增支援在Unit間嘗試等待。

  • 修複剩餘IP感知調度中由於剩餘IP計數錯誤導致可調度Pod變少的問題

v1.26.3-aliyun-6.3.33fdc082

2024年01月10日

  • 自訂彈性資源優先順序

    • 調度修複了使用自訂彈性資源優先順序調度時,ECI可用性區域親和以及打散不生效的問題。

  • CPU拓撲感知調度

    • 避免重複給單個Pod分配相同CPU核,從而導致Pod在節點上啟動失敗。

  • ECI彈性調度

    • 修複了使用alibabacloud.com/burst-resource標籤指定策略時,若標籤的value不為eci或eci_only,依然會調度到ECI上的問題。

  • CapacityScheduling

    • 新增ACK靈駿叢集中自動啟用任務搶佔功能。

v1.26.3-aliyun-6.2.d9c15270

2023年12月21日

新增自訂彈性資源優先順序支援MatchLabelKeys,在應用發版時自動為不同版本進行分組。

v1.26.3-aliyun-6.1.a40b0eef

2023年12月13日

  • CapacityScheduling

    • 新增指定Quota功能,Pod上可通過quota.scheduling.alibabacloud.com/name指定自身所屬Quota。

    • 新增隊列關聯功能,支援只統計被Kube Queue管理的Pod的資源量。

    • 最佳化搶佔邏輯,新版本中CapacityScheduling搶佔將不會導致被搶佔Quota的Pod使用量低於Min值,同樣不會導致搶佔Quota的Pod使用量高於Min值。

  • 自訂彈性資源優先順序

    • 新增支援更新功能,支援更新ResourcePolicy的Unit,支援更新Node的Label,更新後將會同步修改Pod的Deletion-Cost。

    • 新增IgnoreTerminatingPod,支援在統計某個Unit下的Pod數量時忽略正在刪除的Pod。

    • 新增IgnorePreviousPod選項,支援在統計某個Unit下的Pod數量時忽略CreationTimestamp早於關聯的ResourcePolicy的Pod。

    • 新增PreemptPolicy選項,支援在Unit之間進行Pod搶佔嘗試。

  • GPUShare

    • 最佳化GPUShare調度速度,將Filter外掛程式的P99調度延遲由毫秒級降低到微秒級。

v1.26.3-aliyun-5.9-cd4f2cc3

2023年11月16日

  • 最佳化由於雲端硬碟類型不滿足調度失敗的原因展示。

v1.26.3-aliyun-5.8-a1482f93

2023年10月16日

  • 新增支援Windows節點調度。

  • 最佳化Coscheduling處理多任務同時調度時的調度速度,減少任務阻塞的情況。

v1.26.3-aliyun-5.7-2f57d3ff

2023年09月20日

  • 修複GPUShare調度Pod時偶爾發生Admit失敗的問題。

  • 調度器中新增感知節點剩餘IP的外掛程式,當節點上無剩餘IP時不再向節點上調度Pod。

  • 調度器中新增拓撲感知調度外掛程式,支援將Pod調度到同一拓撲域上,並且將自動在多個拓撲域上進行重試。

  • 調度器將以一秒的頻率更新ElasticQuotaTree的Usage以及Request資訊。

v1.26.3-aliyun-5.5-8b98a1cc

2023年07月05日

  • 修複Coscheduling調度過程中,偶爾Pod長時間Pending的問題。

  • 最佳化Coscheduling與彈性節點池同時使用時的使用體驗。在部分Pod由於節點選取器配置錯誤而無法調度以及擴容時,PodGroup中的其他Pod不再觸發節點池擴容。

v1.26.3-aliyun-5.4-21b4da4c

2023年07月03日

  • 修複ResourcePolicy Max屬性失效的問題。

  • 最佳化大量Pending Pod對調度器效能的影響。叢集中存在大量Pending Pod時,調度器輸送量提升到與無Pending Pod時相近。

v1.26.3-aliyun-5.1-58a821bf

2023年05月26日

支援對PodGroup的min-available以及Matchpolicy等欄位進行更新。

v1.26.3-aliyun-5.0-7b1ccc9d

2023年05月22日

  • 自訂彈性資源優先順序功能支援在Unit欄位中聲明最大副本數。

  • 支援GPU拓撲感知調度。

v1.26.3-aliyun-4.1-a520c096

2023年04月27日

在Elasticquota超過限制或Gang Pod數量不滿足時,不再通過autoscaler彈出節點。

1.24版本變更記錄

版本號碼

變更時間

變更內容

v1.24.6-aliyun-6.4.6.c4d551a0

2024年05月16日

  • CapacityScheduling

    • 修複偶發的錯誤提示:running AddPod on PreFilter plugin

v1.24.6-aliyun-6.4.5.aab44b4a

2024年05月09日

v1.24.6-aliyun-6.4.3.742bd819

2024年03月18日

  • 共用GPU調度

    • 支援提交ConfigMap進行指定卡的隔離。

  • 自訂彈性資源優先順序調度

    • 新增支援elastic資源類型。

v1.24.6-aliyun-6.4.1.14ebc575

2024年02月21日

  • 最佳化Virtual Node在NodeResourceFit外掛程式打分時的得分。目前Virtual Node在NodeResourceFit外掛程式打分時總會得到0分,使得Preferred類型的NodeAffinity可以正常實現優先調度ECS節點的功能。

  • 新增支援NUMA聯合調度

  • 自訂彈性資源優先順序調度

    • 新增支援在Unit間嘗試等待。

  • 修複剩餘IP感知調度中由於剩餘IP計數錯誤導致可調度Pod變少的問題

v1.24.6-aliyun-6.3.548a9e59

2024年01月10日

  • 自訂彈性資源優先順序調度

    • 調度修複了使用自訂彈性資源優先順序調度時,ECI可用性區域親和以及打散不生效的問題。

  • CPU拓撲感知調度

    • 避免重複給單個Pod分配相同CPU核,從而導致Pod在節點上啟動失敗。

  • ECI彈性調度

    • 修複了使用alibabacloud.com/burst-resource標籤指定策略時,若標籤的value不為eci或eci_only,依然會調度到ECI上的問題。

  • CapacityScheduling

    • 新增ACK靈駿叢集中自動啟用任務搶佔功能。

v1.24.6-aliyun-6.2.0196baec

2023年12月21日

新增自訂彈性資源優先順序支援MatchLabelKeys,在應用發版時自動為不同版本進行分組。

v1.24.6-aliyun-6.1.1900da95

2023年12月13日

  • CapacityScheduling

    • 新增指定Quota功能,Pod上可通過quota.scheduling.alibabacloud.com/name指定自身所屬Quota。

    • 新增隊列關聯功能,支援只統計被Kube Queue管理的Pod的資源量。

    • 最佳化搶佔邏輯,新版本中CapacityScheduling搶佔將不會導致被搶佔Quota的Pod使用量低於Min值,同樣不會導致搶佔Quota的Pod使用量高於Min值。

  • 自訂彈性資源優先順序

    • 新增支援更新功能,支援更新ResourcePolicy的Unit,支援更新Node的Label,更新後將會同步修改Pod的Deletion-Cost。

    • 新增IgnoreTerminatingPod,支援在統計某個Unit下的Pod數量時忽略正在刪除的Pod。

    • 新增IgnorePreviousPod選項,支援在統計某個Unit下的Pod數量時忽略CreationTimestamp早於關聯的ResourcePolicy的Pod。

    • 新增PreemptPolicy選項,支援在Unit之間進行Pod搶佔嘗試。

  • GPUShare

    • 最佳化GPUShare調度速度,將Filter外掛程式的P99調度延遲由毫秒級降低到微秒級。

v1.24.6-aliyun-5.9-e777ab5b

2023年11月16日

  • 最佳化由於雲端硬碟類型不滿足調度失敗的原因展示。

v1.24.6-aliyun-5.8-49fd8652

2023年10月16日

  • 新增支援Windows節點調度。

  • 最佳化Coscheduling處理多任務同時調度時的調度速度,減少任務阻塞的情況。

v1.24.6-aliyun-5.7-62c7302c

2023年09月20日

  • 修複GPUShare調度Pod時偶爾發生Admit失敗的問題。

v1.24.6-aliyun-5.6-2bb99440

2023年08月31日

  • 調度器中新增感知節點剩餘IP的外掛程式,當節點上無剩餘IP時不再向節點上調度Pod。

  • 調度器中新增拓撲感知調度外掛程式,支援將Pod調度到同一拓撲域上,並且將自動在多個拓撲域上進行重試。

  • 調度器將以一秒的頻率更新ElasticQuotaTree的Usage以及Request資訊。

v1.24.6-aliyun-5.5-5e8aac79

2023年07月05日

  • 修複Coscheduling調度過程中,偶爾Pod長時間Pending的問題。

  • 最佳化Coscheduling與彈性節點池同時使用時的使用體驗。在部分Pod由於節點選取器配置錯誤而無法調度以及擴容時,PodGroup中的其他Pod不再觸發節點池擴容。

v1.24.6-aliyun-5.4-d81e785e

2023年07月03日

  • 修複ResourcePolicy Max屬性失效的問題。

  • 最佳化大量Pending Pod對調度器效能的影響。叢集中存在大量Pending Pod時,調度器輸送量提升到與無Pending Pod時相近。

v1.24.6-aliyun-5.1-95d8a601

2023年05月26日

支援對Coscheduling的min-available以及Matchpolicy等欄位進行更新。

v1.24.6-aliyun-5.0-66224258

2023年05月22日

  • 自訂彈性資源優先順序功能支援在Unit欄位中聲明最大副本數。

  • 支援GPU拓撲感知調度。

v1.24.6-aliyun-4.1-18d8d243

2023年03月31日

ElasticResource支援將Pod調度到Arm VK節點上。

v1.24.6-4.0-330eb8b4-aliyun

2023年03月01日

  • GPUShare:

    • 修複GPU節點降配時調度器狀態錯誤的問題。

    • 修複GPU節點無法滿額分配顯存的問題。

    • 支援搶佔GPU Pod。

  • Coscheduling:

    • 支援通過PodGroup以及Koordinator API的方式申明Gang。

    • 支援通過Matchpolicy控制Gang的重試策略。

    • 支援Gang Group。

    • Gang的命名需要滿足DNS子網域名稱規則。

  • 自訂參數:支援Loadaware相關配置參數。

v1.24.6-3.2-4f45222b-aliyun

2023年01月13日

修複GPUShare記憶體計算不準確,導致Pod無法正常使用顯存的問題。

v1.24.6-ack-3.1

2022年11月14日

  • GPU共用調度預設開啟score功能(之前版本預設不開啟score功能)。

  • 支援負載感知調度。

v1.24.6-ack-3.0

2022年09月27日

支援Capacity Scheduling。

v1.24.3-ack-2.0

2022年09月21日

  • 支援GPU共用調度。

  • 支援Coscheduling。

  • 支援ECI彈性調度。

  • 支援CPU智能調度。

1.22版本變更記錄

版本號碼

變更時間

變更內容

v1.22.15-aliyun-6.4.5.08196303

2024年05月23日

  • 網路拓撲感知調度

    • 修複網路拓撲感知調度在偶發情況下無法調度的問題。

v1.22.15-aliyun-6.4.4.7fc564f8

2024年05月16日

  • CapacityScheduling

    • 修複偶發的錯誤提示:running AddPod on PreFilter plugin

v1.22.15-aliyun-6.4.3.e858447b

2024年04月22日

  • 自訂彈性資源優先順序調度

    • 修複刪除ResourcePolicy時偶爾導致狀態異常的問題。

v1.22.15-aliyun-6.4.2.4e00a021

2024年03月18日

  • CapacityScheduling

    • 修複ACK靈駿叢集中偶發搶佔失敗的問題。

  • 新增支援通過Configmap手動拉黑叢集中特定GPU卡。

v1.22.15-aliyun-6.4.1.1205db85

2024年02月29日

  • 自訂彈性資源優先順序調度

    • 修複偶爾發生的並發衝突問題。

v1.22.15-aliyun-6.4.0.145bb899

2024年02月28日

  • CapacityScheduling

    • 修複指定Quota功能導致Quota統計錯誤的問題。

v1.22.15-aliyun-6.3.a669ec6f

2024年01月10日

  • 自訂彈性資源優先順序調度

    • 修複了使用自訂彈性資源優先順序調度時ECI可用性區域親和以及打散不生效的問題。

    • 新增支援MatchLabelKeys

  • CPU拓撲感知調度

    • 修複了可能重複給單個Pod分配多次相同CPU核導致Pod在節點上啟動失敗的問題。

  • ECI彈性調度

    • 修複了使用alibabacloud.com/burst-resource標籤指定策略時,若標籤的value不為eci或eci_only,依然會調度到ECI上的問題。

  • CapacityScheduling

    • 新增ACK靈駿叢集中自動啟用任務搶佔功能。

v1.22.15-aliyun-6.1.e5bf8b06

2023年12月13日

  • CapacityScheduling

    • 新增指定Quota功能,Pod上可通過quota.scheduling.alibabacloud.com/name指定自身所屬Quota。

    • 新增隊列關聯功能,可通過配置設定Quota只統計被Kube Queue管理的Pod的資源量。

    • 最佳化搶佔邏輯,新版本中CapacityScheduling搶佔將不會導致被搶佔Quota的Pod使用量低於Min值,同樣不會導致搶佔Quota的Pod使用量高於Min值。

  • 自訂彈性資源優先順序

    • 新增支援更新功能,支援更新ResourcePolicy的Unit,支援更新Node的Label,更新後將會同步修改Pod的Deletion-Cost。

    • 新增IgnoreTerminatingPod,支援在統計某個Unit下的Pod數量時忽略正在刪除的Pod。

    • 新增IgnorePreviousPod選項,支援在統計某個Unit下的Pod數量時忽略CreationTimestamp早於關聯的ResourcePolicy的Pod。

    • 新增PreemptPolicy選項,支援在Unit之間進行Pod搶佔嘗試。

  • GPUShare

    • 最佳化GPUShare調度速度,將Filter外掛程式的P99調度延遲由毫秒級降低到微秒級。

v1.22.15-aliyun-5.9-04a5e6eb

2023年11月16日

  • 最佳化由於雲端硬碟類型不滿足調度失敗的原因展示。

v1.22.15-aliyun-5.8-29a640ae

2023年10月16日

  • 新增支援Windows節點調度。

  • 最佳化Coscheduling處理多任務同時調度時的調度速度,減少任務阻塞的情況。

v1.22.15-aliyun-5.7-bfcffe21

2023年09月20日

  • 修複GPUShare調度Pod時偶爾發生Admit失敗的問題。

v1.22.15-aliyun-5.6-6682b487

2023年08月14日

  • 調度器中新增感知節點剩餘IP的外掛程式,當節點上無剩餘IP時不再向節點上調度Pod。

  • 調度器中新增拓撲感知調度外掛程式,支援將Pod調度到同一拓撲域上,並且將自動在多個拓撲域上進行重試。

  • 調度器將以一秒的頻率更新ElasticQuotaTree的Usage以及Request資訊。

v1.22.15-aliyun-5.5-82f32f68

2023年07月05日

  • 修複Coscheduling調度過程中,偶爾Pod長時間Pending的問題。

  • 最佳化PodGroup與彈性節點池同時使用時的使用體驗。在部分Pod由於節點選取器配置錯誤而無法調度以及擴容時,PodGroup中的其他Pod不再觸發節點池擴容。

v1.22.15-aliyun-5.4-3b914a05

2023年07月03日

  • 修複ResourcePolicy Max屬性失效的問題。

  • 最佳化大量Pending Pod對調度器效能的影響。叢集中存在大量Pending Pod時,調度器輸送量提升到與無Pending Pod時相近。

v1.22.15-aliyun-5.1-8a479926

2023年05月26日

支援對PodGroup的min-available以及Matchpolicy等欄位進行更新。

v1.22.15-aliyun-5.0-d1ab67d9

2023年05月22日

  • 自訂彈性資源優先順序功能支援在Unit欄位中聲明最大副本數。

  • 支援GPU拓撲感知調度。

v1.22.15-aliyun-4.1-aec17f35

2023年03月31日

ElasticResource支援將Pod調度到Arm VK節點上。

v1.22.15-aliyun-4.0-384ca5d5

2023年3月3日

  • GPUShare:

    • 修複GPU節點降配時調度器狀態錯誤的問題。

    • 修複GPU節點無法滿額分配顯存的問題。

    • 支援搶佔GPU Pod。

  • Coscheduling:

    • 支援通過PodGroup以及Koordinator API的方式申明Gang。

    • 支援通過Matchpolicy控制Gang的重試策略。

    • 支援Gang Group。

    • Gang的命名需要滿足DNS子網域名稱規則。

  • 自訂參數:支援Loadaware相關配置參數。

v1.22.15-2.1-a0512525-aliyun

2023年01月10日

修複GPUShare記憶體計算不準確導致Pod無法正常使用顯存的問題。

v1.22.15-ack-2.0

2022年11月30日

  • 調度器支援自訂參數。

  • 支援負載感知調度。

  • 支援基於節點池優先順序的彈性調度。

  • 支援GPU共用算力調度。

v1.22.3-ack-1.1

2022年02月27日

修複共用GPU調度在叢集只有一個節點時無法調度的問題。

v1.22.3-ack-1.0

2021年01月04日

  • 支援CPU智能調度。

  • 支援Coscheduling。

  • 支援Capacity Scheduling。

  • 支援ECI彈性調度。

  • 支援GPU共用調度。

1.20版本變更記錄

版本號碼

變更時間

變更內容

v1.20.11-aliyun-10.6-f95f7336

2023年09月22日

  • 修複ElasticQuotaTree中Quota使用量偶發統計錯誤的問題。

v1.20.11-aliyun-10.3-416caa03

2023年05月26日

  • 修複GPUShare在低版本K8s中偶爾Cache錯誤的問題。

v1.20.11-aliyun-10.2-f4a371d3

2023年04月27日

  • ElasticResource支援將Pod調度到Arm VK 節點上。

  • 修複Loadaware scheduling由於CPU使用量超過請求量導致調度失敗的問題。

v1.20.11-aliyun-10.0-ae867721

2023年04月03日

Coscheduling調度支援Matchpolicy。

v1.20.11-aliyun-9.2-a8f8c908

2023年03月08日

  • CapacityScheduling:修複存在同名Quota導致調度器狀態錯誤的問題。

  • 支援雲端硬碟調度。

  • 共用GPU調度:

    • 修複GPU節點降配時調度器狀態錯誤的問題。

    • 修複偶發GPU節點無法滿額分配顯存的問題。

    • 支援搶佔GPU Pod。

  • CPU拓撲感知調度:開啟CPU調度的Pod不會調度到未開啟Numa的節點上。

  • 支援自訂參數。

v1.20.4-ack-8.0

2022年08月29日

修複已知bug。

v1.20.4-ack-7.0

2022年02月22日

支援基於節點池優先順序的彈性調度。

v1.20.4-ack-4.0

2021年09月02日

  • 支援負載感知調度。

  • 支援ECI彈性調度。

v1.20.4-ack-3.0

2021年05月26日

支援基於Socket和L3 cache的CPU智能調度。

v1.20.4-ack-2.0

2021年05月14日

支援Capacity Scheduling。

v1.20.4-ack-1.0

2021年04月07日

  • 支援CPU智能調度。

  • 支援Coscheduling。

  • 支援GPU拓撲感知調度。

  • 支援GPU共用調度。

1.18版本變更記錄

版本號碼

變更時間

變更內容

v1.18-ack-4.0

2021年09月02日

支援負載感知調度。

v1.18-ack-3.1

2021年06月05日

ECI調度相容節點池。

v1.18-ack-3.0

2021年03月12日

支援ECI/ECS統一調度。

v1.18-ack-2.0

2020年11月30日

支援GPU拓撲感知調度支援GPU共用調度。

v1.18-ack-1.0

2020年09月24日

支援CPU智能調度支援Coscheduling。

1.16版本變更記錄

版本號碼

變更時間

變更內容

v1.16-ack-1.0

2020年07月21日

  • 在Kubernetes v1.16叢集中支援CPU智能調度。

  • 在Kubernetes v1.16叢集中支援Coscheduling。