全部產品
Search
文件中心

Container Service for Kubernetes:作業系統Alibaba Cloud Linux 3

更新時間:Jun 19, 2024

Container Service for Kubernetes已全面支援阿里雲新一代作業系統Alibaba Cloud Linux 3的節點建立,並結合Alibaba Cloud Linux 3高版本核心的特性提供了多情境最佳化。本文介紹Alibaba Cloud Linux 3作業系統的優勢和情境,以及如何使用Alibaba Cloud Linux 3作為ACK節點系統鏡像。

Alibaba Cloud Linux 3概述

Alibaba Cloud Linux是阿里雲打造的Linux伺服器作業系統發行版。Alibaba Cloud Linux積極吸收了開源社區成果,為雲上應用程式提供Linux社區的增強功能,還通過引入更完善的發行版品質體系,保障產品品質。同時,Alibaba Cloud Linux結合阿里雲基礎設施進行了深度最佳化,為您提供企業級的支援和維護,提升作業系統服務的使用體驗。在繼承Alibaba Cloud Linux 2且相容Container Service for Kubernetes的同時,Alibaba Cloud Linux 3還進行了大量最佳化,包括但不僅限於:

  • 提供更新的基礎軟體和應用軟體,帶來更新的原生社區功能。

  • Container Service for Kubernetes協同最佳化的同時,雲端式情境和使用者情境持續改進。

  • 針對新的八代雲端服務器執行個體(例如Yitian、Sapphire Rapids、Genoa等)提供深度最佳化。

  • 提供作業系統自研功能,包括效能最佳化、新功能支援、易用性最佳化等。

  • 提供更加詳細的版本說明,便於您瞭解版本演化和變化。

Alibaba Cloud Linux 3作業系統鏡像優勢

優勢

說明

更新的基礎軟體和應用軟體

  • 核心:搭載阿里雲研發的Linux kernel 5.10

  • 編譯器:預設編譯器GCC 10、LLVM 15、RUST 1.66,同時支援gcc-toolset-12

  • 語言庫:支援glibc 2.32、OpenJDK 1.8、Python 3.8、Golang 1.19、Nodejs 14.21

  • 主流應用軟體:

    • Web類:支援Nginx 1.20、HTTPd 2.4.37

    • 資料庫類:支援Redis 6.2.7、MySQL 8.0.32、PostgreSQL 13.10、MariaDB 10.5.16

    • AI類:通過龍蜥社區AI生態軟體倉庫(epao)相容支援

  • Driver驅動:支援CUDA 11.4.4、NVIDIA Driver 470.199.02

  • Framework架構:支援TensorFlow 2.5.0、PyTorch 1.10.1

  • 容器支援:支援nvidia-container-toolkit 1.13.1、libnvidia-container 1.13.1

ACK、ECS執行個體協同最佳化

通過與ECS執行個體協同最佳化啟動速度、內建環境依賴軟體,同時結合ACK靈活高效的自動Auto Scaling能力,大大縮短Alibaba Cloud Linux 3的單節點建立時間。

通過與ECS執行個體深度結合最佳化,結合核心技術最佳化、編譯器最佳化、配置最佳化等,極大提升ACK叢集中各節點的運行時效能,針對巨量資料、Webserver、資料庫、AI等情境效能提升超30%。

提供大量新的作業系統技術,提升雲上體驗

  • 全面支援cgroup v2

    cgroup v2是新一代Linux cgroup機制的API,提供對進程或進程組統一的資源控制能力。相較於cgroup v1,有如下改進:

    • 獨立統一的階層

    • 更加安全的樹形結構設計

    • 新的核心PSI能力

    • 資源分派和管理能力的增強

  • 全面支援eBPF能力

    • 更便捷的eBPF程式編寫和調試體驗,例如許多指令的限制放寬、效能提升、支援調試可見位元組碼對應的原始碼等

    • 更高效能的XDP和核心調測

    • 更多使用者態架構支援,例如BPF skeleton、libbpf-bootstrap等,最佳化BPF程式編寫體驗

    • 更好地支援網路和安全專案Cilium,例如網路頻寬控制、流量加密、會話親和性、BPF層的路由及代理轉寄等

    • 針對BCC、Bpftrace等工具提供更高效能和輕量的實現方式

  • 提供page cache限制功能,同時滿足cgroup層級的限制能力

    Linux系統通過memcg(Memory Control Group)機制控制和管理進程組的記憶體使用量,支援為每個進程組(或工作群組)設定記憶體限制,避免不合理的資源浪費。memcg達到設定的記憶體上限時,系統將觸發memcg層級的直接記憶體回收,可能導致當前進程的效能抖動。儘管系統具有memcg後台非同步回收功能,但對於突發性的記憶體申請來說,其效果有限。有些任務中,例如Spark計算架構,page cache經常會佔用大量記憶體,並且大部分為髒頁(dirty page)。髒頁的回收速度較慢,將導致預期外的OOM。因此,為保持業務的穩定性和減少預期外的OOM,限制page cache的使用量非常重要。

    Alibaba Cloud Linux 3新增了Page Cache限制功能,支援以memcg為粒度(包括根組即整機)限制Page Cache的使用。您可以設定Page Cache的上限,對超過限制的Page Cache進行非同步或者同步回收。這可以協助控制Page Cache的使用量,防止其佔用過多的記憶體資源,從而提高系統的穩定性和可靠性。更多資訊,請參見Page Cache限制功能

為AI開發提供完善的平台支援

  • 通過引入龍蜥社區AI生態軟體倉庫(epao),支援一鍵安裝主流NVIDIA GPU驅動以及CUDA加速庫,節省匹配驅動版本以及手動安裝的時間。

  • epao倉庫支援主流AI架構TensorFlow、PyTorch,並在安裝過程中自動解決AI架構的依賴問題。您無需進行額外編譯,即可搭配系統Python環境進行AI任務快速開發。

  • 所有提供AI能力的相關組件均經過相容性測試。您可以一鍵安裝對應的AI能力,無需修改環境配置中可能出現的系統依賴項,提高使用過程穩定性。

  • 針對Intel、AMD等不同平台的CPU進行了AI專項最佳化,更好地釋放硬體的全部效能。

其他

Alibaba Cloud Linux 3還對系統進行了多種最佳化,例如:

  • 支援TCP/IP協議棧向RMDA透明轉換

  • 為使用透明大頁THP而導致的記憶體膨脹問題提供最佳化方案

  • 為Intel八代SPR執行個體提供多種加速器支援

更多資訊,請參見Alibaba Cloud Linux 3鏡像發布記錄

注意事項

  • 在Alibaba Cloud Linux 3中,iptables和nftables不相容。使用iptables的組件,網路能力可能會受到影響。

  • Alibaba Cloud Linux 3可能會將部分Hostname作為DNS搜尋域,可能導致DNS解析的次數增加。

使用Alibaba Cloud Linux 3作為叢集節點系統鏡像

您可以在建立叢集的配置過程中,將作業系統選擇為Alibaba Cloud Linux 3.2104來使用Alibaba Cloud Linux 3作為叢集節點系統鏡像。具體步驟,請參見通過OpenAPI建立Kubernetes託管版叢集建立ACK專有叢集

說明

如果您選用Alibaba Cloud Linux 3,在建立叢集以及後期擴容節點、添加節點、自動調整節點時,ACK會自動檢測Alibaba Cloud Linux 3的安全補丁更新並自動安裝補丁。

相關文檔

作業系統鏡像概述