如何避免因cgroup引起的應用效能抖動？ - Alibaba Cloud Linux

控制群組（control group）簡稱為cgroup，是Linux的核心功能。系統通過cgroup可以對系統內的資源進行分配、管理、監控等操作。不合理的cgroup層級或數量可能引起系統中應用效能的不穩定。本文主要介紹問題現象以及如何避免該類問題的出現。

問題現象

在容器相關的業務情境下，系統中的應用偶然會出現請求延時增大，並且容器所屬宿主機的CPU使用率中，sys指標（核心空間佔用CPU的百分比）達到30%及以上。例如，通過top命令查看Linux系統效能資料時，CPU的sy指標達到30%。

top - 16:21:19 up 22 days,  1:59,  3 users,  load average: 40.02, 30.02, 25.06
Tasks: 193 total,   3 running, 190 sleeping,   0 stopped,   0 zombie
%Cpu(s):  20.0 us,  30.0 sy,  0.0 ni, 45.0 id,  5.0 wa,  0.0 hi,  0.0 si,  0.0 st
KiB Mem : 24130808 total,  2071424 free,  1832512 used, 20226872 buff/cache
KiB Swap:        0 total,        0 free,        0 used. 19737776 avail Mem

可能原因

例如，運行cat /proc/cgroups 查看當前所有控制群組的狀態，發現memory對應的cgroup數目高達2040。

#subsys_name  hierarchy num_cgroups enabled
cpuset  2     200     1
cpu     2     200     1
cpuacct 2     200     1
blkio   6     62      1
memory  10    2040    1
devices 5     59      1

此時您可以通過perf工具動態分析，定位出現問題的原因。

運行以下命令，安裝perf工具。
```
yum install perf -y
```
運行以下命令，對系統的進程進行採樣、分析。
```
perf record -a -g sleep 10
```

運行以下命令，查看分析結果。

perf report

命令列返回結果樣本，如下所示：

31.04%  [kernel]                                      [k] memcg_stat_show
18.61%  [kernel]                                      [k] memcg_sum_events.isra.22
9.41%  [kernel]                                      [k] mem_cgroup_iter
6.94%  [kernel]                                      [k] css_next_descendant_pre
6.11%  [kernel]                                      [k] _find_next_bit
3.96%  [kernel]                                      [k] mem_cgroup_usage.part.43
1.75%  [kernel]                                      [k] find_next_bit
1.38%  [kernel]                                      [k] mem_cgroup_node_nr_lru_pages

從分析結果中，可得出Linux核心已耗用時間大多集中在memcg_stat_show函數，這是由於memory對應的cgroup數量過多，系統在遍曆這些cgroup所導致的核心長時間運行。

除了memory之外，cpuacct、cpu對應的cgroup過多還可能使CFS、load-balance的效能受影響。

解決方案

當您對Linux執行個體營運時，可參考以下兩條建議，避免因cgroup引起的應用效能抖動。

cgroup的層級建議不超過10層。
cgroup的數量上限建議不超過1000，且應當儘可能地減少cgroup的數量。