随着业务发展和应用数据增长,当云盘使用空间不足时,您可以通过云盘扩容来解决磁盘容量不足的问题。但容器服务Kubernetes 1.16之前的旧版本不支持云盘自动扩容,您需要手动扩容云盘。本文介绍如何通过手动扩容云盘增加云盘空间。

使用说明

  • 使用限制

    仅支持扩容32 TiB及以下容量的云盘。

  • 数据备份

    扩容数据卷前,先执行云盘快照备份数据,以防扩容过程异常导致数据丢失。

  • 适用范围

    PV类型为静态云盘数据卷。

基于云盘的稳定性需求,提供以下两种扩容方式:

查看云盘使用信息

本文以Web有状态应用为例,介绍两种扩容方式。参考以下操作,查看云盘的使用信息。

  1. 执行以下命令,查看Web应用的Pod。
    kubectl get pod | grep web

    预期输出:

    NAME                               READY   STATUS    RESTARTS   AGE
    web-0                              1/1     Running   0          11h
    web-1                              1/1     Running   0          11h
  2. 执行以下命令,查看Web应用的PVC。
    kubectl get pvc | grep web

    预期输出:

    NAME             STATUS   VOLUME        CAPACITY   ACCESS MODES   STORAGECLASS         AGE
    disk-ssd-web-0   Bound    d-0jlhaq***   20Gi       RWO            alicloud-disk-essd   11h
    disk-ssd-web-1   Bound    d-0jl0j5***   20Gi       RWO            alicloud-disk-essd   11h
  3. 执行以下命令查看Web应用的PV。
    kubectl get pv | grep web

    预期输出:

    NAME          CAPACITY   ACCESS MODES   RECLAIM POLICY   STATUS   CLAIM                    STORAGECLASS        REASON    AGE
    d-0jl0j5***   20Gi       RWO            Delete           Bound    default/disk-ssd-web-1   alicloud-disk-essd            11h
    d-0jlhaq***   20Gi       RWO            Delete           Bound    default/disk-ssd-web-0   alicloud-disk-essd            11h

    从以上预期输出可得:示例应用Web使用了20 GiB的d-0jl0j5***d-0jlhaq***云盘,分别挂载在2个Pod上。

关于如何部署Web有状态应用的具体操作,请参见创建有状态工作负载StatefulSet

方式一:不暂停应用手动在线扩容

根据PV信息找到对应的云盘,手动对云盘扩容,然后在云盘对应挂载节点手动执行文件系统扩容。以下示例介绍如何把2个云盘扩容到30 GiB。

步骤一:云盘数据卷扩容

  1. 登录ECS管理控制台
  2. 在左侧导航栏,选择存储与快照 > 云盘
  3. 找到Web应用对应的云盘d-0jl0j5***d-0jlhaq***,查看云盘状态,然后在各自操作列选择更多 > 扩容
  4. 磁盘扩容页面,选中在线扩容,并输入扩容后容量,例如30 GiB。
    说明 设置的扩容后容量不允许小于当前容量。
  5. 仔细阅读并选中《云服务器ECS服务条款》,确认费用后单击确认扩容
    具体操作,请参见扩大云盘容量
  6. 阅读磁盘扩容须知后,单击已阅读,继续扩容,完成费用支付。
    云盘页面查看云盘容量是否扩容成功。

步骤二:文件系统扩容

扩容云盘后,需要完成对文件系统的扩容,否则容器内存储空间依然是扩容前的大小。

重要 此步骤仅针对未分区云盘,是K8s中云盘的标准使用方法,不建议在K8s系统中使用分区云盘。
  1. 查看当前云盘挂载节点。
    1. 登录ECS管理控制台
    2. 在左侧导航栏,选择存储与快照 > 云盘
    3. 找到Web应用对应的云盘d-0jl0j5***d-0jlhaq***,分别单击云盘名称。
    4. 云盘详情页面的挂载实例列表中单击所挂载的实例,然后在实例详情页签查看实例网络信息
      说明 也可通过在K8s中查看该云盘对应Pod所在的节点。具体操作,请参见查看容器组(Pod)
  2. 连接到挂载云盘的ECS实例节点上,获取云盘设备符。
    关于如何连接到ECS实例节点,请参见连接方式概述

    可通过以下方法获取云盘设备符。

    • 获取云盘设备符
    • 执行以下命令获取云盘d-0jlhaq***的设备符。
      # 查询 {pv-name}
      mount |grep d-0jlhaq*** 

      预期输出:

      /dev/vdc on /var/lib/kubelet/plugins/kubernetes.io/csi/pv/d-0jlhaq***/globalmount type ext4 (rw,relatime)
      /dev/vdc on /var/lib/kubelet/pods/a26d174f-***/volumes/kubernetes.io~csi/d-0jlhaq***/mount type ext4 (rw,relatime)

      从以上预期输出可得:所挂载的云盘d-0jlhaq***在当前节点的设备符为/dev/vdc

  3. 执行以下命令,扩容文件系统。
    resize2fs /dev/vdc
    说明 /dev/vdc步骤2获取的云盘设备符。

    预期输出:

    resize2fs 1.43.5 (04-Aug-2017)
    Filesystem at /dev/vdc is mounted on /var/lib/kubelet/plugins/kubernetes.io/csi/pv/d-0jlhaq***/globalmount; on-line resizing required
    old_desc_blocks = 3, new_desc_blocks = 4
    The filesystem on /dev/vdc is now 7864320 (4k) blocks long.
  4. 执行以下命令,验证文件系统扩容结果。
    lsblk /dev/vdc

    预期输出:

    NAME MAJ:MIN  RM SIZE RO TYPE MOUNTPOINT
    vdc  254:32   0  30G  0  disk /var/lib/kubelet/pods/a26d174f-***/volumes/kubernetes.io~csi/d-0jlhaq***/mount

    从以上预期输出可得,vdc文件系统存储空间为30 GiB。

方式二:暂停应用手动扩容

通过删除StatefulSet或者将Replica配置为0的方式暂停应用,手动对每个依赖数据盘扩容,然后再启动应用。以下示例如何把2个云盘扩容到30 GiB。

步骤一:删除应用Pod

  1. 执行以下命令,将Pod缩容为0个副本。
    kubectl scale sts web --replicas=0

    预期输出:

    statefulset.apps/web scaled
  2. 执行以下命令,查看Pod是否删除。
    kubectl get pod | grep web

    无输出,代表已删除Web应用。

步骤二:云盘数据卷扩容

  1. 登录ECS管理控制台
  2. 在左侧导航栏,选择存储与快照 > 云盘
  3. 找到Web应用对应的云盘d-0jl0j5***d-0jlhaq***,查看云盘状态,然后在各自操作列选择更多 > 扩容
  4. 磁盘扩容页面配置扩容方式及扩容后容量。
    • 若云盘处于待挂载状态,在磁盘扩容页面无需选中在线扩容,输入扩容后容量,例如30 GiB。
    • 若云盘处于使用中状态,在磁盘扩容页面选中在线扩容,并输入扩容后容量
    说明 设置的扩容后容量不允许小于当前容量。
  5. 仔细阅读并选中《云服务器ECS服务条款》,确认费用后单击确认扩容
    具体操作,请参见步骤一:扩容云盘容量
  6. 阅读磁盘扩容须知后,单击已阅读,继续扩容,完成费用支付。

步骤三:文件系统扩容

扩容云盘后,需要完成对文件系统的扩容,否则容器内存储空间依然是扩容前的大小。

重要 此步骤仅针对未分区云盘,是K8s中云盘的标准使用方法,不建议在K8s系统中使用分区云盘。
  1. 可选:将待挂载云盘挂载到某个ECS节点。
    说明 需要将云盘挂载到ECS节点上才可实现文件系统扩容。
    1. 登录ECS管理控制台
    2. 在左侧导航栏,选择存储与快照 > 云盘
    3. 对于待挂载状态的云盘,在操作列选择更多 > 挂载
    4. 挂载云盘对话框,选择目标实例并设置云盘相关释放行为。
      配置项说明
      目标实例选择需要挂载的ECS实例。
      云盘随实例释放选中此选项,释放实例时会自动释放此云盘。 如果未选中,当实例被释放时该云盘会被保留下来。
      说明 如果您挂载的是从其他实例卸载的系统盘,云盘随实例释放中的实例指系统盘被卸载前的源ECS实例,并非当前操作的实例。
      自动快照随云盘释放选中此选项,当云盘释放时该云盘创建的自动快照都会一起释放。建议您不要选择该选项,以便保留备份数据。
    5. 单击执行挂载
    如果该云盘的状态变为使用中,表示挂载成功。
  2. 连接到挂载云盘的ECS实例节点上,获取云盘设备符。
    关于如何连接到ECS实例节点,请参见连接方式概述
    • 执行以下命令获取云盘设备符。
      for device in `ls /sys/block | grep vd`; do 
        cat /sys/block/$device/serial | grep 0jlhaq*** && echo $device; 
      done
      说明 0jlhaq***为扩容云盘IDd-0jlhaq***d-后的字符串。
    • 可选:若上述操作无法获取到云盘设备符,请按以下操作获取。
      1. 将目标云盘卸载后执行ls /dev/vd*命令查看云盘列表。
      2. 将目标云盘挂载后执行ls /dev/vd*命令查看云盘列表。
      3. 比较上述获取的云盘列表,多出来的云盘即为目标云盘。
  3. 执行以下命令,扩容文件系统。
    resize2fs /dev/vdb
    说明 /dev/vdb步骤2获取的云盘设备符。

    预期输出:

    resize2fs 1.43.5 (04-Aug-2017)
    Resizing the filesystem on /dev/vdb to 7864320 (4k) blocks.
    The filesystem on /dev/vdb is now 7864320 (4k) blocks long.
  4. 验证文件系统扩容结果。
    1. 执行以下命令,创建临时文件夹/mnt/disk/,并将云盘挂载到临时文件夹上。
      mkdir /mnt/disk
      mount /dev/vdb /mnt/disk/
    2. 执行以下命令,查看文件系统大小。
      df /mnt/disk/

      预期输出:

      Filesystem     1K-blocks  Used Available Use% Mounted on
      /dev/vdb        30832548 45036  30771128   1% /mnt/disk

      从以上预期输出可得:临时文件夹/dev/vdb的内存为30 GiB,说明已经扩容成功。

    3. 执行以下命令,将云盘从临时文件夹卸载。
      umount /mnt/disk

步骤四:重启应用

  1. 执行以下命令,将Pod扩容为2个副本。
    kubectl scale sts web --replicas=2

    预期输出:

    statefulset.apps/web scaled
  2. 执行以下命令,查看Pod是否恢复。
    kubectl get pod | grep web

    预期输出:

    NAME         READY   STATUS    RESTARTS   AGE
    web-0        1/1     Running   0          74s
    web-1        1/1     Running   0          42s
  3. 执行以下命令,查看文件系统大小。
    kubectl exec web-0 -- df /data

    预期输出:

    Filesystem     1K-blocks  Used Available Use% Mounted on
    /dev/vdb        30832548 45036  30771128   1% /data

    从以上预期输出可得,/dev/vdb文件系统存储空间为30 GiB。

在执行resize2fs命令后出现如下错误提示

resize of device /dev/xxx failed: exit status 1 resize2fs output: resize2fs xxx(version)
Please run `e2fsck -f /dev/xxx` first
问题原因

因为不满足文件系统的一致性导致IO崩溃。

解决方案

请按照提示执行e2fsck -f /dev/xxx后再尝试扩容。