為了更方便地監控Linux block IO限流,Alibaba Cloud Linux 2(核心版本4.19.81-17.al7
開始)和Alibaba Cloud Linux 3增加相關介面,用於增強block IO限流的監控統計能力。本文主要介紹新增介面及使用樣本。
背景資訊
很多情境中您會用到Linux block IO限流(bps/iops),特別是在支援控制群組回寫(cgroup writeback)後,IO限流使用情境更加廣泛。提高block IO限流的監控能力能使您更方便進行IO限流相關操作,因此Alibaba Cloud Linux新增了Block IO限流增強監控介面。
介面說明
介面 | 描述 |
blkio.throttle.io_service_time | 該介面表示從block IO限流層開始下發到IO完成的耗時。單位:ns |
blkio.throttle.io_wait_time | 該介面表示在block IO限流層被限流的耗時。單位:ns |
blkio.throttle.io_completed | 該介面表示已完成的IO個數,用於計算block IO限流層的平均時延。單位:個 |
blkio.throttle.total_io_queued | 該介面表示歷史發生限流的IO總個數,通過周期性的監控可以計算出當前周期發生限流的IO個數,從而輔助分析IO時延是否與限流有關。單位:個 |
blkio.throttle.total_bytes_queued | 該介面表示歷史發生限流的IO總位元組數,同blkio.throttle.total_io_queued,只是以IO大小的形式展現。單位:位元組 |
以上介面的路徑為/sys/fs/cgroup/blkio/<cgroup>/,其中<cgroup>
為控制群組。
樣本
您可以通過增強block IO限流的監控統計能力的介面擷取某個磁碟上的平均IO時延。本樣本中通過監控磁碟vdd兩個時間點的平均寫IO時延,時間間隔為5 s,進而統計出磁碟vdd的平均IO時延。樣本參數說明如下。
參數 | 說明 |
write_wait_time<N> | 擷取在block IO限流層被限流的耗時。 |
write_service_time<N> | 擷取從block IO限流層開始下發到IO完成的耗時。 |
write_completed<N> | 擷取已完成的IO個數。 |
在T1時刻擷取監控資料。
write_wait_time1 = `cat /sys/fs/cgroup/blkio/blkcg1/blkio.throttle.io_wait_time | grep -w "254:48 Write" | awk '{print $3}'` write_service_time1 = `cat /sys/fs/cgroup/blkio/blkcg1/blkio.throttle.io_service_time | grep -w "254:48 Write" | awk '{print $3}'` write_completed1 = `cat /sys/fs/cgroup/blkio/blkcg1/blkio.throttle.io_completed | grep -w "254:48 Write" | awk '{print $3}'`
等待5 s後,在T2時刻擷取監控資料。
write_wait_time2 = `cat /sys/fs/cgroup/blkio/blkcg1/blkio.throttle.io_wait_time | grep -w "254:48 Write" | awk '{print $3}'` write_service_time2 = `cat /sys/fs/cgroup/blkio/blkcg1/blkio.throttle.io_service_time | grep -w "254:48 Write" | awk '{print $3}'` write_completed2 = `cat /sys/fs/cgroup/blkio/blkcg1/blkio.throttle.io_completed | grep -w "254:48 Write" | awk '{print $3}'`
統計5 s內的平均IO時延。
平均IO時延的計算規則:(T2時刻的總IO耗時 - T1時刻的總IO耗時)/(T2時刻已完成的IO個數 - T1時刻已完成的IO個數)。
avg_delay = `echo "((write_wait_time2 + write_service_time2) - (write_wait_time1+write_service_time1)) / (write_completed2 - write_completed1)" | bc`