全部產品
Search
文件中心

Simple Log Service:採集主機監控資料

更新時間:Sep 06, 2024

Log ServiceLogtail支援採集主機CPU、記憶體、負載、磁碟、網路等監控資料。本文介紹通過Logtail採集主機監控資料的操作步驟。

前提條件

已建立Project和MetricStore。具體操作,請參見建立專案Project建立MetricStore

使用限制

  • 不支援Windows版本。

  • 不支援採集GPU、硬體狀態等監控資料。

  • 只有Linux Logtail 0.16.40及以上版本的Logtail支援採集主機監控資料。如果您已在伺服器上安裝舊版本的Logtail,需先升級。具體操作,請參見安裝Logtail(Linux系統)

資料擷取配置

  1. 登入Log Service控制台

  2. 單擊控制台右側的快速接入資料卡片。

    image

  3. 接入資料頁面,尋找主機監控並單擊。image

  4. 選擇目標Project和時序庫MetricStore,單擊下一步image

  5. 建立機器組頁簽中。

    • 如果已有可用的機器組,請單擊使用現有機器組image

    • 如果您還沒有可用的機器組,請執行以下操作(以ECS為例)。

      1. ECS機器頁簽中,通過手動選擇執行個體方式選擇目標ECS執行個體,單擊建立

        具體操作,請參見安裝Logtail(ECS執行個體)

        重要

        如果您的伺服器是與Log Service屬於不同帳號的ECS、其他雲廠商的伺服器和自建IDC時,您需要手動安裝Logtail。具體操作,請參見安裝Logtail(Linux系統)。手動安裝Logtail後,您必須在該伺服器上手動設定使用者標識。具體操作,請參見配置使用者標識

      2. 安裝完成後,單擊確認安裝完畢

      3. 建立機器組頁面,輸入名稱,單擊下一步

        Log Service支援建立IP地址機器組和使用者自訂標識機器組,詳細參數說明請參見建立IP地址機器組建立使用者自訂標識機器組

  6. 資料來源設定頁簽中,設定配置名稱外掛程式配置,然後單擊下一步image

    重要

    inputs為資料來源配置,必選項。一個inputs中只允許配置一個類型的資料來源。

    {
        "inputs": [
            {
                "detail": {
                    "IntervalMs": 30000
                },
                "type": "metric_system_v2"
            }
        ]
    }

    參數

    類型

    是否必選

    參數說明

    type

    string

    資料來源類型,固定為metric_system_v2。

    IntervalMs

    int

    每次請求的間隔,單位:ms。不能低於5000,建議設定為30000。

  7. 單擊查詢日誌,進入時序庫。image

資料監控

  1. 在目標時序庫首頁單擊指標統計,可開啟指標統計大盤,您可在此查看所有已採集到的資料指標,也可以按時間周期或者指標參數進行資料過濾。imageimage

  2. 在時序庫首頁,單擊Metrics 探索(指標數:48),可探索、查看和過濾所有可用的指標名稱及其中繼資料。image如需查看CPU 和記憶體資料,可以使用cpu_count{}mem_cache{}語句查詢。更多查詢與分析操作,請參見查詢和分析時序資料image

  3. 當您採集的資料中包含多台機器時,可使用hostnameip進行篩選。為保證篩選資料的準確性,進行篩選前,請先清除歷史查詢資料。image

指標說明

主機CPU、記憶體、負載、磁碟、網路等指標說明如下:

  • CPU相關指標

    指標名

    說明

    單位

    樣本

    cpu_count

    CPU核心數

    2.0

    cpu_util

    CPU使用率,計算方式為排除idle、wait、steal後的佔比

    百分比符號(%)

    7.68

    cpu_guest_util

    客戶時間(guest time)佔比

    百分比符號(%)

    0.0

    cpu_guestnice_util

    Nice進程客戶時間(nice guest time)佔比

    百分比符號(%)

    0.0

    cpu_irq_util

    硬中斷處理時間(Hard Irq time)佔比

    百分比符號(%)

    0.0

    cpu_nice_util

    Nice時間(Nice time)佔比

    百分比符號(%)

    0.0

    cpu_softirq_util

    非強制中斷處理時間(Soft Irq time)佔比

    百分比符號(%)

    0.06

    cpu_steal_util

    等待宿主機CPU時間(Steal time)佔比

    百分比符號(%)

    0.0

    cpu_sys_util

    核心態(System time)佔比

    百分比符號(%)

    2.77

    cpu_user_util

    使用者態(User time)佔比

    百分比符號(%)

    4.84

    cpu_wait_util

    等待IO(Waiting time)佔比

    百分比符號(%)

    0.11

  • 記憶體相關指標

    指標名

    說明

    單位

    樣本

    mem_util

    記憶體使用量率

    百分比符號(%)

    51.03

    mem_cache

    已申請但未使用的記憶體

    byte

    3566386668.0

    mem_free

    未使用的記憶體

    byte

    177350084.0

    mem_available

    可用記憶體

    byte

    3699885553.0

    mem_used

    已使用記憶體

    byte

    4041510463.0

    mem_swap_util

    swap記憶體使用量率

    百分比符號(%)

    0.0

    mem_total

    記憶體總量

    byte

    7919128576.0

  • 磁碟相關指標

    指標名

    說明

    單位

    樣本

    disk_rbps

    硬碟每秒讀取流量

    byte/s

    8376.81

    disk_wbps

    硬碟每秒寫入流量

    byte/s

    247633.58

    disk_riops

    硬碟每秒讀取次數

    次/s

    0.22

    disk_wiops

    硬碟每秒寫入次數

    次/s

    43.39

    disk_rlatency

    平均讀延遲

    ms

    2.83

    disk_wlatency

    平均寫延遲

    ms

    2.15

    disk_util

    IO使用率

    百分比符號(%)

    0.27

    disk_space_usage

    磁碟使用百分比

    百分比符號(%)

    9.12

    disk_inode_usage

    inode使用率

    百分比符號(%)

    1.18

    disk_space_used

    磁碟已使用容量

    byte

    11068512238.59

    disk_space_total

    磁碟總量

    byte

    126692061184.0

    disk_inode_total

    inode總量

    7864320.0

    disk_inode_used

    inode已使用容量

    93054.78

  • NET相關指標

    指標名

    說明

    單位

    樣本

    net_drop_util

    丟棄的資料包佔總資料包的比值

    百分比符號(%)

    0.0

    net_err_util

    報錯資料包佔總資料包的比值

    百分比符號(%)

    0.0

    net_in

    網路接收速率

    byte/s

    8440.91

    net_in_pkt

    每秒接收的資料包

    個/s

    40.83

    net_out

    網路發送速率

    byte/s

    12446.53

    net_out_pkt

    每秒發送的資料包

    個/s

    39.95

  • TCP相關指標

    指標名

    說明

    單位

    樣本

    protocol_tcp_established

    已建立串連數

    205.0

    protocol_tcp_insegs

    接收的所有報文數

    4654.0

    protocol_tcp_outsegs

    發送的報文數

    4870.0

    protocol_tcp_retran_segs

    重傳報文數

    0.0

    protocol_tcp_retran_util

    重傳報文佔總發送報文數量的比值

    百分比符號(%)

    0.0

  • system相關指標

    指標名

    說明

    單位

    樣本

    system_boot_time

    系統啟動時間

    s

    1578461935.0

    system_load1

    系統平均負載,1分鐘平均值

    不涉及

    0.58

    system_load5

    系統平均負載,5分鐘平均值

    不涉及

    0.68

    system_load15

    系統平均負載,15分鐘平均值

    不涉及

    0.60

後續步驟

關於Log Service可視化,請參見時序圖時序資料對接Grafana