Log ServiceLogtail支援採集主機CPU、記憶體、負載、磁碟、網路等監控資料。本文介紹通過Logtail採集主機監控資料的操作步驟。
前提條件
已建立Project和MetricStore。具體操作,請參見建立專案Project和建立MetricStore。
使用限制
不支援Windows版本。
不支援採集GPU、硬體狀態等監控資料。
只有Linux Logtail 0.16.40及以上版本的Logtail支援採集主機監控資料。如果您已在伺服器上安裝舊版本的Logtail,需先升級。具體操作,請參見安裝Logtail(Linux系統)。
資料擷取配置
單擊控制台右側的快速接入資料卡片。
在接入資料頁面,尋找主機監控並單擊。
選擇目標Project和時序庫MetricStore,單擊下一步。
在建立機器組頁簽中。
如果已有可用的機器組,請單擊使用現有機器組。
如果您還沒有可用的機器組,請執行以下操作(以ECS為例)。
在ECS機器頁簽中,通過手動選擇執行個體方式選擇目標ECS執行個體,單擊建立。
具體操作,請參見安裝Logtail(ECS執行個體)。
重要如果您的伺服器是與Log Service屬於不同帳號的ECS、其他雲廠商的伺服器和自建IDC時,您需要手動安裝Logtail。具體操作,請參見安裝Logtail(Linux系統)。手動安裝Logtail後,您必須在該伺服器上手動設定使用者標識。具體操作,請參見配置使用者標識。
安裝完成後,單擊確認安裝完畢。
在建立機器組頁面,輸入名稱,單擊下一步。
Log Service支援建立IP地址機器組和使用者自訂標識機器組,詳細參數說明請參見建立IP地址機器組和建立使用者自訂標識機器組。
在資料來源設定頁簽中,設定配置名稱和外掛程式配置,然後單擊下一步。
重要inputs為資料來源配置,必選項。一個inputs中只允許配置一個類型的資料來源。
{ "inputs": [ { "detail": { "IntervalMs": 30000 }, "type": "metric_system_v2" } ] }
參數
類型
是否必選
參數說明
type
string
是
資料來源類型,固定為metric_system_v2。
IntervalMs
int
是
每次請求的間隔,單位:ms。不能低於5000,建議設定為30000。
單擊查詢日誌,進入時序庫。
資料監控
在目標時序庫首頁單擊指標統計,可開啟指標統計大盤,您可在此查看所有已採集到的資料指標,也可以按時間周期或者指標參數進行資料過濾。
在時序庫首頁,單擊Metrics 探索(指標數:48),可探索、查看和過濾所有可用的指標名稱及其中繼資料。如需查看CPU 和記憶體資料,可以使用
cpu_count{}
和mem_cache{}
語句查詢。更多查詢與分析操作,請參見查詢和分析時序資料。當您採集的資料中包含多台機器時,可使用
hostname
或ip
進行篩選。為保證篩選資料的準確性,進行篩選前,請先清除歷史查詢資料。
指標說明
主機CPU、記憶體、負載、磁碟、網路等指標說明如下:
CPU相關指標
指標名
說明
單位
樣本
cpu_count
CPU核心數
個
2.0
cpu_util
CPU使用率,計算方式為排除idle、wait、steal後的佔比
百分比符號(%)
7.68
cpu_guest_util
客戶時間(guest time)佔比
百分比符號(%)
0.0
cpu_guestnice_util
Nice進程客戶時間(nice guest time)佔比
百分比符號(%)
0.0
cpu_irq_util
硬中斷處理時間(Hard Irq time)佔比
百分比符號(%)
0.0
cpu_nice_util
Nice時間(Nice time)佔比
百分比符號(%)
0.0
cpu_softirq_util
非強制中斷處理時間(Soft Irq time)佔比
百分比符號(%)
0.06
cpu_steal_util
等待宿主機CPU時間(Steal time)佔比
百分比符號(%)
0.0
cpu_sys_util
核心態(System time)佔比
百分比符號(%)
2.77
cpu_user_util
使用者態(User time)佔比
百分比符號(%)
4.84
cpu_wait_util
等待IO(Waiting time)佔比
百分比符號(%)
0.11
記憶體相關指標
指標名
說明
單位
樣本
mem_util
記憶體使用量率
百分比符號(%)
51.03
mem_cache
已申請但未使用的記憶體
byte
3566386668.0
mem_free
未使用的記憶體
byte
177350084.0
mem_available
可用記憶體
byte
3699885553.0
mem_used
已使用記憶體
byte
4041510463.0
mem_swap_util
swap記憶體使用量率
百分比符號(%)
0.0
mem_total
記憶體總量
byte
7919128576.0
磁碟相關指標
指標名
說明
單位
樣本
disk_rbps
硬碟每秒讀取流量
byte/s
8376.81
disk_wbps
硬碟每秒寫入流量
byte/s
247633.58
disk_riops
硬碟每秒讀取次數
次/s
0.22
disk_wiops
硬碟每秒寫入次數
次/s
43.39
disk_rlatency
平均讀延遲
ms
2.83
disk_wlatency
平均寫延遲
ms
2.15
disk_util
IO使用率
百分比符號(%)
0.27
disk_space_usage
磁碟使用百分比
百分比符號(%)
9.12
disk_inode_usage
inode使用率
百分比符號(%)
1.18
disk_space_used
磁碟已使用容量
byte
11068512238.59
disk_space_total
磁碟總量
byte
126692061184.0
disk_inode_total
inode總量
個
7864320.0
disk_inode_used
inode已使用容量
個
93054.78
NET相關指標
指標名
說明
單位
樣本
net_drop_util
丟棄的資料包佔總資料包的比值
百分比符號(%)
0.0
net_err_util
報錯資料包佔總資料包的比值
百分比符號(%)
0.0
net_in
網路接收速率
byte/s
8440.91
net_in_pkt
每秒接收的資料包
個/s
40.83
net_out
網路發送速率
byte/s
12446.53
net_out_pkt
每秒發送的資料包
個/s
39.95
TCP相關指標
指標名
說明
單位
樣本
protocol_tcp_established
已建立串連數
個
205.0
protocol_tcp_insegs
接收的所有報文數
個
4654.0
protocol_tcp_outsegs
發送的報文數
個
4870.0
protocol_tcp_retran_segs
重傳報文數
個
0.0
protocol_tcp_retran_util
重傳報文佔總發送報文數量的比值
百分比符號(%)
0.0
system相關指標
指標名
說明
單位
樣本
system_boot_time
系統啟動時間
s
1578461935.0
system_load1
系統平均負載,1分鐘平均值
不涉及
0.58
system_load5
系統平均負載,5分鐘平均值
不涉及
0.68
system_load15
系統平均負載,15分鐘平均值
不涉及
0.60
後續步驟
關於Log Service可視化,請參見時序圖,時序資料對接Grafana。