CloudMonitor通過安裝在阿里雲主機(ECS執行個體)和非阿里雲主機上的CloudMonitor外掛程式,為您採集最近一段時間內活躍進程的CPU使用率、記憶體使用量率和檔案開啟數。您還可以添加進程監控,查看其進程數,並為這些進程設定警示規則,及時關注進程數的變化,確保其正常運行。
前提條件
請確保您已為阿里雲主機(ECS執行個體)和非阿里雲主機安裝CloudMonitor外掛程式。具體操作,請參見安裝CloudMonitor外掛程式。
背景資訊
CloudMonitor每分鐘統計一次CPU消耗Top5的進程,記錄這些進程的CPU使用率、記憶體使用量率和開啟檔案數。
進程的CPU使用率與記憶體使用量率。
您可以參考Linux中的top命令理解這兩個監控項的含義。
進程的開啟檔案數。
您可以參考Linux中的lsof命令理解這個監控項的含義。
CloudMonitor採集CPU消耗Top5進程的CPU使用率,可能存在以下問題:
如果您的進程佔用多個CPU,則會出現CPU使用率超過100%的情況,因為採集結果為多核CPU的總使用率。
如果您查詢的時間範圍內,CPU消耗Top5的進程不固定,進程列表會顯示該時間範圍內全部進入過Top5的進程,列表中的時間表示該進程最後一次進入Top5的時間。
CloudMonitor只採集CPU消耗Top5進程的CPU使用率、記憶體使用量率和開啟檔案數。如果進程在查詢的時間範圍內未持續進入Top5,則監控圖表中會出現資料點不連續的情況,資料點的密集程度表明了該進程在主機上的活躍程度。樣本如下:
Wrapper進程未持續進入主機CPU消耗Top5,監控圖表中的資料點稀疏,且不連續,表示有資料點的時間該進程進入Top5。
Java進程在監控圖表中的資料點非常密集,且連續,表示該進程已持續進入CPU消耗Top5。
添加進程監控
您可以通過監控主機的進程數,採集關鍵進程的數量,及時擷取關鍵進程的存活狀態。
假設您的主機運行了如下進程:
/usr/bin/java -Xmx2300m -Xms2300m org.apache.catalina.startup.Bootstrap
/usr/bin/ruby
nginx -c /etc/nginx/nginx.conf
您添加了6個進程關鍵字,採集結果如下:
進程關鍵字為
ruby
,採集進程數為1,命中進程名稱。進程關鍵字為
nginx
,採集進程數為1,命中進程名稱與參數。進程關鍵字為
/usr/bin
,採集進程數為2,命中路徑(2個進程包含該路徑)。進程關鍵字為
apache.catalina
,採集進程數為1,命中部分參數。進程關鍵字為
nginx.conf
,採集進程數為1,命中部分參數。進程關鍵字為
-c
,採集進程數為1,命中部分參數。
在左側導覽列,選擇
。在主機監控頁面,單擊目標主機的執行個體名稱連結,或單擊目標主機對應操作列的監控圖表。
單擊進程監控頁簽。
先單擊進程數監控地區,然後單擊右上方的添加進程監控。
在添加進程監控面板,先輸入進程名稱,再單擊增加,然後單擊右上方的表徵圖。
說明添加進程監控後,請您稍等幾分鐘,才能看到進程數的監控資料。
為進程設定警示規則
您添加進程後,可以為該進程設定警示規則。當進程數發生變化時,您可以收到警示通知。
在左側導覽列,選擇
。在主機監控頁面,單擊目標主機的執行個體名稱連結,或單擊目標主機對應操作列的監控圖表。
單擊進程監控頁簽。
先單擊進程數監控地區,然後單擊右上方的表徵圖。
在設定規則描述面板,先設定規則名稱,再設定進程監控指標(Agent)process.count_processname的閾值和警示層級,然後單擊確定。
在建立警示規則面板,先設定警示規則的相關參數,再單擊確認。
關於如何設定警示規則中的相關參數,請參見建立警示規則。
查看進程警示規則。
在左側導覽列,選擇
。在警示規則頁面,您可以查看警示規則列進程維度警示規則。
刪除進程監控
通過應用分組菜單的組進程監控添加的進程,只能在組進程監控中刪除。
在左側導覽列,選擇
。在主機監控頁面,單擊目標主機的執行個體名稱連結,或單擊目標主機對應操作列的監控圖表。
單擊進程監控頁簽。
先單擊進程數監控地區,然後單擊右上方的添加進程監控。
在添加進程監控面板,單擊目標進程對應操作列的刪除。
在刪除確認對話方塊,單擊確定。
單擊右上方的表徵圖。