全部產品
Search
文件中心

CloudMonitor:進程監控

更新時間:Jun 19, 2024

CloudMonitor通過安裝在阿里雲主機(ECS執行個體)和非阿里雲主機上的CloudMonitor外掛程式,為您採集最近一段時間內活躍進程的CPU使用率、記憶體使用量率和檔案開啟數。您還可以添加進程監控,查看其進程數,並為這些進程設定警示規則,及時關注進程數的變化,確保其正常運行。

前提條件

請確保您已為阿里雲主機(ECS執行個體)和非阿里雲主機安裝CloudMonitor外掛程式。具體操作,請參見安裝CloudMonitor外掛程式

背景資訊

CloudMonitor每分鐘統計一次CPU消耗Top5的進程,記錄這些進程的CPU使用率、記憶體使用量率和開啟檔案數。

  • 進程的CPU使用率與記憶體使用量率。

    您可以參考Linux中的top命令理解這兩個監控項的含義。

  • 進程的開啟檔案數。

    您可以參考Linux中的lsof命令理解這個監控項的含義。

CloudMonitor採集CPU消耗Top5進程的CPU使用率,可能存在以下問題:

  • 如果您的進程佔用多個CPU,則會出現CPU使用率超過100%的情況,因為採集結果為多核CPU的總使用率。

  • 如果您查詢的時間範圍內,CPU消耗Top5的進程不固定,進程列表會顯示該時間範圍內全部進入過Top5的進程,列表中的時間表示該進程最後一次進入Top5的時間。

  • CloudMonitor只採集CPU消耗Top5進程的CPU使用率、記憶體使用量率和開啟檔案數。如果進程在查詢的時間範圍內未持續進入Top5,則監控圖表中會出現資料點不連續的情況,資料點的密集程度表明了該進程在主機上的活躍程度。樣本如下:

    • Wrapper進程未持續進入主機CPU消耗Top5,監控圖表中的資料點稀疏,且不連續,表示有資料點的時間該進程進入Top5。wrapper

    • Java進程在監控圖表中的資料點非常密集,且連續,表示該進程已持續進入CPU消耗Top5。JAVA

添加進程監控

您可以通過監控主機的進程數,採集關鍵進程的數量,及時擷取關鍵進程的存活狀態。

假設您的主機運行了如下進程:

  • /usr/bin/java -Xmx2300m -Xms2300m org.apache.catalina.startup.Bootstrap

  • /usr/bin/ruby

  • nginx -c /etc/nginx/nginx.conf

您添加了6個進程關鍵字,採集結果如下:

  • 進程關鍵字為ruby,採集進程數為1,命中進程名稱。

  • 進程關鍵字為nginx,採集進程數為1,命中進程名稱與參數。

  • 進程關鍵字為/usr/bin,採集進程數為2,命中路徑(2個進程包含該路徑)。

  • 進程關鍵字為apache.catalina,採集進程數為1,命中部分參數。

  • 進程關鍵字為nginx.conf,採集進程數為1,命中部分參數。

  • 進程關鍵字為-c,採集進程數為1,命中部分參數。

  1. 登入CloudMonitor控制台

  2. 在左側導覽列,選擇雲資源監控 > 主機監控

  3. 主機監控頁面,單擊目標主機的執行個體名稱連結,或單擊目標主機對應操作列的監控圖表

  4. 單擊進程監控頁簽。

  5. 先單擊進程數監控地區,然後單擊右上方的添加進程監控

  6. 添加進程監控面板,先輸入進程名稱,再單擊增加,然後單擊右上方的image表徵圖。

    說明

    添加進程監控後,請您稍等幾分鐘,才能看到進程數的監控資料。

為進程設定警示規則

您添加進程後,可以為該進程設定警示規則。當進程數發生變化時,您可以收到警示通知。

  1. 登入CloudMonitor控制台

  2. 在左側導覽列,選擇雲資源監控 > 主機監控

  3. 主機監控頁面,單擊目標主機的執行個體名稱連結,或單擊目標主機對應操作列的監控圖表

  4. 單擊進程監控頁簽。

  5. 先單擊進程數監控地區,然後單擊右上方的image表徵圖。

  6. 設定規則描述面板,先設定規則名稱,再設定進程監控指標(Agent)process.count_processname的閾值和警示層級,然後單擊確定

  7. 建立警示規則面板,先設定警示規則的相關參數,再單擊確認

    關於如何設定警示規則中的相關參數,請參見建立警示規則

  8. 查看進程警示規則。

    1. 在左側導覽列,選擇警示服務 > 警示規則

    2. 警示規則頁面,您可以查看警示規則進程維度警示規則。

刪除進程監控

說明

通過應用分組菜單的組進程監控添加的進程,只能在組進程監控中刪除。

  1. 登入CloudMonitor控制台

  2. 在左側導覽列,選擇雲資源監控 > 主機監控

  3. 主機監控頁面,單擊目標主機的執行個體名稱連結,或單擊目標主機對應操作列的監控圖表

  4. 單擊進程監控頁簽。

  5. 先單擊進程數監控地區,然後單擊右上方的添加進程監控

  6. 添加進程監控面板,單擊目標進程對應操作列的刪除

  7. 刪除確認對話方塊,單擊確定

  8. 單擊右上方的關閉表徵圖。