全部產品
Search
文件中心

CloudMonitor:如何處理CloudMonitor外掛程式異常停止問題?

更新時間:Jun 19, 2024

當某個主機的CloudMonitor外掛程式的狀態為已停止時,CloudMonitor將不能對該主機進行監控。您需要判斷該主機的CloudMonitor外掛程式的停止原因,並恢複其運行狀態。

問題分析

CloudMonitor外掛程式預設每3分鐘一次心跳。如果15分鐘沒有心跳,則主機判斷外掛程式已停止運行。CloudMonitor外掛程式自動停止的可能原因如下:

排除以上兩種情況後,如果CloudMonitor外掛程式仍沒有心跳,您可以參考以下方案處理。

重新安裝或升級CloudMonitor外掛程式

如果CloudMonitor外掛程式之前運行正常,您可以通過重新安裝外掛程式來恢複其運行狀態;如果CloudMonitor外掛程式為Go版本或Java版本,請您將其升級為C++版本(最新版本)。具體操作如下:

說明

Go版本和Java版本CloudMonitor外掛程式不再維護。

查看外掛程式的運行狀態和日誌

重要

CloudMonitor僅支援通過管理員帳號許可權(Linux作業系統使用root使用者,Windows作業系統使用Administrator使用者)操作CloudMonitor外掛程式。使用管理員帳號具有一定風險,如果操作不當可能導致系統穩定性問題或資料安全問題,請謹慎操作。

您可以通過查看CloudMonitor外掛程式的運行狀態和日誌來判斷停止原因。如果出現CloudMonitor外掛程式進程已退出的情況,則可能是CloudMonitor自身缺陷導致,建議您直接提工單,並保留問題。

  • 查看外掛程式日誌

    • Windows

      1. 以Administrator使用者登入待安裝CloudMonitor外掛程式的主機。

      2. 進入CloudMonitor外掛程式日誌所在目錄C:\Program Files\Alibaba\cloudmonitor\local_data\logs

      3. 選中記錄檔argusagent.logargusagentd.log,通過記事本或寫字板開啟。

        • argusagentd.log:CloudMonitor外掛程式運行時為了守護進程而記錄的日誌。日誌主要包括監控進程的啟動、停止等資訊。

        • argusagent.log:CloudMonitor外掛程式的作業記錄。

    • Linux

      1. 以root使用者登入待安裝CloudMonitor外掛程式的主機。

      2. 執行以下命令,查看CloudMonitor外掛程式日誌。

        cd /usr/local/cloudmonitor/local_data/logs

        cat argusagent.log

        cat argusagentd.log

        • argusagentd.log:CloudMonitor外掛程式運行時為了守護進程而記錄的日誌。日誌主要包括監控進程的啟動、停止等資訊。

        • argusagent.log:雲監外掛程式的作業記錄。

  • 查看外掛程式運行狀態

    • Windows

      1. 以Administrator使用者登入CloudMonitor外掛程式所在主機。

      2. 開啟服務頁面。

        通過鍵盤快速鍵Win+R開啟運行對話方塊,輸入命令services.msc,單擊確定

      3. 查看服務argusagent service的狀態。

    • Linux

      1. 以root使用者登入CloudMonitor外掛程式所在主機。

      2. 執行以下命令,查看CloudMonitor外掛程式狀態。

        ps aux | grep argusagent | grep -v grep

相關文檔