當某個主機的CloudMonitor外掛程式的狀態為已停止時,CloudMonitor將不能對該主機進行監控。您需要判斷該主機的CloudMonitor外掛程式的停止原因,並恢複其運行狀態。
問題分析
CloudMonitor外掛程式預設每3分鐘一次心跳。如果15分鐘沒有心跳,則主機判斷外掛程式已停止運行。CloudMonitor外掛程式自動停止的可能原因如下:
CloudMonitor外掛程式所在主機無法與CloudMonitor伺服器通訊。
處理方法,請參見配置網路。
CloudMonitor外掛程式進程已退出。
處理方法,請參見如何處理CloudMonitor外掛程式進程自動結束問題。
排除以上兩種情況後,如果CloudMonitor外掛程式仍沒有心跳,您可以參考以下方案處理。
重新安裝或升級CloudMonitor外掛程式
查看外掛程式的運行狀態和日誌
CloudMonitor僅支援通過管理員帳號許可權(Linux作業系統使用root使用者,Windows作業系統使用Administrator使用者)操作CloudMonitor外掛程式。使用管理員帳號具有一定風險,如果操作不當可能導致系統穩定性問題或資料安全問題,請謹慎操作。
您可以通過查看CloudMonitor外掛程式的運行狀態和日誌來判斷停止原因。如果出現CloudMonitor外掛程式進程已退出的情況,則可能是CloudMonitor自身缺陷導致,建議您直接提工單,並保留問題。
查看外掛程式日誌
Windows
以Administrator使用者登入待安裝CloudMonitor外掛程式的主機。
進入CloudMonitor外掛程式日誌所在目錄C:\Program Files\Alibaba\cloudmonitor\local_data\logs。
選中記錄檔argusagent.log或argusagentd.log,通過記事本或寫字板開啟。
argusagentd.log:CloudMonitor外掛程式運行時為了守護進程而記錄的日誌。日誌主要包括監控進程的啟動、停止等資訊。
argusagent.log:CloudMonitor外掛程式的作業記錄。
Linux
以root使用者登入待安裝CloudMonitor外掛程式的主機。
執行以下命令,查看CloudMonitor外掛程式日誌。
cd /usr/local/cloudmonitor/local_data/logs
cat argusagent.log
cat argusagentd.log
argusagentd.log:CloudMonitor外掛程式運行時為了守護進程而記錄的日誌。日誌主要包括監控進程的啟動、停止等資訊。
argusagent.log:雲監外掛程式的作業記錄。
查看外掛程式運行狀態
Windows
以Administrator使用者登入CloudMonitor外掛程式所在主機。
開啟服務頁面。
通過鍵盤快速鍵Win+R開啟運行對話方塊,輸入命令services.msc,單擊確定。
查看服務argusagent service的狀態。
Linux
以root使用者登入CloudMonitor外掛程式所在主機。
執行以下命令,查看CloudMonitor外掛程式狀態。
ps aux | grep argusagent | grep -v grep