可能原因
應用監控被暫停。
應用所在pod的探針沒有被正確載入。
解決方案
步驟一:檢查應用監控是否被暫停
登入ARMS控制台,在左側導覽列選擇 。
在應用列表頁面頂部選擇目標地區,然後單擊目標應用程式名稱。
如果未找到目標應用,請參考步驟二繼續排查。
新版控制台請在上方導覽列選擇
,在探針開關設定地區確認是否暫停應用監控。如果暫停應用監控開關被開啟,請關閉開關,然後單擊儲存。
如果暫停應用監控開關保持關閉,請參考步驟二繼續排查。
舊版控制台請在左側導覽列中單擊應用設定,然後在右側頁面單擊自訂配置頁簽。在Agent開關配置地區確認Agent總開關是否開啟。
如果Agent總開關未開啟,請開啟Agent總開關,然後單擊頁面底部的儲存。
如果Agent總開關已開啟,請參考步驟二繼續排查。
步驟二:檢查探針是否被正確載入
登入Container Service管理主控台,在叢集列表頁面,單擊目的地組群名稱進入叢集詳情頁。
在左側導覽列選擇 。
在容器組頁面頂部選擇您的應用所在的命名空間,然後單擊目標應用右側單擊編輯。
在編輯YAML對話方塊中查看YAML檔案中是否存在initContainers。
在命名空間為ack-onepilot。查看Pod列表中是否存在名稱首碼為ack-onepilot的Pod。 頁面頂部選擇
如果存在,則執行步驟6。
如果不存在,則在應用市場中安裝ack-onepilot。具體操作,請參見如何安裝ack-onepilot和卸載arms-pilot。
在工作負載下的無狀態或有狀態頁面目標應用右側操作列中選擇spec.template.metadata層級下是否存在以下Labels註解。 ,在編輯YAML對話方塊查看YAML檔案中的
labels: armsPilotAutoEnable: "on" armsPilotCreateAppName: "<your-deployment-name>" #請將<your-deployment-name>替換為您的應用程式名稱。 armsSecAutoEnable: "on" #如果需要接入應用安全,則需要配置此參數。
如果存在,則執行步驟7。
如果不存在,則在編輯YAML對話方塊中的spec.template.metadata層級下添加以上Labels註解,然後單擊更新。
在
"Message":"STS錯誤"
。 頁面目標應用右側單擊日誌,查看ack-onepilot的Pod日誌是否報STS錯誤,即提示如果報STS錯誤,則需為應用所在叢集授權,並重啟應用所在Pod。具體操作,請參見為Container ServiceKubernetes版授權。
如果未報STS錯誤,請提交工單。
在javaagent參數。 頁面目標應用右側單擊編輯,在編輯YAML對話方塊中查看YAML檔案中是否存在以下
-javaagent:/home/admin/.opt/ArmsAgent/aliyun-java-agent.jar
說明如果您使用的探針版本在2.7.3.5以下,請將本文中的aliyun-java-agent.jar替換為arms-bootstrap-1.7.0-SNAPSHOT.jar。建議您儘快將探針升級至最新版本。