全部產品
Search
文件中心

Elastic Compute Service:查看雲助手狀態及異常狀態處理

更新時間:Jun 19, 2024

本文介紹如何查看雲助手狀態,以及雲助手狀態異常時如何處理。

查看雲助手狀態

  1. 登入ECS管理主控台

  2. 在左側導覽列,選擇營運與監控 > 雲助手

  3. 在頁面左側頂部,選擇目標資源所在的資源群組和地區。地區

  4. ECS執行個體頁簽下,查看雲助手狀態。

    • 正常:雲助手運行良好,可以正常使用。

      image.png

    • 未安裝:執行個體上沒有安裝雲助手Agent,您可以參考以下方式安裝雲助手Agent

      • 單擊一鍵安裝自動化安裝雲助手Agent

        一鍵安裝雲助手Agent時,需要重啟執行個體才會生效。

      • 手動安裝雲助手Agent,具體操作,請參見安裝雲助手Agent

        image.png

    • 異常:出現異常的原因較多,需要根據具體原因來分析。更多資訊,請參見雲助手異常狀態處理

      image.png

雲助手異常狀態處理

Linux執行個體

  1. 遠端連線Linux執行個體。

    具體操作,請參見通過密碼或密鑰認證登入Linux執行個體

  2. 執行如下命令,查看雲助手安裝目錄是否存在。

    說明

    以下命令中的/usr/local/share/請替換為實際的雲助手安裝目錄。

    • CoreOS作業系統:/opt/local/share/aliyun-assist/

    • 其他動作系統(Alibaba Cloud Linux、Ubuntu、Debian、RedHat、SUSE Linux Enterprise Server和OpenSUSE等):/usr/local/share/aliyun-assist/

    cd /usr/local/share/
    ls
    • 如果aliyun-assist檔案夾存在,請繼續執行步驟3

      image.png

    • 如果aliyun-assist檔案夾不存在,說明雲助手被卸載,需要重新安裝雲助手。具體操作,請參見安裝雲助手Agent

  3. 查看雲助手服務狀態。

    不同核心版本的Linux系統查看雲助手服務狀態命令有所不同,具體說明如下。

    新版本核心的Linux系統通常使用systemd

    查詢您的ECS執行個體是否使用systemd初始化進程服務,有返回資訊則表示使用的是systemd。

    strings /sbin/init | grep "/lib/system"

    執行如下命令,查看雲助手狀態。

    systemctl status aliyun.service
    • 當雲助手狀態為inactive (dead),說明雲助手服務已停止,需要執行systemctl start aliyun.service啟動雲助手服務。

      如果啟動時報錯或無法啟動,請卸載雲助手後重新安裝。具體操作,請參見卸載雲助手Agent(Linux執行個體)Linux執行個體安裝雲助手Agent

      image.png

    • 當雲助手狀態為active (running),說明雲助手服務正常運行中,請繼續執行步驟4

      image.png

    Ubuntu14及更低版本的Linux系統,通常使用UpStart

    查詢您的ECS執行個體是否使用UpStart初始化進程服務,有返回資訊則表示使用的是UpStart。

    strings /sbin/init | grep "upstart"

    執行如下命令,查看雲助手狀態。

    /sbin/initctl status aliyun-service
    • 當雲助手狀態為stop/waiting,說明雲助手服務已停止,需要執行/sbin/initctl start aliyun-service啟動雲助手服務。

      如果啟動時報錯或無法啟動,請卸載雲助手後重新安裝。具體操作,請參見卸載雲助手Agent(Linux執行個體)Linux執行個體安裝雲助手Agent

      image.png

    • 當雲助手狀態為start/running,說明雲助手服務正常運行中,請繼續執行步驟4

      image.png

    低版本核心的Linux系統通常使用sysvinit

    查詢您的ECS執行個體是否使用sysvinit初始化進程服務,有返回資訊則表示使用的是sysvinit。

    strings /sbin/init | grep "sysvinit"

    執行如下命令,查看雲助手狀態。

    /etc/init.d/aliyun-service status
    • 當雲助手狀態為Stopped,說明雲助手服務已停止,需要執行/etc/init.d/aliyun-service start啟動雲助手服務。

      如果啟動時報錯或無法啟動,請卸載雲助手後重新安裝。具體操作,請參見卸載雲助手Agent(Linux執行個體)Linux執行個體安裝雲助手Agent

      image.png

    • 當雲助手狀態為Running,說明雲助手服務正常運行中,請繼續執行步驟4

      image.png

  4. 在雲助手控制台查看雲助手Agent狀態。

    • 如果雲助手Agent狀態為正常,說明異常已解決。

    • 如果雲助手Agent狀態還是異常,需要查看雲助手日誌來具體分析。

      cd /usr/local/share/aliyun-assist/<version>/log  
      tail -100f aliyun_assist_main.log
      說明

      雲助手預設日誌路徑如下,<version>為雲助手Agent的具體版本號碼。

      • CoreOS作業系統:/opt/local/share/aliyun-assist/<version>/log

      • 其他動作系統(Alibaba Cloud Linux、Ubuntu、Debian、RedHat、SUSE Linux Enterprise Server和OpenSUSE等):/usr/local/share/aliyun-assist/<version>/log

Windows執行個體

  1. 遠端連線Windows執行個體。

    具體操作,請參見通過密碼或密鑰認證登入Windows執行個體

  2. 查看雲助手安裝目錄(C:\ProgramData\aliyun\assist)是否存在。

    • 如果aliyun-assist檔案夾存在,請繼續執行檢查雲助手狀態。

      image.png

    • 如果assist檔案夾不存在,說明雲助手被卸載,需要重新安裝雲助手,具體操作,請參見安裝雲助手Agent

  3. 查看雲助手服務狀態。

    1. 單擊開始菜單,選擇Windows 管理工具 > 電腦管理

    2. 選擇電腦管理(本地) > 服務和應用程式 > 服務

    3. 找到Aliyun Assist Service,查看Aliyun Assist Service狀態。

  4. 在雲助手控制台查看雲助手Agent狀態。

    • 如果雲助手Agent狀態為正常,說明異常已解決。

    • 如果雲助手Agent狀態還是異常,需要查看雲助手日誌來具體分析。

      雲助手預設日誌路徑:C:\ProgramData\aliyun\assist\<version>\log,<version>為雲助手Agent的具體版本號碼。

      image.png

常見問題

為什麼雲助手日誌中出現context deadline exceeded (Client.Timeout exceeded while awaiting headers)錯誤資訊?

image.png

出現該錯誤一般是ECS執行個體與雲助手伺服器間的網路連通異常,您可以運行以下命令,查看網路連通性。

說明

請將<region-id>替換為地區的ID。更多資訊,請參見地區和可用性區域

ping <region-id>.axt.aliyun.com
curl https://<region-id>.axt.aliyun.com/luban/api/instance/instance-id

正常情況下網域名稱能夠正常解析並且連通,且介面能夠返回正常的instance_id。

若不能解析或者不能正常返回執行個體id,則說明執行個體網路存在問題,需要進行排查。具體操作,請參見配置雲助手Agent網路許可權

image.png

為什麼受管理的執行個體註冊成功但顯示狀態異常?

若託管的執行個體顯示註冊成功,但云助手控制台顯示雲助手狀態異常,可以查看雲助手日誌是否出現invalid timestamp錯誤。

說明

雲助手預設日誌路徑如下,<version>為雲助手Agent的具體版本號碼。

  • Linux執行個體

    • CoreOS作業系統:/opt/local/share/aliyun-assist/<version>/log

    • 其他動作系統(Alibaba Cloud Linux、Ubuntu、Debian、RedHat、SUSE Linux Enterprise Server和OpenSUSE等):/usr/local/share/aliyun-assist/<version>/log

  • Windows執行個體:C:\ProgramData\aliyun\assist\<version>\log

image.png

出現該錯誤是受管理的執行個體上的時間戳記和實際時間有誤差導致,可以嘗試校準ECS執行個體時間解決。更多資訊,請參見同步伺服器本地時間