全部產品
Search
文件中心

Platform For AI:查看實驗詳情

更新時間:Jul 13, 2024

成功建立實驗後,您可以即時查看實驗詳情,包括實驗的基本資料、Trial列表、各個Trial的運行詳情以及日誌。本文為您介紹實驗中支援查看的詳細內容。

查看實驗的基本資料

  1. 進入自動機器學習(AutoML)頁面。

    1. 登入PAI控制台

    2. 在左側導覽列單擊工作空間列表,在工作空間列表頁面中單擊待操作的工作空間名稱,進入對應工作空間內。

    3. 在左側導覽列,選擇模型開發與訓練 > 自動機器學習(AutoML)

  2. 在實驗列表頁面中,單擊實驗名稱,進入實驗詳情頁面。

  3. 實驗詳情頁面的基本資料頁簽,您可以查看該實驗的基本配置、Trial配置、執行配置、搜尋配置和Trial的執行進度。

    • 基本配置地區,您可以查看該實驗的ID、狀態等。實驗可能的狀態如下:

      • CREATED:在實驗的建立初期,系統正在執行建立管理進程、解析各個配置模組的內容,以及向DLC或MaxCompute等後台提交任務等操作。此時,Trial還沒有開始運行。

      • FINISHED:當實驗下的所有Trial都執行完成,且Trial的狀態至少有一個為FINISHED時,實驗狀態會變為FINISHED。

      • FAILED:當實驗下的所有Trial都執行完成,且Trial的狀態均為FAILED時,實驗狀態會變為FAILED。當手動停止實驗下的所有Trial時,實驗狀態會變為FAILED。

      • RUNNING:當實驗下的Trail狀態為RUNNING時,實驗狀態為RUNNING。

      • TERMINATING:當手動停止實驗後,實驗狀態會變為TERMINATING。

      • USER_CANCELED:當手動停止實驗且實驗完全停止後,實驗狀態會變為USER_CANCELED。

      • NO_MORE_TRIAL:當實驗已經啟動並執行Trial數量達到了實驗設定的最大Trial數量時,不會再產生新的Trial。在最後一個Trial運行結束後,實驗會自動從NO_MORE_TRIAL狀態轉換為Finished狀態。

      • TUNER_NO_MORE_TRIAL nuner:當實驗缺乏足夠的資訊來確定下一組需要測試的超參數時,Tuner會停止產生新的Trial。此時的實驗狀態為TUNER_NO_MORE_TRIAL nuner

    • Trial配置執行配置搜尋配置地區,您可以查看該實驗的參數配置詳情。

    • Trial執行進度地區,您可以查看Trial的執行進度和狀態統計資訊。

查看Trial列表

  1. 進入實驗詳情頁面。具體操作,請參見查看實驗的基本資料

  2. Trial列表頁簽中,展示該實驗下自動產生的所有Trial列表。

    根據配置的演算法,每次實驗都會產生超參數組合,並為每組超參數組合建立一個Trial。同時,每個Trial可能會對應一個DLC任務,也可能對應1個或多個MaxCompute任務。任務的類型取決於實驗的執行配置。後續將通過配置的任務來執行Trial。

查看Trial的運行詳情

Trial列表頁簽,您可以查看實驗下的Trial詳情,包括執行狀態、最終指標和超參數組合等。image.png

  • 狀態:Trial可能的狀態如下:

    • RUNNING:正在執行中。

    • FINISHED:已執行成功。

    • FAILED:執行失敗。

    • USER_CANCELED:手動停止。

    • EARLY_STOPPED:Trial被提前終止。

  • 最終指標:根據實驗中的指標權重配置,系統將使用加權求和值作為最終的評估指標。

  • 超參數組合:根據實驗配置的演算法自動產生的超參數組合。每個Trial對應一組超參數組合。

通過對比每個Trial的最終指標,並根據在搜尋配置中配置的最佳化方向,您可以判斷哪個Trial使用的超參數組合是最優的。

查看日誌

當實驗或Trial執行失敗時,您可以通過動作記錄來有效定位實驗和Trial的異常情況。

查看實驗的日誌

  1. 進入實驗詳情頁面。具體操作,請參見查看實驗的基本資料

  2. 您可以單擊頁面右側的日誌按鈕,或在基本資料頁簽的基本配置地區中,單擊狀態後的日誌按鈕。

  3. 實驗日誌配置面板中,查看日誌詳情。包括以下兩種日誌:

    • nnimanager.log

      該日誌記錄了與實驗管理相關的資訊,包括實驗的啟動、停止和錯誤資訊等。

    • dispatcher.log

      該日誌記錄與任務調度和資源管理相關的資訊,包括Trial的分配、資源的分配等。

查看Trial的日誌

  1. 進入實驗詳情頁面。具體操作,請參見查看實驗的基本資料

  2. Trial列表頁簽,單擊目標Trial操作列下的日誌

  3. Trial日誌配置面板中,查看Trial的日誌詳情。

    Trial日誌包括以下三種日誌:

    • trial.log

      該日誌記錄了Trail的詳細執行過程。

    • stdout

      該日誌中記錄了Trial的標準輸出,包括列印語句和輸出內容等,有助於您瞭解代碼的調試資訊和執行結果。

    • stderr

      該日誌記錄了Trial的標準錯誤,包括一些異常、錯誤資訊和警告等。當Trial任務出現問題時,stderr日誌提供了有關錯誤的詳細描述,協助您進行故障排查和錯誤處理。