全部產品
Search
文件中心

Platform For AI:離線批量預測

更新時間:Dec 28, 2024

對即時性要求不高的業務情境,可以使用模型對資料集進行周期性的批量離線預測。Designer提供了支援離線預測的完整功能。本文為您介紹如何在Designer平台進行離線批量預測。

在開發環境進行批量預測

Designer中提供了多種預測組件,分別對應不同的演算法和情境,拖入畫布中可直接使用。

  • 對於在左側組件列表中成對出現的訓練和預測組件(例如FM演算法組件),訓練完成後直接使用對應的預測組件進行資料的批量預測。image

  • 對於沒有獨立預測組件的演算法,訓練完成後可以使用通用的預測組件進行資料的批量預測。image

    重要

    通用的預測組件可接收的模型格式為OfflineModel,而不是PMML。

  • 對於已有模型,可以使用組件匯入模型和預測資料後,在組件下遊串連預測組件進行預測和部署。

離線預測工作流程部署周期性調度

離線預測工作流程測試通過後,您可以將預測工作流程提交到DataWorks進行周期性調度。

  1. 將離線訓練得到的模型同步至生產環境。

    如果您的DataWorks工作空間是標準模式,由於開發環境和生產環境的MaxCompute資料相互隔離,將預測工作流程配置周期性調度任務前,需要先將離線訓練得到的模型同步至生產環境。

    • 使用通用模型匯出組件和匯入MaxCompute離線模型組件(推薦)

      使用通用模型匯出組件將訓練得到的OfflineModel格式模型匯出至OSS中,然後在周期性啟動並執行預測工作流程中,在實際執行時使用匯入MaxCompute離線模型組件從OSS中匯入所需模型。

    • 使用複製MaxCompute離線模型組件和讀MaxCompute離線模型組件

      說明

      複製操作需要寫入生產環境的MaxCompute儲存,因此只有工作空間管理員或生產帳號才能執行,詳情請參見許可權說明

      使用複製MaxCompute離線模型組件將訓練得到的OfflineModel格式模型直接複製到生產環境,然後在周期性啟動並執行預測工作流程中,使用讀MaxCompute離線模型組件來讀取生產環境的模型。

  2. 使用DataWorks離線調度Designer工作流程

相關文檔

離線預測結果符合預期後,如果您需要將模型部署為EAS線上服務,可以通過單模型部署線上服務,或將離線資料處理pipeline打包成一個pipeline模型,通過Pipeline部署線上服務