全部產品
Search
文件中心

Platform For AI:離線批量預測

更新時間:Jul 13, 2024

對即時性要求不高的業務情境,通常會使用模型對資料集進行周期性的批量離線預測。在Designer中提供了支援離線預測的完整功能。本文為您介紹如何在Designer平台進行離線批量預測。

在開發環境進行批量預測

Designer中提供了多種預測組件,分別對應不同的演算法和情境,在畫布中可直接使用。

  • 對於在左側組件樹中成對出現的訓練和預測組件,訓練完成後直接使用對應的預測組件進行資料的批量預測。image

  • 對於沒有獨立預測組件的演算法,訓練完成後可以使用通用的預測組件進行資料的批量預測。image

    重要

    通用的預測組件可接收的模型格式是OfflineModel,而不是PMML。

  • 在已有模型的情況下,也可以使用組件匯入模型和預測資料,並在組件下遊串連預測組件進行預測和部署。

離線預測工作流程部署周期性調度

離線預測工作流程測試通過後,您可以將預測工作流程提交到DataWorks進行周期性調度,詳情請參見使用DataWorks離線調度Designer工作流程

對於工作空間是DataWorks標準模式的使用者來說,開發環境和生產環境的MaxCompute資料是相互隔離的。因此,在將預測工作流程配置周期性調度任務之前,還需要將離線訓練得到的模型同步至生產環境。有以下兩種實現方式:

  • 使用複製MaxCompute離線模型組件和讀MaxCompute離線模型組件

    使用複製MaxCompute離線模型組件將訓練得到的OfflineModel格式模型直接複製到生產環境,然後在周期性啟動並執行預測工作流程中,使用讀MaxCompute離線模型組件來讀取生產環境的模型。

    這個複製操作需要寫入生產環境的MaxCompute儲存,因此只有工作空間管理員或生產帳號才能執行。詳情請參見許可權說明

  • 使用通用模型匯出組件和匯入MaxCompute離線模型組件(推薦)

    使用通用模型匯出組件將訓練得到的OfflineModel格式模型匯出至OSS中,然後在周期性啟動並執行預測工作流程中,在實際執行時使用匯入MaxCompute離線模型組件從OSS中匯入所需模型。

相關文檔

  • 當離線預測結果符合預期時,您可以將模型部署為EAS線上服務。詳情請參見單模型部署線上服務

  • Designer支援將離線資料處理pipeline打包成一個Pipeline模型,並一鍵部署為EAS線上服務。詳情請參見Pipeline部署線上服務