對即時性要求不高的業務情境,通常會使用模型對資料集進行周期性的批量離線預測。在Designer中提供了支援離線預測的完整功能。本文為您介紹如何在Designer平台進行離線批量預測。
在開發環境進行批量預測
Designer中提供了多種預測組件,分別對應不同的演算法和情境,在畫布中可直接使用。
對於在左側組件樹中成對出現的訓練和預測組件,訓練完成後直接使用對應的預測組件進行資料的批量預測。
對於沒有獨立預測組件的演算法,訓練完成後可以使用通用的預測組件進行資料的批量預測。
重要通用的預測組件可接收的模型格式是OfflineModel,而不是PMML。
在已有模型的情況下,也可以使用組件匯入模型和預測資料,並在組件下遊串連預測組件進行預測和部署。
離線預測工作流程部署周期性調度
離線預測工作流程測試通過後,您可以將預測工作流程提交到DataWorks進行周期性調度,詳情請參見使用DataWorks離線調度Designer工作流程。
對於工作空間是DataWorks標準模式的使用者來說,開發環境和生產環境的MaxCompute資料是相互隔離的。因此,在將預測工作流程配置周期性調度任務之前,還需要將離線訓練得到的模型同步至生產環境。有以下兩種實現方式:
使用複製MaxCompute離線模型組件和讀MaxCompute離線模型組件
使用複製MaxCompute離線模型組件將訓練得到的OfflineModel格式模型直接複製到生產環境,然後在周期性啟動並執行預測工作流程中,使用讀MaxCompute離線模型組件來讀取生產環境的模型。
這個複製操作需要寫入生產環境的MaxCompute儲存,因此只有工作空間管理員或生產帳號才能執行。詳情請參見許可權說明。
使用通用模型匯出組件和匯入MaxCompute離線模型組件(推薦)
使用通用模型匯出組件將訓練得到的OfflineModel格式模型匯出至OSS中,然後在周期性啟動並執行預測工作流程中,在實際執行時使用匯入MaxCompute離線模型組件從OSS中匯入所需模型。
相關文檔
當離線預測結果符合預期時,您可以將模型部署為EAS線上服務。詳情請參見單模型部署線上服務。
Designer支援將離線資料處理pipeline打包成一個Pipeline模型,並一鍵部署為EAS線上服務。詳情請參見Pipeline部署線上服務。