离线模型(OfflineModel)是存储在MaxCompute中的一种数据结构,基于PAICommand框架的传统机器学习算法生成的模型会以离线模型格式存储在对应的MaxComute项目中,您可以使用离线模型相关组件获取离线模型做离线预测。本文为您介绍离线模型的几种相关组件。
复制MaxCompute离线模型
在机器学习开发流程中有一种常规使用场景,即在开发环境中,使用一个工作流来构建模型。在生产环境中的工作流,读取该模型做周期性的预测任务。因此我们需要在模型构建完成后,使用复制MaxCompute离线模型组件,将模型持久化存储到预测任务可以读取的环境下。
您可以在构建模型工作流的下游,连接复制MaxCompute离线模型组件,将模型固定输出为指定名称,具体如下图所示。您可以在该组件的参数设置页签,配置以下参数。其中:
目标MaxCompute Project名:如果不配置该参数,则默认为当前工作空间的MaxCompute Project。
是否覆盖与目标模型同名的模型:如果选中该参数,则在执行时会先删除历史模型,再执行创建新模型。
读MaxCompute离线模型
在机器学习开发流程中有一种常规使用场景,即在开发环境中,使用一个工作流来构建模型,在生产环境中的工作流,使用读MaxCompute离线模型组件直接读取模型,做周期性的预测任务。您只需在该组件的字段设置页签配置模型名即可。
通用模型导出
您可以使用通用模型导出组件,将离线模型导出到指定的OSS路径。您可以在该组件的参数设置页签,配置以下参数。
其中:
是否覆盖:选中该参数,生成的模型文件会覆盖指定OSS路径中的同名模型文件。
导出模型格式:支持按照original(MaxCompute离线模型格式)导出,或导出pmml格式的模型文件。