回归模型评估是指基于预测结果和原始结果,评估回归算法模型的优劣性,从而输出评估指标及残差直方图。
组件配置
您可以使用以下任意一种方式,配置回归模型评估组件参数。
方式一:可视化方式
在Designer工作流页面配置组件参数。
页签 | 参数 | 描述 |
字段设置 | 原回归值 | 支持数值类型。 |
预测回归值 | 支持数值类型。 | |
执行调优 | 节点个数 | 与参数单个节点内存大小搭配使用,取值范围为1~9999。 |
单个节点内存大小 | 取值范围为1024 MB~64*1024 MB。 |
方式二:PAI命令方式
使用PAI命令方式,配置该组件参数。您可以使用SQL脚本组件进行PAI命令调用,详情请参见SQL脚本。
PAI -name regression_evaluation -project algo_public
-DinputTableName=input_table
-DyColName=y_col
-DpredictionColName=prediction_col
-DindexOutputTableName=index_output_table
-DresidualOutputTableName=residual_output_table;
参数 | 是否必选 | 参数描述 | 默认值 |
inputTableName | 是 | 输入表的名称。 | 无 |
inputTablePartitions | 否 | 输入表中,参与计算的分区。 | 全表 |
yColName | 是 | 输入表中,原始因变量的列名,支持数值类型。 | 无 |
predictionColName | 是 | 预测结果中,因变量的列名,支持数值类型。 | 无 |
indexOutputTableName | 是 | 回归指标输出表的名称。 | 无 |
residualOutputTableName | 是 | 残差直方图输出表的名称。 | 无 |
intervalNum | 否 | 直方图区间数量。 | 100 |
lifecycle | 否 | 输出表的生命周期,取值范围为正整数。 | 无 |
coreNum | 否 | Instance数量,取值范围为1~9999。 | 系统自动设置 |
memSizePerCore | 否 | 每个核心的内存,取值范围为1024 MB~64*1024 MB。 | 系统自动设置 |
组件输出
回归指标输出表的输出结果为JSON格式,包括以下参数。
参数 | 描述 |
SST | 总平方和 |
SSE | 误差平方和 |
SSR | 回归平方和 |
R2 | 判定系数 |
R | 多重相关系数 |
MSE | 均方误差 |
RMSE | 均方根误差 |
MAE | 平均绝对误差 |
MAD | 平均误差 |
MAPE | 平均绝对百分误差 |
count | 行数 |
yMean | 原始因变量的均值 |
predictionMean | 预测结果的均值 |