迴歸模型評估是指基於預測結果和原始結果,評估迴歸演算法模型的優劣性,從而輸出評估指標及殘差長條圖。
組件配置
您可以使用以下任意一種方式,配置迴歸模型評估組件參數。
方式一:可視化方式
在Designer工作流程頁面配置組件參數。
頁簽 | 參數 | 描述 |
欄位設定 | 原迴歸值 | 支援數實值型別。 |
預測迴歸值 | 支援數實值型別。 | |
執行調優 | 節點個數 | 與參數單個節點記憶體大小搭配使用,取值範圍為1~9999。 |
單個節點記憶體大小 | 取值範圍為1024 MB~64*1024 MB。 |
方式二:PAI命令方式
使用PAI命令方式,配置該組件參數。您可以使用SQL指令碼組件進行PAI命令調用,詳情請參見SQL指令碼。
PAI -name regression_evaluation -project algo_public
-DinputTableName=input_table
-DyColName=y_col
-DpredictionColName=prediction_col
-DindexOutputTableName=index_output_table
-DresidualOutputTableName=residual_output_table;
參數 | 是否必選 | 參數描述 | 預設值 |
inputTableName | 是 | 輸入表的名稱。 | 無 |
inputTablePartitions | 否 | 輸入表中,參與計算的分區。 | 全表 |
yColName | 是 | 輸入表中,原始因變數的列名,支援數實值型別。 | 無 |
predictionColName | 是 | 預測結果中,因變數的列名,支援數實值型別。 | 無 |
indexOutputTableName | 是 | 迴歸指標輸出表的名稱。 | 無 |
residualOutputTableName | 是 | 殘差長條圖輸出表的名稱。 | 無 |
intervalNum | 否 | 長條圖區間數量。 | 100 |
lifecycle | 否 | 輸出表的生命週期,取值範圍為正整數。 | 無 |
coreNum | 否 | Instance數量,取值範圍為1~9999。 | 系統自動化佈建 |
memSizePerCore | 否 | 每個核心的記憶體,取值範圍為1024 MB~64*1024 MB。 | 系統自動化佈建 |
組件輸出
迴歸指標輸出表的輸出結果為JSON格式,包括以下參數。
參數 | 描述 |
SST | 總平方和 |
SSE | 誤差平方和 |
SSR | 迴歸平方和 |
R2 | 判定係數 |
R | 多重相關係數 |
MSE | 均方誤差 |
RMSE | 均方根誤差 |
MAE | 平均絕對誤差 |
MAD | 平均誤差 |
MAPE | 平均絕對百分誤差 |
count | 行數 |
yMean | 原始因變數的均值 |
predictionMean | 預測結果的均值 |