回帰モデル評価コンポーネントは、予測結果と元の結果に基づいて、回帰アルゴリズムのさまざまなモデルの利点と欠点を評価するために使用されます。 次いで、評価メトリックおよび残差のヒストグラムが生成される。
回帰モデルの評価
次のいずれかの方法を使用して、回帰モデル評価コンポーネントを設定できます。
方法1: パイプラインページでコンポーネントを設定する
回帰モデル評価コンポーネントのパラメーターは、Machine Learning Platform for AI (PAI) のMachine Learning Designerのパイプラインページで設定できます。 Machine Learning Designerは、以前はMachine Learning Studioとして知られていました。 下表に、各パラメーターを説明します。
タブ | パラメーター | 説明 |
フィールド設定 | 元の回帰値 | 数値データ型の列がサポートされています。 |
予測回帰値 | 数値データ型の列がサポートされています。 | |
チューニング | 労働者番号 | コアの数。 有効な値: 1 ~ 9999 このパラメーターは、[ノードごとのメモリサイズ] パラメーターと共に使用する必要があります。 |
ノードあたりのメモリサイズ | 各コアのメモリサイズ。 有効値: 1024〜64 × 1024。 単位:MB。 |
方法2: PAIコマンドを使用する
PAIコマンドを使用してコンポーネントパラメータを設定します。 SQLスクリプトコンポーネントを使用してPAIコマンドを呼び出すことができます。 詳細については、「SQLスクリプト」をご参照ください。
PAI -name regression_evaluation -project algo_public
-DinputTableName=input_table
-DyColName=y_col
-DpredictionColName=prediction_col
-DindexOutputTableName=index_output_table
-DresidualOutputTableName=residual_output_table;
パラメーター | 必須 | 説明 | デフォルト値 |
inputTableName | 可 | 入力テーブルの名前。 | N/A |
inputTablePartitions | 不可 | 計算のために入力テーブルから選択されたパーティション。 | フルテーブル |
yColName | 可 | 入力テーブルの元の従属変数を含む列の名前。 数値データ型の列がサポートされています。 | N/A |
predictionColName | 可 | 予測結果の従属変数を含む列の名前。 数値データ型の列がサポートされています。 | N/A |
indexOutputTableName | 可 | 回帰メトリックの出力テーブルの名前。 | N/A |
residualOutputTableName | 可 | 残差のヒストグラムの出力テーブルの名前。 | N/A |
intervalNum | 不可 | ヒストグラムの間隔の数。 | 100 |
ライフサイクル | 不可 | 出力テーブルのライフサイクル。 このパラメーターの値は正の整数でなければなりません。 | N/A |
coreNum | 不可 | コアの数。 有効な値: 1 ~ 9999 | システムによって決定される |
memSizePerCore | 不可 | 各コアのメモリサイズ。 有効値: 1024〜64 × 1024。 単位:MB。 | システムによって決定される |
Output
回帰メトリックの出力テーブルはJSON形式で生成され、次のパラメーターが含まれます。
パラメーター | 説明 |
SST | 二乗の合計。 |
SSE | 二乗誤差の合計。 |
SSR | 回帰による二乗の合計。 |
R2 | 決定の係数。 |
R | 複数の相関の係数。 |
MSE | 平均二乗誤差。 |
RMSE | 二乗平均平方根誤差。 |
MAE | 平均絶対誤差。 |
MAD | 平均エラー。 |
MAPE | 平均絶対パーセンテージエラー。 |
カウント | 行の数。 |
yMean | 元の従属変数の平均。 |
predictionMean | 予測結果の平均。 |