すべてのプロダクト
Search
ドキュメントセンター

Platform For AI:回帰モデルの評価

最終更新日:Jul 22, 2024

回帰モデル評価コンポーネントは、予測結果と元の結果に基づいて、回帰アルゴリズムのさまざまなモデルの利点と欠点を評価するために使用されます。 次いで、評価メトリックおよび残差のヒストグラムが生成される。

回帰モデルの評価

次のいずれかの方法を使用して、回帰モデル評価コンポーネントを設定できます。

方法1: パイプラインページでコンポーネントを設定する

回帰モデル評価コンポーネントのパラメーターは、Machine Learning Platform for AI (PAI) のMachine Learning Designerのパイプラインページで設定できます。 Machine Learning Designerは、以前はMachine Learning Studioとして知られていました。 下表に、各パラメーターを説明します。

タブ

パラメーター

説明

フィールド設定

元の回帰値

数値データ型の列がサポートされています。

予測回帰値

数値データ型の列がサポートされています。

チューニング

労働者番号

コアの数。 有効な値: 1 ~ 9999 このパラメーターは、[ノードごとのメモリサイズ] パラメーターと共に使用する必要があります。

ノードあたりのメモリサイズ

各コアのメモリサイズ。 有効値: 1024〜64 × 1024。 単位:MB。

方法2: PAIコマンドを使用する

PAIコマンドを使用してコンポーネントパラメータを設定します。 SQLスクリプトコンポーネントを使用してPAIコマンドを呼び出すことができます。 詳細については、「SQLスクリプト」をご参照ください。

PAI -name regression_evaluation -project algo_public
    -DinputTableName=input_table
    -DyColName=y_col
    -DpredictionColName=prediction_col
    -DindexOutputTableName=index_output_table
    -DresidualOutputTableName=residual_output_table;

パラメーター

必須

説明

デフォルト値

inputTableName

入力テーブルの名前。

N/A

inputTablePartitions

不可

計算のために入力テーブルから選択されたパーティション。

フルテーブル

yColName

入力テーブルの元の従属変数を含む列の名前。 数値データ型の列がサポートされています。

N/A

predictionColName

予測結果の従属変数を含む列の名前。 数値データ型の列がサポートされています。

N/A

indexOutputTableName

回帰メトリックの出力テーブルの名前。

N/A

residualOutputTableName

残差のヒストグラムの出力テーブルの名前。

N/A

intervalNum

不可

ヒストグラムの間隔の数。

100

ライフサイクル

不可

出力テーブルのライフサイクル。 このパラメーターの値は正の整数でなければなりません。

N/A

coreNum

不可

コアの数。 有効な値: 1 ~ 9999

システムによって決定される

memSizePerCore

不可

各コアのメモリサイズ。 有効値: 1024〜64 × 1024。 単位:MB。

システムによって決定される

Output

回帰メトリックの出力テーブルはJSON形式で生成され、次のパラメーターが含まれます。

パラメーター

説明

SST

二乗の合計。

SSE

二乗誤差の合計。

SSR

回帰による二乗の合計。

R2

決定の係数。

R

複数の相関の係数。

MSE

平均二乗誤差。

RMSE

二乗平均平方根誤差。

MAE

平均絶対誤差。

MAD

平均エラー。

MAPE

平均絶対パーセンテージエラー。

カウント

行の数。

yMean

元の従属変数の平均。

predictionMean

予測結果の平均。