スコアカード予測コンポーネントは、スコアカードトレーニングコンポーネントによって生成されたモデルを使用してスコアを予測します。
コンポーネントの設定
次のいずれかの方法を使用して、スコアカード予測コンポーネントを設定できます。
方法1: パイプラインページでコンポーネントを設定する
Machine Learning Platform for AI (PAI) のMachine Learning Designerのパイプラインページで、スコアカード予測コンポーネントのパラメーターを設定できます。 Machine Learning Designerは、以前はMachine Learning Studioとして知られていました。 下表に、各パラメーターを説明します。
タブ | パラメーター | 説明 |
フィールド設定 | フィーチャー列 | 予測で使用されるフィーチャ列。 デフォルトでは、すべてのフィーチャ列が選択されています。 |
予約済み列 | IDや対象列など、処理なしで予測結果テーブルに追加される列。 | |
出力変数スコア | 特徴変数ごとにスコアを生成するかどうかを指定します。 総予測スコアは、切片オプションのスコアに各変数のスコアを加えたものである。 | |
チューニング | コア | 必要なCPUコアの数。 デフォルトでは、システムが値を決定します。 |
コアあたりのメモリサイズ | 各CPUコアのメモリサイズ。 デフォルトでは、システムが値を決定します。 |
方法2: PAIコマンドを使用する
PAIコマンドを使用してコンポーネントパラメータを設定します。 SQLスクリプトコンポーネントを使用してPAIコマンドを呼び出すことができます。 詳細については、「SQLスクリプト」をご参照ください。
pai -name=lm_predict
-project=algo_public
-DinputFeatureTableName=input_data_table
-DinputModelTableName=input_model_table
-DmetaColNames=sample_key,label
-DfeatureColNames=fea1,fea2
-DoutputTableName=output_score_table
パラメーター | 説明 | 必須 | デフォルト値 |
inputFeatureTableName | 入力フィーチャテーブルの名前。 | 可 | デフォルト値なし |
inputFeatureTablePartitions | 入力フィーチャテーブルから選択されたパーティション。 | 不可 | フルテーブル |
inputModelTableName | 入力モデルテーブルの名前。 | 可 | デフォルト値なし |
featureColNames | 入力テーブルから選択されたフィーチャ列。 | 不可 | すべての列 |
metaColNames | 変換する必要のない列。 出力のこれらの列は、入力の列と同じです。 列にラベルとサンプルIDを指定できます。 | 不可 | デフォルト値なし |
outputFeatureScore | 予測結果に変数のスコアを生成するかどうかを指定します。 有効な値:
| 不可 | false |
outputTableName | 出力テーブルの名前。 | 可 | デフォルト値なし |
ライフサイクルの設定 (Set lifecycle) | 出力テーブルのライフサイクル。 | 不可 | デフォルト値なし |
coreNum | コアの数。 | 不可 | システムによって決定される |
memSizePerCore | 各コアのメモリサイズ。 単位:MB。 | 不可 | システムによって決定される |
Output
次の図は、スコアカード予測コンポーネントによって生成されるスコアテーブルを示しています。 チャーン列は、入力テーブルから結果テーブルに追加される列です。 この列のデータは予測結果に影響しません。 他の3つの列は予測結果を表示する。 次の表に、3つの列を示します。
列 | データ型 | 説明 |
prediction_score | DOUBLE | 予測スコアを含む列。 線形モデルでは、特徴値およびモデル重み値が乗算され、合計されて、予測スコアが得られる。 スコアカードモデルでは、スコア変換が実行されると、変換されたスコアがこの列に生成される。 |
prediction_prob | DOUBLE | バイナリ分類における陽性サンプルの確率値を含む列。 確率値は、シグモイド関数を使用することによって、元のスコアから (スコア変換なしで) 変換される。 |
prediction_detail | STRING | JSON文字列で記述された正と負のサンプルの確率値を含む列。 値0は負を表し、値1は正を表す。 例: {"0":0.1813110520,"1":0.8186889480} |