全部產品
Search
文件中心

Platform For AI:評分卡預測

更新時間:Jul 13, 2024

評分卡預測組件對未經處理資料根據評分卡訓練組件產出的模型結果進行預測打分。

組件配置

您可以使用以下任意一種方式,配置評分卡預測組件參數。

方式一:可視化方式

Designer工作流程頁面配置組件參數。

頁簽

參數

描述

欄位設定

特徵列

選擇用於預測的原始特徵列,預設選擇全部。

原樣添加到結果表

選擇不進行任何處理,直接附加到預測結果表中的列。例如ID列和目標列等。

輸出變數分

是否輸出每個特徵變數所對應的分數,最終的預測總得分為截距項的得分加所有的變數分。

執行調優

核心數目

使用的CPU Core數量,預設系統自動分配。

每個核的記憶體大小

每個CPU Core所用的記憶體大小,預設系統自動分配。

方式二:PAI命令方式

使用PAI命令方式,配置該組件參數。您可以使用SQL指令碼組件進行PAI命令調用,詳情請參見SQL指令碼

pai -name=lm_predict
    -project=algo_public
    -DinputFeatureTableName=input_data_table
    -DinputModelTableName=input_model_table
    -DmetaColNames=sample_key,label
    -DfeatureColNames=fea1,fea2
    -DoutputTableName=output_score_table

參數

描述

是否必選

預設值

inputFeatureTableName

輸入特徵資料表。

inputFeatureTablePartitions

輸入特徵表選擇的分區。

全表

inputModelTableName

輸入的模型表。

featureColNames

輸入表選擇的特徵列。

所有列

metaColNames

不進行轉換的資料列,選中的列會原樣輸出。可以在此指定Label和sample_id等。

outputFeatureScore

預測結果中是否輸出變數分,取值包括:

  • true:輸出變數分。

  • false:不輸出變數分。

false

outputTableName

輸出預測結果表。

lifecycle

輸出表的生命週期。

coreNum

核心數。

預設自動計算

memSizePerCore

記憶體大小,單位為MB。

預設自動計算

組件輸出

評分卡預測組件輸出的打分表示例如下。打分表示例其中churn列為使用者選擇的原樣添加到結果表中的列,與預測結果無關。其它三列為預測結果列,其含義如下表所示。

列名

列類型

列描述

prediction_score

DOUBLE

預測分數列。線性模型中特徵值和模型權重值直接相乘相加的結果,對應到評分卡模型中,如果模型進行了分數轉換,則該分數輸出轉換後的得分。

prediction_prob

DOUBLE

二分類情境中預測得到的正例機率值,原始得分(未經分數轉換)經過Sigmoid變換後得到該值。

prediction_detail

STRING

用JSON格式描述的各類別機率值,其中0表示負類,1表示正類。例如{“0”:0.1813110520,”1”:0.8186889480}