評分卡預測組件對未經處理資料根據評分卡訓練組件產出的模型結果進行預測打分。
組件配置
您可以使用以下任意一種方式,配置評分卡預測組件參數。
方式一:可視化方式
在Designer工作流程頁面配置組件參數。
頁簽 | 參數 | 描述 |
欄位設定 | 特徵列 | 選擇用於預測的原始特徵列,預設選擇全部。 |
原樣添加到結果表 | 選擇不進行任何處理,直接附加到預測結果表中的列。例如ID列和目標列等。 | |
輸出變數分 | 是否輸出每個特徵變數所對應的分數,最終的預測總得分為截距項的得分加所有的變數分。 | |
執行調優 | 核心數目 | 使用的CPU Core數量,預設系統自動分配。 |
每個核的記憶體大小 | 每個CPU Core所用的記憶體大小,預設系統自動分配。 |
方式二:PAI命令方式
使用PAI命令方式,配置該組件參數。您可以使用SQL指令碼組件進行PAI命令調用,詳情請參見SQL指令碼。
pai -name=lm_predict
-project=algo_public
-DinputFeatureTableName=input_data_table
-DinputModelTableName=input_model_table
-DmetaColNames=sample_key,label
-DfeatureColNames=fea1,fea2
-DoutputTableName=output_score_table
參數 | 描述 | 是否必選 | 預設值 |
inputFeatureTableName | 輸入特徵資料表。 | 是 | 無 |
inputFeatureTablePartitions | 輸入特徵表選擇的分區。 | 否 | 全表 |
inputModelTableName | 輸入的模型表。 | 是 | 無 |
featureColNames | 輸入表選擇的特徵列。 | 否 | 所有列 |
metaColNames | 不進行轉換的資料列,選中的列會原樣輸出。可以在此指定Label和sample_id等。 | 否 | 無 |
outputFeatureScore | 預測結果中是否輸出變數分,取值包括:
| 否 | false |
outputTableName | 輸出預測結果表。 | 是 | 無 |
lifecycle | 輸出表的生命週期。 | 否 | 無 |
coreNum | 核心數。 | 否 | 預設自動計算 |
memSizePerCore | 記憶體大小,單位為MB。 | 否 | 預設自動計算 |
組件輸出
評分卡預測組件輸出的打分表示例如下。其中churn列為使用者選擇的原樣添加到結果表中的列,與預測結果無關。其它三列為預測結果列,其含義如下表所示。
列名 | 列類型 | 列描述 |
prediction_score | DOUBLE | 預測分數列。線性模型中特徵值和模型權重值直接相乘相加的結果,對應到評分卡模型中,如果模型進行了分數轉換,則該分數輸出轉換後的得分。 |
prediction_prob | DOUBLE | 二分類情境中預測得到的正例機率值,原始得分(未經分數轉換)經過Sigmoid變換後得到該值。 |
prediction_detail | STRING | 用JSON格式描述的各類別機率值,其中0表示負類,1表示正類。例如{“0”:0.1813110520,”1”:0.8186889480}。 |