评分卡预测组件对原始数据根据评分卡训练组件产出的模型结果进行预测打分。
组件配置
您可以使用以下任意一种方式,配置评分卡预测组件参数。
方式一:可视化方式
在Designer工作流页面配置组件参数。
页签 | 参数 | 描述 |
字段设置 | 特征列 | 选择用于预测的原始特征列,默认选择全部。 |
原样添加到结果表 | 选择不进行任何处理,直接附加到预测结果表中的列。例如ID列和目标列等。 | |
输出变量分 | 是否输出每个特征变量所对应的分数,最终的预测总得分为截距项的得分加所有的变量分。 | |
执行调优 | 核数目 | 使用的CPU Core数量,默认系统自动分配。 |
每个核的内存大小 | 每个CPU Core所用的内存大小,默认系统自动分配。 |
方式二:PAI命令方式
使用PAI命令方式,配置该组件参数。您可以使用SQL脚本组件进行PAI命令调用,详情请参见SQL脚本。
pai -name=lm_predict
-project=algo_public
-DinputFeatureTableName=input_data_table
-DinputModelTableName=input_model_table
-DmetaColNames=sample_key,label
-DfeatureColNames=fea1,fea2
-DoutputTableName=output_score_table
参数 | 描述 | 是否必选 | 默认值 |
inputFeatureTableName | 输入特征数据表。 | 是 | 无 |
inputFeatureTablePartitions | 输入特征表选择的分区。 | 否 | 全表 |
inputModelTableName | 输入的模型表。 | 是 | 无 |
featureColNames | 输入表选择的特征列。 | 否 | 所有列 |
metaColNames | 不进行转换的数据列,选中的列会原样输出。可以在此指定Label和sample_id等。 | 否 | 无 |
outputFeatureScore | 预测结果中是否输出变量分,取值包括:
| 否 | false |
outputTableName | 输出预测结果表。 | 是 | 无 |
lifecycle | 输出表的生命周期。 | 否 | 无 |
coreNum | 核心数。 | 否 | 默认自动计算 |
memSizePerCore | 内存大小,单位为MB。 | 否 | 默认自动计算 |
组件输出
评分卡预测组件输出的打分表示例如下。其中churn列为用户选择的原样添加到结果表中的列,与预测结果无关。其它三列为预测结果列,其含义如下表所示。
列名 | 列类型 | 列描述 |
prediction_score | DOUBLE | 预测分数列。线性模型中特征值和模型权重值直接相乘相加的结果,对应到评分卡模型中,如果模型进行了分数转换,则该分数输出转换后的得分。 |
prediction_prob | DOUBLE | 二分类场景中预测得到的正例概率值,原始得分(未经分数转换)经过Sigmoid变换后得到该值。 |
prediction_detail | STRING | 用JSON格式描述的各类别概率值,其中0表示负类,1表示正类。例如{“0”:0.1813110520,”1”:0.8186889480}。 |