GBDT二分类预测V2组件提供了针对GBDT二分类V2组件的预测功能,使用梯度提升决策树 (Gradient Boosting Decision Trees) 算法,对数据进行二分类问题的预测。本文介绍GBDT二分类预测V2组件的配置方法。
支持计算资源
支持的计算引擎为MaxCompute和Flink。
算法原理
梯度提升决策树模型构建了一个由多棵决策树组成的组合模型。每一棵决策树对应一个弱学习器,将这些弱学习器组合在一起,可以达到比较好的分类或回归效果。
梯度提升的基本递推结构为:
其中,通常为一棵 CART 决策树,为决策树的参数,为步长。第m棵决策树在前m-1棵决策树的基础上对目标函数进行优化。最终得到包含若干棵决策树的模型。
可视化配置参数
输入桩配置
输入桩(从左到右)
限制数据类型
建议上游组件
是否必选
模型表
无
是
预测数据表
无
是
右侧参数表单
页签
参数
是否必选
描述
默认值
字段设置
预测结果列名
是
预测结果列名。
prediction_result
预测详细信息列名
否
预测详细信息列名。
prediction_detail
算法保留列
否
保留列名,默认保留所有列。
无
执行调优
节点数
否
执行作业的节点数。
根据输入数据自动计算
每节点内存
否
节点所使用的内存数,单位为MB,取值范围为[100,65536]。
根据输入数据自动计算
输出桩说明
输出桩
存储位置
下游建议组件
模型类型
输出
不需要配置
无
相关文档
该组件使用GBDT二分类V2组件训练得到的模型,对数据进行二分类预测。
关于Designer组件更详细的内容介绍,请参见Designer概述。
Designer预置了多种算法组件,你可以根据不同的使用场景选择合适的组件进行数据处理,详情请参见组件参考:所有组件汇总。