GBDT二分類預測V2組件提供了針對GBDT二分類V2組件的預測功能,使用梯度提升決策樹 (Gradient Boosting Decision Trees) 演算法,對資料進行二分類問題的預測。本文介紹GBDT二分類預測V2組件的配置方法。
支援計算資源
支援的計算引擎為MaxCompute和Flink。
演算法原理
梯度提升決策樹模型構建了一個由多棵決策樹組成的組合模型。每一棵決策樹對應一個弱學習器,將這些弱學習器組合在一起,可以達到比較好的分類或迴歸效果。
梯度提升的基本遞推結構為:
其中,通常為一棵 CART 決策樹,為決策樹的參數,為步長。第m棵決策樹在前m-1棵決策樹的基礎上對目標函數進行最佳化。最終得到包含若干棵決策樹的模型。
可視化配置參數
輸入樁配置
輸入樁(從左至右)
限制資料類型
建議上遊組件
是否必選
模型表
無
是
預測資料表
無
是
右側參數表單
頁簽
參數
是否必選
描述
預設值
欄位設定
預測結果列名
是
預測結果列名。
prediction_result
預測詳細資料列名
否
預測詳細資料列名。
prediction_detail
演算法保留列
否
保留列名,預設保留所有列。
無
執行調優
節點數
否
執行作業的節點數。
根據輸入資料自動計算
每節點記憶體
否
節點所使用的記憶體數,單位為MB,取值範圍為[100,65536]。
根據輸入資料自動計算
輸出樁說明
輸出樁
儲存位置
下遊建議組件
模型類型
輸出
不需要配置
無
相關文檔
該組件使用GBDT二分類V2組件訓練得到的模型,對資料進行二分類預測。
關於Designer組件更詳細的內容介紹,請參見Designer概述。
Designer預置了多種演算法組件,你可以根據不同的使用情境選擇合適的組件進行資料處理,詳情請參見組件參考:所有組件匯總。