Lasso迴歸預測組件支援稀疏、稠密兩種資料格式。您可以使用該組件做一些數值型變數的預測,比如貸款額度預測、溫度預測等。本文為您介紹Lasso迴歸預測組件的配置方法。
使用限制
支援的計算引擎為MaxCompute、Flink或DLC。
演算法原理
Lasso迴歸演算法通過構造一個懲罰函數,得到一個較為精鍊的模型。使得它壓縮一些迴歸係數,即強制係數絕對值之和小於某個固定值,同時設定一些迴歸係數為0。因此保留了子集收縮的優點,是一種處理具有複共線性資料的有偏估計。
可視化配置組件參數
通過代碼方式配置組件
您可以將以下代碼複製到PyAlink指令碼組件中,使PyAlink指令碼組件實現與該組件相同的功能。
from pyalink.alink import *
def main(sources, sinks, parameter):
model = sources[0]
batchData = sources[1]
predictor = LassoRegPredictBatchOp()\
.setPredictionCol("pred")
result = predictor.linkFrom(model, batchData)
result.link(sinks[0])
BatchOperator.execute()