嶺迴歸預測組件支援稀疏、稠密兩種資料格式。您可以使用嶺迴歸預測組件做數值型變數的預測,包括樓價預測、銷售量預測、濕度預測等。本文為您介紹嶺迴歸預測組件的配置方法。
使用限制
支援的計算引擎為MaxCompute、Flink或DLC。
演算法原理
嶺迴歸是一種專用於共線性資料分析的有偏估計迴歸方法,實質上是一種改良的最小二乘估計法,通過放棄最小二乘法的無偏性,以損失部分資訊、降低精度為代價獲得迴歸係數更為符合實際、更可靠的迴歸方法,對病態資料的擬合要強於最小二乘法。
可視化配置組件參數
通過代碼方式配置組件
您可以將以下代碼複製到PyAlink指令碼組件中,使PyAlink指令碼組件實現與該組件相同的功能。
from pyalink.alink import *
def main(sources, sinks, parameter):
model = sources[0]
batchData = sources[1]
predictor = RidgeRegPredictBatchOp()\
.setPredictionCol("pred")
result = predictor.linkFrom(model, batchData)
result.link(sinks[0])
BatchOperator.execute()