全部產品
Search
文件中心

Platform For AI:嶺迴歸預測

更新時間:Jul 13, 2024

嶺迴歸預測組件支援稀疏、稠密兩種資料格式。您可以使用嶺迴歸預測組件做數值型變數的預測,包括樓價預測、銷售量預測、濕度預測等。本文為您介紹嶺迴歸預測組件的配置方法。

使用限制

支援的計算引擎為MaxCompute、Flink或DLC。

演算法原理

嶺迴歸是一種專用於共線性資料分析的有偏估計迴歸方法,實質上是一種改良的最小二乘估計法,通過放棄最小二乘法的無偏性,以損失部分資訊、降低精度為代價獲得迴歸係數更為符合實際、更可靠的迴歸方法,對病態資料的擬合要強於最小二乘法。

可視化配置組件參數

  • 輸入樁

    輸入樁(從左至右)

    資料類型

    建議上遊組件

    是否必選

    預測輸入模型

    嶺迴歸訓練

    預測輸入資料

  • 組件參數

    頁簽

    參數

    描述

    欄位設定

    演算法保留列名

    選擇演算法保留列的名稱。

    向量列名

    向量列對應的列名稱。

    參數設定

    預測結果列名

    預測結果列的列名稱。

    組件多線程線程個數

    組件多線程的線程個數,預設為1。

    執行調優

    節點個數

    單個節點記憶體大小參數配對使用。取值為[1, 9999]的正整數。

    單個節點記憶體大小,單位M

    取值範圍為1024 MB~64*1024 MB。

通過代碼方式配置組件

您可以將以下代碼複製到PyAlink指令碼組件中,使PyAlink指令碼組件實現與該組件相同的功能。

from pyalink.alink import *

def main(sources, sinks, parameter):
    model = sources[0]
    batchData = sources[1]

    predictor = RidgeRegPredictBatchOp()\
        .setPredictionCol("pred")
    result = predictor.linkFrom(model, batchData)
    result.link(sinks[0])
    BatchOperator.execute()