全部產品
Search
文件中心

Platform For AI:Lasso迴歸預測

更新時間:Jul 13, 2024

Lasso迴歸預測組件支援稀疏、稠密兩種資料格式。您可以使用該組件做一些數值型變數的預測,比如貸款額度預測、溫度預測等。本文為您介紹Lasso迴歸預測組件的配置方法。

使用限制

支援的計算引擎為MaxCompute、Flink或DLC。

演算法原理

Lasso迴歸演算法通過構造一個懲罰函數,得到一個較為精鍊的模型。使得它壓縮一些迴歸係數,即強制係數絕對值之和小於某個固定值,同時設定一些迴歸係數為0。因此保留了子集收縮的優點,是一種處理具有複共線性資料的有偏估計。

可視化配置組件參數

  • 輸入樁

    輸入樁(從左至右)

    資料類型

    建議上遊組件

    是否必選

    預測輸入模型

    Lasso迴歸訓練

    預測輸入資料

  • 組件參數

    頁簽

    參數

    描述

    欄位設定

    演算法保留列名

    選擇演算法保留列的名稱。

    向量列名

    向量列對應的列名稱。

    參數設定

    預測結果列名

    預測結果列的列名稱。

    組件多線程線程個數

    組件多線程的線程個數,預設為1。

    執行調優

    節點個數

    單個節點記憶體大小參數配對使用。取值為[1, 9999]的正整數。

    單個節點記憶體大小,單位M

    取值範圍為1024 MB~64*1024 MB。

通過代碼方式配置組件

您可以將以下代碼複製到PyAlink指令碼組件中,使PyAlink指令碼組件實現與該組件相同的功能。

from pyalink.alink import *

def main(sources, sinks, parameter):
    model = sources[0]
    batchData = sources[1]

    predictor = LassoRegPredictBatchOp()\
        .setPredictionCol("pred")
    result = predictor.linkFrom(model, batchData)
    result.link(sinks[0])
    BatchOperator.execute()