本文介紹了線性迴歸演算法(Linear Regression,以下簡稱LR)相關內容。
簡介
LR是利用線性迴歸方程的最小平方函數對一個或多個自變數和因變數之間關係進行建模的一種迴歸分析。
使用情境
LR是一個迴歸模型,主要用於擬合數值。該模型簡單,可解釋性強。
LR適用於擬合趨勢線,一條趨勢線代表著時間序列資料的長期走勢,它表示一組特定資料(如股票價格、GMV和銷量)是否在一段時期內增長或下降。雖然可以根據肉眼觀察資料點在座標系的位置來畫出趨勢線,但是更恰當的方法是利用LR計算出趨勢線的位置和傾斜率。
參數說明
下表中的參數為建立模型CREATE MODEL
文法中model_parameter
參數的取值,您可以根據當前需求選擇對應的參數。
參數 | 說明 |
epoch | 迭代次數。通常為正整數,預設值為-1。 說明 迭代次數設定為-1時,表示持續迭代直至收斂。 |
normalize | 是否需要正則化。取值如下:
|
樣本
建立模型與模型離線學習
/*polar4ai*/CREATE MODEL linearreg1 WITH
( model_class = 'linearreg', x_cols = 'dx1,dx2', y_cols='y',
model_parameter=(epoch=3)) AS (SELECT * FROM db4ai.testdata1);
模型評估
/*polar4ai*/SELECT dx1,dx2 FROM EVALUATE(MODEL linearreg1,
SELECT * FROM db4ai.testdata1 LIMIT 10) WITH
(x_cols = 'dx1,dx2',y_cols='y',metrics='r2_score');
模型預測
/*polar4ai*/SELECT dx1,dx2 FROM
PREDICT(MODEL linearreg1, SELECT * FROM db4ai.testdata1 LIMIT 10)
WITH (x_cols = 'dx1,dx2');
說明
x_cols
和y_cols
中的列資料類型必須是浮點型或整型。