このトピックでは、線形回帰 (LR) アルゴリズムについて説明します。
背景情報
LRは、線形回帰方程式の最小二乗関数を使用して、1つまたは複数の独立変数と従属変数との間の関係をモデル化する回帰分析である。
シナリオ
LRは、値をフィッティングするために主に使用される回帰モデルです。 モデルはシンプルですが、非常に解釈可能です。
LRはトレンドラインのフィッティングに適しています。 トレンドラインは、時系列データの長期的なトレンドを表しています。 これは、一連のデータ (株価、GMV、販売量など) が一定期間にわたって増加したか減少したかを示します。 トレンドラインは、座標系のデータポイントの目視検査に基づいて描画できますが、LRを使用してトレンドラインの位置と勾配を計算する方が適切です。
パラメーター
次の表に示すパラメーターの値は、モデルの作成に使用されるCREATE model
ステートメントで指定されたmodel_parameter
パラメーターの値と同じです。 ビジネス要件に基づいてパラメーターを設定できます。
パラメーター | 説明 |
エポック | 反復回数。 このパラメータは通常正の整数です。 デフォルト値: -1。 説明 このパラメーターが-1に設定されている場合、反復は収束するまで続きます。 |
正規化 | 正規化が必要かどうかを指定します。 有効な値:
|
例
LRモデルを作成します。
/*polar4ai*/CREATE MODEL linearreg1 WITH
( model_class = 'linearreg', x_cols = 'dx1,dx2', y_cols='y',
model_parameter=(epoch=3)) AS (SELECT * FROM db4ai.testdata1);
モデルを評価します。
/*polar4ai*/SELECT dx1,dx2 FROM EVALUATE(MODEL linearreg1,
SELECT * FROM db4ai.testdata1 LIMIT 10) WITH
(x_cols = 'dx1,dx2',y_cols='y',metrics='r2_score');
予測にモデルを使用します。
/*polar4ai*/SELECT dx1,dx2 FROM
PREDICT(MODEL linearreg1, SELECT * FROM db4ai.testdata1 LIMIT 10)
WITH (x_cols = 'dx1,dx2');
説明
x_cols
およびy_cols
のデータ型は、浮動小数点または整数である必要があります。