Lasso Regression Predictionコンポーネントは、まばらで密なデータをサポートします。 このコンポーネントを使用して、ローンの限度額や温度などの数値変数の値を推定できます。 このトピックでは、Lasso Regression Predictionコンポーネントを設定する方法について説明します。
制限事項
MaxCompute、Realtime Compute for Apache Flink、またはPlatform for AI (PAI) のディープラーニングコンテナ (DLC) のいずれかのコンピューティングリソースにのみ基づいて、リッジ回帰トレーニングコンポーネントを使用できます。
LASSOのしくみ
LASSOはペナルティ関数を作成し、より洗練されたモデルを取得します。 LASSOは、一部の回帰係数を縮小し、特定の回帰係数をゼロに設定できます。 係数が縮小される場合、係数の絶対値の合計は、固定値未満である。 このように、LASSOはサブセット縮小の有益な機能を保持し、多重共線性データにバイアス推定を実装します。
PAIコンソールでコンポーネントを設定する
入力ポート
入力ポート (左から右)
データ型
推奨上流コンポーネント
必須
予測の入力モデル
なし
可
予測の入力データ
なし
可
パラメータ設定
タブ
パラメーター
説明
フィールド設定
reservedCols
アルゴリズムによって予約される列。
vectorCol
ベクトル列の名前。
パラメーター設定
predictionCol
予測列の名前。
numThreads
コンポーネントのスレッド数。 デフォルト値は 1 です。
実行チューニング
数の労働者
労働者の数。 このパラメーターは、Memory per worker, unit MBパラメーターと一緒に使用する必要があります。 このパラメーターの値は正の整数でなければなりません。 有効な値: [1,9999] 。
ワーカあたりのメモリ、単位MB
各ワーカーのメモリサイズ。 有効値: 1024〜64 × 1024。 単位:MB。
コーディングによるコンポーネントの設定
次のコードをPyAlink Scriptコンポーネントのコードエディターにコピーできます。 このように、PyAlinkスクリプトコンポーネントは、Lasso Regression Predictionコンポーネントのように機能します。
from pyalink.alink import *
def main(sources, sinks, parameter):
model = sources[0]
batchData = sources[1]
predictor = LassoRegPredictBatchOp()\
.setPredictionCol("pred")
result = predictor.linkFrom(model, batchData)
result.link(sinks[0])
BatchOperator.execute()