すべてのプロダクト
Search
ドキュメントセンター

Platform For AI:リッジ回帰予測

最終更新日:Jul 22, 2024

リッジ回帰予測コンポーネントは、まばらで密なデータをサポートします。 このコンポーネントを使用して、住宅価格、販売量、気温などの数値変数の値を推定できます。 このトピックでは、リッジ回帰予測コンポーネントを設定する方法について説明します。

制限事項

MaxCompute、Realtime Compute for Apache Flink、またはPlatform for AI (PAI) のディープラーニングコンテナ (DLC) のいずれかのコンピューティングリソースにのみ基づいて、リッジ回帰トレーニングコンポーネントを使用できます。

Tikhonov正則化の仕組み

Tikhonov正則化は、共線性データの分析専用のバイアス推定回帰法です。 それは本質的に改善された最小二乗法である。 最小二乗法の不均衡を放棄することにより、Tikhonov正則化は、回帰係数を取得するためのより現実的で信頼性が高く、最小二乗法よりも条件の悪いデータによりよく適合します。 ただし、Tikhonov正則化は、部分的な情報の損失と精度の低下も引き起こします。

PAIコンソールでコンポーネントを設定する

  • 入力ポート

    入力ポート (左から右)

    データ型

    推奨上流コンポーネント

    必須

    予測の入力モデル

    None

    リッジ回帰トレーニング

    予測の入力データ

    None

  • コンポーネントパラメータ

    タブ

    パラメーター

    説明

    フィールド設定

    reservedCols

    アルゴリズムによって予約される列。

    vectorCol

    ベクトル列の名前。

    パラメーター設定

    predictionCol

    予測列の名前。

    numThreads

    コンポーネントのスレッド数。 デフォルト値は 1 です。

    実行チューニング

    数の労働者

    労働者の数。 このパラメーターは、Memory per worker, unit MBパラメーターと一緒に使用する必要があります。 このパラメーターの値は正の整数でなければなりません。 有効な値: [1,9999] 。

    ワーカあたりのメモリ、単位MB

    各ワーカーのメモリサイズ。 有効値: 1024〜64 × 1024。 単位:MB。

コーディングによるコンポーネントの設定

次のコードをPyAlink Scriptコンポーネントのコードエディターにコピーできます。 これにより、PyAlinkスクリプトコンポーネントは、リッジ回帰予測コンポーネントのように機能します。

from pyalink.alink import *

def main(sources, sinks, parameter):
    model = sources[0]
    batchData = sources[1]

    predictor = RidgeRegPredictBatchOp()\
        .setPredictionCol("pred")
    result = predictor.linkFrom(model, batchData)
    result.link(sinks[0])
    BatchOperator.execute()