すべてのプロダクト
Search
ドキュメントセンター

Platform For AI:農業ローン申請者の返済能力を予測する

最終更新日:Jul 22, 2024

線形回帰は、数理統計学における一般的な回帰分析方法です。 このメソッドを使用して、2つ以上の変数間の量的関係を見つけることができます。 Machine Learning Designerは、事前設定された線形回帰テンプレートを提供し、過去のローン記録に基づいて農業ローン申請者の返済能力を予測するモデルを構築するのに役立ちます。 このトピックでは、プリセット線形回帰テンプレートの使用方法について説明します。

背景情報

農業ローン申請者の返済能力予測は、典型的なデータマイニングプロセスです。 ローン貸し手は、年収、作物の種類、ローンの記録などの申請者の履歴データに基づいて経験的モデルを構築し、そのモデルを使用してローン申請者の返済能力を予測できます。

説明

このトピックで使用されるデータセットは、実験用にのみ使用されます。

前提条件

データセット

このトピックで使用されるデータセットには、次のフィールドが含まれます。

項目

データ型

説明

id

STRING

申請者の一意のID。

name

STRING

申請者の名前。

region

STRING

申請者が居住する地理的地域。 有効な値: 北、中、南。

farmsize

DOUBLE

農地の大きさ。

降雨量

DOUBLE

この地域の降雨量。

landquality

DOUBLE

農地の質。 値が大きいほど品質が良いことを示す。

farmincome

DOUBLE

申請者の年収。

maincrop

STRING

作物のタイプ。

claimtype

STRING

ローンタイプ。

claimvalue

DOUBLE

ローンの金額。

手順

  1. Machine Learning Designerページに移動します。

    1. PAIコンソールにログインします。

    2. 左側のナビゲーションウィンドウで、[ワークスペース] をクリックします。 [ワークスペース] ページで、管理するワークスペースの名前をクリックします。

    3. ワークスペースページの左側のナビゲーションウィンドウで、モデル开発とトレーニング > ビジュアルモデリング (デザイナー)機械学習デザイナーページに移動します。

  2. パイプラインを作成します。

    1. 可视化モデリング (デザイナー)ページで、プリセットテンプレートタブをクリックします。

    2. プリセットテンプレートタブで、農業ローン予測テンプレートを検索し、作成をクリックします。

    3. [パイプラインの作成] ダイアログボックスで、必要なパラメーターを設定します。 デフォルト値を使用できます。

      Pipeline Data Pathパラメーターの値は、パイプラインの実行時に生成される一時データとモデルのObject Storage Service (OSS) パスを示します。

    4. [OK] をクリックします。

      パイプラインの作成には約10秒かかります。

    5. [パイプライン] タブで、作成したパイプラインを選択し、開く.

    6. キャンバス上のパイプラインのコンポーネントを表示します。 次の図は、プリセットテンプレートに基づいて自動的に作成されるパイプラインを示しています。

      实验

      セクション

      説明

      1

      このセクションのコンポーネントは、パイプラインで使用される次のデータセットを読み取ります。

      • トレーニングデータセット: 線形回帰モデルのトレーニングに使用される100の履歴レコードが含まれます。 データセットには、farmsizeinrain、claimvalueなどのフィールドが含まれています。 claimvalueフィールドは、回収されたローン額を示す。

      • 予測データセット: 今年農業ローンを申請する71人のローン申請者に関する情報が含まれています。 claimvalueフィールドは、要求されたローン額を示す。

      パイプラインは、トレーニングデータセットの履歴レコードに基づいて、予測データセットの応募者の返済能力を予測します。

      2

      このセクションのコンポーネントは、STRING型のフィールド値をDOUBLE型に変換します。 たとえば、regionフィールドの有効な値は、northmiddlesouthです。 このセクションのコンポーネントは、これらの値を数値 (それぞれ012) にマッピングし、数値をDOUBLEタイプに変換します。

      3

      線形回帰コンポーネントは、トレーニングデータセットの履歴レコードを使用して、回帰モデルをトレーニングおよび生成します。 予測コンポーネントは、回帰モデルを使用して、申請者が返済できるローン額を予測します。 [追加列] コンポーネントは、次の図に示すように、予測結果のid、prediction_score、およびclaimvalue列をマージします。 预测结果prediction_scoreフィールドは、申請者が返済できる予測金額を示す。

      4

      Evaluationコンポーネントは、モデルの予測パフォーマンスを評価します。 評価メトリックの詳細については、「表1 (評価メトリック) 」をご参照ください。

      5

      Sq1マッピングコンポーネントは、予測返済額を要求されたローン額と比較することによって適格なローン申請者を識別する。 予測された返済額が要求されたローン額よりも高い場合、申請者は適格と見なされます。

      表 1. 評価メトリック

      メトリック

      説明

      MAE

      平均絶対誤差。

      MAPE

      平均絶対パーセンテージエラー。

      MSE

      平均二乗エラー。

      R

      複数の相関の係数。

      アカウントの作成

      決定の係数。

      RMSE

      二乗平均平方根誤差。

      SAE

      絶対エラーの合計。

      SSE

      二乗誤差の合計。

      SSR

      回帰による二乗の合計。

      SST

      二乗の合計。

      集計

      行の数。

      predictionMean

      予測結果の平均。

      yMean

      元の従属変数の平均。

  3. パイプラインを実行し、予測結果を表示します。

    1. キャンバスの左上隅で、[実行] をクリックします。image.pngアイコンが表示されます。

    2. パイプラインが完了したら、キャンバス上で [Sqlマッピング] コンポーネントを右クリックし、[データの表示] > [出力ポート] を選択します。 表示されるタブで、適格なローン申請者を表示できます。

      输出

関連ドキュメント

アルゴリズムコンポーネントの詳細については、以下のトピックを参照してください。