すべてのプロダクト
Search
ドキュメントセンター

Platform For AI:機能の重要性フィルタリング

最終更新日:Jul 22, 2024

特徴重要度フィルタリングコンポーネントは、線形モデル特徴重要度、GBDT特徴重要度、およびランダムフォレスト特徴重要度を含むコンポーネントのフィルタリング機能を提供する。 特徴重要度フィルタリングコンポーネントは、上位N個の特徴をフィルタリングするために使用することができる。

コンポーネントの設定

AI (PAI) コマンド

PAI -name fe_filter_runner -project algo_public
    -DselectedCols=pdays,previous,emp_var_rate,cons_price_idx,cons_conf_idx,euribor3m,nr_employed,age,campaign,poutcome
    -DinputTable=pai_dense_10_10
    -DweightTable=pai_temp_2252_20319_1
    -DtopN=5
    -DmodelTable=pai_temp_2252_20320_2
    -DoutputTable=pai_temp_2252_20320_1;

パラメーター

説明

必須

inputTable

入力テーブルの名前。

inputTablePartitions

入力テーブルのパーティション。 デフォルトでは、すべてのパーティションが選択されています。

  • 1つのパーティションをpartition_name=valueの形式で指定します。

  • name1=value1,name2=value2の形式で複数のパーティションを指定します。

    説明

    複数のパーティションはコンマ (,) で区切ります。

  • マルチレベルパーティションをname1=value1/name2=value2の形式で指定します。

不可

weightTable

機能の重要度の重みテーブル。 重みテーブルは、線形モデル特徴重要度、GBDT特徴重要度、およびランダムフォレスト特徴重要度コンポーネントの出力テーブルである。

outputTable

上位N個の特徴の後の出力テーブルがフィルタリングされる。

modelTable

特徴フィルタリングによって生成されたモデルファイル。

selectedCols

デフォルトでは、入力テーブルのすべてのフィールドが選択されています。

不可

topN

フィルタリングされる上位N個の特徴。 デフォルト値は 10 です。

説明

このパラメーターの値は正の整数でなければなりません。

不可

ライフサイクルの設定 (Set lifecycle)

出力テーブルのライフサイクル。 デフォルト値 : 7

説明

このパラメーターの値は正の整数でなければなりません。

不可