特徵重要性過濾組件為線性特徵重要性、GBDT特徵重要性和隨機森林特徵重要性等組件提供過濾功能,支援過濾TopN的特徵。
組件配置
PAI命令
PAI -name fe_filter_runner -project algo_public
-DselectedCols=pdays,previous,emp_var_rate,cons_price_idx,cons_conf_idx,euribor3m,nr_employed,age,campaign,poutcome
-DinputTable=pai_dense_10_10
-DweightTable=pai_temp_2252_20319_1
-DtopN=5
-DmodelTable=pai_temp_2252_20320_2
-DoutputTable=pai_temp_2252_20320_1;
參數 | 描述 | 是否必選 |
inputTable | 輸入表名。 | 是 |
inputTablePartitions | 系統預設選擇所有分區。指定輸入表的分區:
| 否 |
weightTable | 特徵重要性的權重表(即線性特徵重要性、GBDT特徵重要性、隨機森林特徵重要性的輸出表)。 | 是 |
outputTable | 過濾出TopN特徵的輸出表。 | 是 |
modelTable | 特徵過濾產出的模型檔案。 | 是 |
selectedCols | 預設輸入表的所有欄位列名。 | 否 |
topN | TopN特徵,預設10。 說明 僅支援輸入正整數。 | 否 |
lifecycle | 輸出表生命週期,預設7。 說明 僅支援輸入正整數。 | 否 |