全部產品
Search
文件中心

Platform For AI:特徵重要性過濾

更新時間:Jul 13, 2024

特徵重要性過濾組件為線性特徵重要性、GBDT特徵重要性和隨機森林特徵重要性等組件提供過濾功能,支援過濾TopN的特徵。

組件配置

PAI命令
PAI -name fe_filter_runner -project algo_public
    -DselectedCols=pdays,previous,emp_var_rate,cons_price_idx,cons_conf_idx,euribor3m,nr_employed,age,campaign,poutcome
    -DinputTable=pai_dense_10_10
    -DweightTable=pai_temp_2252_20319_1
    -DtopN=5
    -DmodelTable=pai_temp_2252_20320_2
    -DoutputTable=pai_temp_2252_20320_1;
參數描述是否必選
inputTable輸入表名。
inputTablePartitions系統預設選擇所有分區。指定輸入表的分區:
  • 指定單個分區,格式為partition_name=value
  • 指定多個分區,格式為name1=value1,name2=value2
    說明 多個分區之間用英文逗號(,)分隔。
  • 指定多級分區,格式為name1=value1/name2=value2
weightTable特徵重要性的權重表(即線性特徵重要性、GBDT特徵重要性、隨機森林特徵重要性的輸出表)。
outputTable過濾出TopN特徵的輸出表。
modelTable特徵過濾產出的模型檔案。
selectedCols預設輸入表的所有欄位列名。
topNTopN特徵,預設10。
說明 僅支援輸入正整數。
lifecycle輸出表生命週期,預設7。
說明 僅支援輸入正整數。