このトピックでは、フィーチャの予測力を評価する情報価値 (IV) メソッドについて説明します。
シナリオ
IVは一般に有効な特徴を選択するために用いられる。 リスク管理シナリオでは、数千または数万の特徴が存在する可能性があり、予測特徴を手動で選択することは困難である。 IV法を用いてこの問題を処理することができる。
構文
CREATE FEATURE feature_name WITH ( feature_class = '', x_cols = '', y_cols = '', parameters=()) AS (SELECT select_expr [, select_expr] ... FROM table_reference)
パラメータの説明:パラメーター | 説明 |
feature_name | フィーチャーの名前。 |
feature_class | フィーチャーのタイプ。 値をivに設定します。 |
x_cols | 独立変数のリスト。 複数の変数はコンマ (,) で区切ります。 |
y_cols | 従属変数。 |
parameters | フィーチャーを作成するためのカスタムパラメーター。 IV法はカテゴリ特徴のみをサポートする。 値はcategorical_featuresにのみ設定できます。 複数のフィーチャはコンマ (,) で区切ります。 |
select_expr | フィーチャーの作成に使用される列の名前。 |
table_reference | フィーチャーの作成に使用される列を含むテーブルの名前。 |
例:
/* polar4ai */CREATE FEATURE iv_001 WITH ( feature_class = 'iv' 、x_cols='Airline、Flight、AirportFrom、AirportTo、DayOfWeek、Time、Length' 、y_cols='Delay' 、parameters=(categorical_feature='Airline、Flight、AirportFrom、AirportTo、OofDayOfing_Ofay_Week') '))))