すべてのプロダクト
Search
ドキュメントセンター

PolarDB:人口安定指数

最終更新日:Jun 04, 2024

このトピックでは、モデルの安定性を評価するために、データの予想分布と実際の分布の差を測定する人口安定性指数 (PSI) について説明します。

シナリオ

PSIは、安定性がモデルの有効性を決定する重要な要素であるリスク管理の分野で一般的に使用されています。 ほとんどのリスク管理モデルは、交換されるまで1年以上使用されますが、これはかなり長い時間です。 モデルが安定していない場合、決定の質は悪影響を受ける可能性がある。

構文

CREATE FEATURE feature_name WITH ( feature_class = '', x_cols = '', parameters=())
パラメータの説明:
パラメーター説明
feature_nameフィーチャーの名前。
feature_classフィーチャーのタイプ。 値をpsiに設定します。
x_cols独立変数のリスト。 複数の変数はコンマ (,) で区切ります。
parametersフィーチャーを作成するためのカスタムパラメーター。 以下のパラメーターがサポートされます。
  • actual_table: 変数の実際の分布のテーブル。
  • predict_table: 変数の予想される分布のテーブル。
  • bin_num: ビンの数。 このパラメーターはオプションです。 このパラメーターを指定する場合は、bins_methodも指定する必要があります。 このパラメーターを指定しない場合、システムはビニング方法と実際のデータに基づいてビンの数を決定します。
  • bins_method: データビニング方法。 デフォルト値: chi。 有効な値:
    • chi: chi-square法。
    • 分位数: 等しい周波数の方法。
    • step: 等しいステップ法。
    • dt: 決定木の方法。
    • kmean: k-meansクラスタリング法。
  • categorical_feature: categorical features。 複数のフィーチャはコンマ (,) で区切ります。

例:

/* polar4ai */CREATE FEATURE psi_001 WITH ( feature_class = 'psi' 、x_cols='Airline、Flight、AirportFrom、AirportTo、DayOfWeek、Time、Length' 、parameters='airlines_train_1000 '、predict_table='Airairlines=test_1000' 、Airofport' から