このトピックでは、Machine Learning Studioが提供する散布プロットコンポーネントについて説明します。
回帰分析では、散布図はデカルト座標系のデータ点の分布を示します。
コンポーネントの設定
次のいずれかの方法を使用して、散布図コンポーネントを設定できます。
方法1: パイプラインページでコンポーネントを設定する
散布図コンポーネントのパラメーターは、Machine Learning Platform for AI (PAI) のMachine Learning Designerのパイプラインページで設定できます。 Machine Learning Designerは、以前はMachine Learning Studioとして知られていました。 下表に、各パラメーターを説明します。
パラメーター | 説明 |
フィーチャー列 | トレーニングサンプルのデータの特徴を表す列。 |
ラベル列 | ラベル列。 |
サンプル | サンプルの数。 |
方法2: PAIコマンドを使用する
PAIコマンドを使用してコンポーネントパラメータを設定します。 SQLスクリプトコンポーネントを使用してPAIコマンドを呼び出すことができます。 詳細については、「SQLスクリプト」をご参照ください。
PAI -name scatter_diagram -project algo_public
-DselectedCols=emp_var_rate,cons_price_rate,cons_conf_idx,euribor3m
-DlabelCol=y
-DmapTable=pai_temp_2447_22859_2
-DinputTable=scatter_diagram
-DoutputTable=pai_temp_2447_22859_1;
パラメーター | 必須 | 説明 | デフォルト値 |
inputTable | 可 | 入力テーブルの名前。 | デフォルト値なし |
inputTablePartitions | 不可 | トレーニング用に入力テーブルから選択されたパーティション。 次の形式がサポートされています。
説明 複数のパーティションを指定する場合は、コンマ (,) で区切ります。 | デフォルト値なし |
outputTable | 可 | 出力テーブルの名前。 | デフォルト値なし |
mapTable | 可 | 各フィーチャの最大値、最小値、および列挙値を格納する出力テーブルの名前。 | デフォルト値なし |
selectedCols | 可 | 入力テーブルから選択され、散布図の描画に使用される列。 最大5つの列を選択できます。 | デフォルト値なし |
labelCol | 可 | ラベル列として使用するINT型またはSTRING型の列。 | Empty |
ライフサイクル | 可 | 出力テーブルのライフサイクル。 単位:日 | 28 |
例:
入力データ
create table scatter_diagram as select emp_var_rate,cons_price_rate, cons_conf_idx,euribor3m,y from pai_bank_data limit 10
emp_var_rate
cons_price_rate
cons_conf_idx
euribor3m
y
1.4
93.918
-42.7
4.962
0
-0.1
93.2
-42.0
4.021
0
-1.7
94.055
-39.8
0.729
1
-1.8
93.075
-47.1
1.405
0
-2.9
92.201
31.4
0.869
1
1.4
93.918
-42.7
4.961
0
-1.8
92.893
-46.2
1.327
0
-1.8
92.893
92.893
1.313
0
-2.9
92.963
-40.8
1.266
1
-1.8
93.075
-47.1
1.41
0
1.1
93.994
-36.4
4.864
0
1.4
93.444
-36.1
4.964
0
1.4
93.444
-36.1
4.965
1
-1.8
92.893
-46.2
1.291
0
1.4
94.465
-41.8
4.96
0
1.4
93.918
-42.7
4.962
0
-1.8
93.075
-47.1
1.365
1
-0.1
93.798
-40.4
4.86
1
1.1
93.994
-36.4
4.86
0
1.4
93.918
-42.7
4.96
0
-1.8
93.075
-47.1
1.405
0
1.4
94.465
-41.8
4.967
0
1.4
93.918
-42.7
4.963
0
1.4
93.918
-42.7
4.968
0
1.4
93.918
-42.7
4.962
0
-1.8
92.893
-46.2
1.344
0
-3.4
92.431
-26.9
0.754
0
-1.8
93.075
-47.1
1.365
0
-1.8
92.893
-46.2
1.313
0
1.4
93.918
-42.7
4.961
0
1.4
94.465
-41.8
4.961
0
-1.8
92.893
-46.2
1.327
0
-1.8
92.893
-46.2
1.299
0
-2.9
92.963
-40.8
1.268
1
1.4
93.918
-42.7
4.963
0
-1.8
92.893
-46.2
1.334
0
1.4
93.918
-42.7
4.96
0
-1.8
93.075
-47.1
1.405
0
1.4
94.465
-41.8
4.96
0
1.4
93.444
-36.1
4.962
0
1.1
93.994
-36.4
4.86
0
1.1
93.994
-36.4
4.857
0
1.4
93.918
-42.7
4.961
0
-3.4
92.649
-30.1
0.715
1
1.4
93.444
-36.1
4.966
0
-0.1
93.2
-42.0
4.076
0
1.4
93.444
-36.1
4.965
0
-1.8
92.893
-46.2
1.354
0
1.4
93.444
-36.1
4.967
0
1.4
94.465
-41.8
4.959
0
-1.8
92.893
-46.2
1.354
0
1.4
94.465
-41.8
4.958
0
-1.8
92.893
-46.2
1.354
0
1.4
94.465
-41.8
4.864
0
1.1
93.994
-36.4
4.859
0
1.1
93.994
-36.4
4.857
0
-1.8
92.893
-46.2
1.27
0
1.1
93.994
-36.4
4.857
0
1.1
93.994
-36.4
4.859
0
1.4
94.465
-41.8
4.959
0
1.1
93.994
-36.4
4.856
0
-1.8
93.075
-47.1
1.405
0
-1.8
92.843
-50.0
1.811
1
-0.1
93.2
-42.0
4.021
0
-2.9
92.469
-33.6
1.029
0
1.4
93.918
-42.7
4.962
0
-1.8
93.075
-47.1
1.365
0
1.1
93.994
-36.4
4.857
0
-1.8
92.893
-46.2
1.259
0
1.1
93.994
-36.4
4.857
0
1.4
94.465
-41.8
4.866
0
-2.9
92.201
-31.4
0.883
0
-0.1
93.2
-42.0
4.076
0
1.1
93.994
-36.4
4.857
0
1.4
93.918
-42.7
4.96
0
1.4
93.444
-36.1
4.962
0
1.1
93.994
-36.4
4.858
0
1.1
93.994
-36.4
4.857
0
1.1
93.994
-36.4
4.856
0
1.4
93.918
-42.7
4.968
0
1.4
93.444
-36.1
4.966
0
1.4
94.465
-41.8
4.962
0
1.4
93.444
-36.1
4.963
0
-1.8
92.843
-50.0
1.56
1
1.4
93.918
-42.7
4.96
0
1.4
93.444
-36.1
4.963
0
-3.4
92.431
-26.9
0.74
0
1.1
93.994
-36.4
4.856
0
1.4
93.918
-42.7
4.962
0
1.1
93.994
-36.4
4.856
0
-0.1
93.2
-42.0
4.245
1
1.1
93.994
-36.4
4.857
0
-1.8
93.075
-47.1
1.405
0
-1.8
92.893
-46.2
1.327
0
-0.1
93.2
-42.0
4.12
0
1.4
94.465
-41.8
4.958
0
-1.8
93.749
-34.6
0.659
1
1.1
93.994
-36.4
4.858
0
1.1
93.994
-36.4
4.858
0
1.4
93.444
-36.1
4.963
0
パラメータ設定
散布図のオプションのラベル列としてy列を選択します。 フィーチャ列として、emp_var_rate、cons_price_rate、cons_conf_idx、およびeuribor3m列を選択します。
Output
散布図のさまざまなフィーチャのラベル列で指定されたオブジェクトの分布を表示できます。