本文為您介紹Designer提供的散佈圖。
散佈圖是指在迴歸分析中,資料點在直角座標系平面上的分布圖。
組件配置
您可以使用以下任意一種方式,配置散佈圖組件參數。
方式一:可視化方式
在Designer工作流程頁面配置組件參數。
參數 | 描述 |
選擇特徵列 | 選擇用來表現訓練樣本資料特徵的列。 |
分類標籤列 | 標籤欄位。 |
抽樣樣本數 | 抽樣的樣本數量。 |
方式二:PAI命令方式
使用PAI命令方式,配置該組件參數。您可以使用SQL指令碼組件進行PAI命令調用,詳情請參見SQL指令碼。
PAI -name scatter_diagram -project algo_public
-DselectedCols=emp_var_rate,cons_price_rate,cons_conf_idx,euribor3m
-DlabelCol=y
-DmapTable=pai_temp_2447_22859_2
-DinputTable=scatter_diagram
-DoutputTable=pai_temp_2447_22859_1;
參數名稱 | 是否必選 | 描述 | 預設值 |
inputTable | 是 | 輸入表的名稱。 | 無 |
inputTablePartitions | 否 | 輸入表中,參與訓練的分區。系統支援以下格式:
說明 指定多個分區時,分區之間使用英文逗號(,)分隔。 | 無 |
outputTable | 是 | 輸出表名稱。 | 無 |
mapTable | 是 | 輸出資訊表,存放每個特徵的最小值、最大值和枚舉取值等。 | 無 |
selectedCols | 是 | 選擇列名類型,用於繪製兩兩特徵之間的散佈圖,最多勾選5個特徵。 | 無 |
labelCol | 是 | 把Int或者String欄位當做枚舉標籤列。 | 空 |
lifecycle | 是 | 輸出表生命週期。單位:天。 | 28 |
樣本
輸入資料
create table scatter_diagram as select emp_var_rate,cons_price_rate, cons_conf_idx,euribor3m,y from pai_bank_data limit 10
emp_var_rate
cons_price_rate
cons_conf_idx
euribor3m
y
1.4
93.918
-42.7
4.962
0
-0.1
93.2
-42.0
4.021
0
-1.7
94.055
-39.8
0.729
1
-1.8
93.075
-47.1
1.405
0
-2.9
92.201
31.4
0.869
1
1.4
93.918
-42.7
4.961
0
-1.8
92.893
-46.2
1.327
0
-1.8
92.893
92.893
1.313
0
-2.9
92.963
-40.8
1.266
1
-1.8
93.075
-47.1
1.41
0
1.1
93.994
-36.4
4.864
0
1.4
93.444
-36.1
4.964
0
1.4
93.444
-36.1
4.965
1
-1.8
92.893
-46.2
1.291
0
1.4
94.465
-41.8
4.96
0
1.4
93.918
-42.7
4.962
0
-1.8
93.075
-47.1
1.365
1
-0.1
93.798
-40.4
4.86
1
1.1
93.994
-36.4
4.86
0
1.4
93.918
-42.7
4.96
0
-1.8
93.075
-47.1
1.405
0
1.4
94.465
-41.8
4.967
0
1.4
93.918
-42.7
4.963
0
1.4
93.918
-42.7
4.968
0
1.4
93.918
-42.7
4.962
0
-1.8
92.893
-46.2
1.344
0
-3.4
92.431
-26.9
0.754
0
-1.8
93.075
-47.1
1.365
0
-1.8
92.893
-46.2
1.313
0
1.4
93.918
-42.7
4.961
0
1.4
94.465
-41.8
4.961
0
-1.8
92.893
-46.2
1.327
0
-1.8
92.893
-46.2
1.299
0
-2.9
92.963
-40.8
1.268
1
1.4
93.918
-42.7
4.963
0
-1.8
92.893
-46.2
1.334
0
1.4
93.918
-42.7
4.96
0
-1.8
93.075
-47.1
1.405
0
1.4
94.465
-41.8
4.96
0
1.4
93.444
-36.1
4.962
0
1.1
93.994
-36.4
4.86
0
1.1
93.994
-36.4
4.857
0
1.4
93.918
-42.7
4.961
0
-3.4
92.649
-30.1
0.715
1
1.4
93.444
-36.1
4.966
0
-0.1
93.2
-42.0
4.076
0
1.4
93.444
-36.1
4.965
0
-1.8
92.893
-46.2
1.354
0
1.4
93.444
-36.1
4.967
0
1.4
94.465
-41.8
4.959
0
-1.8
92.893
-46.2
1.354
0
1.4
94.465
-41.8
4.958
0
-1.8
92.893
-46.2
1.354
0
1.4
94.465
-41.8
4.864
0
1.1
93.994
-36.4
4.859
0
1.1
93.994
-36.4
4.857
0
-1.8
92.893
-46.2
1.27
0
1.1
93.994
-36.4
4.857
0
1.1
93.994
-36.4
4.859
0
1.4
94.465
-41.8
4.959
0
1.1
93.994
-36.4
4.856
0
-1.8
93.075
-47.1
1.405
0
-1.8
92.843
-50.0
1.811
1
-0.1
93.2
-42.0
4.021
0
-2.9
92.469
-33.6
1.029
0
1.4
93.918
-42.7
4.962
0
-1.8
93.075
-47.1
1.365
0
1.1
93.994
-36.4
4.857
0
-1.8
92.893
-46.2
1.259
0
1.1
93.994
-36.4
4.857
0
1.4
94.465
-41.8
4.866
0
-2.9
92.201
-31.4
0.883
0
-0.1
93.2
-42.0
4.076
0
1.1
93.994
-36.4
4.857
0
1.4
93.918
-42.7
4.96
0
1.4
93.444
-36.1
4.962
0
1.1
93.994
-36.4
4.858
0
1.1
93.994
-36.4
4.857
0
1.1
93.994
-36.4
4.856
0
1.4
93.918
-42.7
4.968
0
1.4
93.444
-36.1
4.966
0
1.4
94.465
-41.8
4.962
0
1.4
93.444
-36.1
4.963
0
-1.8
92.843
-50.0
1.56
1
1.4
93.918
-42.7
4.96
0
1.4
93.444
-36.1
4.963
0
-3.4
92.431
-26.9
0.74
0
1.1
93.994
-36.4
4.856
0
1.4
93.918
-42.7
4.962
0
1.1
93.994
-36.4
4.856
0
-0.1
93.2
-42.0
4.245
1
1.1
93.994
-36.4
4.857
0
-1.8
93.075
-47.1
1.405
0
-1.8
92.893
-46.2
1.327
0
-0.1
93.2
-42.0
4.12
0
1.4
94.465
-41.8
4.958
0
-1.8
93.749
-34.6
0.659
1
1.1
93.994
-36.4
4.858
0
1.1
93.994
-36.4
4.858
0
1.4
93.444
-36.1
4.963
0
參數配置
選擇y為散佈圖可選的標籤列,選擇select emp_var_rate,cons_price_rate,cons_conf_idx,euribor3m為特徵列。
運行結果
直觀的展示了特徵與特徵之間分類標籤的分布情況。