ヒストグラムは、質量分布プロファイルとしても知られている。 ヒストグラムは、データ分布を示すために、さまざまな高さの一連の縦縞または線分で構成される統計レポートチャートです。 横軸はデータ型を表し、縦軸はデータ分布を表す。
コンポーネントの設定
次のいずれかの方法を使用して、ヒストグラム (複数列) コンポーネントを設定できます。
方法1: パイプラインページでコンポーネントを設定する
Machine Learning Platform for AI (PAI) のMachine Learning Designerのパイプラインページで、ヒストグラム (複数列) コンポーネントのパラメーターを設定できます。 Machine Learning Designerは、以前はMachine Learning Studioとして知られていました。 下表に、各パラメーターを説明します。
タブ | パラメーター | 説明 |
フィールドの設定 | 列の選択 | 分析する列を選択します。 DOUBLE型とBIGINT型のみがサポートされています。 説明 最大1,024の列がサポートされます。 |
パラメーター設定 | 間隔 | ヒストグラムが分割される間隔の数。 |
チューニング | コア | コンピューティングで使用されるコアの数。 値は正の整数でなければなりません。 |
コアあたりのメモリサイズ | 各コアのメモリサイズ。 有効な値: 1 ~ 65536 単位:MB。 |
方法2: PAIコマンドを使用する
PAIコマンドを使用してコンポーネントパラメータを設定します。 SQLスクリプトコンポーネントを使用してPAIコマンドを呼び出すことができます。 詳細については、「SQLスクリプト」をご参照ください。
PAI -name histogram
-project algo_public
-DinputTableName=maple_histogram_1to20_input
-DoutputTableName=maple_histogram_1to20_output
-DselectedColNames=col0,col1 -DintervalNum=20;
パラメーター | 必須 | 説明 | デフォルト値 |
inputTableName | 可 | 入力テーブルの名前。 | デフォルト値なし |
inputTablePartitions | 不可 | トレーニング用に入力テーブルから選択されたパーティション。 次の形式がサポートされています。
説明 複数のパーティションを指定する場合は、コンマ (,) で区切ります。 | デフォルト値なし |
outputTableName | 可 | 出力テーブルの名前。 | デフォルト値なし |
selectedColNames | 可 | トレーニング用に入力テーブルから選択された列の名前。 複数の列の名前はコンマ (,) で区切ります。 INT型とDOUBLE型がサポートされています。 説明 最大1,024の列がサポートされます。 | デフォルト値なし |
intervalNum | 不可 | ヒストグラムが分割される間隔の数。 | 100 |
ライフサイクル | 不可 | テーブルのライフサイクル。 | デフォルト値なし |
coreNum | 不可 | コンピューティングで使用されるコアの数。 値は正の整数でなければなりません。 有効な値: [1,9999] 。 | システムによって決定される |
memSizePerCore | 不可 | 各コアのメモリサイズ。 有効な値: 1 ~ 65536 単位:MB。 | システムによって決定される |
例:
入力の説明
col0
col1
1
1.0
2
2.0
3
3.0
4
4.0
5
5.0
6
6.0
7
7.0
8
8.0
9
9.0
10
10.0
11
11.0
12
12.0
13
13.0
14
14.0
有効期限の 15
15.0
16
16.0
17
17.0
18
18.0
19
19.0
20
20.0
PAIコマンド
PAI -name histogram -project algo_public -DinputTableName=maple_histogram_1to20_input -DoutputTableName=maple_histogram_1to20_output -DselectedColNames=col0,col1 -DintervalNum=20;
アウトプットの説明
colname
ヒストグラム
col0
[1、1.95):1;[1.95、2.9):1;[2.9、3.85):1;[3.85、4.8):1;[4.8、5.75):1;[9.55、10.5):1;[5.75、6.7):1;[6.7、):1;[7.65、8.6):1;[8.6、9.55):1;[、):1;[10.5、11.45):1;[11.45、12.4):1;[12.4、13.35):1;[13.35、14.3):1;[14.3、15.25):1;[15.25、):1;[、16.2):1;[16.2、17.15):1;[17.15、18.1):1;[18.1、19.05):1;[19.05、20]:1
col1
[1、1.95):1;[1.95、2.9):1;[2.9、3.85):1;[3.85、4.8):1;[4.8、5.75):1;[9.55、10.5):1;[5.75、6.7):1;[6.7、):1;[7.65、8.6):1;[8.6、9.55):1;[、):1;[10.5、11.45):1;[11.45、12.4):1;[12.4、13.35):1;[13.35、14.3):1;[14.3、15.25):1;[15.25、):1;[、16.2):1;[16.2、17.15):1;[17.15、18.1):1;[18.1、19.05):1;[19.05、20]:1