列のマージコンポーネントは、2つのテーブルを列ごとにマージします。 このコンポーネントを使用する場合、2つのテーブルの行数は同じでなければなりません。 2つのテーブルの一方にパーティションがある場合、パーティションテーブルは2番目の入力ポートに接続する必要があります。
コンポーネントの設定
次のいずれかの方法を使用して、列のマージコンポーネントを設定できます。
方法1: パイプラインページでコンポーネントを設定する
左側のテーブルからマージする列を選択すると、生成された結果は右側のテーブルの指定された列に保存されます。
方法2: PAIコマンドを使用する
PAIコマンドを使用してコンポーネントパラメータを設定します。 SQLスクリプトコンポーネントを使用してPAIコマンドを呼び出すことができます。 詳細については、「SQLスクリプト」をご参照ください。
PAI -name appendColumns
-project algo_public
-DinputTableNames=maple_test_appendcol_basic_input1,maple_test_appendcol_basic_input2
-DoutputTableName=maple_test_appendcol_setOutCol_output
-DoutputTableColNames=x0,x1,x2,x3,x4,x5,x6,x7,x8,x9;
パラメーター | 必須 | 説明 | デフォルト値 |
inputTableNames | Yes | 2つの入力テーブルの名前。 2つのテーブル名はコンマ (,) で区切ります。 | デフォルト値なし |
outputTableName | Yes | 出力テーブルの名前。 | デフォルト値なし |
selectedColNamesList | No | 入力テーブルから選択された列。
説明 2つのテーブルのすべての列を選択する場合、パラメーター値は二重引用符 (") で囲む必要があります。 それ以外の場合、セミコロン (;) はターミネータとして処理されます。 テーブル内のすべての列が選択されている場合、すべての列名を省略できますが、セミコロン (;) は保持する必要があります。 | デフォルト値なし |
inputPartitionsInfoList | No | 入力テーブルから選択されたパーティション。
説明 すべてのパーティションを選択する場合、パラメーター値は二重引用符 (") で囲む必要があります。 それ以外の場合、セミコロン (;) はターミネータとして処理されます。 テーブルがパーティション分割されていない場合は、すべてのパーティション名を省略できますが、セミコロン (;) を保持する必要があります。 | デフォルト値なし |
autoRenameCol | No | 出力テーブルの列の名前を自動的に変更するかどうかを指定します。 | false |
outputTableColNames | No | 出力テーブルの列の新しい名前。 このパラメーターを指定しない場合、元のテーブルの列名が使用されます。 重要 autoRenameColパラメーターがtrueに設定されている場合、このパラメーターは無視できます。 | デフォルト値なし |
ライフサイクル | No | 出力テーブルのライフサイクル。 値は正の整数でなければなりません。 | デフォルト値なし |
coreNum | No | コアの数。 値は正の整数でなければなりません。 このパラメーターはmemSizePerCoreパラメーターと一緒に使用する必要があります。 有効な値: [1,9999] 。 | システムによって決定される |
memSizePerCore | No | 各コアのメモリサイズ。 値は正の整数でなければなりません。 有効値: [1024,64x1024] 単位:MB。 | システムによって決定される |
例:
この例では、次のテーブルがマージされます。
ソース表1
表 1. maple_test_appendcol_basic_input1
col0:bigint
col1: ダブル
col2: 文字列
col3:Datetime
col4: ブール
10
0.0
aaaa
2015-10-01 00:00:00
TRUE
11
1.0
aaaa
2015-10-01 00:00:00
FALSE
12
2.0
aaaa
2015-10-01 00:00:00
TRUE
13
3.0
aaaa
2015-10-01 00:00:00
TRUE
14
4.0
aaaa
2015-10-01 00:00:00
TRUE
ソース表2
表2. maple_test_appendcol_basic_input2
col10:bigint
col11: ダブル
col12: 文字列
col13:Datetime
col14: ブール
110
10.0
2aaaa
2015-10-01 00:00:00
TRUE
111
11.0
2aaaa
2015-10-01 00:00:00
FALSE
112
12.0
2aaaa
2015-10-01 00:00:00
TRUE
113
13.0
2aaaa
2015-10-01 00:00:00
TRUE
114
14.0
2aaaa
2015-10-01 00:00:00
FALSE
次のPAIコマンドを実行して、上記の2つのソーステーブルの列をマージします。
PAI -name appendColumns
-project algo_public
-DinputTableNames=maple_test_appendcol_basic_input1,maple_test_appendcol_basic_input2
-DoutputTableName=maple_test_appendcol_setOutCol_output
-DoutputTableColNames=x0,x1,x2,x3,x4,x5,x6,x7,x8,x9;
以下の出力テーブルが生成される。
表3. maple_test_appendcol_setOutCol_出力
x0 | x1 | x2 | x3 | x4 | x5 | x6 | x7 | x8 | x9 |
10 | 0 | aaaa | 2015-10-01 00:00:00 | true | 110 | 10 | 2aaaa | 2015-10-01 00:00:00 | true |
11 | 1 | aaaa | 2015-10-01 00:00:00 | false | 111 | 11 | 2aaaa | 2015-10-01 00:00:00 | false |
12 | 2 | aaaa | 2015-10-01 00:00:00 | true | 112 | 12 | 2aaaa | 2015-10-01 00:00:00 | true |
13 | 3 | aaaa | 2015-10-01 00:00:00 | true | 113 | 13 | 2aaaa | 2015-10-01 00:00:00 | true |
14 | 4 | aaaa | 2015-10-01 00:00:00 | true | 114 | 14 | 2aaaa | 2015-10-01 00:00:00 | false |