すべてのプロダクト
Search
ドキュメントセンター

Platform For AI:列のマージMerge Columns

最終更新日:Jul 22, 2024

列のマージコンポーネントは、2つのテーブルを列ごとにマージします。 このコンポーネントを使用する場合、2つのテーブルの行数は同じでなければなりません。 2つのテーブルの一方にパーティションがある場合、パーティションテーブルは2番目の入力ポートに接続する必要があります。

コンポーネントの設定

次のいずれかの方法を使用して、列のマージコンポーネントを設定できます。

方法1: パイプラインページでコンポーネントを設定する

左側のテーブルからマージする列を選択すると、生成された結果は右側のテーブルの指定された列に保存されます。Component configurations

方法2: PAIコマンドを使用する

PAIコマンドを使用してコンポーネントパラメータを設定します。 SQLスクリプトコンポーネントを使用してPAIコマンドを呼び出すことができます。 詳細については、「SQLスクリプト」をご参照ください。

PAI -name appendColumns
    -project algo_public
    -DinputTableNames=maple_test_appendcol_basic_input1,maple_test_appendcol_basic_input2
    -DoutputTableName=maple_test_appendcol_setOutCol_output
    -DoutputTableColNames=x0,x1,x2,x3,x4,x5,x6,x7,x8,x9;

パラメーター

必須

説明

デフォルト値

inputTableNames

Yes

2つの入力テーブルの名前。 2つのテーブル名はコンマ (,) で区切ります。

デフォルト値なし

outputTableName

Yes

出力テーブルの名前。

デフォルト値なし

selectedColNamesList

No

入力テーブルから選択された列。

  • テーブル内の列はコンマ (,) で区切ります。

  • 異なるテーブルの列をセミコロン (;) で区切ります。

説明

2つのテーブルのすべての列を選択する場合、パラメーター値は二重引用符 (") で囲む必要があります。 それ以外の場合、セミコロン (;) はターミネータとして処理されます。 テーブル内のすべての列が選択されている場合、すべての列名を省略できますが、セミコロン (;) は保持する必要があります。

デフォルト値なし

inputPartitionsInfoList

No

入力テーブルから選択されたパーティション。

  • 表のパーティションをスラッシュ (/) で区切ります。

  • 異なるテーブルのパーティションをセミコロン (;) で区切ります。

説明

すべてのパーティションを選択する場合、パラメーター値は二重引用符 (") で囲む必要があります。 それ以外の場合、セミコロン (;) はターミネータとして処理されます。 テーブルがパーティション分割されていない場合は、すべてのパーティション名を省略できますが、セミコロン (;) を保持する必要があります。

デフォルト値なし

autoRenameCol

No

出力テーブルの列の名前を自動的に変更するかどうかを指定します。

false

outputTableColNames

No

出力テーブルの列の新しい名前。 このパラメーターを指定しない場合、元のテーブルの列名が使用されます。

重要

autoRenameColパラメーターがtrueに設定されている場合、このパラメーターは無視できます。

デフォルト値なし

ライフサイクル

No

出力テーブルのライフサイクル。 値は正の整数でなければなりません。

デフォルト値なし

coreNum

No

コアの数。 値は正の整数でなければなりません。 このパラメーターはmemSizePerCoreパラメーターと一緒に使用する必要があります。 有効な値: [1,9999]

システムによって決定される

memSizePerCore

No

各コアのメモリサイズ。 値は正の整数でなければなりません。 有効値: [1024,64x1024] 単位:MB。

システムによって決定される

例:

この例では、次のテーブルがマージされます。

  • ソース表1

    表 1. maple_test_appendcol_basic_input1

    col0:bigint

    col1: ダブル

    col2: 文字列

    col3:Datetime

    col4: ブール

    10

    0.0

    aaaa

    2015-10-01 00:00:00

    TRUE

    11

    1.0

    aaaa

    2015-10-01 00:00:00

    FALSE

    12

    2.0

    aaaa

    2015-10-01 00:00:00

    TRUE

    13

    3.0

    aaaa

    2015-10-01 00:00:00

    TRUE

    14

    4.0

    aaaa

    2015-10-01 00:00:00

    TRUE

  • ソース表2

    表2. maple_test_appendcol_basic_input2

    col10:bigint

    col11: ダブル

    col12: 文字列

    col13:Datetime

    col14: ブール

    110

    10.0

    2aaaa

    2015-10-01 00:00:00

    TRUE

    111

    11.0

    2aaaa

    2015-10-01 00:00:00

    FALSE

    112

    12.0

    2aaaa

    2015-10-01 00:00:00

    TRUE

    113

    13.0

    2aaaa

    2015-10-01 00:00:00

    TRUE

    114

    14.0

    2aaaa

    2015-10-01 00:00:00

    FALSE

次のPAIコマンドを実行して、上記の2つのソーステーブルの列をマージします。

PAI -name appendColumns
    -project algo_public
    -DinputTableNames=maple_test_appendcol_basic_input1,maple_test_appendcol_basic_input2
    -DoutputTableName=maple_test_appendcol_setOutCol_output
    -DoutputTableColNames=x0,x1,x2,x3,x4,x5,x6,x7,x8,x9;

以下の出力テーブルが生成される。

表3. maple_test_appendcol_setOutCol_出力

x0

x1

x2

x3

x4

x5

x6

x7

x8

x9

10

0

aaaa

2015-10-01 00:00:00

true

110

10

2aaaa

2015-10-01 00:00:00

true

11

1

aaaa

2015-10-01 00:00:00

false

111

11

2aaaa

2015-10-01 00:00:00

false

12

2

aaaa

2015-10-01 00:00:00

true

112

12

2aaaa

2015-10-01 00:00:00

true

13

3

aaaa

2015-10-01 00:00:00

true

113

13

2aaaa

2015-10-01 00:00:00

true

14

4

aaaa

2015-10-01 00:00:00

true

114

14

2aaaa

2015-10-01 00:00:00

false