JOINアルゴリズムは通常、データ前処理段階で使用され、1つまたは複数のフィールド上のレコードを照合することによって、異なるデータソースからの関連情報を単一のデータテーブルに統合します。 この操作はSQLのJOINステートメントに似ており、マージされたデータが整合性と一貫性の点で正確であることを保証し、その後のトレーニングと分析のための信頼できるデータ基盤を提供することを目的としています。
コンポーネントの設定
JOINコンポーネントは、Machine Learning Designerのパイプラインページで設定できます。 下表に、各パラメーターを説明します。
パラメーター | 説明 |
結合タイプ | 結合タイプ。 有効な値: Left Join、Inner Join、Right Join、Full Join。 |
MapJoin最適化 | JOIN操作の実行を高速化するために、小さなテーブルのデータをメモリにロードするかどうかを指定します。 有効な値:
|
結合条件 | 式の形式である結合条件。 手動で結合条件を追加または削除できます。 |
左側のテーブルから出力列を選択 | 左のテーブルからの出力列。 |
右側のテーブルから出力列を選択 | 右側のテーブルからの出力列。 |