JOIN演算法通常用於資料預先處理階段,通過在一個或多個欄位上匹配記錄,將來自不同資料來源的相關資訊整合為一個資料表。這種操作類似於SQL中的JOIN語句,旨在確保合并後的資料在完整性和一致性方面準確無誤,為後續的訓練和分析提供可靠的資料基礎。
配置組件
在Designer工作流程頁面添加JOIN組件,並在介面右側配置相關參數:
參數 | 描述 |
連線類型 | 支援左串連、內串連、右串連和全串連。 |
MapJoin最佳化 | 將小表載入到記憶體中,提高運行速度。取值:
|
關聯條件 | 僅支援等式,可手動添加或刪除關聯條件。 |
選擇左表輸出欄位列 | 選擇左表輸出欄位列。 |
選擇右表輸出欄位列 | 選擇右表輸出欄位列。 |