在配置同步到Kafka的資料同步作業時,為提升同步的效能,您可以調整Kafka Partition(分區)同步策略,例如根據Hash結果將資料同步至不同的Partition。
Hash演算法
DTS採用Java預設的hashcode演算法來計算Hash值。
配置方法
您需要在配置資料同步作業的選擇同步對象環節中配置Kafka Partition同步策略。配置案例請參見從RDS同步至自建Kafka叢集,更多相關案例請參見DTS資料同步方案概覽。
警告 資料同步作業啟動後,請勿修改目標Topic的Partition數量,否則將導致資料同步失敗。
策略說明
策略名稱稱 | 說明 | 優缺點 |
全部投遞到Partition 0 | 將所有資料和DDL資訊都投遞到目標Topic的Partition 0。 |
|
按庫名+表名的hash值投遞到不同Partition | 將庫名與表名合并作為Partition Key來計算Hash值,然後將各個表的資料和DDL資訊投遞到目標Topic中的各個Partition。 說明
|
|
按主鍵的hash值投遞到不同Partition | 將表中的列(預設為主鍵,如果無主鍵則使用唯一鍵)作為Partition Key來計算Hash值,然後將不同的行投遞到目標Topic的各個Partition中。您也可以指定單個或多個列作為Partition Key來計算Hash值。 說明
|
|