全部產品
Search
文件中心

DataWorks:配置並管理即時同步任務

更新時間:Jun 19, 2024

完成資料來源、網路、資源的準備配置後,您可建立即時同步節點,同步資料至Hologres。本文為您介紹如何建立資料即時同步任務,並在建立完成後查看任務運行情況。

前提條件

  1. 已完成資料來源配置。您需要在Data Integration同步任務配置前,配置好您需要同步的源端和目標端資料庫,以便在同步任務配置過程中,可通過選擇資料來源名稱來控制同步任務的讀取和寫入資料庫。即時同步支援的資料來源及其配置詳情請參見即時同步支援的資料來源

    說明

    資料來源相關能力介紹詳情請參見:資料來源概述

  2. 已購買合適規格的獨享Data Integration資源群組。詳情請參見:新增和使用獨享Data Integration資源群組

  3. 獨享Data Integration資源群組與資料來源網路已打通。詳情請參見:配置資源群組與網路連通

使用限制

  • 即時資料同步任務僅支援使用獨享Data Integration資源群組。

  • 即時資料同步任務暫不支援同步沒有主鍵的表。

建立即時同步任務

  1. 建立整庫即時同步節點
  2. 配置資源群組
  3. 設定同步來源和規則。
    1. 資料來源地區,選擇要同步的資料來源類型資料來源名稱等資訊。

    2. 選擇要同步的表。

      選擇同步的源表地區,為您展示所選資料來源下所有的表,您可以在源端庫表地區選中需要同步的整庫全表或部分表,並單擊表徵圖表徵圖,將其移動至已選庫表

      重要

      如果選中的表沒有主鍵,將無法進行即時同步。

    3. 設定表(庫)名的映射規則地區,單擊添加規則,選擇相應的規則進行添加。
      同步時預設將源端資料表寫入目的端同名schema或同名表中,同時,您可以通過添加映射規則定義最終寫入目的端的schema或表名稱,實現將多張表資料寫入到同一個目標表中,或統一將源端某固定首碼的表名在寫入目標表時更新為其他首碼。支援通過Regex轉換寫入的schema名或表名,還支援使用內建變數拼接目標表名。配置邏輯請參見:設定來源和同步規則
  4. 設定目標表。
    1. 設定寫入Hologres策略
      寫入Hologres策略目前僅支援重放,重放表示鏡像功能,即源端INSERT一條記錄,Hologres中也INSERT一條記錄;源端執行UPDATE或DELETE操作,Hologres中也進行UPDATE或DELETE。
    2. 重新整理源表和Hologres表映射。
      單擊重新整理源表和Hologres表映射,將根據您在步驟3配置的目標檔案映射規則來產生目標表,若步驟3未配置映射規則,將預設寫入與源表同名的目標表,若目標端不存在該同名表,將預設建立。同時,您可以修改表建立方式、為目標表在源有表欄位基礎上增加附加欄位。
      功能描述
      為非主鍵表選擇主鍵由於當前方案不支援無主鍵表同步,所以您需要單擊同步主鍵列的編輯按鈕,為無主鍵表設定自選主鍵,即選擇表中一個或部分欄位作為主鍵。
      選擇表建立方式支援自動建表使用已有表
      • 表建立方式選擇使用已有表時,您可以在Hologres表名列對應的下拉式清單中選擇需要使用的表名稱。
      • 表建立方式選擇自動建表時,Hologres表名列顯示自動建立的Hologres表名稱。您可以單擊表名稱,查看和修改建表語句。
      為目標欄位添加附加欄位單擊操作列的編輯附加欄位,可以為目標表在源端欄位的基礎上增加欄位並為欄位賦值。支援手動賦值常量與變數。
      說明 僅在表建立方式自動建表時,可以使用此功能。
      Data Integration附加欄位支援的變數欄位如下:
      EXECUTE_TIME:執行時間
      UPDATE_TIME:更新時間
      DB_NAME_SRC:未經處理資料庫名稱
      DB_NAME_SRC_TRANSED:轉換後資料庫名稱
      DATASOURCE_NAME_SRC:源端資料來源名稱
      DATASOURCE_NAME_DEST:目的端資料來源名稱
      DB_NAME_DEST:目的端資料庫名稱
      TABLE_NAME_DEST:目的端表名稱
      TABLE_NAME_SRC:源端表名稱
    3. 單擊下一步
      如果您前一步中目標資料來源使用的表建立方式自動建表,則需要在彈出的自動建表對話方塊,單擊開始建表,大量建立目標Hologres表。
  5. 設定表粒度同步規則。
    即當源表發生插入、更新、刪除時,您可以在此處定義對應的處理策略。
    • 正常處理:源端DML訊息將會繼續下發給目標資料來源,由目標資料來源來處理。
    • 忽略:直接丟棄該訊息,不再向目標資料來源發送對應的DML訊息,對應資料不會改變。
    • 有條件的正常處理:選擇後,您可以配置過濾條件,同步任務將按照您配置的過濾運算式對源端資料進行過濾,滿足過濾條件的資料會被正常處理,不滿足的會被忽略掉。
  6. DDL訊息處理規則設定。

    來來源資料源會包含許多DDL操作,Data Integration體提供預設處理策略,您也可以根據業務需求,對不同的DDL訊息設定同步至目標端的處理策略。不同DDL訊息處理策略請參見:DDL訊息處理規則

  7. 運行資源設定。
    1. 運行資源設定頁面,配置各項參數。
      參數描述
      來源端讀取支援最大串連數讀取端的最大串連數,即來源端資料庫的JDBC串連數。請根據資料庫資源的實際情況合理配置。預設為15
      目標端寫入並發數資料同步任務內,可以從來源表並行讀取或寫入資料至目標端的最大線程數。最大並發數為32。請根據您的資源群組大小和目標端實際規模合理設定。
    2. 單擊完成配置

提交並發布即時同步任務

  1. 單擊工具列中的儲存表徵圖,儲存節點。
  2. 單擊工具列中的提交表徵圖,提交節點任務。
  3. 提交新版本對話方塊中,輸入變更描述
  4. 單擊確定
    如果您使用的是標準模式的工作空間,任務提交成功後,需要將任務發布至生產環境進行發布。請單擊頂部功能表列左側的任務發布。具體操作請參見發布任務

後續步驟

任務配置完成後,您可以在營運中心 > 即時任務營運 > 即時同步任務面板啟動並管理該任務,詳情請參見:即時同步任務營運