全部產品
Search
文件中心

DataWorks:配置DataHub輸入

更新時間:Nov 21, 2024

DataHubStream Reader外掛程式通過DataHub SDK即時讀取DataHub資料的功能。

背景資訊

外掛程式啟動後一直運行,等待源端DataHub有資料後進行讀取。DataHubStream Reader外掛程式有以下兩個功能:

  • 即時讀取。

  • 根據DataHub Shard個數並發讀取。

操作步驟

  1. 進入資料開發頁面。

    登入DataWorks控制台,切換至目標地區後,單擊左側導覽列的資料開發與治理 > 資料開發,在下拉框中選擇對應工作空間後單擊進入資料開發

  2. 滑鼠移至上方至建立表徵圖,單擊建立節點 > Data Integration > 即時同步

    您也可以展開商務程序,按右鍵目標商務程序,選擇建立節點 > Data Integration > 即時同步

  3. 建立節點對話方塊中,選擇同步方式單表(Topic)到單表(Topic)ETL,輸入名稱,並選擇路徑

    重要

    節點名稱必須是大小寫字母、中文、數字、底線(_)以及英文句號(.),且不能超過128個字元。

  4. 單擊確認

  5. 在即時同步節點的編輯頁面,按一下滑鼠輸入 > DataHub並拖拽至編輯面板。

  6. 單擊DataHub節點,在節點配置對話方塊中,配置各項參數。

    image

    參數

    描述

    資料來源

    選擇已經配置好的DataHub資料來源,此處僅支援DataHub資料來源。

    如果未配置資料來源,請單擊右側的建立資料來源,跳轉至工作空間管理 > 資料來源管理頁面進行建立。詳情請參見配置DataHub資料來源

    Topic

    選擇當前資料來源下需要同步的Topic。您可以單擊右側的資料預覽進行確認。

    使用訂閱模式

    如開啟訂閱模式,會自動建立訂閱ID,並使用該ID從DataHub訂閱資料,這可以提高穩定性和效能,請不要在DataHub上刪除正在使用的訂閱ID,否則會造成任務失敗。

    輸出欄位

    選擇需要同步的欄位。

  7. 單擊工具列中的儲存表徵圖。