Azure Blob Storage資料來源為您提供讀取檔案的能力,您可以使用本資料來源,擷取Azure Blob Storage中儲存的檔案,解析並同步至任意目標資料來源。本文為您介紹DataWorks的Azure Blob Storage資料同步的能力支援情況。
使用限制
支援的欄位類型
Azure Blob Stoage資料來源,提供了以下資料類型。
資料類型 | 說明 |
STRING | 文本類型。 |
LONG | 整型。 |
BYTES | 位元組數組,將讀取到的常值內容轉為UTF-8編碼的位元組數組。 |
BOOL | 布爾型。 |
DOUBLE | 浮點型。 |
DATE | 日期時間類型,支援以下日期時間格式:
|
建立資料來源
在進行資料同步任務開發之前,您需要在DataWorks上建立Azure Blob Storage資料來源,具體操作流程請參見建立並管理資料來源。詳細的配置參數解釋可在配置介面查看對應參數的文案提示。
資料同步任務開發
單表離線同步任務配置指導
操作流程請參見通過嚮導模式配置離線同步任務、通過指令碼模式配置離線同步任務。
指令碼模式配置的全量參數和指令碼Demo,請參見下文附錄:Azure Blob Storage指令碼Demo與參數說明。
附錄:Azure Blob Storage指令碼Demo與參數說明
離線任務指令碼配置方式
如果您配置離線任務時使用指令碼模式的方式進行配置,您需要在任務指令碼中按照指令碼的統一格式要求編寫指令碼中的Reader參數,指令碼模式的統一要求請參見通過指令碼模式配置離線同步任務,以下為您介紹指令碼模式下的資料來源的Reader參數的指導詳情。