Simple Storage Service(簡稱S3)是一種專為從任意位置儲存和檢索任意數量的資料而構建的Object Storage Service,DataWorksData Integration支援使用Amazon S3 Reader外掛程式從S3資料庫讀取資料,本文為您介紹DataWorks的Amazon S3資料讀取能力。
支援的Amazon S3版本
Amazon S3 Reader使用Amazon官網提供的Java SDK擷取S3資料。
使用限制
Amazon S3是非結構化資料存放區。對於Data Integration而言,目前Amazon S3 Reader支援的功能如下。
支援 | 不支援 |
|
|
建立資料來源
在進行資料同步任務開發時,您需要在DataWorks上建立一個對應的資料來源,操作流程請參見建立並管理資料來源,詳細的配置參數解釋可在配置介面查看對應參數的文案提示。
資料同步任務開發
資料同步任務的配置入口和通用配置流程可參見下文的配置指導。
單表離線同步任務配置指導
操作流程請參見通過嚮導模式配置離線同步任務、通過指令碼模式配置離線同步任務。
指令碼模式配置的全量參數和指令碼Demo請參見下文的附錄:指令碼Demo與參數說明。
附錄:指令碼Demo與參數說明
離線任務指令碼配置方式
如果您配置離線任務時使用指令碼模式的方式進行配置,您需要按照統一的指令碼格式要求,在任務指令碼中編寫相應的參數,詳情請參見通過指令碼模式配置離線同步任務,以下為您介紹指令碼模式下資料來源的參數配置詳情。