Azure Blob Storage数据源为您提供读取文件的能力,您可以使用本数据源,获取Azure Blob Storage中存储的文件,解析并同步至任意目标数据源。本文为您介绍DataWorks的Azure Blob Storage数据同步的能力支持情况。
使用限制
支持的字段类型
Azure Blob Stoage数据源,提供了以下数据类型。
数据类型 | 说明 |
STRING | 文本类型。 |
LONG | 整型。 |
BYTES | 字节数组,将读取到的文本内容转为UTF-8编码的字节数组。 |
BOOL | 布尔型。 |
DOUBLE | 浮点型。 |
DATE | 日期时间类型,支持以下日期时间格式:
|
创建数据源
在进行数据同步任务开发时,您需要在DataWorks上创建一个对应的数据源,操作流程请参见创建并管理数据源,详细的配置参数解释可在配置界面查看对应参数的文案提示。
数据同步任务开发
数据同步任务的配置入口和通用配置流程可参见下文的配置指导。
单表离线同步任务配置指导
操作流程请参见通过向导模式配置离线同步任务、通过脚本模式配置离线同步任务。
脚本模式配置的全量参数和脚本Demo,请参见下文附录:脚本Demo与参数说明。
附录:脚本Demo与参数说明
离线任务脚本配置方式
如果您配置离线任务时使用脚本模式的方式进行配置,您需要按照统一的脚本格式要求,在任务脚本中编写相应的参数,详情请参见通过脚本模式配置离线同步任务,以下为您介绍脚本模式下数据源的参数配置详情。