DataWorks数据集成支持HttpFile数据源,可以通过HTTP协议下载文件并同步文件至目标数据源。
使用限制
HttpFile数据源支持使用Serverless资源组(推荐)和独享数据集成资源组。
支持的字段类型
数据类型 | 说明 |
STRING | 文本类型。 |
LONG | 整数。 |
BYTES | 字节数组,将读取到的文本内容转为UTF-8编码的字节数组。 |
BOOL | 布尔型。 |
DOUBLE | 小数。 |
DATE | 日期时间类型,支持以下日期时间格式:
|
创建数据源
在进行数据同步任务开发时,您需要在DataWorks上创建一个对应的数据源,操作流程请参见创建并管理数据源,详细的配置参数解释可在配置界面查看对应参数的文案提示。
数据同步任务开发:HttpFile同步流程引导
数据同步任务的配置入口和通用配置流程可参见下文的配置指导。
单表离线同步任务配置指导
操作流程请参见通过向导模式配置离线同步任务、通过脚本模式配置离线同步任务。
脚本模式配置的全量参数和脚本Demo请参见下文的附录:HttpFile脚本Demo与参数说明。
附录:HttpFile脚本Demo与参数说明
离线任务脚本配置方式
如果您配置离线任务时使用脚本模式的方式进行配置,您需要按照统一的脚本格式要求,在任务脚本中编写相应的参数,详情请参见通过脚本模式配置离线同步任务,以下为您介绍脚本模式下数据源的参数配置详情。
Reader脚本Demo
Reader脚本参数
相关文档
数据源配置,详情请参见支持的数据源及同步方案。
数据源的权限管理,详情请参见RAM角色授权模式。