RestAPI数据源为您提供读取和写入RestAPI双向通道的功能,本文为您介绍DataWorks的RestAPI数据同步的能力支持情况。
使用限制
目前该数据源仅支持独享数据集成资源组。
目前不支持设置超时参数,当前DataWorks内置的请求超时时间是60s, 如果您的API查询返回时间超过60s将导致任务失败。
支持的字段类型
类型分类 | 数据集成column配置类型 |
整数类 | LONG,INT |
字符串类 | STRING |
浮点类 | DOUBLE,FLOAT |
布尔类 | BOOLEAN |
日期时间类 | DATE |
创建数据源
在进行数据同步任务开发时,您需要在DataWorks上创建一个对应的数据源,操作流程请参见创建并管理数据源,详细的配置参数解释可在配置界面查看对应参数的文案提示。
数据同步任务开发
数据同步任务的配置入口和通用配置流程可参见下文的配置指导。
单表离线同步任务配置指导
操作流程请参见通过向导模式配置离线同步任务、通过脚本模式配置离线同步任务。
脚本模式配置的全量参数和脚本Demo请参见下文的附录:脚本Demo与参数说明。
常见问题
只能指定好请求数据的翻页次数吗?
答:是的
是否支持自动翻页,例如当请求参数后面没数据时便停止翻页。
答:不支持, 否则无法进行split切分。
如果需要指定翻页次数,但指定翻页次数比实际页数多,导致后面数据为空,系统会如何处理?
答:当后面页数数据为空时,相当于SQL查到空数据,系统将会继续查询下一条数据。
只支持解析一层JSON据吗?
答:是的,不会进行深入解析。
DataWorks数据集成RestAPI非数组类型如何配置?
答:确保在
reader
的parameter
中,将dataPath
设置为指向非数组类型数据的路径,例如:dataPath:"data.list"
。这将帮助插件正确地定位到您要读取的数据字段。接下来,将dataMode
设置为multiData
。这意味着DataWorks将把数据作为多个单独的记录来处理,即使它们在源数据中并非数组形式。说明请注意,在
multiData
模式下,column
配置不再适用。您应直接在dataPath
中指定要读取的数据路径。以下是DataWorks数据集成RestAPI非数组类型的配置示例:
reader: { name: "restapi", parameter: { dataPath: "data.list", dataMode: "multiData", // 其他参数 } }
附录:脚本Demo与参数说明
离线任务脚本配置方式
如果您配置离线任务时使用脚本模式的方式进行配置,您需要按照统一的脚本格式要求,在任务脚本中编写相应的参数,详情请参见通过脚本模式配置离线同步任务,以下为您介绍脚本模式下数据源的参数配置详情。