迭代(Map)状态允许用户对一个数组中的每个元素执行相同的操作,从而简化大规模数据的处理和工作流的管理。
迭代状态的处理模式
为了提高数据处理的效率,适应不同的应用场景,迭代状态提供了以下两种处理模式:
内联模式
迭代(Map)状态的每次迭代都在包含迭代(Map)状态的工作流的上下文中运行。默认情况下,迭代(Map)状态是内联模式。更多信息,请参见内联模式。
分布式模式
迭代(Map)状态将每次迭代作为子工作流执行,最高支持10000个Map迭代。更多信息,请参见分布式模式。
内联模式和分布式模式的区别
对比项 | 内联模式 | 分布式模式 |
数据来源 | 从工作流上一步状态获取数据。 |
|
迭代过程 | 迭代(Map)状态的每次迭代都在包含迭代(Map)状态的工作流的上下文中运行。 | 迭代(Map)状态将每次迭代作为子工作流执行,最高支持10000个Map迭代。 |
迭代的最大并发数 | 默认最大并发数是40。 | 默认最大并发数是100,可通过工单提交配额提升申请。 |
迭代的最大次数 | 默认最大迭代次数没有限制,但迭代Output的总大小受到Event IO Size 的限制。 | 默认最大迭代次数 10000,可通过工单提升至最大1000000。 |
有效载荷 | 强制限制64 KB的输入有效负载大小。 | 通过ItemReader读取外部输入时不受64 KB的输入有效负载大小限制。 |