全部产品
Search
文档中心

大数据开发治理平台 DataWorks:HTTP触发器节点

更新时间:Nov 19, 2024

如果您有其他调度系统,希望在调度系统的任务完成后触发DataWorks上的任务运行,您可以使用DataWorks的HTTP触发器节点功能。本文为您介绍外部调度系统触发场景下,使用DataWorks的HTTP触发器节点的流程和注意事项。

前提条件

  • 已开通DataWorks企业版及以上版本。

  • 已创建好业务流程和需要通过HTTP触发器节点触发的计算任务节点。以使用MaxCompute的SQL进行任务计算为例,您可参见开发ODPS SQL任务,创建完成MaxCompute的SQL计算节点。

背景信息

外部调度系统触发任务运行有以下两种典型场景:

  • HTTP触发器节点无其他上游任务节点

    无上游任务节点此种场景下,您需要创建HTTP触发节点后,在其他调度系统配置好调度触发,并在DataWorks上配置好各节点的调度和上下游依赖关系,详情可参见创建HTTP触发器节点其他调度系统的触发配置

  • HTTP触发器节点有上游任务节点

    上游有任务节点此种场景下:

    • 您需要创建HTTP触发节点后,在其他调度系统配置好调度触发,并在DataWorks上配置好各节点的调度和上下游依赖关系,详情可参见创建HTTP触发器节点其他调度系统的触发配置

    • HTTP触发器节点默认上游节点为业务流程的根节点,当上游有其他任务节点时,您需要手动修改为对应的上游任务节点。

    • 当上游任务节点运行完成,且外部调度系统发出调度指令后,HTTP触发节点才会触发下游任务节点运行。

      如果外部调度系统提前发出调度指令,但是上游任务节点没有运行完成,HTTP触发节点不会触发下游任务节点。系统会保留外部调度系统的调度指令,待上游任务运行完成后,再通过HTTP触发节点触发下游任务节点运行。

      重要

      外部调度系统的触发指令仅保留24小时。如果24小时内上游任务节点没有运行完成,则触发指令会丢失,外部调度系统本次发出的调度指令失效。

使用限制

  • HTTP触发器节点功能仅适用DataWorks企业版及以上版本,关于DataWorks版本介绍,详情请参见DataWorks各版本详解

  • 由于HTTP触发器节点仅支持T+1次生成实例,且补数据操作生成的实例不可被触发,因此HTTP触发器节点需要在任务发布生产环境后第二天才可被外部调度系统触发。

  • HTTP触发器节点仅作为触发节点,不可以直接写计算运行任务,您需要将待运行的任务节点作为HTTP触发器节点的下游节点。

  • 业务流程创建完成并正常运行后,若您想重跑触发器节点,则需重新运行该节点并同时在外部调度系统中下发触发指令。重新运行HTTP触发器节点不会触发已处于运行成功状态的下游节点运行。

  • 业务流程创建完成正常运行后,如果您想获取触发器节点的下游任务节点的历史时间段的运行结果,您可参见执行补数据并查看补数据实例(新版)进行补数据操作。补数据操作时无需外部调度系统下发调度指令,HTTP触发器节点会直接触发下游节点运行,即HTTP触发器节点无法通过补数据的方式,实现外部系统触发DataWorks HTTP触发器的补数据任务执行。

  • 支持的地域:华东1(杭州)、华东2(上海)、华北2(北京)、华南1(深圳)、西南1(成都)、中国香港、日本(东京)、新加坡、马来西亚(吉隆坡)、德国(法兰克福)、美国(硅谷)。

触发说明

触发HTTP触发器节点需要满足以下条件:

  • HTTP触发器节点已经生成周期实例(在运维中心周期实例面板可以搜到该实例)。该实例在未被RunTriggerNode API成功触发前,将处于等待触发状态,其下游节点将被阻塞直至成功调用RunTriggerNode API触发HTTP触发器节点执行。

  • HTTP触发器节点所依赖的所有父节点都已经执行成功(实例为成功状态)。

  • HTTP触发器节点生成的周期实例定时时间已到。

  • HTTP触发器节点使用的调度资源组,在触发时间点资源充足。

  • HTTP触发器节点处于非冻结状态。

  • 仅等待触发状态下的HTTP触发器节点才可被触发(已触发成功过的再次触发将不会执行)。

创建HTTP触发器节点

  1. 进入数据开发页面。

    登录DataWorks控制台,切换至目标地域后,单击左侧导航栏的数据开发与治理 > 数据开发,在下拉框中选择对应工作空间后单击进入数据开发

  2. 数据开发页面,鼠标悬停至新建图标,单击新建节点 > 通用 > HTTP触发器

    您也可以打开相应的业务流程,右键单击通用,选择新建节点 > HTTP触发器

  3. 新建节点对话框中,输入选择路径,并输入名称

  4. 单击确认

  5. 单击节点编辑区域右侧的调度配置,配置节点的调度属性,详情请参见配置基础属性

    说明

    HTTP触发器节点默认上游节点为业务流程的根节点,当上游有其他任务节点时,您需要手动修改为对应的上游任务节点。

  6. 保存并提交节点。
    重要 您需要设置节点的重跑属性依赖的上游节点,才可以提交节点。
    1. 单击工具栏中的保存图标,保存节点。
    2. 单击工具栏中的提交图标。
    3. 提交新版本对话框中,输入变更描述
    4. 单击确认
    如果您使用的是标准模式的工作空间,提交成功后,请单击右上方的发布。具体操作请参见发布任务
  7. 任务运维,详情请参见周期任务基本运维操作

其他调度系统的触发配置

在外部调度系统中进行触发配置时,您可以通过以下三种方式:Java方式、Python方式或API调用方式。

  • Java方式

    1. 安装Java SDK,详情可参见开始使用

      其中,DataWorks的SDK请用下面的pom配置。

      <dependency>
        <groupId>com.aliyun</groupId>
        <artifactId>aliyun-java-sdk-dataworks-public</artifactId>
        <version>3.4.2</version>
      </dependency>
    2. 代码示例

      您可进入RunTriggerNode的调试页面,在SDK示例页签查看完整的Java示例。image.png

  • Python方式

    1. 安装Python SDK,详情可参见集成SDK

      其中,DataWorks的SDK请使用下面的命令安装。

      pip install aliyun-python-sdk-dataworks-public==2.1.2
    2. 代码示例

      您可进入RunTriggerNode的调试页面,在SDK示例页签查看完整的Python示例。image.png

  • API调用方式

    API调用方式可参见RunTriggerNode