全部产品
Search
文档中心

大数据开发治理平台 DataWorks:开发前准备:绑定数据源或集群

更新时间:Nov 13, 2024

若您要在DataWorks中进行数据建模、数据开发或使用运维中心周期性调度任务,需先将已创建的数据源或集群绑定至数据开发(DataStudio)模块。绑定后,才可读取数据源或集群中的数据,并进行相关开发操作。

前提条件

您需根据后续要开发和调度的任务类型,提前创建好对应的数据源或集群。

数据源或集群

说明

创建MaxCompute数据源

首次创建MaxCompute数据源后,DataWorks会自动将数据源绑定至数据开发(DataStudio),您无需按本文手动绑定。但后续创建的MaxCompute数据源需要手动绑定至数据开发(DataStudio)。

创建Hologres数据源

创建这些数据源后,需要参照本文指导手动绑定。

创建AnalyticDB for PostgreSQL数据源

创建AnalyticDB for MySQL3.0数据源

创建ClickHouse数据源

注册E-MapReduce集群至DataWorks

注册集群后,DataWorks会将集群绑定至数据开发(DataStudio),您无需按本文手动绑定。

注册CDH或CDP集群至DataWorks

使用限制

  • 部分场景可能导致数据源或集群无法绑定至DataStudio(数据开发):

    • 部分数据源或集群是否可在DataStudio绑定,与数据源或集群的配置有关。例如,不支持在DataStudio绑定AccessKey及AccessSecret模式创建的数据源。更多绑定限制,请参见产品绑定界面提示说明。

    • 数据源缺失开发环境或生产环境。

    说明

    不同数据源或集群无法绑定至DataStudio(数据开发)的原因存在差异,平台会自动展示不支持绑定的原因,您可基于具体原因进行排查处理。

  • 当前仅支持绑定MaxCompute、E-MapReduce、Hologres、AnalyticDB for MySQL、ClickHouse、CDH/CDP、AnalyticDB for PostgreSQL至DataStudio(数据开发)。

  • 不同DataWorks版本,支持绑定的数据源或集群类型及数量限制存在差异。详情请参见DataWorks各版本支持的功能详情

绑定数据源或集群

  1. 进入数据开发页面。

    登录DataWorks控制台,切换至目标地域后,单击左侧导航栏的数据开发与治理 > 数据开发,在下拉框中选择对应工作空间后单击进入数据开发

  2. 在左侧导航栏单击数据源,进入数据源或集群绑定页面。

    若左侧导航栏未显示数据源模块,则您需进入个人设置页面,设置该模块显示至左侧导航栏中。操作详情请参见模块管理

  3. 绑定数据源或集群。

    数据源页面,您可通过名称搜索找到目标数据源或集群进行绑定操作。绑定后,便可基于数据源的连接信息读取该数据源的数据,进行相关开发操作。

    说明

    当数据源信息发生变更时,若当前界面数据更新不及时,请刷新当前页面更新缓存数据。

    image.png

    • 部分场景可能导致数据源或集群无法绑定至DataStudio(数据开发):

      • 部分数据源或集群是否可在DataStudio绑定,与数据源或集群的配置有关。例如,不支持在DataStudio绑定AccessKey及AccessSecret模式创建的数据源。更多绑定限制,请参见产品绑定界面提示说明。

      • 数据源缺失开发环境或生产环境。

      说明

      不同数据源或集群无法绑定至DataStudio(数据开发)的原因存在差异,平台会自动展示不支持绑定的原因,您可基于具体原因进行排查处理。

    • 当前仅支持绑定MaxCompute、E-MapReduce、Hologres、AnalyticDB for MySQL、ClickHouse、CDH/CDP、AnalyticDB for PostgreSQL至DataStudio(数据开发)。

    • 不同DataWorks版本,支持绑定的数据源或集群类型及数量限制存在差异。详情请参见DataWorks各版本支持的功能详情

后续操作

数据源绑定后,您可基于需要执行如下操作:

  • 计算任务开发与调度:进行数据开发及任务的周期性调度运行。详情请参见数据开发概述运维中心概述

  • 数据建模:执行相关依赖于数据源的建模任务,例如,模型开发、模型发布等。详情请参见概述

  • 管理数据源:

    • 设置默认数据源:若同类型数据源存在多个,则可设置某个数据源为默认数据源,设置后,后续开发任务默认首选使用该数据源。

      说明

      当同类型数据源仅存在一个,则该数据源即为默认数据源。

    • 解绑数据源:若某数据源无需用于数据建模、数据开发或任务调度,则可对其进行解绑。解绑后,相关关联任务可能无法使用。

    • 编辑数据源:您可进入数据源管理页面,修改数据源信息。