如果您在创建工作空间时选择了参加数据开发(Data Studio)(新版)公测,则还需为该工作空间创建计算资源,绑定计算资源后,即可在工作空间开发和调度计算资源的相关任务。
前提条件
已创建工作空间,并且创建工作空间时选中了参加数据开发(Data Studio)(新版)公测,详情请参见创建工作空间。
您可以在工作空间列表页,找到目标工作空间,单击操作列的快速进入,区分是否参加了新版数据开发公测:
未参加新版数据开发公测
参加新建数据开发公测
单击操作列的快速进入,选择数据开发,进入数据开发页面。
未参加新版数据开发公测时,数据开发界面如下:
DataStudio(数据开发)的更多信息,请参见数据开发概述。
单击操作列的快速进入,选择数据开发(新版),进入数据开发页面。
参加新版数据开发公测时,数据开发界面如下:
新版数据开发Data Studio的更多信息,请参见Data Studio概述。
已具备相关的计算资源服务,DataWorks绑定计算资源仅是将您已有的计算资源关联至DataWorks,计算资源的存储、数据以及计费均归属于对应计算资源。
开通DataWorks服务时,已自动购买了按量付费的Serverless资源组(不使用不计费),并绑定至默认工作空间,如您在新工作空间完成本文操作,则请将资源组绑定至新工作空间,具体操作,请参见为工作空间绑定资源组。
绑定的计算资源,需确保与Serverless资源组的连通性,详情请参见网络连通方案。
相关概念
计算资源
计算资源是计算引擎用于执行数据处理和分析任务的资源实例,如MaxCompute项目(Quota组)、Hologres实例等。例如,在大数据处理场景下,使用阿里云MaxCompute时,你可以通过设置Quota组来管理你的计算任务所使用的计算资源量。
一个工作空间支持添加多种计算资源。为工作空间绑定MaxCompute、Hologres、AnalyticDB for PostgreSQL、AnalyticDB for MySQL 3.0、ClickHouse、E-MapReduce、CDH、OpenSearch、Serverless Spark、Serverless StarRocks和全托管 Flink后,即可在工作空间开发和调度计算资源的相关任务。
数据源
数据源用于连接不同的数据存储服务,它包含了连接到该数据库所需的所有信息(如用户名、密码、主机地址等)。在数据开发前,您需要先定义好数据源信息,以便在执行节点任务时,能够通过选择数据源名称来确定数据读取和写入的数据库。一个工作空间支持添加多种数据源实例。
数据目录
数据目录是一个结构化的列表或地图,用来展示一个组织内部所有的数据资产,包括但不限于数据库、表、文件等。对于DataWorks这样的平台而言,数据目录记录了关于这些数据资产的元数据信息。
计算资源、数据源、数据目录之间的关系
三者是独立的对象,但存在关联关系,具体关系如下:
绑定计算资源时,可关联创建出数据源和数据目录。
创建数据源时,可关联创建出数据目录。
创建数据目录时,无法关联创建出数据源或计算资源。
绑定计算资源
DataWorks支持多种方式为工作空间绑定计算资源,您可选择其一创建即可。
创建工作空间时绑定计算资源
完成创建工作空间相关参数配置后,单击创建工作空间,将自动进入绑定计算资源步骤,您可以按需选择您的计算资源,完成绑定操作。
DataWorks在选择参与新版数据开发公测后,进入绑定计算资源引导时,支持绑定多种计算资源,具体绑定说明如下:
分类 | 计算资源 | 绑定说明 | 绑定计算资源参数说明 |
离线计算 | MaxCompute | DataWorks无法直连到MaxCompute的Quota上,只能绑定到MaxCompute项目上。绑定MaxCompute计算资源后,会同步创建MaxCompute的数据源、绑定MaxCompute数据目录。 | |
Serverless Spark | 绑定Spark工作空间。Spark计算资源无需绑定数据目录。 | ||
实时查询 | Hologres | DataWorks无法直连到Hologres的计算组,需要绑定到Hologres的Database上。绑定Hologres计算资源后,会同步创建Hologres数据源、绑定Hologres数据目录。 | |
Serverless StarRocks | DataWorks无法直连到StarRocks的队列,需要绑定到StarRocks的实例(Instance)。绑定StarRocks计算资源,会同步创建StarRocks的数据源、绑定StarRocks的数据目录。 | ||
全托管 | 全托管Flink | 绑定Flink项目空间。Flink计算资源无需绑定数据目录。 | |
多模态搜索 | OpenSearch | 绑定OpenSearch实例。绑定OpenSearch计算资源后,会同步创建OpenSearch数据源。该计算资源无需绑定数据目录。 |
工作空间详情页绑定计算资源
如果您在创建工作空间时未立即绑定计算资源,您还可以在工作空间详情页为工作空间绑定计算资源。
登录DataWorks控制台,切换至目标地域后,单击左侧导航栏的工作空间,进入工作空间列表页面。
找到已创建的工作空间,单击操作列的详情,进入工作空间详情页。
在左侧导航栏选择计算资源,单击绑定计算资源,您可以按需选择您的计算资源,然后配置相关参数,参数详情请参见绑定计算资源参考,完成后续绑定操作。
配置完成后,单击确认按钮保存计算资源。
管理中心绑定计算资源
如果您在创建工作空间时未立即绑定计算资源,您还可以在管理中心为工作空间绑定计算资源。
登录DataWorks控制台,切换至目标地域后,单击左侧导航栏的 ,在下拉框中选择对应工作空间后单击进入管理中心。
在左侧导航栏单击计算资源。
在计算资源页面,单击绑定计算资源,选择需要绑定的计算资源类型,然后配置相关参数,参数详情可参见:绑定计算资源参考。
绑定计算资源参考
MaxCompute
Serverless Spark
Hologres
Serverless StarRocks
全托管Flink
OpenSearch
AnalyticDB for MySQL (V3.0)
AnalyticDB for PostgreSQL
AnalyticDB for Spark
CDH
ClikcHouse
EMR
后续步骤
除绑定计算资源参考中部分计算资源会同步绑定对应数据目录外,您也可以单独绑定DLF Catalog、MaxCompute、Hologres、StarRocks类型的数据目录,用于在新版数据开发中可视化查看和管理。绑定数据目录操作详情请参见:从管理中心、工作空间详情页绑定数据目录。
绑定数据目录成功后,您可前往数据开发中查看和管理数据目录中的详细表信息,具体操作,请参见数据目录管理。
绑定计算资源后,即可执行后续数据开发、数据分析、使用运维中心周期性调度运行相关任务等操作,详情请参见Data Studio概述、数据分析概述、运维中心入门。