全部产品
Search
文档中心

大数据开发治理平台 DataWorks:基于三方客户端的DataWorks Agent

更新时间:Feb 13, 2026

DataWorks Agent基于MCP协议(模型上下文协议),可对接DataWorks MCP Server及其他大数据MCP Server(如Hologres MCP Server),旨在通过自然语言交互在DataWorks中实现数据开发、任务运维和数据集成等能力。

重要

该功能基于三方客户端实现,若您希望体验更便捷的Agent智能体服务,可参见DataWorks Agent

功能介绍

DataWorks Agent支持通过自然语言交互方式,在智能对话窗口实现大数据开发。它的主要原理如下:DataWorks Agent通过大语言模型(LLM)解析需求,并智能调用MCP Server能力完成任务执行。

例如,您可通过DataWorks Agent对话窗口输入“我有几个工作空间”,Agent会通过LLM解析并调用内置DataWorks OpenAPIDataWorks MCP Server提供的ListProjects工具查询,并返回结果。当任务较复杂时,LLM将与MCP Server进行多次交互。

DataWorks Agent不仅集成DataWorks MCP Server,还支持接入其他MCP Server。您也可按需选择自己的LLM(比如通义千问、DeepSeek、OpenAI等)。

image

您也可输入如下提问,体验更多DataWorks Agent支持的任务场景。

适用范围

示例提问

数据开发

【查询任务】查询本工作空间项目目录下所有调度类型为暂停的MaxCompute SQL数据开发节点。

【重命名任务】帮我把上述节点的名字修改为:无效节点_待删除,多个节点可以用序号来区分。

【创建任务】帮我在本工作空间项目目录下创建5个MaxCompute SQL节点,名称以MC_Demo开头,中间下划线连接,末尾以01开始的数字自增结束。

任务运维

【重跑失败任务】查看本工作空间,20250330日运行失败的任务,并重跑这些实例。注意bizdate是毫秒级别的时间戳。

【查询失败实例】查看本工作空间项目下,20250331日状态为失败的实例,bizdate的格式为毫秒级的时间戳。

【分析任务重跑属性】分析这些任务的重跑属性,是否可重跑,如可重跑,则重跑任务。

数据集成

【同步MySQL单表至MaxCompute】请在当前工作空间中创建一个离线数据集成任务:

  • 源数据源mc_test_mysql(表名:users);

  • 目标数据源mc_test_maxcompute(目标表名:users,与源表同名);

  • 资源组mc_test_res

  • 字段映射方式:自动同名映射(即源表与目标表中字段名相同的列将被一一对应)。

数据分析

【销量分析】帮我分析order表这个月前10销量商品的销量走向。

使用限制

仅支持在已启用新版数据开发的工作空间中,于个人开发环境中使用。

重要

个人开发环境重启后,需要重新安装MCP Server功能,请谨慎操作。

计费说明

使用 DataWorks Agent 将产生以下费用:

  • DataWorks OpenAPI 调用费用

    当 Agent 通过 MCP Server 调用 DataWorks OpenAPI 时,将按照OpenAPI计费标准收取相应费用。

  • LLM Token 费用

    Agent 在解析用户意图、生成自然语言回复等过程中,需调用您配置的大模型(如通义千问等)。该过程将消耗模型输入与输出的 Token 数量,并依据所选模型服务商的计费规则进行计费。如使用百炼中的qwen-coder-plus模型时,费用将依据百炼计费说明计算。

快速体验DataWorks Agent

当您完成DataWorks Agent配置后,单击 Cline 页面右上角的image图标,进入 DataWorks Agent 对话界面快速体验:查询当前工作空间的成员。

您只需输入提问:查询当前工作空间的成员。

Agent拆解步骤并运行:

  1. 需求解析与确认:Agent 解析用户意图(如“查询当前工作空间成员”),自动识别需调用的 ListProjectMembers 接口,并弹窗提示用户确认目标工作空间(ProjectId)等必要参数。

  2. 接口调用与响应:经用户授权后,Agent 调用 ListProjectMembers OpenAPI,获取并结构化返回该工作空间的成员列表(含角色、账号类型等信息)。更多关于ListProjectMembersOpenAPI的说明,可以参见:ListProjectMembers - 查询工作空间成员列表

    说明
    • 运行过程中,系统将提示您确认相关操作并获取必要信息。您可以单击 Approve 同意执行,或单击 Reject 拒绝该操作。

    • 关键步骤的拆解逻辑可能因任务复杂度、LLM 选型及模型版本差异而略有不同,实际执行流程以当前会话中 Agent 的解析与交互为准。

配置DataWorks Agent

DataWorks Agent 通过 MCP 客户端插件(例如 Cline)构建前端对话界面,并通过 MCP Server 配置接入 DataWorks MCP Server阿里云MCP Server

说明

您可按需接入更多开源MCP Server,以增强 DataWorks Agent 的能力。

准备工作

步骤一:进入个人开发环境

您可通过以下步骤,启用并进入个人开发环境。

  1. 进入DataWorks工作空间列表页,在顶部切换至目标地域,找到已创建的工作空间,单击操作列的快速进入 > Data Studio,进入Data Studio。

  2. 单击顶部导航栏个人开发环境旁边的image图标,检查您创建的个人开发环境实例的状态并进入个人开发环境。

    • 实例状态为运行中:单击个人开发环境中正在运行的个人开发环境实例,进入个人开发环境。

    • 实例状态为其它状态:单击弹窗中的管理环境,在个人开发环境实例页面找到您创建的实例,单击操作栏中的启动按钮,等待实例状态变为运行中,再单击该实例进入个人开发环境。

    说明

    个人开发环境区域出现类似image图标时,表示您已成功进入个人开发环境。

步骤二:安装 Cline

进入个人开发环境后,您可以按照以下步骤配置 DataWorks Agent。本文将以 Cline 为例进行说明。

重要

在创建个人开发环境实例时,如果您选择的镜像是 dataworks-mcp:py3.11-ubuntu22.04,则无需升级程序引擎安装Cline扩展程序

升级程序引擎

如果您使用的是之前的个人开发环境,或者已经在个人开发环境中安装过 Cline 扩展程序,您需要按照以下方法来升级现有的底层引擎,以便使用扩展程序功能。已进行升级操作可跳过该步骤。

一键升级:进入个人开发环境后,如果遇到提示底层引擎升级适配的弹窗,请单击一键升级按钮来完成底层引擎的适配升级。

命令升级:单击页面底部工具栏左侧的image图标,进入终端命令栏,在命令栏中输入以下升级命令,单击回车进行升级。

wget https://nodejs.org/dist/v20.19.0/node-v20.19.0-linux-x64.tar.xz
tar xf node-v20.19.0-linux-x64.tar.xz
mv /etc/dsw/node /etc/dsw/node14
mv node-v20.19.0-linux-x64 /etc/dsw/node

bash <(curl -s https://dataworks-notebook-${REGION}.oss-${REGION}.aliyuncs.com/public-datasets/aone-release/dwcode-server/scripts/update.sh)  0.2.169
说明

上述命令中的 ${REGION} 无需您手动替换,系统将自动识别并填充当前地域信息;您也可在终端中执行 echo ${REGION} 命令,确认实际解析的地域值。

升级完成后,请在弹窗中单击重新加载窗口以应用最新的更改。

安装Cline扩展程序

您可根据以下步骤,在个人开发环境安装扩展程序Cline,作为您的Agent对话窗口。

  1. 单击个人开发环境页面左侧导航栏的image图标,进入程序扩展页。

  2. 在程序扩展页的搜索框中输入Cline

  3. 找到下方出现的扩展程序 Cline。

  4. 单击 Cline 程序右下方的安装,等待程序安装完成。

  5. 安装完成后,在 Data Studio 页面,单击顶部导航栏右上角的image,进入 Copilot Chat,单击image切换至 Cline。

  6. 进一步您可以通过右键单击image图标,根据个人喜好进行配置键绑定、将插件程序移动到 > 主侧边栏移动到 > 面板等。

image

步骤三:配置 LLM 的 API Key

安装完 Cline 扩展程序后,请按照以下步骤配置 API Key 信息。这里将以使用 OpenAI Compatible 模式连接百炼 API 为例进行配置说明。

说明
  • 其它模式连接模型,请根据界面实际参数进行相关配置。

  • 目前仅支持Use your own API key配置方式,不支持Get Started for Free配置方式。

  1. 在 Data Studio 个人开发环境页面,单击顶部导航栏右上角的image,进入 Copilot Chat,单击image切换至 Cline。

  2. 单击 Cline 页面中的Use your own API key,根据下表参数说明进行相关配置。

    参数

    说明

    API Provider

    指定您要使用的 API 服务提供商,选择OpenAI Compatible。这表示您将使用与 OpenAI API 兼容的接口来连接百炼 API。

    Base URL

    API 服务的基础 URL,用于指定 API 请求的根地址。

    例如百炼 API 提供的与 OpenAI 兼容的 API 端点地址:https://dashscope-intl.aliyuncs.com/compatible-mode/v1

    API Key

    用于身份验证的密钥,可从阿里云百炼控制台获取该 API Key。

    Model ID

    指定您要使用的具体模型。不同模型在功能定位和性能表现上各有侧重。

    选择qwen-coder-plusqwen-plus

    • qwen-coder-plus:适用于代码生成和编程任务。

    • qwen-plus:适用于通用文本生成和处理任务。

  3. 单击下方的 Let's go! 按钮,完成 API Key 的配置。

步骤四:配置 MCP Server

完成 API Key 配置后,您可按以下步骤接入并配置 DataWorks MCP Server。更多关于 DataWorks MCP Server的说明,可见附录:DataWorks MCP Server

  1. 在 Cline 页面右上角单击image图标,进入 MCP Serves Marketplace 页签。

  2. 切换至 Installed 页签,查看已安装的 MCP Server;

  3. 单击 Configure MCP Servers 打开cline_mcp_settings.json配置文件。DataWorks 默认预置 alibabacloud-dataworks-mcp-server 的基础配置,具体配置信息如下:

    {
      "mcpServers": {
        "alibabacloud-dataworks-mcp-server": {
          "command": "npx",
          "args": [
            "alibabacloud-dataworks-mcp-server"
          ],
          "env": {
            "REGION": "cn-shanghai",
            "ALIBABA_CLOUD_CREDENTIALS_URI": "http://localhost:7002/api/v1/credentials/0",
            "TOOL_CATEGORIES": "SERVER_IDE_DEFAULT"
          },
          "disabled": false,
          "autoApprove": [],
          "timeout": 60
        }
      }
    }

    参数

    说明

    command

    npx,表示dataworks-mcp-server提供的指令方式。

    args

    alibabacloud-dataworks-mcp-server,表示dataworks-mcp-server的指令参数。

    env

    REGION

    示例中为cn-shanghai,表示当前 DataWorks 工作空间所在的地域。

    ALIBABA_CLOUD_CREDENTIALS_URI

    指定阿里云凭证的URI。

    重要

    该参数仅在DataWorks个人开发环境生效,用于获取阿里云用户身份认证。

    TOOL_CATEGORIES

    配置Tool分类的白名单。请在此处填写OpenAPI的分类,多个分类之间用半角逗号分隔。

    例如:"TOOL_CATEGORIES":"数据源,空间管理,资源组管理,数据地图,数据集成,数据开发(新版),运维中心,数据服务,开放平台,数据质量,标签管理,安全中心,SERVER_IDE_DEFAULT"

    说明
    • SERVER_IDE_DEFAULT为个人开发环境上的默认Tools,上述其他业务分类可在大数据开发治理平台 DataWorks - OpenAPI 概览页的左侧目录树中查看。

    • 为提升模型加载性能和用户体验,默认配置中将 TOOL_CATEGORIES 设为 SERVER_IDE_DEFAULT;如需启用全部 OpenAPI 工具,可删除该配置项。

    TOOL_NAMES

    配置Tool名字的白名单。请在此处填写OpenAPI的名字,多个名字之间用半角逗号分隔。

    例如:"TOOL_NAMES":"ListProjects,CreateNode,UpdateNode"

  4. 配置信息保存后,当页面成功加载并显示可用的 Tools 列表时,即表示 alibabacloud-dataworks-mcp-server 已安装并配置成功,您可立即开始使用 DataWorks MCP Server 功能。

    说明

    如果未能加载出以下信息,请确认是否已升级程序引擎

    image

  5. 您可以通过直接编辑上述 cline_mcp_settings.json 配置文件,或在 Marketplace 中安装其他 MCP Server,灵活扩展 DataWorks Agent 的能力。例如,若需在 DataWorks Agent 中使用 Hologres 相关功能,可接入 Hologres MCP Server

常见问题

  • Q:在 MCP Server 上执行预设提问时,API 请求长时间无响应,可能是什么原因?如何解决?

    A:若 API 请求长时间处于运行状态而未返回结果,可能是由于当前使用的程序引擎版本较低,与系统存在兼容性问题。建议您升级程序引擎

  • Q:当模型响应速度较慢时,有哪些优化建议?

    A:为提升响应性能,可采取以下措施:

    • 减少同时启用的 MCP Server 数量,降低系统资源开销;

    • 在 MCP Server 的配置文件中,通过 env 参数显式指定 TOOL_CATEGORIES 或 TOOL_NAMES,仅加载必要的工具集,从而减少引入的Tools数量。

附录:DataWorks MCP Server

MCP(Model Context Protocol)是一种为大型语言模型(LLM)提供标准化上下文的协议。它定义了一种标准方式,使得大模型能够连接不同的数据源和工具,从而更有效地理解和处理信息。MCP客户端通过MCP协议,可调用各种 MCP Server 的能力。

DataWorks MCP Server 作为一种 MCP Server,封装DataWorks OpenAPI,拥有 DataWorks 大数据处理能力。您可在第三方产品、程序、Agent 接入DataWorks MCP Server,实现对 DataWorks 能力的快速调用。

重要

当您不在 DataWorks 个人开发环境使用时,需要在参数env中配置ALIBABA_CLOUD_ACCESS_KEY_IDALIBABA_CLOUD_ACCESS_KEY_SECRET(请在此处获取),同时删除配置ALIBABA_CLOUD_CREDENTIALS_URI

image