DataWorks Agent基于MCP协议(模型上下文协议),可对接DataWorks MCP Server及其他大数据MCP Server(如Hologres MCP Server),旨在通过自然语言交互在DataWorks中实现数据开发、任务运维和数据集成等能力。
该功能基于三方客户端实现,若您希望体验更便捷的Agent智能体服务,可参见DataWorks Agent。
功能介绍
DataWorks Agent支持通过自然语言交互方式,在智能对话窗口实现大数据开发。它的主要原理如下:DataWorks Agent通过大语言模型(LLM)解析需求,并智能调用MCP Server能力完成任务执行。
例如,您可通过DataWorks Agent对话窗口输入“我有几个工作空间”,Agent会通过LLM解析并调用内置DataWorks OpenAPI的DataWorks MCP Server提供的ListProjects工具查询,并返回结果。当任务较复杂时,LLM将与MCP Server进行多次交互。
DataWorks Agent不仅集成DataWorks MCP Server,还支持接入其他MCP Server。您也可按需选择自己的LLM(比如通义千问、DeepSeek、OpenAI等)。
您也可输入如下提问,体验更多DataWorks Agent支持的任务场景。
适用范围 | 示例提问 |
数据开发 | 【查询任务】查询本工作空间项目目录下所有调度类型为暂停的 |
【重命名任务】帮我把上述节点的名字修改为:无效节点_待删除,多个节点可以用序号来区分。 | |
【创建任务】帮我在本工作空间项目目录下创建5个 | |
任务运维 | 【重跑失败任务】查看本工作空间, |
【查询失败实例】查看本工作空间项目下, | |
【分析任务重跑属性】分析这些任务的重跑属性,是否可重跑,如可重跑,则重跑任务。 | |
数据集成 | 【同步MySQL单表至MaxCompute】请在当前工作空间中创建一个离线数据集成任务:
|
【销量分析】帮我分析order表这个月前10销量商品的销量走向。 |
使用限制
仅支持在已启用新版数据开发的工作空间中,于个人开发环境中使用。
个人开发环境重启后,需要重新安装MCP Server功能,请谨慎操作。
计费说明
使用 DataWorks Agent 将产生以下费用:
DataWorks OpenAPI 调用费用
当 Agent 通过 MCP Server 调用 DataWorks OpenAPI 时,将按照OpenAPI计费标准收取相应费用。
LLM Token 费用
Agent 在解析用户意图、生成自然语言回复等过程中,需调用您配置的大模型(如通义千问等)。该过程将消耗模型输入与输出的 Token 数量,并依据所选模型服务商的计费规则进行计费。如使用百炼中的
qwen-coder-plus模型时,费用将依据百炼计费说明计算。
快速体验DataWorks Agent
当您完成DataWorks Agent配置后,单击 Cline 页面右上角的
图标,进入 DataWorks Agent 对话界面快速体验:查询当前工作空间的成员。
您只需输入提问:查询当前工作空间的成员。
Agent拆解步骤并运行:
需求解析与确认:Agent 解析用户意图(如“查询当前工作空间成员”),自动识别需调用的
ListProjectMembers接口,并弹窗提示用户确认目标工作空间(ProjectId)等必要参数。接口调用与响应:经用户授权后,Agent 调用
ListProjectMembersOpenAPI,获取并结构化返回该工作空间的成员列表(含角色、账号类型等信息)。更多关于ListProjectMembersOpenAPI的说明,可以参见:ListProjectMembers - 查询工作空间成员列表。说明运行过程中,系统将提示您确认相关操作并获取必要信息。您可以单击 Approve 同意执行,或单击 Reject 拒绝该操作。
关键步骤的拆解逻辑可能因任务复杂度、LLM 选型及模型版本差异而略有不同,实际执行流程以当前会话中 Agent 的解析与交互为准。
配置DataWorks Agent
DataWorks Agent 通过 MCP 客户端插件(例如 Cline)构建前端对话界面,并通过 MCP Server 配置接入 DataWorks MCP Server等阿里云MCP Server。
您可按需接入更多开源MCP Server,以增强 DataWorks Agent 的能力。
准备工作
已创建工作空间,并选择使用新版数据开发(Data Studio)。
(可选,RAM账号需要)进行任务开发的RAM账号已被添加至对应工作空间中,并具有开发或空间管理员(权限较大,谨慎添加)角色权限,添加成员的操作详情请参见为工作空间添加空间成员。
如果您使用的是主账号,则可忽略该添加操作。
- 说明
如您的个人开发环境需要绑定VPC,您需配置个人开发环境访问公网。
步骤一:进入个人开发环境
您可通过以下步骤,启用并进入个人开发环境。
进入DataWorks工作空间列表页,在顶部切换至目标地域,找到已创建的工作空间,单击操作列的,进入Data Studio。
单击顶部导航栏个人开发环境旁边的
图标,检查您创建的个人开发环境实例的状态并进入个人开发环境。实例状态为运行中:单击个人开发环境中正在运行的个人开发环境实例,进入个人开发环境。
实例状态为其它状态:单击弹窗中的管理环境,在个人开发环境实例页面找到您创建的实例,单击操作栏中的启动按钮,等待实例状态变为运行中,再单击该实例进入个人开发环境。
说明当个人开发环境区域出现类似
图标时,表示您已成功进入个人开发环境。
步骤二:安装 Cline
进入个人开发环境后,您可以按照以下步骤配置 DataWorks Agent。本文将以 Cline 为例进行说明。
在创建个人开发环境实例时,如果您选择的镜像是 dataworks-mcp:py3.11-ubuntu22.04,则无需升级程序引擎和安装Cline扩展程序。
升级程序引擎
安装Cline扩展程序
步骤三:配置 LLM 的 API Key
安装完 Cline 扩展程序后,请按照以下步骤配置 API Key 信息。这里将以使用 OpenAI Compatible 模式连接百炼 API 为例进行配置说明。
其它模式连接模型,请根据界面实际参数进行相关配置。
目前仅支持Use your own API key配置方式,不支持Get Started for Free配置方式。
在 Data Studio 个人开发环境页面,单击顶部导航栏右上角的
,进入 Copilot Chat,单击
切换至 Cline。单击 Cline 页面中的Use your own API key,根据下表参数说明进行相关配置。
参数
说明
API Provider
指定您要使用的 API 服务提供商,选择
OpenAI Compatible。这表示您将使用与 OpenAI API 兼容的接口来连接百炼 API。Base URL
API 服务的基础 URL,用于指定 API 请求的根地址。
例如百炼 API 提供的与 OpenAI 兼容的 API 端点地址:
https://dashscope-intl.aliyuncs.com/compatible-mode/v1。API Key
用于身份验证的密钥,可从阿里云百炼控制台获取该 API Key。
Model ID
指定您要使用的具体模型。不同模型在功能定位和性能表现上各有侧重。
选择
qwen-coder-plus或qwen-plus:qwen-coder-plus:适用于代码生成和编程任务。qwen-plus:适用于通用文本生成和处理任务。
单击下方的 Let's go! 按钮,完成 API Key 的配置。
步骤四:配置 MCP Server
完成 API Key 配置后,您可按以下步骤接入并配置 DataWorks MCP Server。更多关于 DataWorks MCP Server的说明,可见附录:DataWorks MCP Server。
在 Cline 页面右上角单击
图标,进入 MCP Serves 的 Marketplace 页签。切换至 Installed 页签,查看已安装的 MCP Server;
单击 Configure MCP Servers 打开
cline_mcp_settings.json配置文件。DataWorks 默认预置alibabacloud-dataworks-mcp-server的基础配置,具体配置信息如下:{ "mcpServers": { "alibabacloud-dataworks-mcp-server": { "command": "npx", "args": [ "alibabacloud-dataworks-mcp-server" ], "env": { "REGION": "cn-shanghai", "ALIBABA_CLOUD_CREDENTIALS_URI": "http://localhost:7002/api/v1/credentials/0", "TOOL_CATEGORIES": "SERVER_IDE_DEFAULT" }, "disabled": false, "autoApprove": [], "timeout": 60 } } }参数
说明
command
npx,表示dataworks-mcp-server提供的指令方式。
args
alibabacloud-dataworks-mcp-server,表示dataworks-mcp-server的指令参数。
env
REGION
示例中为cn-shanghai,表示当前 DataWorks 工作空间所在的地域。
ALIBABA_CLOUD_CREDENTIALS_URI
指定阿里云凭证的URI。
重要该参数仅在DataWorks个人开发环境生效,用于获取阿里云用户身份认证。
TOOL_CATEGORIES
配置
Tool分类的白名单。请在此处填写OpenAPI的分类,多个分类之间用半角逗号分隔。例如:
"TOOL_CATEGORIES":"数据源,空间管理,资源组管理,数据地图,数据集成,数据开发(新版),运维中心,数据服务,开放平台,数据质量,标签管理,安全中心,SERVER_IDE_DEFAULT"。说明SERVER_IDE_DEFAULT为个人开发环境上的默认Tools,上述其他业务分类可在大数据开发治理平台 DataWorks - OpenAPI 概览页的左侧目录树中查看。为提升模型加载性能和用户体验,默认配置中将
TOOL_CATEGORIES设为SERVER_IDE_DEFAULT;如需启用全部 OpenAPI 工具,可删除该配置项。
TOOL_NAMES
配置
Tool名字的白名单。请在此处填写OpenAPI的名字,多个名字之间用半角逗号分隔。例如:
"TOOL_NAMES":"ListProjects,CreateNode,UpdateNode"。说明TOOL_NAMES可在大数据开发治理平台 DataWorks - OpenAPI 概览中查看。配置信息保存后,当页面成功加载并显示可用的 Tools 列表时,即表示
alibabacloud-dataworks-mcp-server已安装并配置成功,您可立即开始使用 DataWorks MCP Server 功能。说明如果未能加载出以下信息,请确认是否已升级程序引擎。

您可以通过直接编辑上述
cline_mcp_settings.json配置文件,或在 Marketplace 中安装其他 MCP Server,灵活扩展 DataWorks Agent 的能力。例如,若需在 DataWorks Agent 中使用 Hologres 相关功能,可接入 Hologres MCP Server。
常见问题
Q:在 MCP Server 上执行预设提问时,API 请求长时间无响应,可能是什么原因?如何解决?
A:若 API 请求长时间处于运行状态而未返回结果,可能是由于当前使用的程序引擎版本较低,与系统存在兼容性问题。建议您升级程序引擎。
Q:当模型响应速度较慢时,有哪些优化建议?
A:为提升响应性能,可采取以下措施:
减少同时启用的 MCP Server 数量,降低系统资源开销;
在 MCP Server 的配置文件中,通过
env参数显式指定TOOL_CATEGORIES或TOOL_NAMES,仅加载必要的工具集,从而减少引入的Tools数量。
附录:DataWorks MCP Server
MCP(Model Context Protocol)是一种为大型语言模型(LLM)提供标准化上下文的协议。它定义了一种标准方式,使得大模型能够连接不同的数据源和工具,从而更有效地理解和处理信息。MCP客户端通过MCP协议,可调用各种 MCP Server 的能力。
DataWorks MCP Server 作为一种 MCP Server,封装DataWorks OpenAPI,拥有 DataWorks 大数据处理能力。您可在第三方产品、程序、Agent 接入DataWorks MCP Server,实现对 DataWorks 能力的快速调用。
当您不在 DataWorks 个人开发环境使用时,需要在参数env中配置ALIBABA_CLOUD_ACCESS_KEY_ID和ALIBABA_CLOUD_ACCESS_KEY_SECRET(请在此处获取),同时删除配置ALIBABA_CLOUD_CREDENTIALS_URI。
图标,根据个人喜好进行配置键绑定、将插件程序