本文根据您的角色推荐不同的文档阅读顺序。
如果您是MaxCompute初学者
如果您是初学者,建议先熟悉如下模块,然后再有针对性地对深入学习其他模块。
模块 | 说明 |
介绍MaxCompute产品的概况、主要功能、应用场景、使用限制及基本概念。通过阅读该章节,您会对MaxCompute有一个总体的认知。 | |
通过示例指导您如何准备账号、准备环境、创建表、导入数据、运行SQL及导出结果数据。 | |
介绍MaxCompute的常用命令。您可以进一步熟悉如何操作MaxCompute。 | |
您需要在分析数据前掌握MaxCompute涉及的客户端、MaxCompute Studio等工具。 | |
介绍MaxCompute各地域支持的连接方式及Endpoint信息,并对您在与其他云产品(ECS、Tablestore或OSS)互访场景中遇到的网络连通性和下载数据收费等问题进行说明。 |
如果您是数据分析师
如果您拥有一定开发经验
如果您拥有一定的开发经验,了解分布式概念,且希望解决某些无法用SQL实现的数据分析问题,推荐您学习MaxCompute更高级的功能模块。
模块 | 说明 |
MaxCompute提供Java MapReduce编程模型。您可以使用MapReduce提供的接口(Java API)编写MapReduce程序,处理MaxCompute中的数据。 | |
一套面向迭代的图计算处理框架。使用图进行建模,图由点(Vertex)和边(Edge)组成,点和边包含权值(Value)。通过迭代对图进行编辑、演化,最终得出结果。 | |
您可以使用Tunnel服务向MaxCompute批量上传离线数据或从MaxCompute下载离线数据。 | |
向开发者提供的Java接口。 | |
向开发者提供的Python接口。 |
如果您是项目Owner或管理员
如果您是一个项目的Owner(创建和使用项目)或管理员(管理项目、安全和费用)需要熟知如下模块。
模块 | 子模块 | 说明 |
项目管理 | 创建项目前期工作 | 项目(Project)是MaxCompute的基本组织单元,它类似于传统数据库的Database或Schema的概念,是进行多用户隔离和访问控制的主要边界。一个用户可以同时拥有多个项目的权限,通过安全授权,可以在一个项目中访问另一个项目中的对象,例如表(Table)、资源(Resource)、函数(Function)和实例(Instance)。使用MaxCompute,实际是操作项目中的各种对象。前期准备工作如下:
|
创建项目 | 创建项目具体操作,请参见创建MaxCompute项目。 | |
项目成员管理 | 成员管理主要考虑成员的职责和安全问题,如果通过DataWorks使用MaxCompute,您需要考虑两个产品之间的关联权限。 | |
RAM用户管理 | MaxCompute项目支持阿里云账号和RAM用户两种账号体系。您可以将阿里云账号下的任意RAM用户加入MaxCompute的某一个项目中。RAM用户详情,请参见创建RAM用户。 通过DataWorks使用MaxCompute和DataWorks的工作空间,仅支持添加阿里云账号下的RAM用户为成员。因此,需要阿里云账号通过RAM系统创建RAM用户,并对RAM用户进行维护管理。 说明
| |
调度资源管理 | 即DataWorks上的调度资源,调度资源用于执行或分发调度系统下发的任务。DataWorks的调度资源分为如下两种模式:
| |
项目设置 | 在项目开发过程中,部分项目的设置操作需要项目Owner来执行。例如,设置项目是否允许全表扫描、设置项目默认打开2.0新类型等。详情请参见项目操作。 | |
费用管理 | 无 | 资源预算是在使用之前进行成本预估。基于MaxCompute的计费方式,很多业务无法更准确地预估成本,因此在整个业务开发过程中需要进行费用管理,主要需要关注:
|