本文根據您的角色推薦不同的文檔讀取順序。
如果您是MaxCompute初學者
如果您是初學者,建議先熟悉如下模組,然後再有針對性地對深入學習其他模組。
模組 | 說明 |
模組 | 說明 |
介紹MaxCompute產品的概況、主要功能、應用情境、使用限制及基本概念。通過閱讀該章節,您會對MaxCompute有一個總體的認知。 | |
通過樣本指導您如何準備帳號、準備環境、建立表、匯入資料、運行SQL及匯出結果資料。 | |
介紹MaxCompute的常用命令。您可以進一步熟悉如何操作MaxCompute。 | |
您需要在分析資料前掌握MaxCompute涉及的用戶端、MaxCompute Studio等工具。 | |
介紹MaxCompute各地區支援的串連方式及Endpoint資訊,並對您在與其他雲產品(ECS、Tablestore或OSS)互訪情境中遇到的網路連通性和下載資料收費等問題進行說明。 |
如果您是資料分析師
如果您擁有一定開發經驗
如果您擁有一定的開發經驗,瞭解分布式概念,且希望解決某些無法用SQL實現的資料分析問題,推薦您學習MaxCompute更進階的功能模組。
模組 | 說明 |
模組 | 說明 |
MaxCompute提供Java MapReduce編程模型。您可以使用MapReduce提供的介面(Java API)編寫MapReduce程式,處理MaxCompute中的資料。 | |
一套面向迭代的圖計算處理架構。使用圖進行建模,圖由點(Vertex)和邊(Edge)組成,點和邊包含權值(Value)。通過迭代對圖進行編輯、演化,最終得出結果。 | |
您可以使用Tunnel服務向MaxCompute批量上傳離線資料或從MaxCompute下載離線資料。 | |
向開發人員提供的Java介面。 | |
向開發人員提供的Python介面。 |
如果您是專案Owner或管理員
如果您是一個專案的Owner(建立和使用專案)或管理員(管理專案、安全和費用)需要熟知如下模組。
模組 | 子模組 | 說明 |
模組 | 子模組 | 說明 |
專案管理 | 建立專案前期工作 | 專案(Project)是MaxCompute的基主要組織單元,它類似於傳統資料庫的Database或Schema的概念,是進行多使用者隔離和存取控制的主要邊界。一個使用者可以同時擁有多重專案的許可權,通過安全授權,可以在一個專案中訪問另一個專案中的對象,例如表(Table)、資源(Resource)、函數(Function)和執行個體(Instance)。使用MaxCompute,實際是操作專案中的各種對象。前期準備工作如下:
|
建立專案 | 建立專案具體操作,請參見建立MaxCompute專案。 | |
專案成員管理 | 成員管理主要考慮成員的職責和安全問題,如果通過DataWorks使用MaxCompute,您需要考慮兩個產品之間的關聯許可權。 | |
RAM使用者管理 | MaxCompute專案支援阿里雲帳號和RAM使用者兩種帳號體系。您可以將阿里雲帳號下的任意RAM使用者加入MaxCompute的某一個專案中。RAM使用者詳情,請參見建立RAM使用者。 通過DataWorks使用MaxCompute和DataWorks的工作空間,僅支援添加阿里雲帳號下的RAM使用者為成員。因此,需要阿里雲帳號通過RAM系統建立RAM使用者,並對RAM使用者進行維護管理。
| |
調度資源管理 | 即DataWorks上的調度資源,調度資源用於執行或分發調度系統下發的任務。DataWorks的調度資源分為如下兩種模式:
| |
專案設定 | 在專案開發過程中,部分專案的設定作業需要專案Owner來執行。例如,設定專案是否允許全表掃描、設定專案預設開啟2.0新類型等。詳情請參見專案操作。 | |
費用管理 | 無 | 資源預算是在使用之前進行成本預估。基於MaxCompute的計費方式,很多業務無法更準確地預估成本,因此在整個業務開發過程中需要進行費用管理,主要需要關註:
|