全部產品
Search
文件中心

MaxCompute:術語表

更新時間:Jun 19, 2024

在開始使用MaxCompute產品前,您可以提前查閱MaxCompute所涉及的術語及其含義,為瞭解產品及快速上手提供協助。本文為您介紹MaxCompute涉及的術語及其概念。

A

  • AccessKey

    簡稱AK,包括AccessKey ID和AccessKey Secret,是訪問阿里雲API的密鑰。在阿里雲官網註冊雲帳號後,可以在AccessKey管理頁面產生該資訊,用於標識使用者,為訪問MaxCompute、其他阿里雲產品或串連第三方工具做簽名驗證。請妥善保管AccessKey Secret,必須保密,如果存在泄露風險,請及時禁用或更新AccessKey。

  • 安全

    MaxCompute提供多租戶資料安全體系,主要包括使用者認證、專案的使用者與授權管理、跨專案的資源分享以及專案的資料保護。更多MaxCompute安全操作資訊,請參見許可權概述

C

  • Console

    即MaxCompute用戶端,是運行在Window或Linux下的工具,您可以在MaxCompute用戶端通過運行命令的方式完成專案管理、DDL、DML等操作。MaxCompute用戶端的操作指導,請參見使用本地用戶端(odpscmd)串連

D

  • Data Type

    MaxCompute表中列的資料類型。MaxCompute支援的資料類型版本及各版本的資料類型列表,請參見資料類型版本說明

  • DDL

    Data Definition Language,資料定義語言 (Data Definition Language)。例如建立表、建立視圖等操作。更多DDL文法資訊,請參見DDL語句

  • DML

    Data Manipulation Language,資料操作語言。例如INSERT、UPDATE、DELETE操作。更多DML文法資訊,請參見DML操作

F

  • Function(函數)

    MaxCompute提供函數功能,包括內建函數和UDF。更多函數資訊,請參見函數

  • fuxi(伏羲)

    伏羲是飛天平台核心中負責資源管理和任務調度的模組,同時也為應用開發提供了一套編程基礎架構。MaxCompute的底層任務調度模組為fuxi的調度模組。

I

  • Instance(執行個體)

    即實際運行作業的一個具體執行個體,類同Hadoop中Job的概念。詳情請參見任務執行個體

M

  • MapReduce

    MapReduce是處理資料的一種編程模型,通常用於大規模資料集的並行運算。您可以使用MapReduce提供的介面(Java API)編寫MapReduce程式,來處理MaxCompute中的資料。編程思想是將資料的處理方式分為Map(映射)和Reduce(規約)。

    在正式執行Map前,需要將輸入的資料進行分區。所謂分區,就是將輸入資料切分為大小相等的資料區塊,每一塊作為單個Map Worker的輸入被處理,以便於多個Map Worker同時工作。每個Map Worker在讀入各自的資料後,進行計算處理,最終通過Reduce函數整合中間結果,從而得到最終計算結果。詳情請參見MapReduce

N

  • Networklink(網路連接)

    當您使用外部表格、UDF或湖倉一體功能時,MaxCompute預設未建立與外網或VPC網路間的網路連接,您需要開通網路連接以訪問外網或VPC中的目標服務(例如HBase、RDS、Hadoop等)。更多開通網路連接資訊,請參見網路開通流程

P

  • Partition(分區)

    分區Partition是指一張表下,根據分區欄位(一個或多個欄位的組合)對資料存放區進行劃分。如果表沒有分區,資料是直接放在表所在的目錄下。如果表有分區,每個分區對應表下的一個目錄,資料是分別儲存在不同的分區目錄下。更多分區資訊,請參見分區

  • Project(專案)

    專案是MaxCompute的基主要組織單元,類似於傳統資料庫的Database或Schema的概念,是進行多使用者隔離和存取控制的主要邊界。更多專案資訊,請參見專案

Q

  • Quota(配額)

    配額是MaxCompute的計算資源集區,提供作業運行所需計算資源。更多配額資訊,請參見配額

R

  • Role(角色)

    角色是MaxCompute安全功能中的概念,可以理解為擁有相同許可權的使用者的集合。多個使用者可以同時存在於一個角色下,一個使用者也可以隸屬於多個角色。給角色授權後,該角色下的所有使用者擁有相同的許可權。更多角色管理資訊,請參見角色規劃

  • Resource(資源)

    資源是MaxCompute中特有的概念。當您使用MaxCompute的自訂函數(UDF)或MapReduce功能時,需要依賴資源來完成。更多資源資訊,請參見資源

S

  • SDK

    Software Development Kit,軟體開發套件。一般都是一些被軟體工程師用於為特定的軟體包、軟體執行個體、軟體架構、硬體平台、作業系統、文檔包等建立應用軟體的開發工具的集合。MaxCompute支援Java SDKPython SDK

  • 授權

    專案系統管理員或者專案Owner可以授予其他角色對MaxCompute中的對象(例如表、任務、資源等)進行某種操作的許可權,包括讀、寫、查看等。更多授權資訊,請參見使用者規劃與管理

  • 沙箱(Sandboxie)

    沙箱是一種按照安全性原則限制程式行為的執行環境。沙箱機制是一種安全機制,將Java代碼限定在特定的運行範圍中,並且嚴格限制代碼對本地系統資源訪問,通過這樣的措施來保證對代碼的有效隔離,防止對本地系統造成破壞。MaxCompute MapReduce及UDF程式在分布式環境中運行時受到Java沙箱的限制。

T

  • Table(表)

    表是MaxCompute的資料存放區單元。更多表資訊,請參見

  • Tunnel

    MaxCompute的資料通道,提供高並發的離線資料上傳下載服務。您可以使用Tunnel服務向MaxCompute批量上傳資料或者向本地進行批量資料下載。相關命令請參見Tunnel命令批量資料通道SDK

U

  • UDF

    User Defined Function,使用者自訂函數。

    廣義的UDF代表了自訂純量涵式、自訂彙總函式及自訂表格值函數三種類型。MaxCompute支援通過Java、Python編程介面開發自訂函數,詳情請參見MaxCompute UDF

    狹義的UDF指使用者自訂純量涵式(User Defined Scalar Function),它的輸入與輸出是一對一的關係,即讀入一行資料,寫出一條輸出值。

  • UDAF

    User Defined Aggregation Function,自訂彙總函式。它的輸入與輸出是多對一的關係, 即將多條輸入記錄彙總成一條輸出值。可以與SQL中的GROUP BY語句聯用。詳情請參見UDAF

  • UDTF

    User Defined Table Valued Function,自訂表格值函數。它是唯一能返回多個欄位的自訂函數。詳情請參見UDTF

  • User(使用者)

    使用者是MaxCompute安全功能中的概念,MaxCompute支援您通過阿里雲帳號、RAM使用者或RAM角色訪問MaxCompute。非MaxCompute專案所有者(Project Owner)的使用者必須被加入MaxCompute專案中,且被授予相應的許可權,才能操作MaxCompute專案中的資料、作業、資源及函數。更多使用者管理資訊,請參見使用者規劃與管理

V

  • View(視圖)

    視圖是在表之上建立的虛擬表,它的結構和內容都來自表。一個視圖可以對應一個表或多個表。如果您想保留查詢結果,但不想建立表佔用儲存,可以通過視圖實現。更多視圖資訊,請參見視圖操作