全部產品
Search
文件中心

Data Lake Analytics - Deprecated:Serverless Presto概述

更新時間:Jul 06, 2024

Serverless Presto是雲原生資料湖團隊基於Presto打造的互動式分析引擎,Presto開發的初衷就是為瞭解決使用Hive來進行線上分析速度太慢的問題,因此它採用全記憶體流水線化的執行引擎,相較於其它引擎會把中間資料落盤的執行方式,Presto在執行速度上有很大的優勢,特別適合用來做Adhoc查詢、BI分析、輕量級ETL等資料分析工作。

阿里雲資料湖分析團隊在Presto之上又進行了很多的最佳化,DLA支援了阿里雲幾乎所有的資料來源比如AnalyticDB、TableStore等等;阿里雲資料湖分析團隊最佳化了Hive Connector,使得分析OSS資料時對OSS調用量大幅下降,從而提高效能且節省成本;DLA內建了企業級的許可權控制體系,保護您的資料安全;內建了高可用的Coordinator方案,提高整體服務的可用性;DLA在Presto之上實現了MySQL接入協議,使得您可以使用任何相容MySQL協議的工具來進行資料分析。

Serverless Presto的整體架構如下:Serverless SQL架構圖
  • FrontNode是使用者訪問的入口,它實現了MySQL協議,因此您使用任何相容MySQL協議的用戶端進行串連。
    • 您可以通過DLA的SQL執行頁面直接進行庫、表建立以及資料查詢。
    • 您也可以使用其它用戶端串連Serverless Presto服務。具體請參見建立服務存取點
      說明 登入到DMS串連資料庫,需要輸入資料庫的帳號和密碼。關於如何建立帳號和修改密碼,請參見管理DLA帳號重設資料庫帳號密碼
  • Presto Clusters叢集承擔分析計算的職責。
    • 您可以閱讀文檔DLA Presto CU版本快速入門來學習如何開通、使用DLA Presto的CU版本。
    • 您可以閱讀SQL參考文檔學習如何建立庫和表、資料查詢、許可權控制等其它SQL文法。每種資料來源建立庫、表的選項稍有不同,可以閱讀串連資料來源下面的文檔來查看建每種資料來源庫表的具體寫法。
    • DLA的Presto Clusters叢集是相容社區Presto的,關於函數的具體定義可以參考社區文檔。
  • Presto Clusters叢集下面可以接入各種資料來源。
    • 您可以閱讀串連資料來源下面的文檔來學習如何串連到各種資料來源。