全部產品
Search
文件中心

E-MapReduce:什麼是EMR Serverless Spark

更新時間:Sep 15, 2024

EMR Serverless Spark是一款雲原生,專為大規模資料處理和分析而設計的全託管Serverless產品。它為企業提供了一站式的資料平台服務,包括任務開發、調試、調度和營運等,極大地簡化了資料處理的全生命週期工作流程。使用EMR Serverless Spark,企業可以更專註於資料分析和價值提煉,提高工作效率。

產品特性

構建企業級全託管的資料平台服務

  • 易用性強

    致力於為客戶提供優質的產品體驗。您無需構建複雜的基礎設施即可開始作業開發之旅。

  • 高效能

    基於Fusion Engine (Spark Native Engine) ,效能體驗最高可達開源Spark的4倍。

  • 高擴充性

    基於阿里雲Serverless底座,提供資源彈效能力,滿足ETL作業突發高峰的同時,進一步降低實際計算資源成本。

  • 資源可觀測

    提供資源和任務執行個體層級的可觀測指標以及警示能力。

  • 高安全性

    基於阿里雲Virtual Private Cloud部署,提供專用網路訪問,同時提供更細力度存取控制及更高安全等級保護。

開放架構與生態整合

EMR Serverless Spark與阿里雲OSS-HDFS/OSS,資料湖構建DLF,以及DataWorks無縫對接,為客戶提供了最大程度的便利。

產品架構

產品優勢

雲原生極速計算引擎

  • 內建Fusion Engine (Spark Native Engine),相對開源版本效能提升300%。

  • 內建Celeborn(Remote Shuffle Service),支援PB級Shuffle資料,計算資源總成本最高下降30%。

開放化的資料湖架構

  • 支援計算儲存分離,計算可Auto Scaling,儲存可隨用隨付。

  • 對接OSS-HDFS,完全相容HDFS的雲上儲存,無縫平滑遷移上雲。

  • 中心化的DLF中繼資料,全面打通湖倉中繼資料。

一站式的開發體驗

  • 提供作業開發、調試、發布、調度等一站式資料開發體驗。

  • 內建版本管理、開發與生產隔離,滿足企業級開發與發布標準。

Serverless的資源平台

  • 開箱即用,無需手動管理和營運雲基礎設施。

  • Auto Scaling,秒級資源彈性與供給。

  • 隨用隨付,按實際計算資源量付費,進一步降低計算總成本。