EMR Serverless Spark是一款雲原生,專為大規模資料處理和分析而設計的全託管Serverless產品。它為企業提供了一站式的資料平台服務,包括任務開發、調試、調度和營運等,極大地簡化了資料處理的全生命週期工作流程。使用EMR Serverless Spark,企業可以更專註於資料分析和價值提煉,提高工作效率。
產品特性
構建企業級全託管的資料平台服務
易用性強
致力於為客戶提供優質的產品體驗。您無需構建複雜的基礎設施即可開始作業開發之旅。
高效能
基於Fusion Engine (Spark Native Engine) ,效能體驗最高可達開源Spark的4倍。
高擴充性
基於阿里雲Serverless底座,提供資源彈效能力,滿足ETL作業突發高峰的同時,進一步降低實際計算資源成本。
資源可觀測
提供資源和任務執行個體層級的可觀測指標以及警示能力。
高安全性
基於阿里雲Virtual Private Cloud部署,提供專用網路訪問,同時提供更細力度存取控制及更高安全等級保護。
開放架構與生態整合
EMR Serverless Spark與阿里雲OSS-HDFS/OSS,資料湖構建DLF,以及DataWorks無縫對接,為客戶提供了最大程度的便利。
產品架構
產品優勢
雲原生極速計算引擎
內建Fusion Engine (Spark Native Engine),相對開源版本效能提升300%。
內建Celeborn(Remote Shuffle Service),支援PB級Shuffle資料,計算資源總成本最高下降30%。
開放化的資料湖架構
支援計算儲存分離,計算可Auto Scaling,儲存可隨用隨付。
對接OSS-HDFS,完全相容HDFS的雲上儲存,無縫平滑遷移上雲。
中心化的DLF中繼資料,全面打通湖倉中繼資料。
一站式的開發體驗
提供作業開發、調試、發布、調度等一站式資料開發體驗。
內建版本管理、開發與生產隔離,滿足企業級開發與發布標準。
Serverless的資源平台
開箱即用,無需手動管理和營運雲基礎設施。
Auto Scaling,秒級資源彈性與供給。
隨用隨付,按實際計算資源量付費,進一步降低計算總成本。