全部產品
Search
文件中心

E-MapReduce:什麼是EMR on ECS

更新時間:Jul 01, 2024

EMR on ECS是指EMR在ECS上啟動並執行方式。EMR on ECS將EMR的巨量資料處理功能與ECS的容器化部署優勢相結合,使得您可以更加靈活地配置和管理EMR叢集,從而更好地適應複雜的資料處理和分析情境。通過EMR on ECS,您可以快速建立、管理和營運EMR叢集,同時也能夠更加高效地使用計算和儲存資源。

產品優勢

EMR為您提供了相對方便可控的企業級開源巨量資料服務。您可以快速搭建開源巨量資料服務,例如Hadoop、Spark、Flink、Kafka和HBase服務。

  • 100%採用社區開源組件,適配並最佳化開源組件,效能遠高於開源版本。

  • 基於時間的Auto Scaling能力,搶佔式執行個體可進一步降低成本。

  • 解耦了計算與儲存之間的綁定關係,實現了資源的彈性利用。

  • 分鐘層級建立和擴容叢集,無需手動部署和啟動服務。

產品計費

EMR on ECS支援的計費方式如下:

  • 訂用帳戶:按一定時間長度購買資源,先付費後使用。

  • 隨用隨付:按需開通和釋放資源,先使用後付費。

詳細的計費規則,請參見計費概述

與自建Hadoop叢集對比

開源巨量資料開發平台EMR與自建Hadoop叢集的優勢對比如下表所示。

對比項

阿里雲EMR

自建Hadoop叢集

成本

支援按量和訂用帳戶付費方式,叢集資源支援靈活調整,資料階層式存放區,資源使用率高。無額外軟體License費用。

需提前預估資源,且資源相對固定,資源使用率低。採用Hadoop發行版,需額外支付License費用。

效能

較開源版本效能大幅提升。

採用開源社區版本,效能需自行最佳化。

易用性

分鐘層級啟動Hadoop叢集,敏捷響應業務需求。

採購伺服器,部署Hadoop生態組件,周期長達數周。

彈性

可根據作業臨時啟動和銷毀叢集。叢集資源可根據時間周期或叢集負載動態自動調整。基於JindoFS計算儲存分離架構,輕鬆分別擴充計算和儲存資源。

計算和儲存耦合,資源相對固定,無法彈性調整資源。

安全

支援企業級多租戶資源管理,支援對錶、列、行層級的許可權控制和日誌審計,支援資料加密。

多租戶管理能力需自行配置,能力不完善,無法滿足企業級需求。

可靠

大規模、企業級環境的檢驗,隨開源版本升級,並經過專業的相容性驗證測試,提供優於社區版本的使用體驗。

需自行更新和升級開源版本,驗證各組件版本相容性,自行修複社區bug。

服務

專業和資深巨量資料專家技術服務團隊提供售後支援。

社區版本無服務支援,Hadoop發行版,需額外支付License和服務費用。