EMR on ECS是指EMR在ECS上啟動並執行方式。EMR on ECS將EMR的巨量資料處理功能與ECS的容器化部署優勢相結合,使得您可以更加靈活地配置和管理EMR叢集,從而更好地適應複雜的資料處理和分析情境。通過EMR on ECS,您可以快速建立、管理和營運EMR叢集,同時也能夠更加高效地使用計算和儲存資源。
產品優勢
EMR為您提供了相對方便可控的企業級開源巨量資料服務。您可以快速搭建開源巨量資料服務,例如Hadoop、Spark、Flink、Kafka和HBase服務。
100%採用社區開源組件,適配並最佳化開源組件,效能遠高於開源版本。
基於時間的Auto Scaling能力,搶佔式執行個體可進一步降低成本。
解耦了計算與儲存之間的綁定關係,實現了資源的彈性利用。
分鐘層級建立和擴容叢集,無需手動部署和啟動服務。
產品計費
EMR on ECS支援的計費方式如下:
詳細的計費規則,請參見計費概述。
與自建Hadoop叢集對比
開源巨量資料開發平台EMR與自建Hadoop叢集的優勢對比如下表所示。
對比項 | 阿里雲EMR | 自建Hadoop叢集 |
成本 | 支援按量和訂用帳戶付費方式,叢集資源支援靈活調整,資料階層式存放區,資源使用率高。無額外軟體License費用。 | 需提前預估資源,且資源相對固定,資源使用率低。採用Hadoop發行版,需額外支付License費用。 |
效能 | 較開源版本效能大幅提升。 | 採用開源社區版本,效能需自行最佳化。 |
易用性 | 分鐘層級啟動Hadoop叢集,敏捷響應業務需求。 | 採購伺服器,部署Hadoop生態組件,周期長達數周。 |
彈性 | 可根據作業臨時啟動和銷毀叢集。叢集資源可根據時間周期或叢集負載動態自動調整。基於JindoFS計算儲存分離架構,輕鬆分別擴充計算和儲存資源。 | 計算和儲存耦合,資源相對固定,無法彈性調整資源。 |
安全 | 支援企業級多租戶資源管理,支援對錶、列、行層級的許可權控制和日誌審計,支援資料加密。 | 多租戶管理能力需自行配置,能力不完善,無法滿足企業級需求。 |
可靠 | 大規模、企業級環境的檢驗,隨開源版本升級,並經過專業的相容性驗證測試,提供優於社區版本的使用體驗。 | 需自行更新和升級開源版本,驗證各組件版本相容性,自行修複社區bug。 |
服務 | 專業和資深巨量資料專家技術服務團隊提供售後支援。 | 社區版本無服務支援,Hadoop發行版,需額外支付License和服務費用。 |