全部產品
Search
文件中心

E-MapReduce:EMR-5.5.x版本說明

更新時間:Jul 01, 2024

本文介紹EMR-5.5.x版本的發布日期、更新內容和發行版本資訊。

發布日期

版本

日期

EMR-5.5.1

2022年3月25日

EMR-5.5.0

2022年2月15日

更新內容

EMR-5.5.1

說明

新版控制台的OLAP叢集支援該版本。

服務

變更點

Clickhouse

修改了部分參數的預設值。

StarRocks

升級至2.1.1版本。

EMR-5.5.0

服務

變更點

SmartData

組件下線。

BIGBOOT

RSS

  • 升級ESS服務為RSS。

  • 增強了服務的功能和穩定性。

JindoSDK

  • 升級架構為JindoData。

  • EMR首次整合JindoSDK 4.0,支援OSS和OSS-HDFS服務等。

Spark

  • COUNT DISTINCT函數支援IF語句以及最佳化Case when的用法。

    設定參數spark.sql.optimizer.rewriteConditionalDistinctAggregates為true。

  • Shuffle Hash Join支援fallback到Sort Merge Join。

    設定參數spark.sql.join.preferSortMergeJoin為false,設定參數spark.sql.join.enableShuffledHashJoinFallback為true。

  • 支援非動態分區自動合并小檔案。

    設定spark.sql.adaptive.merge.output.small.files.enabled參數為true。

  • GroupingSet以及Distinct等情境會自動調整並發度。

    設定參數spark.sql.execution.optimizeExpand為true。

  • 最佳化了Hive on Spark。

  • 支援Time Travel文法。

  • 適配JindoSDK。

Tez

適配JindoSDK。

Hive

  • 最佳化了Hive Jindo大量刪除的問題。

  • 最佳化了HiveServer2 OOM問題。

  • 最佳化了Hive on Spark。

  • 適配JindoSDK。

Presto

  • 升級Presto至社區358版本。

  • 預設增加MySQL、Iceberg、Hudi、Phoenix、Kudu和Delta連接器,並更新預設配置。

  • 支援資料湖分析。

  • 支援UDF動態載入功能。

  • 適配JindoSDK。

Delta Lake

  • 版本升級

    • 升級至1.1.0版本,相容Spark 3.2.0。

    • 所有商業版功能遷移至1.1.0版本。

  • 中繼資料管理

    • 最佳化中繼資料修改同步到metastore的部分。

    • 自動上報表的統計資訊(dataProfiling)到metastore。

  • SQL

    • 支援Time Travel文法。

    • 支援DropPartition SQL文法。

    • 支援SQL動態分區覆蓋寫。

    • 支援指定位置(FIRST和AFTER)的ADD COLUMN操作。

  • 表管理能力增強

    • 支援並預設開啟可以根據表大小動態調整檔案大小。

    • 支援並預設開啟自動Vacuum,支援並發Vacuum。

    • 最佳化了自動Compaction的邏輯,預設關閉。

    • 新增Zorder文法,並加速了Zorder的處理過程。

Hudi

  • 升級至0.10.0版本。

  • 支援Spark 3.2.0版本。

  • 支援JindoFS Block模式。

HDFS

適配JindoSDK。

YARN

  • 適配RSS記憶體配置。

  • 適配JindoSDK。

Flume

適配JindoSDK。

Impala

適配JindoSDK。

Ranger

  • 支援Spark 3.2.0版本。

  • 支援Presto 358版本。

HBase

  • 修複了預設參數存在的問題。

  • 修複了GC日誌日期格式問題。

Clickhouse

Iceberg

  • 升級至0.13.0版本。

  • 支援Presto 358版本。

DLF-Auth

  • 支援Spark 3.2.0版本。

  • 支援Presto 358版本。

發行版本資訊

說明

OLAP叢集需要在新版控制台查看。

Hadoop叢集

服務

版本

HDFS

3.2.1

YARN

3.2.1

Hive

3.1.2

Spark

3.2.0

Knox

1.1.0

Tez

0.9.2

Ganglia

3.7.2

Sqoop

1.4.7

DLF-Auth

1.0.4

Iceberg

0.13.0

Hudi

0.10.0

DeltaLake

1.1.0

OpenLDAP

2.4.44

Hue

4.9.0

JindoSDK

4.0.0

HBase

2.3.4

Zookeeper

3.6.3

Presto

358

Impala

3.4.0

Zeppelin

0.10.2

Flume

1.9.0

Livy

0.7.1

Superset

0.36.0

Ranger

2.1.0

RSS

1.0.0

Alluxio

2.5.0

Kudu

1.14.0

Oozie

5.2.1

ClickHouse叢集

服務

版本

Zookeeper

3.6.3

Ganglia

3.7.2

ClickHouse

21.3.13.9

Shuffle Service叢集

服務

版本

RSS

1.0.0

OLAP叢集

服務

版本

ClickHouse

21.3.13.9.2.9

StarRocks

2.1.1

Zookeeper

3.6.3