全部產品
Search
文件中心

Realtime Compute for Apache Flink:2024-05-29版本

更新時間:Aug 27, 2024

本文為您介紹2024年05月29日發布的Realtime ComputeFlink版的重大功能變更和主要缺陷修複。

重要

本次升級計劃在全網分步驟完成灰階,具體升級計劃,請關注Realtime Compute管理主控台頁面右側的最新公告。如果您不能使用相關新功能,說明您的帳號暫未完成灰階。如果您需要儘快升級,請提交工單告知我們,我們將結合實際情況進行安排。

概述

2024年5月29日正式對外發布Realtime ComputeFlink版的新版本,包含平台升級、引擎更新、連接器更新、效能最佳化以及缺陷修複。

平台側

本次平台功能更新聚焦於增強系統的穩定性和營運能力,並提升了易用性。

  • 為保證您作業啟動並執行穩定性,我們對同城高可用功能進行了最佳化。支援將已有的單可用性區域CU類型專案空間轉換為跨可用性區域CU類型專案空間,無需建立專案空間並進行作業遷移,極大地簡化了啟用同城高可用的流程。

  • 支援在作業資源配置專家模式下設定運算元的狀態TTL,能更精細地調整不同運算元的狀態TTL,實現用更少的資源擷取更高的穩定性效果。

  • 支援通過Realtime ComputeFlink版VS Code外掛程式,實現本地Flink作業開發、部署及上線全流程,並支援快速從線上同步作業。

除此之外,我們也對資料血緣、營運頁面等部分進行了進一步的最佳化。

引擎側

引擎側正式對外發布VVR 8.0.7,該版本是基於Apache Flink 1.17.2的企業級Flink引擎,主要包含以下變更:

  • 在即時湖倉方面,Paimon連接器SDK升級,支援Paimon資料湖格式0.9版本。

  • 在SQL增強方面,您可以使用運算元狀態生命週期(TTL)Hints單獨為雙流聯結運算元和分組彙總運算元設定TTL,更精準的控制各個運算元的狀態大小;您可以使用具名引數來實現自訂函數,提升開發效率,降低維護成本。

  • 在連接器方面,本版本MongoDB連接器結束公測,正式進入生產階段,它提供了完整的CDC源表、維表和結果表能力。另外本版本還重點提升了MySQL CDC和Redis連接器相關能力:

    • MySQL CDC

      • 支援通過op_type虛擬列擷取資料操作類型,使得下遊能夠獲得該變化資料的操作類型(+I、+/-U、-D),藉此功能,您可靈活地根據具體的操作類型設計商務邏輯和資料清理策略。

      • 最佳化了以Decimal類型作為主鍵的MySQL表的讀取效能,並實現了大容量表的SourceRecord(資料變更記錄)平行處理,以提升處理效率。

      • 支援Source複用功能,開啟Source複用功能後,Flink會嘗試合并同一作業內某些配置項(庫名、表名和server-id除外)均相同的MySQL CDC源表,以減輕MySQL伺服器的串連和監聽壓力。

      • 在開啟sink.ignore-null-when-update參數時,會進行攢批執行,數倍提升了處理效能。

    • Redis:Redis作為維表和結果表時,當Key的資料類型為HashMap時,支援多種非主鍵Key格式的DDL定義,方便您更好地理解;支援設定Key的首碼和分隔字元,滿足Redis資料治理要求。

  • 在中繼資料管理方面,MySQL視圖作為資料庫中的一種邏輯結構,本身無法進行實際的資料讀寫。為避免資料操作錯誤,新建立的MySQL Catalog中將不再展示視圖資訊。

  • 在安全方面,本版本對開啟Kerberos的Hive叢集的相容範圍擴充至Hadoop 2.x版本;對日誌中連接器的串連配置等敏感資訊進行了隱藏屏蔽。

  • 在缺陷修複方面,本版本重點修複了ClickHouse結果表shardWrite參數未生效與在極端情況下作業快照無法產生等問題,旨在提高系統的穩定性和可靠性。

該版本主要特性詳情及相關文檔詳見下方表格,我們將在全網進行分步驟的灰階,灰階完畢後,歡迎您將作業使用的引擎升級至此版本,具體操作請參見作業引擎版本升級。期待您的使用體驗反饋!

主要功能介紹

特性

詳情

相關文檔

同城高可用功能最佳化

支援專案空間類型(單可用性區域和跨可用性區域)互相切換。

同城高可用

血緣關係功能最佳化

欄位層級血緣關係支援通過欄位名稱進行搜尋,多個結果時支援按上下鍵進行切換,方便您快速定位並查看欄位血緣資訊。

image

通過節點或欄位名稱搜尋查看血緣資訊

作業營運頁面新增建立人欄位

您可以在作業營運頁面,單擊右側的image配置自訂欄表展示,添加建立人欄位。通過建立人欄位,能夠準確過濾作業列表,當作業出現問題時可以快速確認作業的建立人,提升協作效率。

  • 在作業列表的建立人列,支援篩選我建立的,查看該專案空間下當前帳號建立的所有作業。

    image

  • 在作業列表上方的檢索框中,選擇建立人欄位,輸入目標建立人名稱,可以尋找指定建立人建立的作業列表。

    image

許可權管理功能最佳化

建立工作空間的身份(主帳號、RAM使用者、RAM角色等)預設具有專案空間下owner角色許可權。

專案空間授權

SQL作業有狀態啟動時狀態相容性檢測行為最佳化

選擇從最新狀態啟動作業時,Flink系統會檢測作業變化。當檢測到作業發生變化時,建議單擊狀態相容性檢測旁的點擊檢測檢查相容性,並依據相容性結果後決定後續行為。

作業啟動

上線VS Code本地開發外掛程式

為您打通了本地Flink作業開發全流程,協助您在本地輕鬆完成Flink作業的開發、部署及上線,包括SQL、JAR和Python作業,並支援快速從線上同步作業。

VS Code本地開發外掛程式

支援運算元粒度的TTL設定

在只有某些運算元需要設定較大TTL的情境下,為整個作業設定統一的TTL可能會導致State膨脹,造成資源損耗。您可以通過以下任意一種方式設定運算元TTL,更精準的控制各個運算元的狀態大小,節約大狀態作業的使用資源。

  • 在作業營運頁面資源配置專家模式中設定。

    說明
    • 僅Realtime Compute引擎VVR 8.0.7及以上版本支援。

    • 僅SQL作業使用專家模式(細粒度)資源配置時支援。

  • 使用運算元狀態生命週期(TTL)Hints為雙流聯結運算元和分組彙總運算元設定TTL。

支援通過具名引數實現自訂函數

可以提升開發效率,降低維護成本。

概述

MySQL CDC連接器能力增強

  • 支援通過op_type虛擬列擷取資料操作類型。

  • MySQL CDC最佳化了以Decimal類型作為主鍵的MySQL表的讀取效能,並實現了大容量表的SourceRecord(資料變更記錄)平行處理。

  • 支援開啟CDC Source複用功能。

  • 在開啟sink.ignore-null-when-update參數時,會進行攢批執行。

MySQL

Redis連接器能力增強

  • Redis作為維表和結果表時,當Key的資料類型為HashMap時,支援多種非主鍵Key格式的DDL定義,方便您更好地理解。

  • 支援設定Key的首碼和分隔字元,滿足Redis資料治理要求。

KVStore for Redis

MQ支援攢批讀取

可以有效提高處理效率並降低資源成本。

雲訊息佇列 RocketMQ 版

MySQL Catalog中不再支援查看視圖

MySQL視圖作為資料庫中的一種邏輯結構,本身並不儲存資料。因此自該版本起,新建立的MySQL Catalog都無法查看視圖資訊。

管理MySQL Catalog

增強了對Hive Kerberos叢集的支援

對開啟Kerberos的Hive叢集相容性範圍擴充至Hadoop 2.x。

註冊Hive Kerberos叢集

Iceberg Connector SDK版本升級

支援讀寫Apache Iceberg 1.5。

主要缺陷修複

  • 修複了Realtime Compute引擎VVR 8.0.5和VVR 8.0.6版本Hologres連接器Where條件下推導致的資料正確性問題。

  • 修複了SLS連接器在Failover期間,SLS源表仍然在消費位點提交而導致資料丟失問題。

  • 修複了同時設定有TTL的mapState和無TTL的valueState時出現的valueState狀態丟失問題。

  • 修複了動態CEP中還原序列化WithinType.PREVIOUS_AND_CURRENT結果不一致問題。

  • 修複了控制台監控頁面與Flink UI頁面的currentEmitEventTimeLag 彙報資料不一致問題。

  • 修複了Apache Flink 1.17.2版本的所有缺陷,詳情請參見Apache Flink 1.17.2 Release Announcement