全部產品
Search
文件中心

Realtime Compute for Apache Flink:2023-08-21版本

更新時間:Jul 13, 2024

本文為您介紹2023年8月21日發布的Realtime ComputeFlink版的重大功能變更和主要缺陷修複。

重要

經過仔細評估,發現Realtime Compute引擎VVR 8.0.1版本在極端情況下可能存在資料丟失的風險,這可能會影響到您的業務資料正確性。因此該版本將快速逐步EOS,請您儘快將作業引擎版本升級到VVR 8.0.5及以上版本,升級方法請參見作業引擎版本升級。我們可以提供必要的支援和指導,協助您平滑過渡到更安全、更穩定的版本,感謝您的理解與合作。

概述

2023年8月21日正式對外發布Realtime ComputeFlink版的新版本,包含引擎更新、連接器更新、效能最佳化以及缺陷修複。

引擎側將正式對外發布VVR 8.0.1版本,該版本是基於Apache Flink 1.17.1的全新企業級Flink引擎。在該版本中,我們將包含Apache Flink 1.17.1的所有新功能、效能提升與缺陷修複。在Apache Flink 1.17中,通過通用增量Checkpoint(GIC)功能,提升了Checkpoint的處理速度和穩定性。同時,增強了Unaligned Checkpoint(UC)在處理作業反壓時的穩定性,現在已達到生產級可用性。此外,Batch的效能也得到大幅度改進。

在這個版本中,我們對企業級狀態後端核心架構進行了重構,在效能和穩定性方面都有大幅提升,主要體現在兩個方面:(1)採用了更緊湊的狀態格式和檔案儲存體,以及更高效的資料清理策略,顯著降低了本地狀態儲存空間,並大幅提升了訪問效能。對於狀態瓶頸的作業,其平均效能可以提升40%以上,狀態大小可縮減約30%。(2)進一步提升了狀態擴縮容和恢複機制,在大狀態情境下(100G)可以讓作業更新斷流時間從分鐘級降低到秒級。新版本企業級狀態在VVR 8.0.1作為預設版本,無需您更改配置。

除引擎核心與狀態後端升級外,本次發布進一步增強了Flink與阿里雲各儲存和計算產品間的互通性,提供了更豐富的連接器功能,並提升了效能和穩定性。主要包括:

  • 正式推出MongoDB CDC連接器,進入公測階段,支援高效地從MongoDB資料庫中(複本集或分區叢集架構)捕獲即時增量和歷史資料同步到下遊系統。MongoDB CDC連接器實現了增量快照演算法,在全量階段支援並發讀取海量歷史資料,自動切換從全量讀到增量讀,同步過程提供資料不丟不重語義;在增量讀取階段,支援掃描完整變更事件流,對下遊Flink SQL計算作業非常友好。同時MongoDB CDC提供多種啟動位點模式,方便您按需靈活選擇。

  • CDAS功能支援了在對新增表等變更操作後,可以以有狀態的方式重啟作業並繼續執行,這避免了重啟帶來的狀態丟失與額外作業的管理成本。

  • 新增OceanBase連接器,可以將OceanBase資料庫作為結果表和維表使用。OceanBase是阿里巴巴和螞蟻集團100% 自主研發的一款原生分布式關係型HTAP資料庫,具有資料強一致、高可用、高效能、線上擴充、高度相容SQL標準和主流關係型資料庫、低成本等特點。

  • 加強了Tair的企業級資料結構的更全面支援,您可以使用Flink+TairTs即時構建時序資料集,使用Flink+TairVector構建AI向量資料集,也可以通過Flink+TairCpc進行即時風控應用構建,或者採用Flink+TairRoaring實現即時客戶畫像系統。

  • 新增對阿里雲SLS Catalog結果表的支援,您可以使用持久表的方式進行SLS資料表的定義與寫入。

  • 作為一個預覽功能,本次發布包含了Apache Paimon 0.5-snapshot的更新,並支援了Flink CDC寫入Paimon時源表列類型變更應用。

我們將在兩周內在全網進行分步驟的灰階,灰階完畢後的客戶和地區平台能力將完成升級,並且可以在作業選擇引擎的列表中看到新引擎版本,歡迎您將作業使用的引擎升級至此版本,具體操作請參見作業引擎版本升級。期待您的使用體驗反饋!

主要功能介紹

特性

詳情

相關文檔

MongoDB CDC連接器開始公測

支援以源表形式讀取MongoDB增量變化資料。

MongoDB CDC(公測中)

CDAS支援源庫新增表加入資料同步

CDAS作業啟動後,如果源庫新增表,支援從作業快照重啟,從而捕獲到新的表,對新增表進行資料同步。

CREATE DATABASE AS(CDAS)語句

支援在Begin Statement/END中新添加CTAS子句

如果新增CTAS語句,支援從作業快照重啟,從而捕獲到新的表,對新增表進行資料同步。CTAS的使用更加靈活,且不會增加作業數量。

CREATE TABLE AS(CTAS)語句

雙流Join支援不同流的State TTL分別設定

在部分涉及雙流Join的業務情境中,兩個不同的流可能需要設定不一樣的長度。通常而言,某一個流或許需要長達15天的設定時間,與此同時,另一條流可能只需短至1天的設定時間,即可使業務需求得以滿足。通過新加此項功能,一方面能提升作業穩定性,另一方面則能有效降低運行成本。

高效能Flink SQL最佳化技巧

新增OceanBase連接器

支援作為結果表和維表使用。

OceanBase(公測中)

SLS連接器支援查詢下推

支援在源端進行資料過濾,提升讀取效率。

Log ServiceSLS

SLS Catalog支援結果表

支援使用Catalog進行SLS的寫入。

管理SLS Catalog

ADB PostgreSQL連接器支援ADB PostgreSQL 7.0版本

新增對雲原生資料倉儲AnalyticDB PostgreSQL版7.0版本的支援。

雲原生資料倉儲AnalyticDB PostgreSQL版(ADB PG)

Tair連接器支援更多的資料類型寫入

新增對TairTs、TairCpc、TairRoaring、TairVector和TairGis的支援。

雲原生記憶體資料庫Tair

Paimon升級,並支援Flink CDC寫入Paimon時源表列類型變更應用

Paimon升級到0.5-snapshot版本,並支援了當通過Flink CDC寫入Paimon資料時,如果源表發生了列變更,Paimon可以應用此變更。

重要缺陷修複

  • 修複MySQL源表讀取PolarDB MySQL時出現Filtering update table metadata event: Event{header=EventHeaderV4的問題。

  • 修複使用帶有條件的視窗TVF時無資料輸出的問題。