全部產品
Search
文件中心

Realtime Compute for Apache Flink:安全白皮書

更新時間:Oct 25, 2024

Realtime ComputeFlink版完全相容開源Apache Flink API,從存取控制、網路、儲存、備份恢複、Action Trail等方面,提供全面的安全強化功能來保障您的資料安全。

租戶隔離

支援多租戶的使用情境,通過阿里雲帳號認證體系(認證方式採用AccessKey對稱金鑰認證技術)對使用者的每個HTTP請求進行簽名認證。針對不同使用者資料,進行資料存放區隔離,並將其離散儲存在Distributed File System中。能夠同時滿足多使用者協同、資料共用、資料保密和安全的需要,做到真正的多租戶資源隔離。

存取控制

通過多維度存取控制來保證資料安全。

RAM許可權控制

阿里雲提供存取控制RAM(Resource Access Management),協助您管理不同RAM使用者對Flink資源的操作許可權,並支援資來源目錄成員(包括雲SSO使用者)登入訪問。詳情請參見什麼是存取控制支援的登入方式

專案空間許可權

提供靈活和安全的專案空間許可權管理機制,多個使用者共同使用某專案空間進行作業開發、營運時,支援根據實際業務需求靈活定義角色以及配置細粒度的許可權。詳情請參見專案空間授權

白名單

預設情況下,Flink上下遊存放裝置預設拒絕外部裝置的訪問。因此,您需要在目標存放裝置白名單中添加Flink虛擬交換器的網段。如果您的虛擬交換器和上下遊儲存不在同一可用性區域,添加虛擬交換器網段至白名單後,網路可以連通。詳情請參見網路連通性

Hive Kerberos叢集訪問

Kerberos是一種電腦網路授權協議,用來進行身份認證,以保證通訊的安全性。如果您的Flink作業要訪問的Hive支援了Kerberos,則需要您先在Realtime Compute控制台註冊Hive Kerberos叢集,然後在Flink作業中配置Kerberos叢集資訊,即可訪問支援了Kerberos的Hive,具體操作請參見註冊Hive Kerberos叢集

網路隔離

支援通過專用網路和公網訪問上下遊服務。建議您使用安全性更高的專用網路。同時,支援您在Realtime Compute控制台上管理上下遊服務網域名稱。

Virtual Private Cloud

VPC(Virtual Private Cloud)是私人網路環境,通過底層網路通訊協定,在網路二層完成網路隔離,具備安全可靠、靈活可控、簡單易用的特性和較強的可擴充性。詳情請參見什麼是專用網路

公網(Internet)

可以通過阿里雲提供的NAT Gateway實現VPC網路與公網網路互連,使得Flink通過公網訪問其他上下遊服務(不推薦),詳情請參見網路連通性

網域名稱管理

在Realtime Compute控制台上,您可以管理上下遊服務的網域名稱。

資料加密

密鑰管理

支援在SQL作業的DDL或日誌配置中配置密鑰,避免明文AccessKey帶來的安全風險。具體操作請參見變數管理

備份恢複

提供多種備份方式來保障資料的持久化與可恢複性。

資料備份

採用儲存計算分離架構,使用Object Storage Service來儲存作業系統檢查點、作業快照、日誌和JAR包等資訊。Flink全託管服務會在您選擇的Bucket下建立不同目錄來儲存不同類型的資料,預設儲存時間為7天。更多資訊請參見開通Realtime ComputeFlink版

資料恢複

  • 手動建立作業快照:如果您需要在某個特定時間(作業運行時或者停止時)手動建立一個作業快照,並希望從該快照恢複作業,則可以手動建立作業快照。可用於資料恢複、快速部署業務或資料驗證等情境。

  • 配置定時自動建立作業快照:如果您需要系統可以自動定時建立作業快照,則可以配置作業快照建立周期。儲存該規則後,作業運行過程中,系統會根據此周期來自動建立作業快照,無需您進行手動建立。

  • 從(其他作業)指定快照恢複作業:如果您需要從指定快照恢複作業,則可以指定作業快照,進行作業恢複。

    說明

    支援作業間快照的共用,此時您需要滿足作業間的狀態的相容性。例如,進行雙跑測試。

作業狀態備份

您可以在作業營運頁面,單擊目標作業名稱,在狀態集管理頁簽查看作業狀態集。詳情請參見查看狀態產生總覽

任務快速重啟

當流作業中的某個Task發生異常時,為了保證資料一致性,同一個PipelineRegion的所有Task都會進行Failover。作業Failover後,Source節點需要從上一個系統檢查點開始消費資料。然而,在一些作業中, Task Failover後還需要下載大資源檔或者State資料。如果作業並發很高,所有Task進行一輪Failover的調度時間可能也會比較長。這些都會導致作業出現延遲或阻塞,一段時間內無法正常消費資料等問題,恢複正常運行所需的時間會更長。Task快速重啟配置可以有效緩解上述問題,詳情請參見Task快速重啟配置

同城容災

支援同城(同地區內不同可用性區域之間)災備能力,通過使用跨可用性區域CU類型的專案空間,實現在同城的不同可用性區域進行調度和切換的能力。當單個可用性區域發生故障時,該專案空間下的Flink作業能夠在備可用性區域恢複,從而有效避免因單個可用性區域故障導致服務中斷,確保作業的持久性和高可用性。詳情請參見同城高可用

Action Trail

Action Trail(ActionTrail)可以協助您監控並記錄阿里雲帳號的活動,包括通過阿里雲控制台、OpenAPI、開發人員工具對雲上產品和服務的訪問和使用行為。您可以將這些行為事件下載或儲存到Log ServiceSLS或Object Storage Service,然後進行行為分析、安全分析、資源變更行為追蹤和行為合規性審計等操作。ActionTrail的詳細資料,請參見什麼是Action Trail

本產品已經對接阿里雲Action Trail(ActionTrail),無需付費,您就可以在ActionTrail中擷取資源的操作事件和相關資訊的情境,詳情請參見查看Flink審計事件