阿里雲雲端硬碟三副本技術通過Distributed File System為Elastic Compute Service提供穩定、高效、可靠的資料隨機訪問能力,為ECS執行個體實現99.9999999%的資料可靠性保證。本文介紹三副本的概念及原理。
三副本介紹
您對雲端硬碟的讀寫最終都會被映射為對阿里雲資料存放區平台上的檔案的讀寫。阿里雲提供了一個扁平的線性儲存空間,在內部會對線性地址進行切片,一個分區稱為一個Chunk(中文含義為塊)。每一個Chunk,阿里雲都會複製成三個副本,並將這些副本按照一定的策略存放在儲存叢集中的不同資料節點上,保證資料的可靠性。
對雲端硬碟上的資料而言,無論是新增、修改還是刪除資料,所有使用者層的讀寫操作都會同步到底層的三份副本上。這種三副本模式,能夠保障您資料的可靠性和一致性。
三副本原理
在阿里雲資料存放區平台中,有三類角色,分別為Master、Chunk Server和Client。您的一個寫操作最終由Client執行,執行過程簡要說明如下:
Client收到寫操作請求,並計算出寫操作對應的Chunk。
Client向Master查詢該Chunk的三份副本存放的資料節點(即Chunk Server)。
Client根據Master返回的結果,向這三個Chunk Server發出寫請求。
如果三份都寫成功,Client返回成功,反之則Client返回失敗。
為防止由於一個Chunk Server或一個機架的故障導致資料不可用,Master會保證三份副本分布在不同機架下的不同Chunk Server上。因此,Master的分布策略中會綜合考慮資料存放區平台中所有Chunk Server的硬碟使用方式、交換器的分布情況、電源供電情況和節點負載情況等。
資料保護機制
當有資料節點損壞,或者某個資料節點上的部分硬碟發生故障時,叢集中部分Chunk的有效副本數就會小於三。此時,Master就會發起自動同步任務,在Chunk Server之間複製資料,使叢集中所有Chunk的有效副本數達到三份。
如果ECS執行個體由於病毒感染、人為誤刪除或駭客入侵等非封鎖性失敗原因造成資料丟失,需要您採用備份或者快照等技術手段來解決。任何技術都不可能解決全部問題,因地制宜地選擇合適的資料保護措施,才能為您的業務資料築起一道堅實的防線。更多有關快照的詳情,請參見快照概述。