ApsaraDB for HBase的預資料分割函數可以協助您合理的設計Rowkey,從而避免出現資料熱點現象。本文介紹如何為HBase表設定預分區。
設定方法
為HBase表test設定預分區,建立表格的語句如下樣本,樣本中欄位的描述如下表。
create'test',{NAME => 'f1',COMPRESSION => 'snappy' }, { NUMREGIONS => 50, SPLITALGO => 'HexStringSplit' }
欄位 | 描述 |
NAME | HBase表的列族名稱。 |
COMPRESSION | HBase表的資料壓縮格式,具體請參見資料壓縮與編碼。 |
NUMREGIONS | 表示Region的個數,一般按照每個Region使用6~8 GB的儲存量來計算Region數量。如果叢集規模大,Region數量可以設定多。 |
SPLITALGO | 表示Rowkey分割的演算法。ApsaraDB for HBase內建了三種分隔演算法,每個分割演算法的適用情境如下描述:
關於Rowkey的設計方法,請參見如何設計Rowkey。 |