本文介紹HBase的優勢。
類別 | ApsaraDB for HBase增強版(Lindorm) | HBase開源版 | |
核心功能 | HBase API | 支援 | 支援 |
資料模型 | 支援寬列(HBase API)、表格(SQL-Like API)、隊列等多種,對其他模型感興趣的話,請聯絡我們。 | 僅支援寬列 | |
全域二級索引 | 內建,查詢透明、高效能、按需冗餘非索引列,請參見二級索引。 | 依賴外部組件,複雜。 | |
全文檢索索引 | 智能整合搜尋引擎Solr,提供面向海量資料的儲存、多維查詢、全文索引等統一訪問的混合型能力,請參見全文索引服務。 | 不支援 | |
效能 | 吞吐效能 | 單機吞吐是開源HBase的7倍,請參見測試結果。 | 無最佳化 |
請求毛刺 | P99延遲是開源HBase的1/10,請參見測試結果。 | 無最佳化 | |
成本 | 資料壓縮 | 深度最佳化的ZSTD演算法,JNA重寫,可杜絕Core dump,並且基於字典採樣最佳化,壓縮率比snappy提高50%,資料壓縮比可高達10:1。 | 預設為Snappy,使用ZSTD需依賴Hadoop-3.0,存在Core Dump的機率。 |
編碼 | IndexableDelta演算法,相比DIFF演算法,保持相同壓縮率,訪問速度快一倍。 | 推薦DIFF,隨機訪問較慢。 | |
冷熱分離 | 冷熱資料自動階層式存放區,冷資料使用高壓縮和廉價儲存介質,減少70%成本,熱資料可提升訪問效能15%,請參見冷熱分離。 | 不支援 | |
儲存介質 | 支援高效雲端硬碟、SSD雲端硬碟、本地HDD、本地SSD。支援冷儲存(OSS)、容量型雲端硬碟(超性價比雲端硬碟,即將發布)。 | N/A | |
可靠性 | 主備雙活 | 成熟,支援自動容災切換、雙叢集請求並發等進階能力,支援與自建HBase構建混合主備。 | 無最佳化,不支援切換。 |
備份恢複 | 支援100TB+規模的資料備份至OSS,並提供與規模無關的RTO(<30分鐘)、按需備份、指定時間點恢複等進階能力,請參見開通備份恢複。 | 不支援 | |
MTTR | 深度最佳化,宕機恢複速度是開源HBase的10倍。 | 不支援 | |
多租戶 | 認證與ACL | 支援易用的帳號密碼認證和ACL管理,請參見使用者和ACL許可權管理。 | 較複雜 |
資源隔離 | 支援RS Group功能,實現租戶間的資源物理隔離。 | 不支援 | |
營運診斷 | 營運工具 | 介面化叢集管理工具,支援表,Namespace,Group,ACL等管理,請參見叢集管理系統。 | HBase Shell |
資料查詢 | HBase Shell+叢集管理系統內支援圖形化SQL互動查詢,請參見資料查詢。 | HBase Shell | |
生態 | 資料搬遷 | 支援HBase各個版本之間的線上、跨版本、自動化、高效搬遷,應用零影響、零改造,請參見LTS(原BDS)服務介紹。 | 只能離線遷移 |
MySQL資料同步 | 請參見LTS(原BDS)服務介紹,支援MySQL資料到HBase的全量同步、線上即時同步。 | 藉助工具、不支援線上增量。 | |
Spark分析 | 產品化深度整合,支援Spark SQL分析HBase,HBase資料到Spark(HDFS/OSS)的增量歸檔,離線分析結果迴流到HBase等。 | 無最佳化,Data Integration需要較大開發。 | |
MaxCompute | 產品化整合,請參見全量匯出MaxCompute。 | Data Integration需要較大開發。 | |
Log Service(SLS) | 請參見LTS(原BDS)服務介紹,支援SLS資料到HBase的Log Service(SLS)增量匯入。 | Data Integration需要較大開發。 | |
服務能力 | 可用性SLA | 提供SLA保障,單叢集99.9%,雙叢集高可用99.95%。 | N/A |
營運成本 | 全託管,無需複雜的資料庫營運投入。 | N/A | |
技術團隊 | 由多名Apache社區PMC&Committer組成的專家隊伍提供技術服務支援。 | N/A | |
實踐經驗 | 支援9年天貓雙十一,阿里部署上萬台。 | N/A |