全文索引Search服務用來解決複雜的多維查詢和全文檢索索引。
警告 HBase增強版的全文索引特性目前處於關閉狀態,相關能力已全面遷移到Lindorm中,更強大、更成熟、更好用。
Solr是構建在Apache Lucene上的企業級搜尋平台,是分布式全文檢索索引的最佳實務之一,支援各種複雜的條件查詢和全文檢索索引,具有廣泛的使用者基礎。通過深度融合HBase與Solr,我們推出了既能滿足巨量資料海量儲存,又可以支援複雜多維查詢和全文檢索索引的Search服務。
Search服務適用於:需要儲存海量資料,並且需要各種條件組合查詢的業務。例如:
- 物流情境,需要儲存大量軌跡物流資訊,並需根據任意多個欄位組合查詢。
- 交通監控情境,儲存大量過車記錄,同時會根據車輛資訊任意條件組合檢索出感興趣的記錄。
- 網站會員、商品資訊檢索情境,一般儲存大量的商品/會員資訊,並需要根據少量條件進行複雜且任意的查詢,以滿足網站使用者任意搜尋需求等。
Search服務的整體資料流如上圖,資料寫入HBase後,BDS負責將資料即時同步到Solr中。在此架構下,HBase服務、資料同步通道BDS和Solr都是以獨立叢集的方式存在,您可以分別對各個叢集進行管理:如果Solr處理能力不足,只需要擴容Solr叢集;如果BDS同步能力不足,可以單獨擴容BDS。HBase/BDS/Solr可以針對不同的使用情境選擇不同的機型,獨立的部署形態大幅提升了系統的穩定性。
與二級索引的區別
HBase增強版提供二級索引,可以低成本的解決非主鍵查詢問題,適用於查詢列比較固定的情境。如果業務情境需要複雜的多維組合查詢,需要考慮使用Search服務。
與開源Solr的區別
Search服務深度融合HBase和Solr,使用者無需關注各個服務的運行,只需要通過簡單的API/Shell操作就可以將HBase與Solr建立關聯。
Search服務基於開源Solr深度定製,完全相容開源Solr API,在系統穩定性、讀寫效能、監控警示上做了大量工作,提供更加可靠、高效能的企業級搜尋平台。
服務開通
開通Search服務需要三步:
- 建立增強版HBase叢集;
- 建立BDS叢集;
- HBase叢集建立成功後,在HBase控制台頁面單擊
全文索引
,完成Search執行個體的購買和關聯。
具體參見開通指南。
使用指南
最佳實務
參見最佳實務。