PolarSearch是PolarDB基於OpenSearch研發的高效能分布式資料檢索與分析引擎,相容Elasticsearch、OpenSearch生態。您無需手動將PolarDB中的資料同步至其他資料檢索平台,便可直接通過API或SDK進行文字文件、圖片特徵、日誌等多模態資料的毫秒級全文檢索索引、向量檢索與智能分析。
藉助PolarSearch,您可以進行:
全文檢索索引 | 向量檢索 |
技術架構
PolarSearch基於PolarStore分布式共用儲存和雲原生計算儲存分離架構,深度融合自主研發的智能搜尋引擎與分散式運算架構,併兼容Elasticsearch DSL文法協議。致力于海量PB級異構資料的儲存、分析及多路融合即時檢索,協助您快速構建高並發、高可用的資料搜尋服務,從而釋放資料的價值。
產品價值
效率提升:無需手工搭建MySQL到檢索引擎的資料同步鏈路,檢索類
workload耗時從分鐘級降至毫秒級,開發週期縮短50%。成本最佳化:替代傳統“資料庫+檔案儲存體+計算引擎”多引擎、多系統架構,基於PFS多層級分布式共用儲存,TCO資源消耗降低40%。
業務創新:依託非結構化資料存放區與挖掘、AI向量檢索等能力,構建智能推薦、RAG知識庫、Agent記憶庫等AI infra基礎設施。
適用情境
電商內容平台與SaaS服務
商品標題/詳情頁的模糊搜尋、語義匹配、個人化推薦。
使用者評論、UGC內容的即時關鍵詞分析與情感挖掘。
企業RAG知識庫與文件管理
PDF、Word等文檔內容的全文檢索索引與文檔召回。
圖片特徵向量化儲存,支援相似圖片搜尋。
Agent記憶庫與智能體資料管理
短期記憶:如目前的交談的上下文內容、會話上下文資訊、臨時變數等。
長期記憶:儲存使用者偏好、歷史查詢內容、LLM參數等長期互動資料。
日誌分析與營運監控
PB級日誌資料的即時檢索、彙總統計與異常警示。
多維度日誌欄位的關聯分析與可視化報表產生。
物聯網與即時IoT資料流
IoT裝置時序資料的海量並發寫入與快速檢索。
感應器資料流的多條件過濾與動態彙總。
核心特性
高可用與彈性擴充
分布式架構自動負載平衡,單節點故障無感知切換,服務可用性達99.99%。
支援線上動態擴容,儲存與計算資源按需擴充,輕鬆應對億級資料量。
智能搜尋引擎
支援針對PolarDB RW節點中InnoDB主表資料建立倒排二級索引,提供事務級可見度。
支援對InnoDB主表資料的全文檢索索引請求基於最佳化器識別並自動轉寄至搜尋節點完成檢索。
支援文本分詞、語義向量化、數值範圍等多維度混合索引,提升查詢效率10倍以上。
內建中文NLP增強模型,實現同義字擴充、拼音錯誤修正、意圖識別等進階功能。
多模態資料融合
支援標量正排、全文倒排、向量等多種資料類型的統一儲存與多路融合檢索。
提供海量異構非結構化資料(如圖片、文檔)的儲存、提取與內容解析外掛程式。
即時檢索與彙總分析
資料寫入後百毫秒內可檢索,支援複雜條件過濾、分桶統計及Top-K排序等操作。
內建時序資料滾動視窗計算、地理位置圍欄判斷等情境化函數。