本文介紹Lindorm的產品概要。
產品介紹
Lindorm是面向物聯網、互連網、車連網等設計和最佳化的雲原生多模超融合資料庫,支援寬表、時序、文本、對象、流、空間等多種資料的統一訪問和融合處理,併兼容SQL、HBase/Cassandra/S3、TSDB、HDFS、Solr、Kafka等多種標準介面和無縫整合三方生態工具,適用於日誌、監控、賬單、廣告、社交、出行、風控等情境,Lindorm也是為阿里巴巴核心業務提供支撐的資料庫之一。
Lindorm基於儲存計算分離、多模共用融合的雲原生架構,具備彈性、低成本、簡單易用、開放、穩定等優勢,適合中繼資料、日誌、賬單、標籤、訊息、報表、維表、結果表、Feed流、使用者畫像、裝置資料、監控資料、感應器資料、小檔案、小圖片等資料的儲存和分析,其核心能力包括:
核心能力 | 說明 |
多模超融合 | 支援寬表、時序、對象、文本、隊列、空間等多種資料模型,模型之間資料互融互連,具備資料接入、儲存、檢索、計算、分析等一體化融合處理與服務的能力,協助應用開發更加敏捷、靈活、高效。 |
高性價比 | 支援千萬級高並發吞吐、毫秒級訪問延遲,並通過多級儲存介質、智能冷熱分離、自適應特徵壓縮,大幅減少儲存成本。 |
雲原生彈性 | 支援計算資源、儲存資源獨立Auto Scaling。 |
開放相容 | 相容SQL、HBase/Cassandra/S3、TSDB、HDFS、Solr、Kafka等多種標準介面,支援與Hadoop、Spark、Flink、Kafka等系統無縫打通,並提供簡單易用的資料交換、處理、訂閱等能力。 |
多模介紹
Lindorm支援寬表、時序、對象、檔案、隊列、空間等多種資料模型,提供標準SQL和開源介面兩種方式,模型之間資料互融互連,協助應用開發更加敏捷、靈活、高效。多模型的核心能力主要由以下幾巨量資料引擎提供,包括:
資料引擎 | 核心能力 |
寬表引擎 | 負責寬表與對象資料的管理和服務,具備全域二級索引、多維檢索、動態列、TTL等能力,適用於中繼資料、訂單、賬單、畫像、社交、feed流、日誌等情境,相容SQL、HBase、Cassandra(CQL)、S3等標準介面。 支援千萬級高並發吞吐,支援百PB級儲存,吞吐效能是開源HBase(Apache HBase)的3~7倍,P99時延為開源HBase(Apache HBase)的1/10,平均故障恢復相比開源HBase(Apache HBase)提升10倍,支援冷熱分離,壓縮率比開源HBase(Apache HBase)提升一倍,綜合儲存成本為開源HBase(Apache HBase)的1/2。 |
時序引擎 | 負責時序資料的管理和服務,主要面向工業、IoT、監控等領域的量測資料、監控資料以及裝置運行資料提供基於SQL的管理、寫入、查詢能力。針對時序資料設計的壓縮演算法,壓縮率可達10:1。支援海量資料的多維查詢和彙總計算,同時也支援時序資料的預降採樣和持續查詢。 |
搜尋引擎 | 負責多模資料的檢索分析加速,其基於列存、倒排等核心技術,具備全文檢索索引、彙總計算、複雜多維查詢等能力,適用於日誌、賬單、畫像等情境,相容SQL、開源Solr等標準介面。 |
計算引擎 | 計算引擎與Lindorm儲存引擎深度融合,雲端式原生架構提供的分散式運算服務,資源歸屬於使用者,滿足使用者在資料生產、互動式分析、機器學習和圖計算等情境的計算需求,相容開源Spark標準介面。 |
向量引擎 | Lindorm向量引擎提供面向海量向量資料的儲存、索引和檢索服務,支援多種索引演算法和距離函數,並支援豐富的融合檢索方式。向量引擎不僅可以為大模型RAG系統提供必需的全文-向量融合檢索能力,進一步提升大模型回答準確度,同時還適用於推薦、NLP服務、智能問答等多種AI業務情境。 |
AI引擎 | Lindorm AI引擎資源歸屬於使用者,為使用者提供了一站式整合AI推理能力,支援通過Lindorm SQL靈活匯入並部署預訓練模型,對海量多模資料進行智能分析和處理。 |