本文介紹Lindorm的產品概要。
什麼是雲原生多模資料庫Lindorm
Lindorm是面向物聯網、互連網、車連網等設計和最佳化的雲原生多模超融合資料庫,支援寬表、時序、文本、對象、流、空間等多種資料的統一訪問和融合處理,併兼容SQL、HBase/Cassandra/S3、TSDB、HDFS、Solr、Kafka等多種標準介面和無縫整合三方生態工具,適用於日誌、監控、賬單、廣告、社交、出行、風控等情境,Lindorm也是為阿里巴巴核心業務提供支撐的資料庫之一。
為什麼選擇雲原生多模資料庫Lindorm
業務背景
傳統資料存放區方案需針對結構化、半結構化等不同類型資料採用獨立資料庫(如關係型、時序、Object Storage Service等),導致技術片段化嚴重:技術組件繁雜、選型複雜、資料同步鏈路冗長。這不僅推高技術人員門檻和業務上線周期,還增加故障率與維護成本;更阻礙架構演化(如實現跨可用性區域高可用或全球同步需各組件獨立改造),而5G/IoT等技術普及進一步加劇了"多樣資料需求與儲存架構複雜化"的核心矛盾。
為瞭解決這個問題,阿里雲自研了雲原生多模資料庫Lindorm,滿足多模型資料的統一儲存、查詢和分析需求。如下圖所示,與傳統方案相比,Lindorm系統極大地簡化資料存放區技術架構設計,大幅度提升系統穩定性,降低建設成本投入。
核心能力
Lindorm具備彈性、低成本、簡單易用、開放、穩定等優勢,適合中繼資料、日誌、賬單、標籤、訊息、報表、維表、結果表、Feed流、使用者畫像、裝置資料、監控資料、感應器資料、小檔案、小圖片等資料的儲存和分析,其核心能力包括:
核心能力 | 說明 |
多模超融合 | 支援寬表、時序、對象、文本、隊列、空間等多種資料模型,模型之間資料互融互連,具備資料接入、儲存、檢索、計算、分析等一體化融合處理與服務的能力,協助應用開發更加敏捷、靈活、高效。 |
高性價比 | 支援千萬級高並發吞吐、毫秒級訪問延遲,並通過多級儲存介質、智能冷熱分離、自適應特徵壓縮,大幅減少儲存成本。 |
雲原生彈性 | 支援計算資源、儲存資源獨立Auto Scaling。 |
開放相容 | 相容SQL、HBase/Cassandra/S3、TSDB、HDFS、Solr、Kafka等多種標準介面,支援與Hadoop、Spark、Flink、Kafka等系統無縫打通,並提供簡單易用的資料交換、處理、訂閱等能力。 |
產品架構
Lindorm創新性地使用儲存計算分離、多模共用融合的雲原生架構,以適應雲端運算時代資源解耦和Auto Scaling的訴求。Lindorm以雲原生Distributed File SystemLindormDFS為統一儲存底座,支撐寬表引擎、時序引擎、搜尋引擎、向量引擎、列存引擎等各個垂直專用的多模資料引擎。在多模引擎之上,Lindorm既提供統一的SQL訪問實現跨模型聯集查詢,也提供HBase/Cassandra、OpenTSDB、Spark、HDFS等開源標準介面,保障存量業務無縫遷移。同時,資料通道服務(LTS)即時處理引擎間資料流轉與變更捕獲,實現資料移轉、即時訂閱、數湖轉存、數倉迴流、單元化多活及備份恢複等能力。
多模介紹
Lindorm支援寬表、時序、對象、檔案、隊列、空間等多種資料模型,提供標準SQL和開源介面兩種方式,模型之間資料互融互連,協助應用開發更加敏捷、靈活、高效。多模型的核心能力主要由以下幾巨量資料引擎提供,包括:
資料引擎 | 核心能力 |
寬表引擎 | 負責寬表與對象資料的管理和服務,具備全域二級索引、多維檢索、動態列、TTL等能力,適用於中繼資料、訂單、賬單、畫像、社交、feed流、日誌等情境,相容SQL、HBase、Cassandra(CQL)、S3等標準介面。 支援千萬級高並發吞吐,支援百PB級儲存,吞吐效能是開源HBase(Apache HBase)的3~7倍,P99時延為開源HBase(Apache HBase)的1/10,平均故障恢復相比開源HBase(Apache HBase)提升10倍,支援冷熱分離,壓縮率比開源HBase(Apache HBase)提升一倍,綜合儲存成本為開源HBase(Apache HBase)的1/2。 |
時序引擎 | 負責時序資料的管理和服務,主要面向工業、IoT、監控等領域的量測資料、監控資料以及裝置運行資料提供基於SQL的管理、寫入、查詢能力。針對時序資料設計的壓縮演算法,壓縮率可達10:1。支援海量資料的多維查詢和彙總計算,提供原生PromQL查詢能力,同時也支援時序資料的預降採樣和持續查詢。 |
搜尋引擎 | 負責多模資料的檢索分析加速,其基於列存、倒排等核心技術,具備全文檢索索引、彙總計算、複雜多維查詢等能力,適用於日誌、賬單、畫像等情境,相容SQL、開源Solr等標準介面。 |
計算引擎 | 計算引擎與Lindorm儲存引擎深度融合,雲端式原生架構提供的分散式運算服務,資源歸屬於使用者,滿足使用者在資料生產、互動式分析、機器學習和圖計算等情境的計算需求,相容開源Spark標準介面。 |
向量引擎 | Lindorm向量引擎提供面向海量向量資料的儲存、索引和檢索服務,支援多種索引演算法和距離函數,並支援豐富的融合檢索方式。向量引擎不僅可以為大模型RAG系統提供必需的全文-向量融合檢索能力,進一步提升大模型回答準確度,同時還適用於推薦、NLP服務、智能問答等多種AI業務情境。 |
列存引擎 | Lindorm列存引擎是一款高效能、低成本、穩定可靠的線上列存資料庫引擎服務,面向IoT、車連網、日誌等情境,提供高效讀寫、高壓縮比儲存、高效能線上分析等能力。 |
AI引擎 | Lindorm AI引擎資源歸屬於使用者,為使用者提供了一站式整合AI推理能力,支援通過Lindorm SQL靈活匯入並部署預訓練模型,對海量多模資料進行智能分析和處理。 |