雲原生多模資料庫Lindorm - Lindorm

本文介紹Lindorm的產品概要。

什麼是雲原生多模資料庫Lindorm

Lindorm是面向物聯網、互連網、車連網等設計和最佳化的雲原生多模超融合資料庫，支援寬表、時序、文本、對象、流、空間等多種資料的統一訪問和融合處理，併兼容SQL、HBase/Cassandra/S3、TSDB、HDFS、Solr、Kafka等多種標準介面和無縫整合三方生態工具，適用於日誌、監控、賬單、廣告、社交、出行、風控等情境，Lindorm也是為阿里巴巴核心業務提供支撐的資料庫之一。

為什麼選擇雲原生多模資料庫Lindorm

業務背景

傳統資料存放區方案需針對結構化、半結構化等不同類型資料採用獨立資料庫（如關係型、時序、Object Storage Service等），導致技術片段化嚴重：技術組件繁雜、選型複雜、資料同步鏈路冗長。這不僅推高技術人員門檻和業務上線周期，還增加故障率與維護成本；更阻礙架構演化（如實現跨可用性區域高可用或全球同步需各組件獨立改造），而5G/IoT等技術普及進一步加劇了"多樣資料需求與儲存架構複雜化"的核心矛盾。

為瞭解決這個問題，阿里雲自研了雲原生多模資料庫Lindorm，滿足多模型資料的統一儲存、查詢和分析需求。如下圖所示，與傳統方案相比，Lindorm系統極大地簡化資料存放區技術架構設計，大幅度提升系統穩定性，降低建設成本投入。

核心能力

Lindorm具備彈性、低成本、簡單易用、開放、穩定等優勢，適合中繼資料、日誌、賬單、標籤、訊息、報表、維表、結果表、Feed流、使用者畫像、裝置資料、監控資料、感應器資料、小檔案、小圖片等資料的儲存和分析，其核心能力包括：

核心能力	說明
多模超融合	支援寬表、時序、對象、文本、隊列、空間等多種資料模型，模型之間資料互融互連，具備資料接入、儲存、檢索、計算、分析等一體化融合處理與服務的能力，協助應用開發更加敏捷、靈活、高效。
高性價比	支援千萬級高並發吞吐、毫秒級訪問延遲，並通過多級儲存介質、智能冷熱分離、自適應特徵壓縮，大幅減少儲存成本。
雲原生彈性	支援計算資源、儲存資源獨立Auto Scaling。
開放相容	相容SQL、HBase/Cassandra/S3、TSDB、HDFS、Solr、Kafka等多種標準介面，支援與Hadoop、Spark、Flink、Kafka等系統無縫打通，並提供簡單易用的資料交換、處理、訂閱等能力。

更多詳情請參見功能特性和產品優勢。

產品架構

Lindorm創新性地使用儲存計算分離、多模共用融合的雲原生架構，以適應雲端運算時代資源解耦和Auto Scaling的訴求。Lindorm以雲原生Distributed File SystemLindormDFS為統一儲存底座，支撐寬表引擎、時序引擎、搜尋引擎、向量引擎、列存引擎等各個垂直專用的多模資料引擎。在多模引擎之上，Lindorm既提供統一的SQL訪問實現跨模型聯集查詢，也提供HBase/Cassandra、OpenTSDB、Spark、HDFS等開源標準介面，保障存量業務無縫遷移。同時，資料通道服務（LTS）即時處理引擎間資料流轉與變更捕獲，實現資料移轉、即時訂閱、數湖轉存、數倉迴流、單元化多活及備份恢複等能力。

多模介紹

Lindorm支援寬表、時序、對象、檔案、隊列、空間等多種資料模型，提供標準SQL和開源介面兩種方式，模型之間資料互融互連，協助應用開發更加敏捷、靈活、高效。多模型的核心能力主要由以下幾巨量資料引擎提供，包括：

資料引擎	核心能力
寬表引擎	負責寬表與對象資料的管理和服務，具備全域二級索引、多維檢索、動態列、TTL等能力，適用於中繼資料、訂單、賬單、畫像、社交、feed流、日誌等情境，相容SQL、HBase、Cassandra（CQL）、S3等標準介面。支援千萬級高並發吞吐，支援百PB級儲存，吞吐效能是開源HBase（Apache HBase）的3~7倍，P99時延為開源HBase（Apache HBase）的1/10，平均故障恢復相比開源HBase（Apache HBase）提升10倍，支援冷熱分離，壓縮率比開源HBase（Apache HBase）提升一倍，綜合儲存成本為開源HBase（Apache HBase）的1/2。
時序引擎	負責時序資料的管理和服務，主要面向工業、IoT、監控等領域的量測資料、監控資料以及裝置運行資料提供基於SQL的管理、寫入、查詢能力。針對時序資料設計的壓縮演算法，壓縮率可達10:1。支援海量資料的多維查詢和彙總計算，提供原生PromQL查詢能力，同時也支援時序資料的預降採樣和持續查詢。
搜尋引擎	負責多模資料的檢索分析加速，其基於列存、倒排等核心技術，具備全文檢索索引、彙總計算、複雜多維查詢等能力，適用於日誌、賬單、畫像等情境，相容SQL、開源Solr等標準介面。
計算引擎	計算引擎與Lindorm儲存引擎深度融合，雲端式原生架構提供的分散式運算服務，資源歸屬於使用者，滿足使用者在資料生產、互動式分析、機器學習和圖計算等情境的計算需求，相容開源Spark標準介面。
向量引擎	Lindorm向量引擎提供面向海量向量資料的儲存、索引和檢索服務，支援多種索引演算法和距離函數，並支援豐富的融合檢索方式。向量引擎不僅可以為大模型RAG系統提供必需的全文-向量融合檢索能力，進一步提升大模型回答準確度，同時還適用於推薦、NLP服務、智能問答等多種AI業務情境。
列存引擎	Lindorm列存引擎是一款高效能、低成本、穩定可靠的線上列存資料庫引擎服務，面向IoT、車連網、日誌等情境，提供高效讀寫、高壓縮比儲存、高效能線上分析等能力。
AI引擎	Lindorm AI引擎資源歸屬於使用者，為使用者提供了一站式整合AI推理能力，支援通過Lindorm SQL靈活匯入並部署預訓練模型，對海量多模資料進行智能分析和處理。