本文介绍云原生多模数据库 Lindorm的产品概要。
产品介绍
Lindorm是面向物联网、互联网、车联网等设计和优化的云原生多模超融合数据库,支持宽表、时序、文本、对象、流、空间等多种数据的统一访问和融合处理,并兼容SQL、HBase/Cassandra/S3、TSDB、HDFS、Solr、Kafka等多种标准接口和无缝集成三方生态工具,适用于日志、监控、账单、广告、社交、出行、风控等场景,Lindorm也是为阿里巴巴核心业务提供支撑的数据库之一。
Lindorm基于存储计算分离、多模共享融合的云原生架构,具备弹性、低成本、简单易用、开放、稳定等优势,适合元数据、日志、账单、标签、消息、报表、维表、结果表、Feed流、用户画像、设备数据、监控数据、传感器数据、小文件、小图片等数据的存储和分析,其核心能力包括:
核心能力 | 说明 |
多模超融合 | 支持宽表、时序、对象、文本、队列、空间等多种数据模型,模型之间数据互融互通,具备数据接入、存储、检索、计算、分析等一体化融合处理与服务的能力,帮助应用开发更加敏捷、灵活、高效。 |
高性价比 | 支持千万级高并发吞吐、毫秒级访问延迟,并通过多级存储介质、智能冷热分离、自适应特征压缩,大幅减少存储成本。 |
云原生弹性 | 支持计算资源、存储资源独立弹性伸缩。 |
开放兼容 | 兼容SQL、HBase/Cassandra/S3、TSDB、HDFS、Solr、Kafka等多种标准接口,支持与Hadoop、Spark、Flink、Kafka等系统无缝打通,并提供简单易用的数据交换、处理、订阅等能力。 |
多模介绍
Lindorm支持宽表、时序、对象、文件、队列、空间等多种数据模型,提供标准SQL和开源接口两种方式,模型之间数据互融互通,帮助应用开发更加敏捷、灵活、高效。多模型的核心能力主要由以下几大数据引擎提供,包括:
数据引擎 | 核心能力 |
宽表引擎 | 负责宽表与对象数据的管理和服务,具备全局二级索引、多维检索、动态列、TTL等能力,适用于元数据、订单、账单、画像、社交、feed流、日志等场景,兼容SQL、HBase、Cassandra(CQL)、S3等标准接口。 支持千万级高并发吞吐,支持百PB级存储,吞吐性能是开源HBase(Apache HBase)的3~7倍,P99时延为开源HBase(Apache HBase)的1/10,平均故障恢复时间相比开源HBase(Apache HBase)提升10倍,支持冷热分离,压缩率比开源HBase(Apache HBase)提升一倍,综合存储成本为开源HBase(Apache HBase)的1/2。 |
时序引擎 | 负责时序数据的管理和服务,主要面向工业、IoT、监控等领域的量测数据、监控数据以及设备运行数据提供基于SQL的管理、写入、查询能力。针对时序数据设计的压缩算法,压缩率可达10:1。支持海量数据的多维查询和聚合计算,同时也支持时序数据的预降采样和持续查询。 |
搜索引擎 | 负责多模数据的检索分析加速,其基于列存、倒排等核心技术,具备全文检索、聚合计算、复杂多维查询等能力,适用于日志、账单、画像等场景,兼容SQL、开源Solr等标准接口。 |
计算引擎 | 计算引擎与Lindorm存储引擎深度融合,基于云原生架构提供的分布式计算服务,资源归属于用户,满足用户在数据生产、交互式分析、机器学习和图计算等场景的计算需求,兼容开源Spark标准接口。 |
向量引擎 | 云原生多模数据库 Lindorm向量引擎提供面向海量向量数据的存储、索引和检索服务,支持多种索引算法和距离函数,并支持丰富的融合检索方式。向量引擎不仅可以为大模型RAG系统提供必需的全文-向量融合检索能力,进一步提升大模型回答准确度,同时还适用于推荐、NLP服务、智能问答等多种AI业务场景。 |
AI引擎 | 云原生多模数据库 Lindorm AI引擎资源归属于用户,为用户提供了一站式集成AI推理能力,支持通过Lindorm SQL灵活导入并部署预训练模型,对海量多模数据进行智能分析和处理。 |