表格存储(Tablestore)是阿里云自研的结构化数据存储,提供海量结构化数据存储以及快速的查询和分析服务。表格存储提供兼容HBase的WideColumn模型、消息模型Timeline以及时空模型Timestream,实现PB级存储、千万TPS以及毫秒级延迟的服务能力。

适用场景

表格存储单表支持PB级存储、千万QPS,以及多种索引方式(全局二级索引、全文索引、倒排索引以及时空索引),被广泛用于社交互联网、物联网、人工智能、元数据和大数据等领域结构化数据业务场景。

  • 元数据

    用户存储海量的文档、媒体文件等数据的同时,对文件元数据的存储和分析不可或缺。此外,电商的订单、银行流水、运营商话费账单也需要存储及分析大量的元数据。表格存储可以帮助您实现高效的元数据管理。

  • 消息数据

    表格存储自研的Timeline模型主要用于消息数据,能够抽象出支撑海量Topic的轻量级消息队列,可以存储大量社交信息,包括IM聊天,以及评论、跟帖和点赞等Feed流信息。目前表格存储Timeline模型已被应用在众多IM系统中,例如支撑钉钉海量消息同步等。

  • 轨迹溯源

    表格存储提供了面向轨迹类场景的Timestream模型,帮助您管理和分析跑步、骑行、健走、外卖等轨迹数据。

  • 科学大数据

    多维网格数据是一种科学大数据,在地球科学领域(气象、海洋、地质、地形等)应用非常广泛,且数据规模也越来越大。相关的科学工作者有快速浏览数据的需求以及在线查询的需求,查询种类丰富、延迟要求高。表格存储可以解决科学大数据的海量存储规模和查询性能问题。

  • 互联网大数据

    互联网各类电商平台以及咨讯平台的产品设计者需要汇总统计和分析各类平台的数据做为依据,决定后续的产品发展,公司的公关和市场部门也需要根据舆情作出相应的及时处理。表格存储可以帮助您实现百亿级互联网舆情存储及分析。

  • 物联网

    表格存储可以满足IoT设备、监控系统等时序数据的存储需求,大数据分析SQL直读以及高效的增量流式读接口让数据完成离线分析与实时流计算。

性能

表格存储单表提供10 PB级数据量、万亿条记录数、千万级别的TPS以及毫秒级延迟的服务能力,支持自动负载均衡及热点迁移,无需人工运维,提供高吞吐写入能力以及稳定可预期的读写性能。详情请参见表格存储性能白皮书

数据持久性和服务可用性

表格存储将数据的多个备份存储在不同机架的不同机器上,并会在备份失效时进行快速恢复,根据99.99%的高可用以及99.999999999(11个9)的可靠性标准设计。

扩展性和弹性

表格存储通过数据分片和负载均衡技术,实现了存储无缝扩展。随着表数据量的不断增大,表格存储会进行数据分区的调整从而为该表配置更多的存储。表格存储可支持不少于10 PB数据存储量,单表可支持不少于1 PB数据存储量或1万亿条记录。

安全性

表格存储提供表级别和API级别的鉴权和授权机制,支持STS临时授权和自定义权限认证及主子账号功能,实现用户级别资源隔离。详情请参见RAM 和 STS 介绍。表格存储支持互联网、ECS内网及VPC私有网络访问,提供网络访问控制功能。

接口

表格存储提供标准的RESTful API接口,开发者一般使用工具或封装了API接口的SDK来开发应用。表格存储目前提供包括Java、Python、PHP、Go在内的多种开发语言SDK命令行工具CLI提供简洁、方便的管理命令,包括实例操作、表操作、数据操作等,支持Windows、Linux、Mac平台。

表格存储管理控制台提供实例、数据表、多元索引的创建,基本的数据读写操作,以及实例和表级别的访问监控数据(QPS、延时、请求数等)。

费用模型

使用表格存储,您可以按实际使用量付费,先使用,后付费,以较低的成本满足访问波动明显大并发低延时的需要。您也可以通过包年包月的方式,预先购买资源包,之后使用资源时,扣除相应的额度。表格存储是按使用量计费的服务,计费项包括数据存储量、读吞吐量、写吞吐量、外网下行流量,如果使用多元索引和全局二级索引,也会产生相应的费用。详情请参见计费概述