数据存储
功能集 |
功能 |
功能描述 |
参考文档 |
元数据存储 |
宽表模型 |
宽表模型(WideColumn)是类Bigtable/HBase模型,可应用于元数据、大数据等多种场景。宽表模型通过数据表存储数据,单表支持PB级数据存储和千万QPS。数据表具有Schema-Free、宽行、多版本数据以及生命周期管理特点,支持主键列自增、局部事务、原子计数器、过滤器、条件更新等功能。 |
|
多元索引 |
多元索引(Search Index)基于倒排索引和列式存储,可以解决大数据的多维查询和统计分析难题。当日常业务中有非主键列查询、多列组合查询、模糊查询等多维查询需求以及求最值、统计行数、数据分组等数据分析需求时,您可以将这些属性作为多元索引中的字段并使用多元索引查询与分析数据。 |
||
消息模型 |
消息(Timeline)模型是针对消息数据场景所设计的,能够满足消息数据场景对消息保序、海量消息存储、实时同步的业务需求,同时支持全文检索与多维度组合查询。适用于IM、Feed流等消息场景。 |
||
物联网存储 |
时序模型 |
表格存储的时序模型是针对时间序列数据的特点进行设计,适用于物联网设备监控、设备采集数据、机器监控数据等场景,支持自动构建时序元数据索引、丰富的时序查询能力等功能。时序模型通过时序表存储时间序列数据,能提供高并发写入和查询以及PB级海量数据的低成本存储。您还可以通过SQL查询与分析时序数据。 |
|
SQL查询 |
数据映射 |
使用过程时请确保SQL中和数据表中字段数据类型相匹配。 |
SQL数据类型映射 |
DDL |
表格存储支持的DDL操作,包括创建表的映射关系、创建多元索引的映射关系、更新映射表属性列、删除映射关系和查询表的描述信息的操作。 |
DDL操作 | |
DQL |
表格存储支持的DQL操作,包括查询数据、聚合数据、全文检索、多元索引数组和嵌套类型查询、多元索引虚拟列、Join等操作。 |
DQL操作 | |
Database Administration |
表格存储支持的Database Administration操作 ,包括查询索引描述信息和列出表名称列表的操作。 |
Database Administration | |
查询优化 |
SQL查询时支持通过索引选择和计算下推实现数据查询加速。您可以通过显式访问二级索引表进行索引查询。对于多元索引,表格存储提供了自动多元索引选择策略和显式访问多元索引两种方式。 多元索引提供了条件过滤、聚合、排序等功能,在创建多元索引后,系统能够充分利用多元索引的计算能力,将部分SQL计算任务下推到多元索引执行,避免全表扫描,提高计算效率。 |
查询优化 |
数据管理能力
功能集 |
功能 |
功能描述 |
参考文档 |
数据管理 |
数据版本 |
最大版本数(Max Versions)表示数据表中的属性列能够保留数据的最大版本个数。当属性列中数据的版本个数超过设置的最大版本数时,系统会自动异步删除较早版本的数据。 为数据表配置最大版本数后,当您每次更新属性列的值时,表格存储均会为该值生成一个新版本,版本的值即为版本号(时间戳),单位为毫秒。 |
最大版本数 |
生命周期管理 |
数据生命周期是数据表的一个属性,即数据的保存时间,单位为秒。当属性列中数据的保留时间超过设置的TTL时,系统会自动异步清理超过该属性列的数据。如果一行中所有属性列中数据的保留时间均超过了TTL,则系统会自动异步清理该行数据。 |
数据生命周期 |
安全合规
功能集 |
功能 |
功能描述 |
参考文档 |
访问控制 |
身份管理 |
为确保您的阿里云账号及云资源使用安全,如非必要都应避免直接使用阿里云账号(即主账号)来访问表格存储。推荐的做法是使用RAM身份(即RAM用户和RAM角色)来访问表格存储。 |
- |
STS管理 |
相对于RAM提供的长效控制机制,STS提供的是一种临时访问授权,通过STS可以返回临时的AccessKey和Token,这些信息可以直接发给临时用户用来访问表格存储。一般来说,从STS获取的权限会受到更加严格的限制,并且拥有时间限制,因此即使这些信息泄露,对于系统的影响也很小。 |
RAM和STS介绍 | |
RAM Policy |
访问控制RAM中的权限策略(RAM Policy)是一种基于用户的授权策略,可以集中管理您的用户(例如员工、系统或应用程序)以及控制用户访问资源的权限。 |
RAM Policy | |
Control Policy |
资源管理Resource Management中的资源目录的管控策略(Control Policy)是一种基于资源结构(资源夹或成员)的访问控制策略,可以统一管理资源目录各层级内资源访问的权限边界。 如果希望对企业成员进行统一授权和管理,您可以开通资源目录后通过资源目录管控策略对企业成员所属资源目录进行权限配置和授权。 |
Control Policy | |
Network ACL |
表格存储中的NetWork ACL是基于资源的网络访问控制功能,可以用于为单个实例配置网络访问方式。 |
- |
|
Instance Policy |
表格存储中的Instance Policy是基于资源的授权策略,可以用于为单个实例配置访问权限。 |
- |
|
数据安全 |
服务端加密 |
为了保证表数据安全,表格存储提供了数据落盘加密功能。您可以在创建数据表时配置数据表加密。 |
数据加密 |
传输加密 |
表格存储支持TLS传输链路加密,表格存储客户端和服务端之间的通信会进行TLS数据传输加密。表格存储支持通过自定义RAM Policy、Control Policy等方式限制用户访问表格存储时使用的TLS版本。更高的TLS版本对应的传输加密算法更安全,推荐使用TLS 1.2及以上版本。 |
||
安全合规 |
审计日志 |
表格存储审计日志集成了日志服务的日志查询与分析、统计图表、日志聚类等功能,支持通过日志记录用户对表格存储实例中资源有修改影响的操作,例如创建数据表、创建时序表、创建索引等。审计日志可用于安全审计、合规性审计、故障排查等场景。 |
审计日志 |
容灾备份
功能集 |
功能 |
功能描述 |
参考文档 |
备份 |
备份与恢复 |
为了防止由于误删、恶意篡改等导致重要数据不可用,您可以使用表格存储数据备份功能备份实例中宽表数据,并在数据丢失或受损时及时恢复。 |
备份与恢复 |
高可用 |
同城冗余 |
为了实现实例数据的机房级容灾,表格存储提供了同城冗余功能。通过创建使用同城冗余的实例存储数据,即使当由于断网、断电或者灾难事件导致某个机房不可用时,表格存储仍能继续提供强一致性的服务。同城冗余功能确保了数据的高可用性和容灾能力。 |
同城冗余 |
产品生态
功能集 |
功能 |
功能描述 |
参考文档 |
数据可视化 |
DataV |
DataV可用于展示表格存储数据表或者二级索引表中的数据,一般用于构建复杂的大数据处理分析展现的企业应用系统。 |
对接DataV |
Grafana |
Grafana可用于展示表格存储数据表或者时序表中的数据。 |
对接Grafana | |
计算及分析生态对接 |
MaxCompute |
在同一个云账号下实现表格存储和MaxCompute之间的无缝连接。如果您在表格存储中的数据有着独特的结构,希望自定义开发逻辑来处理每一行数据,例如解析特定的JSON字符串,您可以使用用户自定义函数UDF(User Defined Function)来处理表格存储中的数据。 |
MaxCompute |
Spark |
使用Spark计算引擎时,支持通过E-MapReduce SQL或者DataFrame编程方式访问表格存储。 |
Spark/SparkSQL | |
Hive或者HadoopMR |
使用Hive或者HadoopMR访问表格存储中的数据。 |
Hive/HadoopMR | |
函数计算 |
通过函数计算访问表格存储,对表格存储增量数据进行实时计算。 |
函数计算 | |
Flink |
通过实时计算Flink访问表格存储中的源表、维表或者结果表,实现大数据实时计算与分析。 目前数据表支持作为源表、维表或者结果表,时序表只支持作为结果表。 |
Flink | |
Presto |
使用PrestoDB对接表格存储Tablestore后,基于PrestoDB on Tablestore您可以使用SQL查询与分析Tablestore中的数据、写入数据到Tablestore以及导入数据到Tablestore。 |
Presto | |
迁移同步 |
同步Kafka数据 |
基于Tablestore Sink Connector,您可以将Apache Kafka中的数据批量导入到表格存储(Tablestore)的数据表或者时序表中。 |
同步Kafka数据 |
同步到MaxCompute |
Tablestore中的增量数据及全量数据可以通过DataWorks的数据集成同步到MaxCompute中。 |
同步到MaxCompute | |
同步到OSS |
表格存储中的全量数据以及增量数据可以通过DataWorks数据集成同步到对象存储中备份和使用。 |
同步到OSS | |
同步到本地文件 |
表格存储支持通过命令行工具或者DataX工具直接下载数据到本地文件。您也可以通过DataWorks工具将数据同步到OSS后再在OSS侧下载数据到本地文件。 |
同步到本地文件 | |
数据湖投递 |
数据湖投递 |
表格存储数据湖投递可以全量备份或实时投递数据到数据湖OSS中存储,以满足更低成本的历史数据存储,以及更大规模的离线和准实时数据分析需求。 |
数据湖投递概述 |
数据湖计算分析 |
将表格存储数据投递到OSS后,使用EMR的JindoFS缓存模式连接OSS数据湖分析数据。 |
使用EMR | |
通道服务 |
通道服务 |
通道服务(Tunnel Service)是基于表格存储数据接口上的全增量一体化服务。通道服务提供了增量、全量、增量加全量三种类型的分布式数据实时消费通道。通过为数据表建立数据通道,您可以简单地实现对表中历史存量和新增数据的消费处理。 |
通道服务 |
基础产品能力
功能集 |
功能 |
功能描述 |
参考文档 |
基础概念 |
地域 |
地域(Region)是指阿里云物理数据中心所在的位置。表格存储部署在多个地域中,您可以根据自身的业务需求创建不同地域中的表格存储实例。 |
地域 |
实例 |
实例(Instance)是您使用和管理表格存储服务的实体,每个实例相当于一个数据库。表格存储对应用程序的访问控制和资源计量都在实例级别完成。 |
实例 | |
服务地址 |
每个表格存储实例对应一个服务地址(Endpoint),应用程序进行表和数据操作时需要指定服务地址。 |
服务地址 | |
使用方式 |
控制台 |
表格存储通过控制台完成时序模型和宽表模型的实例基础操作、表操作、数据基本操作、SQL查询相关操作等。 |
- |
SDK |
表格存储提供了Java SDK、Go SDK、Python SDK、Node.js SDK、.NET SDK和PHP SDK的主流语言SDK供用户使用。 |
- |
|
命令行工具 |
Tablestore CLI提供简洁、方便的管理命令,支持Windows、Linux和Mac平台。包括实例操作,宽表模型的数据表操作、数据操作、二级索引操作、多元索引操作、通道服务操作和SQL查询以及时序模型的时序表操作、数据操作和SQL查询功能。 |
- |
|
SQL |
通过SQL查询功能,您可以对表格存储中数据进行复杂的查询和高效的分析,为多数据引擎提供统一的访问接口。 |
- |